コンテンツにスキップ

图像生成接口

兆投算力提供多种主流图像生成模型的统一接口,支持文生图、图生图、图像编辑等功能。

🎨 支持的模型

模型 描述 特点
Gemini-3-Pro-Image-preview Google Gemini 3 Pro 图像生成模型(Nano banana2) 高质量、多风格、细节丰富
Gemini-2.5-Flash-Image-preview Google Gemini 2.5 Flash 图像生成模型(Nano banana) 快速生成、成本效益高
GPT-4o-image OpenAI GPT-4o 图像生成模型 多模态理解、创意性强
Seedream-4.0 Seedream 4.0 图像生成模型 风格多样、艺术感强
Seedream-4.5 Seedream 4.5 图像生成模型 升级版、质量更高
Flux Kontext Flux Kontext 图像生成模型 上下文理解、细节精准
Flux 2.0 Flux 2.0 图像生成模型 新一代、性能优化

🚀 快速开始

基础文生图

curl https://zhaotouai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ZHAOTOU_API_KEY" \
  -d '{
    "model": "gemini-3-pro-image-preview",
    "prompt": "一只可爱的小猫在花园里玩耍,阳光明媚,色彩鲜艳",
    "n": 1,
    "size": "1024x1024"
  }'

高质量图像生成

curl https://zhaotouai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ZHAOTOU_API_KEY" \
  -d '{
    "model": "gemini-3-pro-image-preview",
    "prompt": "一只可爱的小猫在花园里玩耍,阳光明媚,色彩鲜艳",
    "n": 1,
    "size": "1024x1024",
    "quality": "hd",
    "style": "vivid"
  }'

图像编辑

curl https://zhaotouai.com/v1/images/edits \
  -H "Authorization: Bearer $ZHAOTOU_API_KEY" \
  -F "model=gemini-3-pro-image-preview" \
  -F "image=@original.png" \
  -F "prompt=给这只猫戴上一顶红色的小帽子" \
  -F "n=1" \
  -F "size=1024x1024"

生成图像变体

curl https://zhaotouai.com/v1/images/variations \
  -H "Authorization: Bearer $ZHAOTOU_API_KEY" \
  -F "image=@original.png" \
  -F "n=2" \
  -F "size=1024x1024"

📋 API 接口

生成图像

端点: POST /v1/images/generations

请求格式: application/json

参数 类型 必填 描述
prompt string 期望生成图像的文本描述
model string 图像生成模型,默认为 gemini-3-pro-image-preview
n integer 生成图像数量,1-10,默认为 1
size string 图像尺寸,默认为 1024x1024
quality string 图像质量,standard 或 hd
style string 图像风格,vivid 或 natural
response_format string 返回格式,url 或 b64_json

编辑图像

端点: POST /v1/images/edits

请求格式: multipart/form-data

参数 类型 必填 描述
image file 要编辑的原始图像
prompt string 编辑描述
mask file 编辑区域蒙版
model string 使用的模型
n integer 生成数量
size string 图像尺寸
response_format string 返回格式

生成变体

端点: POST /v1/images/variations

请求格式: multipart/form-data

参数 类型 必填 描述
image file 原始图像
model string 使用的模型
n integer 生成数量
size string 图像尺寸
response_format string 返回格式

🎯 模型特性

Gemini-3-Pro-Image-preview (Nano banana2)

  • 优势: 最高质量、细节丰富、风格多样
  • 适用场景: 专业设计、艺术创作、高质量内容
  • 推荐设置: 1024x1024、quality=hd、style=vivid

Gemini-2.5-Flash-Image-preview (Nano banana)

  • 优势: 生成速度快、成本效益高、质量稳定
  • 适用场景: 批量生成、快速原型、成本敏感场景
  • 推荐设置: 1024x1024、quality=standard

GPT-4o-image

  • 优势: 多模态理解、创意性强、逻辑性好
  • 适用场景: 创意设计、概念图解、复杂场景
  • 推荐设置: 1024x1024、style=vivid

Seedream-4.0/4.5

  • 优势: 艺术感强、风格独特、视觉效果出色
  • 适用场景: 艺术创作、插画设计、视觉艺术
  • 推荐设置: 1024x1024、style=vivid

Flux Kontext/Flux 2.0

  • 优势: 上下文理解好、细节精准、性能优化
  • 适用场景: 商业设计、产品图像、营销素材
  • 推荐设置: 1024x1024 或 1792x1024

📝 支持的尺寸

模型 支持尺寸 默认尺寸
Gemini 系列 1024x1024, 1792x1024, 1024x1792 1024x1024
GPT-4o-image 1024x1024, 1536x1024, 1024x1536 1024x1024
Seedream 系列 1024x1024, 1920x1080, 1080x1920 1024x1024
Flux 系列 1024x1024, 1280x720, 720x1280 1024x1024

💡 最佳实践

  1. 提示词优化
  2. 使用具体、详细的描述
  3. 包含主体、场景、风格、色彩等要素
  4. 避免矛盾或模糊的表达

  5. 模型选择

  6. 高质量需求:选择 Gemini-3-Pro 或 Seedream-4.5
  7. 快速生成:选择 Gemini-2.5-Flash
  8. 创意设计:选择 GPT-4o-image 或 Seedream 系列
  9. 商业用途:选择 Flux 系列

  10. 参数设置

  11. 艺术创作:quality=hd, style=vivid
  12. 实用场景:quality=standard, style=natural
  13. 横版构图:1792x1024 或 1920x1080
  14. 竖版构图:1024x1792 或 1080x1920

  15. 错误处理

  16. 检查提示词是否符合内容政策
  17. 验证图像文件格式和大小限制
  18. 处理网络超时和重试逻辑

🔧 JavaScript 示例

// 生成图像
async function generateImage(prompt, model = 'gemini-3-pro-image-preview') {
  const response = await fetch('https://zhaotouai.com/v1/images/generations', {
    method: 'POST',
    headers: {
      'Content-Type': 'application/json',
      'Authorization': 'Bearer ' + apiKey
    },
    body: JSON.stringify({
      model: model,
      prompt: prompt,
      n: 1,
      size: '1024x1024',
      quality: 'hd',
      style: 'vivid'
    })
  });

  const result = await response.json();
  return result.data[0];
}

// 编辑图像
async function editImage(imageFile, prompt, model = 'gemini-3-pro-image-preview') {
  const formData = new FormData();
  formData.append('model', model);
  formData.append('image', imageFile);
  formData.append('prompt', prompt);
  formData.append('n', 1);
  formData.append('size', '1024x1024');

  const response = await fetch('https://zhaotouai.com/v1/images/edits', {
    method: 'POST',
    headers: {
      'Authorization': 'Bearer ' + apiKey
    },
    body: formData
  });

  const result = await response.json();
  return result.data[0];
}

// 生成变体
async function createVariations(imageFile, model = 'gemini-3-pro-image-preview') {
  const formData = new FormData();
  formData.append('model', model);
  formData.append('image', imageFile);
  formData.append('n', 2);
  formData.append('size', '1024x1024');

  const response = await fetch('https://zhaotouai.com/v1/images/variations', {
    method: 'POST',
    headers: {
      'Authorization': 'Bearer ' + apiKey
    },
    body: formData
  });

  const result = await response.json();
  return result.data;
}

❗ 常见错误

  • 400 Bad Request: 检查提示词长度、参数格式
  • 401 Unauthorized: 验证 API Key 是否正确
  • 413 Payload Too Large: 图像文件过大,请压缩后重试
  • 429 Too Many Requests: 降低请求频率
  • 500 Server Error: 服务器内部错误,建议重试
  • 内容政策违规: 检查提示词内容,避免敏感内容