Token502 API文档
  1. Nano-banana
Token502 API文档
  • 产品介绍
  • 基本使用
    • 在API客户端中使用
    • 获取API令牌(API密钥)
    • 常用大模型
  • API
    • 发出请求
    • 完成对象
    • 常见问题
    • OpenAI
      • 聊天(Chat)
        • 创建聊天补全(带图片)
        • 创建聊天补全
      • 音频(Audio)
        • 创建语音
        • 创建转录
        • 创建翻译
      • 图像(Images)
        • 创建图像
        • 创建图片编辑
      • 自动补全(Completions)
        • 创建 Completions
      • 嵌入(Embeddings)
        • 创建嵌入
      • 模型(Models)
        • 列出模型
        • 检索模型
        • 删除微调模型
    • Anthropic
      • 模型
        • 列出模型
        • 获取模型
      • 消息
        • 消息
        • 强制返回思考
        • 图片理解
        • 函数调用
        • 多轮函数调用
        • Web search / 联网搜索
    • Gemini
      • 图片生成
        • 使用 Gemini 生成图片
        • 使用 Gemini 编辑图片
        • 使用 Imagen 3 生成图片
        • 使用 Gemini 生成图片 Copy
      • 文本生成
        • 文字输入
        • 多轮对话
        • 流式输出
        • 多轮对话(流式)
    • Midjourney
      • 查询
        • 查询接口
        • 批量查询接口
        • 获取种子(Seed)接口
      • 图像
        • 文生图(Imagine)接口
        • 图片融合(Blend)接口
      • 视频
        • 生成视频(Video)接口
      • 其他操作
        • 按钮点击(Action)接口
        • 图生文(Describe)接口
        • 上传(upload)接口
    • 其他厂商LLM
      • grok
        • OpenAI兼容接口
          • 联网搜索 / OpenAI兼容接口
      • 通义千问
    • 图片生成
      • Flux
        • flux-kontext-pro / OpenAI兼容接口
        • flux携带参考图 / OpenAI兼容接口
      • Nano-banana
        • 接口请求和格式
        • chat格式
          • 图片编辑(Nano-banana)
        • dalle格式
          • 图像生成(Nano-banana)
          • 创建图像
          • 创建图片编辑
        • 谷歌官方格式
          • 生成图像
      • seedream
    • 视频生成
      • 如何调用视频模型
      • sora-2
        • chat格式
          • 生成视频
          • 生成视频 Copy
        • 官方格式
          • 生成视频
          • 查询视频
          • 下载视频
          • 编辑视频
      • veo
        • chat 格式
          • 流式请求
          • 流式请求(传图)
        • 视频统一格式
          • 生成视频
          • 查询视频
    • Rerank API
      • Cohere 重排序格式
      • Xinference 重排序格式
      • Jina AI 重排序格式
  • 在客户端中使用
    • cline中使用
    • chatbox中使用大语言模型
  1. Nano-banana

接口请求和格式

3. API 接口规格(多种方式)#

方式一:Gemini API 格式(推荐)#

3.1.1 API Endpoint#

https://comfyrouter.com/v1beta/models/gemini-2.5-flash-image:generateContent

3.1.2 HTTP 方法#

POST

3.1.3 Request Headers#

{
  "Content-Type": "application/json",
  "Authorization": "Bearer {api_key}"
}

3.1.4 Request Body 结构#

{
  "contents": [
    {
      "parts": [
        {
          "text": "string - 图像生成/编辑的提示词"
        },
        {
          "inline_data": {
            "mime_type": "image/png | image/jpeg",
            "data": "string - base64 编码的图片数据(不含前缀)"
          }
        }
      ]
    }
  ],
  "generationConfig": {
    "responseModalities": ["IMAGE", "TEXT"],
    "imageConfig": {
      "aspectRatio": "1:1 | 16:9 | 9:16 | 4:3 | 3:4"
    }
  }
}
字段说明:
contents.parts: 数组,可包含多个 text 和 inline_data 部分
parts[0]: 通常是文本提示词
parts[1+]: 可选的输入图片,支持多张
inline_data.mime_type: 图片 MIME 类型
inline_data.data: base64 编码的图片数据(注意:不包含 data:image/png;base64, 前缀)
responseModalities: 响应模式,["IMAGE", "TEXT"] 表示同时返回图片和文本
imageConfig.aspectRatio: 输出图片的宽高比

3.1.5 完整请求示例#

示例:图像编辑(对象替换)

3.1.6 响应格式#

响应情况 1:成功生成(带 Markdown 格式)
{
    "candidates": [
        {
            "content": {
                "role": "model",
                "parts": [
                    {
                        "text": "Here's the adjusted image for you: \n![image](https://filesystem.site/cdn/20251107/xoxSjLn4vB40KTJje4hUBBa1PK7rqz.png)"
                    }
                ]
            },
            "finishReason": "STOP",
            "index": 0,
            "safetyRatings": []
        }
    ],
    "usageMetadata": {
        "promptTokenCount": 206,
        "candidatesTokenCount": 45,
        "totalTokenCount": 251,
        "thoughtsTokenCount": 0,
        "promptTokensDetails": null
    }
}
响应字段说明:
candidates[0].content.parts[0].text: 包含生成的图片 URL,格式为 Markdown ![image](url)
finishReason: 完成原因,STOP 表示正常完成
usageMetadata: Token 使用统计信息
图片 URL 提取:
需要从 Markdown 格式的文本中提取图片 URL:
正则表达式:!\[image\]\((https?://[^\)]+)\)
示例 URL:https://filesystem.site/cdn/20251107/xoxSjLn4vB40KTJje4hUBBa1PK7rqz.png
响应情况 2:成功生成(Base64 Data URI)
{
    "candidates": [
        {
            "content": {
                "role": "model",
                "parts": [
                    {
                        "text": "![image](...)"
                    }
                ]
            },
            "finishReason": "STOP",
            "index": 0,
            "safetyRatings": []
        }
    ],
    "usageMetadata": {
        "promptTokenCount": 536,
        "candidatesTokenCount": 1290,
        "totalTokenCount": 1826,
        "thoughtsTokenCount": 0,
        "promptTokensDetails": null
    }
}
响应字段说明:
candidates[0].content.parts[0].text: 包含 base64 编码的图片数据,格式为 Markdown data URI ![image](data:image/png;base64,...)
与响应情况1的主要区别:图片以 base64 data URI 格式内嵌在响应中,而不是 HTTP URL
修改于 2025-11-07 03:51:19
上一页
flux携带参考图 / OpenAI兼容接口
下一页
图片编辑(Nano-banana)
Built with