接口请求和格式

3. API 接口规格（多种方式）

方式一：Gemini API 格式（推荐）

3.1.1 API Endpoint

https://comfyrouter.com/v1beta/models/gemini-2.5-flash-image:generateContent

3.1.2 HTTP 方法

POST

3.1.3 Request Headers

{
  "Content-Type": "application/json",
  "Authorization": "Bearer {api_key}"
}

3.1.4 Request Body 结构

{
  "contents": [
    {
      "parts": [
        {
          "text": "string - 图像生成/编辑的提示词"
        },
        {
          "inline_data": {
            "mime_type": "image/png | image/jpeg",
            "data": "string - base64 编码的图片数据（不含前缀）"
          }
        }
      ]
    }
  ],
  "generationConfig": {
    "responseModalities": ["IMAGE", "TEXT"],
    "imageConfig": {
      "aspectRatio": "1:1 | 16:9 | 9:16 | 4:3 | 3:4"
    }
  }
}

字段说明：

contents.parts: 数组，可包含多个 text 和 inline_data 部分

parts[0]: 通常是文本提示词

parts[1+]: 可选的输入图片，支持多张

inline_data.mime_type: 图片 MIME 类型

inline_data.data: base64 编码的图片数据（注意：不包含 data:image/png;base64, 前缀）

responseModalities: 响应模式，["IMAGE", "TEXT"] 表示同时返回图片和文本

imageConfig.aspectRatio: 输出图片的宽高比

3.1.5 完整请求示例

示例：图像编辑（对象替换）

3.1.6 响应格式

响应情况 1：成功生成（带 Markdown 格式）

{
    "candidates": [
        {
            "content": {
                "role": "model",
                "parts": [
                    {
                        "text": "Here's the adjusted image for you: \n![image](https://filesystem.site/cdn/20251107/xoxSjLn4vB40KTJje4hUBBa1PK7rqz.png)"
                    }
                ]
            },
            "finishReason": "STOP",
            "index": 0,
            "safetyRatings": []
        }
    ],
    "usageMetadata": {
        "promptTokenCount": 206,
        "candidatesTokenCount": 45,
        "totalTokenCount": 251,
        "thoughtsTokenCount": 0,
        "promptTokensDetails": null
    }
}

响应字段说明：

candidates[0].content.parts[0].text: 包含生成的图片 URL，格式为 Markdown ![image](url)

finishReason: 完成原因，STOP 表示正常完成

usageMetadata: Token 使用统计信息

图片 URL 提取：
需要从 Markdown 格式的文本中提取图片 URL：

正则表达式：!\[image\]\((https?://[^\)]+)\)

示例 URL：https://filesystem.site/cdn/20251107/xoxSjLn4vB40KTJje4hUBBa1PK7rqz.png

响应情况 2：成功生成（Base64 Data URI）

{
    "candidates": [
        {
            "content": {
                "role": "model",
                "parts": [
                    {
                        "text": "![image](data:image/png;base64,iVBORw0KGgo...)"
                    }
                ]
            },
            "finishReason": "STOP",
            "index": 0,
            "safetyRatings": []
        }
    ],
    "usageMetadata": {
        "promptTokenCount": 536,
        "candidatesTokenCount": 1290,
        "totalTokenCount": 1826,
        "thoughtsTokenCount": 0,
        "promptTokensDetails": null
    }
}

响应字段说明：

candidates[0].content.parts[0].text: 包含 base64 编码的图片数据，格式为 Markdown data URI ![image](data:image/png;base64,...)

与响应情况1的主要区别：图片以 base64 data URI 格式内嵌在响应中，而不是 HTTP URL

3. API 接口规格（多种方式）#

方式一：Gemini API 格式（推荐）#

3.1.1 API Endpoint#

3.1.2 HTTP 方法#

3.1.3 Request Headers#

3.1.4 Request Body 结构#

3.1.5 完整请求示例#

3.1.6 响应格式#