Token502 API文档
  1. 基本使用
Token502 API文档
  • 产品介绍
  • 基本使用
    • 在API客户端中使用
    • 获取API令牌(API密钥)
    • 常用大模型
  • API
    • 发出请求
    • 完成对象
    • 常见问题
    • OpenAI
      • 聊天(Chat)
        • 创建聊天补全(带图片)
        • 创建聊天补全
      • 音频(Audio)
        • 创建语音
        • 创建转录
        • 创建翻译
      • 图像(Images)
        • 创建图像
        • 创建图片编辑
      • 自动补全(Completions)
        • 创建 Completions
      • 嵌入(Embeddings)
        • 创建嵌入
      • 模型(Models)
        • 列出模型
        • 检索模型
        • 删除微调模型
    • Anthropic
      • 模型
        • 列出模型
        • 获取模型
      • 消息
        • 消息
        • 强制返回思考
        • 图片理解
        • 函数调用
        • 多轮函数调用
        • Web search / 联网搜索
    • Gemini
      • 图片生成
        • 使用 Gemini 生成图片
        • 使用 Gemini 编辑图片
        • 使用 Imagen 3 生成图片
        • 使用 Gemini 生成图片 Copy
      • 文本生成
        • 文字输入
        • 多轮对话
        • 流式输出
        • 多轮对话(流式)
    • Midjourney
      • 查询
        • 查询接口
        • 批量查询接口
        • 获取种子(Seed)接口
      • 图像
        • 文生图(Imagine)接口
        • 图片融合(Blend)接口
      • 视频
        • 生成视频(Video)接口
      • 其他操作
        • 按钮点击(Action)接口
        • 图生文(Describe)接口
        • 上传(upload)接口
    • 其他厂商LLM
      • grok
        • OpenAI兼容接口
          • 联网搜索 / OpenAI兼容接口
      • 通义千问
    • 图片生成
      • Flux
        • flux-kontext-pro / OpenAI兼容接口
        • flux携带参考图 / OpenAI兼容接口
      • Nano-banana
        • 接口请求和格式
        • chat格式
          • 图片编辑(Nano-banana)
        • dalle格式
          • 图像生成(Nano-banana)
          • 创建图像
          • 创建图片编辑
        • 谷歌官方格式
          • 生成图像
      • seedream
    • 视频生成
      • 如何调用视频模型
      • sora-2
        • chat格式
          • 生成视频
          • 生成视频 Copy
        • 官方格式
          • 生成视频
          • 查询视频
          • 下载视频
          • 编辑视频
      • veo
        • chat 格式
          • 流式请求
          • 流式请求(传图)
        • 视频统一格式
          • 生成视频
          • 查询视频
    • Rerank API
      • Cohere 重排序格式
      • Xinference 重排序格式
      • Jina AI 重排序格式
  • 在客户端中使用
    • cline中使用
    • chatbox中使用大语言模型
  1. 基本使用

常用大模型

常用大模型#

小编先推荐几个日程焊死在自己电脑上的大模型
标题使用场景
gemini-2.5-pro文案写作
claude-sonnet-4-5-20250929-thinking数据分析、页面设计
gpt-5文案写作
nano-banana图片制作
sora-2视频生成
如果你还想了解更多细节,情继续往下读
如果不知道该使用那些大模型,可以参考以下列表;
如果你的api客户端能保存多个模型id,建一将以下模型全部增加到API客户端;
模型名称说明
claude-sonnet-4Claude Sonnet 4 显著增强了其前身 Sonnet 3.7 的能力,在编码和推理任务中表现出色,具有更高的精确度和可控性。在 SWE-bench 上实现了最先进的性能(72.7%),Sonnet 4 在能力和计算效率之间取得了平衡,适用于从日常编码任务到复杂软件开发项目的广泛应用。主要改进包括增强的自主代码库导航、降低代理驱动工作流程中的错误率,以及在执行复杂指令时的可靠性。Sonnet 4 针对实际日常使用进行了优化,提供了先进的推理能力,同时保持在各种内部和外部场景中的效率和响应速度。
claude-opus-4Claude Opus 4 被评为全球最优秀的编码模型,在发布时在复杂的长时间任务和代理工作流程中表现出持续的性能。它在软件工程方面设定了新的基准,在 SWE-bench(72.5%)和 Terminal-bench(43.2%)上取得了领先的成绩。Opus 4 支持扩展的代理工作流程,能够连续处理数千个任务步骤数小时而不出现性能下降。
gemini-2.5-pro-previewGemini 2.5 Pro 是谷歌的最先进人工智能模型,专为高级推理、编码、数学和科学任务设计。它具有“思考”能力,能够以更高的准确性和细致的上下文处理能力进行推理。Gemini 2.5 Pro 在多个基准测试中表现出色,包括在 LMArena 排行榜上名列第一,反映出其优越的人类偏好对齐和复杂问题解决能力。
gemini-2.5-flash-previewGemini 2.5 Flash 5 月 20 日检查点是谷歌最先进的工作模型,专为高级推理、编码、数学和科学任务设计。它内置“思考”功能,能够提供更高准确性和细致上下文处理的响应。
gpt-4.1GPT-4.1 是一款旗舰级大型语言模型,针对高级指令跟踪、真实世界软件工程和长上下文推理进行了优化。它支持 100 万个 token 上下文窗口,在编码(54.6% SWE-bench 验证)、指令合规性(87.4% IFEval)和多模态理解基准测试中均优于 GPT-4o 和 GPT-4.5。它针对精确的代码差异、代理可靠性以及大文档上下文中的高召回率进行了调整,使其成为代理、IDE 工具和企业知识检索的理想选择。
o3o3 是一个功能全面且强大的跨领域模型。它为数学、科学、编程和视觉推理任务树立了新的标准。它在技术写作和指令执行方面也表现出色。使用它来思考涉及跨文本、代码和图像分析的多步骤问题。请注意,此模型需要 BYOK
o4-miniOpenAI o4-mini 是 o 系列中的一款紧凑型推理模型,经过优化,实现了快速、经济高效的性能,同时保留了强大的多模态和代理能力。它支持工具使用,并在 AIME(使用 Python 时准确率达 99.5%)和 SWE-bench 等基准测试中展现出极具竞争力的推理和编码性能,超越了其前身 o3-mini,甚至在某些领域接近 o3。
尽管体积较小,o4-mini 在 STEM 任务、视觉问题求解(例如 MathVista、MMMU)和代码编辑方面仍表现出极高的准确率。它尤其适用于对延迟或成本要求严格的高吞吐量场景。凭借其高效的架构和精益求精的强化学习训练,o4-mini 可以链接工具、生成结构化输出并以极低的延迟(通常不到一分钟)完成多步骤任务。
deepseek-r1t-chimeraDeepSeek-R1T-Chimera 由 DeepSeek-R1 和 DeepSeek-V3(0324)合并创建,结合了 R1 的推理能力与 V3 在令牌效率方面的改进。它基于 DeepSeek-MoE Transformer 架构,优化用于通用文本生成任务。
该模型融合了两个源模型的预训练权重,以平衡推理能力、效率和指令遵循任务的性能。它采用 MIT 许可证发布,适用于研究和商业用途。
qwen3-235b-a22bQwen3-235B-A22B 是由 Qwen 开发的一个 235B 参数的专家混合模型(MoE),在每次前向传播中激活 22B 参数。它支持在“思考”模式(用于复杂推理、数学和编码任务)和“非思考”模式(用于一般对话效率)之间无缝切换。该模型展现出强大的推理能力,支持多语言(100 多种语言和方言),具有先进的指令遵循和代理工具调用能力。它原生支持 32K 令牌的上下文窗口,并通过 YaRN 扩展技术扩展至 131K 令牌。
gpt-4.1-miniGPT-4.1 Mini 是一款中等规模的模型,其性能与 GPT-4o 相媲美,但延迟和成本却显著降低。它保留了 100 万个 token 上下文窗口,在硬指令评估中得分为 45.1%,在 MultiChallenge 中得分为 35.8%,在 IFEval 中得分为 84.1%。Mini 还展现出强大的编码能力(例如,在 Aider 的多语言 diff 基准测试中得分为 31.6%)和视觉理解能力,使其非常适合性能受限的交互式应用。
claude-3.7-sonnetClaude 3.7 Sonnet 是一个先进的大型语言模型,其推理、编码和问题解决能力均有所提升。它引入了一种混合推理方法,允许用户在快速响应和扩展的逐步处理复杂任务之间进行选择。该模型在编码方面表现出显著的改进,尤其是在前端开发和全栈更新方面,并且在代理工作流方面表现出色,可以自主导航多步骤流程。
Claude 3.7 Sonnet 在标准模式下保持与其前代产品相同的性能,同时提供扩展推理模式,以提高数学、编码和指令跟踪任务的准确性。
llama-4-maverickLlama 4 Maverick 17B Instruct(128E)是 Meta 推出的高容量多模态语言模型,采用混合专家(MoE)架构,拥有 128 个专家,每次前向传播有 170 亿个活跃参数(总计 4000 亿)。它支持多语言文本和图像输入,并在 12 种支持的语言中生成多语言文本和代码输出。Maverick 专为视觉-语言任务优化,经过指令调优,具备助手式行为、图像推理和通用多模态交互能力。
Maverick 具有早期融合的原生多模态能力和 100 万令牌的上下文窗口。它在经过精心筛选的公共、授权和 Meta 平台数据上训练,涵盖约 22 万亿个令牌,知识截止到 2024 年 8 月。于 2025 年 4 月 5 日发布,采用 Llama 4 社区许可证,适用于需要先进多模态理解和高模型吞吐量的研究和商业应用。
deepseek-r1deepseek
deepseek-v3deepseek最新的对话模型,已经同步到0324版本
qwen3-30b-a3bQwen3 是 Qwen 大型语言模型系列的最新一代,采用密集和专家混合(MoE)架构,在推理、多语言支持和高级代理任务方面表现出色。其独特的能力在复杂推理时无缝切换思考模式,在高效对话时切换非思考模式,确保多功能、高质量的性能。
显著优于之前的模型如 QwQ 和 Qwen2.5,Qwen3 在数学、编码、常识推理、创造性写作和交互对话能力方面表现出色。Qwen3-30B-A3B 版本包括 305 亿参数(33 亿激活),48 层,128 个专家(每个任务激活 8 个),并支持高达 131K 令牌的上下文,采用 YaRN,树立了开源模型的新标准。
qwen3-32bQwen3-32B 是来自 Qwen3 系列的密集型 32.8 亿参数因果语言模型,优化用于复杂推理和高效对话。它支持在“思考”模式(用于数学、编码和逻辑推理等任务)和“非思考”模式(用于更快的通用对话)之间无缝切换。该模型在指令执行、代理工具使用、创意写作和多语言任务(涵盖 100 多种语言和方言)方面表现出色。它原生支持 32K 令牌上下文,并可使用 YaRN 扩展到 131K 令牌。
gpt-4o-imageGPT-4o生图模型
gpt-4o-image-vipGPT-4o生图模型,贵一点但稳定,如果gpt-4o-image失败,可以用这个
o3-mini该模型支持 reasoning_effort 参数,可设置为“high”、“medium”或“low”来控制模型的思考时间。默认值为“medium”。
该模型具有三个可调节的推理力度级别,并支持关键开发人员功能,包括函数调用、结构化输出和流媒体,但不包括视觉处理功能。
该模型较其前代产品有显著改进,专业测试人员对其答案的满意度高达 56%,复杂问题上的重大错误率也降低了 39%。在中等推理工作量设置下,o3-mini 在 AIME 和 GPQA 等高难度推理评估中的表现堪比规模更大的 o1 模型,同时保持了更低的延迟和成本。
gpt-4o-mini4o mini 是 OpenAI 最新的模型,继 GPT-4 Omni 之后,支持文本和图像输入,输出文本。作为他们最先进的小型模型,它比其他最新的前沿模型多倍更实惠,比 GPT-3.5 Turbo 便宜超过 60%。它保持了最先进的智能水平,同时具有显著更高的性价比。
4o mini 在 MMLU 上获得了 82%的分数,目前在聊天偏好常用排行榜上排名高于 GPT-4。
valkyrie-49b-v1创意写作
ref:
https://www.superclueai.com/
https://lmarena.ai/leaderboard
修改于 2025-10-06 13:48:24
上一页
获取API令牌(API密钥)
下一页
发出请求
Built with