Skip to content

模型详情页

模型详情页提供了单个 AI 模型的完整信息,包括模型能力、定价详情、性能指标和 API 调用示例,帮助你全面了解模型特性并快速集成到你的应用中。

访问详情页

AI 模型市场 中点击任意模型卡片,即可进入该模型的详情页。

模型基本信息

页面顶部展示模型的核心信息:

  • 模型名称: 完整的模型名称,点击右侧的复制按钮可快速复制模型名称
  • 提供商: 模型的服务提供商
  • 类型标签: 模型类型(Chat、Reasoning、Image、Video)
  • 功能标签: 模型支持的能力(如 Vision、Function Call、Tools、Coding 等)
  • 发布日期: 模型的发布时间
  • 模型描述: 详细介绍模型的特点、能力和适用场景

Overview(概览)

展示模型的核心能力和基本配置信息。

模型能力(Model Capabilities)

输入模态(Input Modalities)

模型支持的输入类型:

输入类型说明
Text支持文本输入
Image支持图像输入(视觉理解能力)

输出模态(Output Modalities)

模型支持的输出类型:

输出类型说明
Text支持文本输出

模型定价(Model Pricing)

展示模型的基础定价信息:

  • Input: 输入价格(Mcoin/M tokens)
  • Output: 输出价格(Mcoin/M tokens)
  • Cache: 缓存价格(Mcoin/M tokens),部分模型支持缓存功能以降低成本

说明: 价格以官方 token 计算单位为准

模型限制和上下文(Model Limits and Context)

展示模型的技术限制:

  • Total Context: 总上下文长度,如 128K 表示支持 128,000 个 tokens 的上下文
  • Max Output: 最大输出长度,单次请求最多可生成的 token 数量

支持的 API 风格(Supported API Styles)

API 风格说明适用场景
OpenAI Style最常用的兼容风格,可访问几乎所有大模型适用于所有模型,兼容性最好
Anthropic StyleClaude 官方风格,满足 Claude 模型完整数据支持仅 Anthropic 提供的模型显示
Google StyleGoogle Gemini 官方风格,支持所有 Gemini 特性仅 Google 提供的模型显示
OpenAI ResponseOpenAI 原生响应格式,提供完整的响应数据仅 OpenAI 提供的模型显示

鼠标悬停在问号图标上可以查看每种 API 风格的详细说明。

Pricing(定价)

展示不同提供商分组的详细定价信息。

分组说明

ModelGate 将请求路由到能够处理你的提示大小和参数的最佳提供商,并提供故障转移机制以最大化正常运行时间。

每个分组包含以下信息:

分组标识:

  • 分组名称(如 Premium、Balanced、Budget)
  • 折扣标签:显示相对基础价格的折扣比例

性能指标:

  • Latency: 平均延迟时间(秒)
  • Throughput: 吞吐量(token/s)
  • Availability: 可用性百分比

定价信息:

项目单位说明
Inputmcoin/M输入价格,按百万 tokens 计费
Outputmcoin/M输出价格,按百万 tokens 计费
Cachemcoin/M缓存价格,使用缓存功能的费用

说明:

  • Premium (品质)分组通常提供最佳性能,但价格较高
  • Balanced (均衡)分组平衡了性能和价格
  • Budget (特价)分组提供最优惠的价格,适合预算有限的场景

Performance(性能)

展示模型在不同提供商分组下的实时性能数据。

吞吐量(Throughput)

展示各分组的输出吞吐量趋势图:

  • 单位: token/s(每秒生成的 token 数)
  • 说明: 吞吐量越高,模型生成内容的速度越快
  • 平均值: 图表下方显示每个分组的平均吞吐量

延迟(Latency)

展示各分组的延迟趋势图:

  • 单位: 秒(s)
  • 说明: 延迟越低,模型响应速度越快
  • 平均值: 图表下方显示每个分组的平均延迟

可用性(Availability)

展示各分组的可用性趋势:

  • 单位: 百分比(%)
  • 说明: 可用性越高,服务越稳定可靠
  • 时间范围: 图表展示最近一段时间的可用性变化

容错机制:

当上游提供商发生错误时,ModelGate 可以自动路由到另一个健康的提供商,前提是你的请求过滤器允许这样做。

性能数据说明

  • 图表展示的是实时监控数据
  • 鼠标悬停在图表上可以查看具体时间点的数值
  • 不同颜色的线条代表不同的提供商分组
  • 可以通过性能数据选择最适合你需求的分组

常见问题

如何复制模型名称?

点击页面顶部模型名称右侧的复制按钮,即可将模型名称复制到剪贴板。在 API 调用时需要使用这个准确的模型名称。

不同的 API 风格有什么区别?

  • OpenAI Style: 兼容性最好,适用于所有模型,但部分特定参数可能不支持
  • Anthropic Style: 专为 Claude 模型优化,支持 Claude 特有的功能
  • Google Style: 专为 Gemini 模型优化,支持 Gemini 特有的功能
  • OpenAI Response: 提供完整的响应数据,包括详细的 token 使用统计

建议:优先使用模型提供商对应的原生 API 风格,以获得最完整的功能支持。

如何选择合适的策略?

在 Settings → API Keys 中创建或编辑 API Key 时,可以设置 Model Preference(模型偏好策略)。当使用同名模型时,系统会根据所选策略自动选择最合适的提供商:

需求场景推荐策略说明
生产环境,稳定性优先Availability First优先选择可用性最高的模型,确保稳定的服务体验
成本敏感,预算有限Price First优先选择价格最便宜的模型,降低使用成本(可能影响可用性和速度)
实时应用,响应速度优先Speed First优先选择延迟最低、输出速度最快的模型,提供最佳性能体验

提示: 不同的策略会影响系统如何在 Premium、Balanced、Budget 等提供商分组中进行选择。

性能数据多久更新一次?

性能数据是实时监控的,图表展示的是最近一段时间的实际数据。每次访问 Performance 标签都会从服务器获取最新数据。

为什么有些功能没有显示?

  • 部分 API 风格仅在特定提供商的模型上显示
  • 某些功能(如 Cache)可能只有部分模型支持
  • 如果模型较新,部分历史性能数据可能尚未完整

如何获取 API Key?

请参阅 快速开始 文档,了解如何创建和管理 API Key。

相关文档

ModelGate 产品文档