API 价格说明-创锋一号

1. 说明目的

本文用于解释该 API 平台价格页中的几个核心概念，包括：

页面价格是否已经包含倍率
模型倍率、分组倍率、补全倍率分别是什么意思
token 消耗与费用之间如何计算
如何理解输入价格、补全价格、缓存读取价格

说明：以下结论是根据当前截图中的字段和数值关系整理得到，适合作为平台内部或个人使用时的价格说明文档。

2. 结论：页面价格已经包含倍率

根据截图中的价格表，可以判断：

页面展示的“模型价格”已经是包含倍率后的最终展示价格，不是原始价格。

也就是说：

页面右侧看到的“输入价格 / 补全价格 / 缓存读取价格”
已经综合考虑了倍率因素
正常理解下，结算应直接按页面显示价格计算
不应在结算时再额外乘一次倍率

2.1 判断依据

从表中可反推出一个基础输入单价，然后通过倍率精确还原页面价格。

例如：

`gpt-4.1`

模型倍率：1
分组倍率：3
补全倍率：4
页面输入价格：¥43.8000 / 1M Tokens
页面补全价格：¥175.2000 / 1M Tokens

若基础输入价记为¥14.6 / 1M Tokens，则：

输入价格 =14.6 × 1 × 3 = 43.8
补全价格 =43.8 × 4 = 175.2

与页面完全一致。

`gpt-4o`

模型倍率：1.25
分组倍率：1
补全倍率：4
页面输入价格：¥18.2500 / 1M Tokens
页面补全价格：¥73.0000 / 1M Tokens

计算：

输入价格 =14.6 × 1.25 × 1 = 18.25
补全价格 =18.25 × 4 = 73.0

也与页面一致。

`gpt-5`

模型倍率：0.625
分组倍率：3
补全倍率：8
页面输入价格：¥27.3750 / 1M Tokens
页面补全价格：¥219.0000 / 1M Tokens

计算：

输入价格 =14.6 × 0.625 × 3 = 27.375
补全价格 =27.375 × 8 = 219.0

仍然完全一致。

2.2 最终判断

因此，这个平台价格页中：

倍率列：用于解释价格是如何折算出来的
模型价格列：已经是折算后的最终价格

3. 三种倍率的含义

根据截图，倍率大概率有三层含义：

3.1 模型倍率

模型倍率 = 某个模型相对“基础输入单价”的价格系数

它反映的是：

这个模型本身贵不贵
同样是输入 token，不同模型的基础成本不同

例如：

gpt-4.1模型倍率 =1
gpt-4o模型倍率 =1.25
gpt-5模型倍率 =0.625

可以理解为：

1：标准价格
1.25：比标准价高 25%
0.625：按标准价的 62.5% 计

3.2 分组倍率

分组倍率 = 当前令牌分组对价格的额外放大系数

它反映的是：

同一个模型，放在不同的令牌分组下，最终卖价可能不同
平台使用它来统一不同模型组、不同通道、不同令牌组的计费方式

例如之前页面左侧可见的：

deepseek 1x
default 1x
gpt 3x
claude 3x
gork 5x

这里的1x / 3x / 5x，本质上就对应“分组倍率”。

3.3 补全倍率

补全倍率 = 输出 token 相对于输入 token 的价格系数

它反映的是：

模型生成出来的 token，比输入 token 贵多少倍

例如：

gpt-4.1补全倍率 =4
gpt-5补全倍率 =8

意思是：

如果输入价格先算出来
那么输出价格 = 输入价格 × 补全倍率

4. 价格计算公式

根据截图，最合理的价格结构是：

4.1 输入价格

输入价格 = 基础输入价 × 模型倍率 × 分组倍率

4.2 补全价格

补全价格 = 输入价格 × 补全倍率

4.3 实际调用费用

若按 token 计费，则一次请求的费用可表示为：

总费用 = 输入 tokens / 1,000,000 × 输入价格 + 输出 tokens / 1,000,000 × 补全价格 + 缓存读取 tokens / 1,000,000 × 缓存读取价格 + 缓存创建 tokens / 1,000,000 × 缓存创建价格

5. 页面上的价格字段分别是什么意思

5.1 输入价格

输入价格 = 用户发给模型的 token 单价

包括但不限于：

prompt
system prompt
历史上下文
工具说明
文档内容

页面单位通常是：

¥X / 1M Tokens

即：每 100 万输入 token 的价格。

5.2 补全价格

补全价格 = 模型生成输出 token 的单价

也就是模型回答内容的价格。

通常输出 token 比输入 token 更贵，因此会设置“补全倍率”。

5.3 缓存读取价格

缓存读取价格 = 已缓存内容被重复使用时的读取成本

适用于：

固定大段系统提示词
固定文档前缀
重复使用的工具描述
长上下文模板

其价格通常低于普通输入价格。

5.4 缓存创建价格

缓存创建价格 = 首次将某段内容写入缓存时的成本

特点：

第一次可能比普通输入更贵或不同
之后复用时可按缓存读取价计费
对高频重复调用场景更有意义

6. token 与价格的计算示例

下面给出两个例子，帮助理解 token 消耗与实际费用的关系。

6.1 示例一：不带缓存

假设某模型价格如下：

输入价格：¥27.375 / 1M Tokens
补全价格：¥219.000 / 1M Tokens

一次请求消耗：

输入：10,000 tokens
输出：2,000 tokens

则：

输入费用

10,000 / 1,000,000 × 27.375 = 0.01 × 27.375 = ¥0.27375

输出费用

2,000 / 1,000,000 × 219 = 0.002 × 219 = ¥0.438

总费用

¥0.27375 + ¥0.438 = ¥0.71175

也就是说，这次调用大约消耗：

¥0.71175

6.2 示例二：带缓存

假设某模型价格如下：

输入价格：¥9.000 / 1M Tokens
补全价格：¥45.000 / 1M Tokens
缓存读取价格：¥0.900 / 1M Tokens
缓存创建价格：¥11.250 / 1M Tokens

第一次调用：创建缓存

假设：

缓存创建：30,000 tokens
新输入：5,000 tokens
输出：2,000 tokens

则：

缓存创建费用：

30,000 / 1,000,000 × 11.25 = ¥0.3375

新输入费用：

5,000 / 1,000,000 × 9 = ¥0.045

输出费用：

2,000 / 1,000,000 × 45 = ¥0.09

总费用：

¥0.3375 + ¥0.045 + ¥0.09 = ¥0.4725

第二次调用：复用缓存

假设第二次：

缓存读取：30,000 tokens
新输入：5,000 tokens
输出：2,000 tokens

则：

缓存读取费用：

30,000 / 1,000,000 × 0.9 = ¥0.027

新输入费用：

5,000 / 1,000,000 × 9 = ¥0.045

输出费用：

2,000 / 1,000,000 × 45 = ¥0.09

总费用：

¥0.027 + ¥0.045 + ¥0.09 = ¥0.162

可以看到：

第一次：¥0.4725
第二次：¥0.162

这说明：

缓存的核心作用是：首次建立有成本，但重复调用时更便宜。

7. 如何阅读这个价格页

可以按以下顺序理解：

7.1 先看模型名和供应商

确认是：

OpenAI
Anthropic
DeepSeek
Google
xAI

中的哪个模型。

7.2 再看计费类型

常见是：

按量计费：按 token 数收费
按次计费：按请求次数收费

从截图看，大多数文本模型是按量计费。

7.3 再看倍率

倍率帮助你理解：

模型本身的价格档次（模型倍率）
当前令牌分组会不会再加价（分组倍率）
输出 token 相比输入 token 贵多少（补全倍率）

7.4 最后看模型价格

最终真正需要拿来估算成本的是：

输入价格
补全价格
缓存读取价格
缓存创建价格

这些价格已是页面展示的最终折算价格。

8. 一句话总结

这个平台的价格体系可以概括为：

模型倍率：模型本身相对基础价贵多少
分组倍率：当前令牌分组再把价格放大多少
补全倍率：输出 token 相对于输入 token 贵多少
页面显示价格：已经包含倍率后的最终单价
实际计费：按页面显示价格和实际消耗 token 数量直接计算

9. 推荐对外说明模板

如果需要对用户简要解释，可使用如下表述：

本平台大多数模型采用按量计费，价格单位为“每 100 万 Tokens”。
页面展示的输入价、补全价、缓存读取价等，均为包含倍率后的最终价格。
其中模型倍率表示模型本身的价格系数，分组倍率表示令牌分组的加价系数，补全倍率表示输出 token 相对输入 token 的价格倍数。
实际费用根据输入 token、输出 token 以及缓存使用情况，按页面显示单价直接计算。

企业官网建设流程全解析

1. 说明目的

2. 结论：页面价格已经包含倍率

2.1 判断依据

`gpt-4.1`

`gpt-4o`

`gpt-5`

2.2 最终判断

3. 三种倍率的含义

3.1 模型倍率

3.2 分组倍率

3.3 补全倍率

4. 价格计算公式

4.1 输入价格

4.2 补全价格

4.3 实际调用费用

5. 页面上的价格字段分别是什么意思

5.1 输入价格

5.2 补全价格

5.3 缓存读取价格

5.4 缓存创建价格

6. token 与价格的计算示例

6.1 示例一：不带缓存

输入费用

输出费用

总费用

6.2 示例二：带缓存

第一次调用：创建缓存

第二次调用：复用缓存

7. 如何阅读这个价格页

7.1 先看模型名和供应商

7.2 再看计费类型

7.3 再看倍率

7.4 最后看模型价格

8. 一句话总结

9. 推荐对外说明模板

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

1. 说明目的

2. 结论：页面价格已经包含倍率

2.1 判断依据

gpt-4.1

gpt-4o

gpt-5

2.2 最终判断

3. 三种倍率的含义

3.1 模型倍率

3.2 分组倍率

3.3 补全倍率

4. 价格计算公式

4.1 输入价格

4.2 补全价格

4.3 实际调用费用

5. 页面上的价格字段分别是什么意思

5.1 输入价格

5.2 补全价格

5.3 缓存读取价格

5.4 缓存创建价格

6. token 与价格的计算示例

6.1 示例一：不带缓存

输入费用

输出费用

总费用

6.2 示例二：带缓存

第一次调用：创建缓存

第二次调用：复用缓存

7. 如何阅读这个价格页

7.1 先看模型名和供应商

7.2 再看计费类型

7.3 再看倍率

7.4 最后看模型价格

8. 一句话总结

9. 推荐对外说明模板

热门文章

文章分类

标签云

相关文章

如何高效激活Windows和Office：开源KMS工具的完整指南

终极指南：5步彻底解决Reloaded-II模组无限下载循环问题

别再混淆了！一文讲清RS485、TTL、UART电平与接口的本质区别

需要专业的网站建设服务？

`gpt-4.1`

`gpt-4o`

`gpt-5`