AI成本通缩但账单变贵，中美争夺塔尖，赌AI不可替代性能维持多久？-创锋一号

AI成本通缩但账单变贵：中美争夺塔尖，赌AI不可替代性能维持多久？

Django框架联合创始人Simon Willison，或许是当下世界上对Claude Code和Codex了解最深的开发者之一。过去30天，他消耗了价值2180.16美元的token，实际却仅支付了200美元。许多人看到的是其中的划算，而Simon关注的却是另一件事——这种便宜正在逐渐消失。

OpenAI已将Codex从按消息估算改回按token计费；Anthropic虽未提高Opus 4.7的挂牌价格，却通过新的tokenizer让同样文本最多多切35% token。以往被平台补贴掉的那部分成本，正一点点回到用户账单上。对Simon而言，这意味着一个具体变化：过去200美元能烧掉2000多美元token的日子，正在成为历史，且不会再成为长期模式。未来某一天，他消耗的那2180美元，很可能真的需要支付2180美元。

这对任何重度开发者来说，都不是个轻松的消息。而且，这件事几乎不可避免。企业已率先感受到这种变化。据The Information报道，Uber进入2026年没几个月就烧穿了全年AI预算，主因是Claude Code。4月23日，OpenAI发布GPT - 5.5，输入和输出价格从GPT - 5.4的2.5/15美元提高到5/30美元；Anthropic虽维持Opus 4.7的挂牌价格不变，但Willison估算其有效成本约为Opus 4.6的1.4倍。一个明涨，一个暗涨。

仅看这些新闻，很容易得出“AI越来越贵了”的结论。但问题是，这个结论与过去几年最重要的研究结果相悖。a16z合伙人Guido Appenzeller给这条曲线起过一个名字：LLMflation。2021年，每百万token 60美元的GPT - 3级能力，如今只需0.06美元。武汉大学Mingdeng Du团队今年3月统计OpenRouter 318个模型和Epoch AI 3237条记录后发现，过去六年，token价格整体下降约600倍。经济档模型价格半衰期只有1.10年，中档模型1.55年，都快过摩尔定律。若只看成本，如今的大模型行业根本不像在涨价，更像是在经历一场历史罕见的通缩。

于是问题来了：如果成本在下降，账单为何越来越贵？很多讨论把企业今天付的两笔钱混为一谈，所以永远算不明白这笔账。

第一笔钱：AI开始真正干活

Claude Code修一个Bug，并非在聊天框里简单回答问题。它要读取代码仓库、分析依赖关系、调用工具、运行测试、理解报错，再把结果送回模型推理。用户最后看到的可能只是几百行代码改动，背后却消耗了几十万token。推理模型也是如此，行业测算显示，一些复杂推理任务里，模型内部消耗的token可达最终输出的几十倍甚至上百倍。所以Uber的预算失控，未必意味着浪费，也可能意味着AI开始真正干活了。

过去几年，人们习惯把大模型当作搜索引擎、聊天机器人或写作助手。如今，越来越多企业将其当作工程师、分析师、运营人员和客服团队使用。任务变复杂了，消耗自然会上升。就像买法拉利的人不会抱怨油耗，不是不在乎钱，而是买法拉利就是为了其性能。如今很多Agent任务也是如此，代码审查、复杂运维、金融分析、合同审核等场景中，顶级Agent和顶级模型往往绑定。当然可以换一个便宜五倍的模型，但结果很可能大打折扣。这部分钱买的是能力，并没有白花。

第二笔钱：塔尖模型的稀缺性

如果故事到此结束，结论会很简单：AI更能干了，所以更贵了。但问题恰恰出在这里。过去几年最重要的研究结果表明，AI并没有变贵，而是在经历前所未有的降价。很多人记住了武汉大学论文里六年降价600倍这组数字，真正值得关注的却是那条没有降下来的曲线。

论文对模型分层后发现，经济档和中档模型都在沿着同一条轨迹下滑，能力越来越普及，价格越来越接近成本。若故事到此结束，AI最终会变成一种标准化商品，就像云服务器、电力或带宽。但偏偏有一部分模型不遵守这个规律，论文对旗舰模型价格做指数拟合，得到的R²只有0.031，也就是说，降价规律到这里几乎失效。与此同时，推理模型相对于普通模型还存在平均31.5倍溢价，这不是统计误差，而是市场结构。普通能力越来越便宜，不可替代的能力却没有。

OpenAI提高GPT - 5.5的价格，Anthropic通过tokenizer提高Opus 4.7的有效价格，都发生在这条曲线之外。于是出现一个有意思的现象：同样是token，有些正在迅速商品化，价格越来越接近成本；有些正在迅速硬通货化，价格越来越接近稀缺性。这也是GPT - 5.5和DeepSeek可以同时存在且都合理的原因，前者卖的是当前最强能力，后者卖的是已被验证、正在扩散的能力，两者在AI市场中遵循不同的定价原则。

塔尖的价值

既然顶级模型最终都会扩散，今天的GPT - 5.5迟早会变成明天的普通能力，为何还有人拼命往塔尖冲？因为塔尖最大的价值，从来不是卖贵，而是定义什么叫先进。

汽车行业就是如此，一辆5万元的车和一辆500万元的车都能把人从A点送到B点，后者更贵，但豪车存在的意义不只是让富人消费。ABS、ESP、主动安全、智能驾驶等很多后来成为行业标配的东西，最早都出现在最贵的那批车上，等技术成熟，再进入更大的市场。豪车赚到的钱是一方面，更重要的是，它定义了行业下一步的走向。

AI也是如此，最新的架构、最长的上下文、最复杂的推理链、最激进的训练方法，都会首先出现在塔尖模型里。它们中的绝大多数会失败，少数成功的部分再被蒸馏、压缩、工程化，最后进入更便宜的产品。塔尖提价不是为了卖得更贵，而是稀缺性和不可替代性本身就是最刚性的价格支撑。只要一个模型代表当前最先进能力，其价格就不再完全由成本决定，而是由有多少人需要它以及有多少人能够替代它决定。这也是美国前沿模型公司真正捍卫的东西，不是某一个版本，而是“最先进模型”这个位置本身。

中美之争

美国以全球AI创新第一策源地自居，无论是否认可这个说法，至少在当下，它仍掌握着最强闭源模型、最强商业化产品和最强融资能力。既然掌握这个位置，价格自然不会跟着成本一起跌，因为它卖的不是token，而是不可替代性。美国前沿收的那笔钱不是利润，而是赌注的本金。SpaceX的S - 1招股文件显示，Anthropic自2026年5月起向它采购COLOSSUS与COLOSSUS II的算力，合约到2029年5月，每月最高约12.5亿美元，而这只是它供应商名单里的一家。从价格与成本那道缝里挤出来的钱，转手投入机房。这种承诺成立的前提是：它赌自己手里那点不可替代性，未来几年不会崩塌。

中国押的也是同一道题，只是方向不同。很多人把中国模型理解成低价路线，这是一种误读。如果只是低价，中国不会出现DeepSeek的百亿美元融资，不会出现智谱持续冲击更强编码能力，也不会出现腾讯混元结束两年单边降价、重新提高API价格。中国企业同样在争夺塔尖，因为没有人愿意永远接受别人的价格锚点。

真正的区别在于，中国更相信技术扩散。DeepSeek把V4 - Pro永久降到原价四分之一，百万token输入输出合计约5.27美元，是GPT - 5.5的七分之一、Claude Opus 4.7的六分之一，同时推进约100亿美元融资。小米MiMo - V2.5系列永久降价，最高降幅99%。火山引擎披露，豆包大模型日均token已突破120万亿，三个月翻倍。这些动作背后不是简单的价格战，而是一种产业判断。

过去二十年，中国最成功的产业几乎都遵循同一条路径，新能源车、动力电池、光伏皆是如此。先追赶最先进技术，再把先进技术工程化、规模化、商品化，最后把原本属于少数人的能力带进大众市场。AI正在重复这条路径。塔尖固然重要，但最大的市场从来不在塔尖。中国赌的是，塔尖能力扩散的速度会快于塔尖收租的速度，而这道墙现在有多厚，没人知道。智谱4月7日开源的GLM - 5.1，编程能力达到Claude Opus 4.6的94.6%，MIT协议商用零限制，训练全程跑华为昇腾、没有一张英伟达卡。

今天这场看似在争论token价格的较量，争的不是价格，而是AI的不可替代性还能维持多久。美国赌的是这道墙足够厚，中国赌的是这道墙会越来越薄。等答案揭晓，两边的下注里，必有一笔成为再也收不回的沉没成本。

企业官网建设流程全解析

AI成本通缩但账单变贵：中美争夺塔尖，赌AI不可替代性能维持多久？

第一笔钱：AI开始真正干活

第二笔钱：塔尖模型的稀缺性

塔尖的价值

中美之争

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

AI成本通缩但账单变贵：中美争夺塔尖，赌AI不可替代性能维持多久？

第一笔钱：AI开始真正干活

第二笔钱：塔尖模型的稀缺性

塔尖的价值

中美之争

热门文章

文章分类

标签云

相关文章

内置锁设计全解析：从机械原理到智能锁DIY实战指南

Proface GP-Pro EX 409汉化包：官方与民间资源解析及安全安装指南

Codex CLI三步配置法：认证可信化→配置结构化→模式场景化

需要专业的网站建设服务？