AI成本通缩但账单变贵,中美争夺塔尖,赌AI不可替代性能维持多久?
2026/6/16 5:02:04 网站建设 项目流程

AI成本通缩但账单变贵:中美争夺塔尖,赌AI不可替代性能维持多久?

Django框架联合创始人Simon Willison,或许是当下世界上对Claude Code和Codex了解最深的开发者之一。过去30天,他消耗了价值2180.16美元的token,实际却仅支付了200美元。许多人看到的是其中的划算,而Simon关注的却是另一件事——这种便宜正在逐渐消失。

OpenAI已将Codex从按消息估算改回按token计费;Anthropic虽未提高Opus 4.7的挂牌价格,却通过新的tokenizer让同样文本最多多切35% token。以往被平台补贴掉的那部分成本,正一点点回到用户账单上。对Simon而言,这意味着一个具体变化:过去200美元能烧掉2000多美元token的日子,正在成为历史,且不会再成为长期模式。未来某一天,他消耗的那2180美元,很可能真的需要支付2180美元。

这对任何重度开发者来说,都不是个轻松的消息。而且,这件事几乎不可避免。企业已率先感受到这种变化。据The Information报道,Uber进入2026年没几个月就烧穿了全年AI预算,主因是Claude Code。4月23日,OpenAI发布GPT - 5.5,输入和输出价格从GPT - 5.4的2.5/15美元提高到5/30美元;Anthropic虽维持Opus 4.7的挂牌价格不变,但Willison估算其有效成本约为Opus 4.6的1.4倍。一个明涨,一个暗涨。

仅看这些新闻,很容易得出“AI越来越贵了”的结论。但问题是,这个结论与过去几年最重要的研究结果相悖。a16z合伙人Guido Appenzeller给这条曲线起过一个名字:LLMflation。2021年,每百万token 60美元的GPT - 3级能力,如今只需0.06美元。武汉大学Mingdeng Du团队今年3月统计OpenRouter 318个模型和Epoch AI 3237条记录后发现,过去六年,token价格整体下降约600倍。经济档模型价格半衰期只有1.10年,中档模型1.55年,都快过摩尔定律。若只看成本,如今的大模型行业根本不像在涨价,更像是在经历一场历史罕见的通缩。

于是问题来了:如果成本在下降,账单为何越来越贵?很多讨论把企业今天付的两笔钱混为一谈,所以永远算不明白这笔账。

第一笔钱:AI开始真正干活

Claude Code修一个Bug,并非在聊天框里简单回答问题。它要读取代码仓库、分析依赖关系、调用工具、运行测试、理解报错,再把结果送回模型推理。用户最后看到的可能只是几百行代码改动,背后却消耗了几十万token。推理模型也是如此,行业测算显示,一些复杂推理任务里,模型内部消耗的token可达最终输出的几十倍甚至上百倍。所以Uber的预算失控,未必意味着浪费,也可能意味着AI开始真正干活了。

过去几年,人们习惯把大模型当作搜索引擎、聊天机器人或写作助手。如今,越来越多企业将其当作工程师、分析师、运营人员和客服团队使用。任务变复杂了,消耗自然会上升。就像买法拉利的人不会抱怨油耗,不是不在乎钱,而是买法拉利就是为了其性能。如今很多Agent任务也是如此,代码审查、复杂运维、金融分析、合同审核等场景中,顶级Agent和顶级模型往往绑定。当然可以换一个便宜五倍的模型,但结果很可能大打折扣。这部分钱买的是能力,并没有白花。

第二笔钱:塔尖模型的稀缺性

如果故事到此结束,结论会很简单:AI更能干了,所以更贵了。但问题恰恰出在这里。过去几年最重要的研究结果表明,AI并没有变贵,而是在经历前所未有的降价。很多人记住了武汉大学论文里六年降价600倍这组数字,真正值得关注的却是那条没有降下来的曲线。

论文对模型分层后发现,经济档和中档模型都在沿着同一条轨迹下滑,能力越来越普及,价格越来越接近成本。若故事到此结束,AI最终会变成一种标准化商品,就像云服务器、电力或带宽。但偏偏有一部分模型不遵守这个规律,论文对旗舰模型价格做指数拟合,得到的R²只有0.031,也就是说,降价规律到这里几乎失效。与此同时,推理模型相对于普通模型还存在平均31.5倍溢价,这不是统计误差,而是市场结构。普通能力越来越便宜,不可替代的能力却没有。

OpenAI提高GPT - 5.5的价格,Anthropic通过tokenizer提高Opus 4.7的有效价格,都发生在这条曲线之外。于是出现一个有意思的现象:同样是token,有些正在迅速商品化,价格越来越接近成本;有些正在迅速硬通货化,价格越来越接近稀缺性。这也是GPT - 5.5和DeepSeek可以同时存在且都合理的原因,前者卖的是当前最强能力,后者卖的是已被验证、正在扩散的能力,两者在AI市场中遵循不同的定价原则。

塔尖的价值

既然顶级模型最终都会扩散,今天的GPT - 5.5迟早会变成明天的普通能力,为何还有人拼命往塔尖冲?因为塔尖最大的价值,从来不是卖贵,而是定义什么叫先进。

汽车行业就是如此,一辆5万元的车和一辆500万元的车都能把人从A点送到B点,后者更贵,但豪车存在的意义不只是让富人消费。ABS、ESP、主动安全、智能驾驶等很多后来成为行业标配的东西,最早都出现在最贵的那批车上,等技术成熟,再进入更大的市场。豪车赚到的钱是一方面,更重要的是,它定义了行业下一步的走向。

AI也是如此,最新的架构、最长的上下文、最复杂的推理链、最激进的训练方法,都会首先出现在塔尖模型里。它们中的绝大多数会失败,少数成功的部分再被蒸馏、压缩、工程化,最后进入更便宜的产品。塔尖提价不是为了卖得更贵,而是稀缺性和不可替代性本身就是最刚性的价格支撑。只要一个模型代表当前最先进能力,其价格就不再完全由成本决定,而是由有多少人需要它以及有多少人能够替代它决定。这也是美国前沿模型公司真正捍卫的东西,不是某一个版本,而是“最先进模型”这个位置本身。

中美之争

美国以全球AI创新第一策源地自居,无论是否认可这个说法,至少在当下,它仍掌握着最强闭源模型、最强商业化产品和最强融资能力。既然掌握这个位置,价格自然不会跟着成本一起跌,因为它卖的不是token,而是不可替代性。美国前沿收的那笔钱不是利润,而是赌注的本金。SpaceX的S - 1招股文件显示,Anthropic自2026年5月起向它采购COLOSSUS与COLOSSUS II的算力,合约到2029年5月,每月最高约12.5亿美元,而这只是它供应商名单里的一家。从价格与成本那道缝里挤出来的钱,转手投入机房。这种承诺成立的前提是:它赌自己手里那点不可替代性,未来几年不会崩塌。

中国押的也是同一道题,只是方向不同。很多人把中国模型理解成低价路线,这是一种误读。如果只是低价,中国不会出现DeepSeek的百亿美元融资,不会出现智谱持续冲击更强编码能力,也不会出现腾讯混元结束两年单边降价、重新提高API价格。中国企业同样在争夺塔尖,因为没有人愿意永远接受别人的价格锚点。

真正的区别在于,中国更相信技术扩散。DeepSeek把V4 - Pro永久降到原价四分之一,百万token输入输出合计约5.27美元,是GPT - 5.5的七分之一、Claude Opus 4.7的六分之一,同时推进约100亿美元融资。小米MiMo - V2.5系列永久降价,最高降幅99%。火山引擎披露,豆包大模型日均token已突破120万亿,三个月翻倍。这些动作背后不是简单的价格战,而是一种产业判断。

过去二十年,中国最成功的产业几乎都遵循同一条路径,新能源车、动力电池、光伏皆是如此。先追赶最先进技术,再把先进技术工程化、规模化、商品化,最后把原本属于少数人的能力带进大众市场。AI正在重复这条路径。塔尖固然重要,但最大的市场从来不在塔尖。中国赌的是,塔尖能力扩散的速度会快于塔尖收租的速度,而这道墙现在有多厚,没人知道。智谱4月7日开源的GLM - 5.1,编程能力达到Claude Opus 4.6的94.6%,MIT协议商用零限制,训练全程跑华为昇腾、没有一张英伟达卡。

今天这场看似在争论token价格的较量,争的不是价格,而是AI的不可替代性还能维持多久。美国赌的是这道墙足够厚,中国赌的是这道墙会越来越薄。等答案揭晓,两边的下注里,必有一笔成为再也收不回的沉没成本。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询