2026年6月10日,Anthropic CEO Dario Amodei发表了一篇题为《AI指数级发展政策》(Policy on the AI Exponential)的长文,直指一个正在加速逼近的核心矛盾:**AI能力的指数级增长,与传统政策制定流程之间,已经形成了一道危险的"时差鸿沟"**。
这道鸿沟有多宽?Amodei在文章中以亲身经历佐证:几年前,AI模型连一句连贯的代码都写不出来;到2026年,Anthropic自己的Claude Mythos Preview已经能在每个主流操作系统和浏览器中发现数千个高危漏洞。再过一两年,AI就有可能进化成一个"数据中心里的天才国度"。而在国会需要数年时间才能完成立法的周期里,AI早已从"一个有趣的玩具",升级成了"汇聚天才的国度"。
面对这种根本性的速度错配,Amodei提出的方案不再是过去的自愿披露和自律——他明确表示,**"透明度已经不够用了,我们需要更严肃、更具约束力的监管"**。
与此同时,文章发布的时间点也耐人寻味。就在前一天,Anthropic刚刚发布了新一代旗舰模型Claude Fable 5和Mythos 5——这是他们史上最强、同时也是风险最高的公开模型。换句话说,Amodei一边警告"自家模型也很危险",一边加快了商业化步伐。这种"两条腿走路"的姿态,也正是理解这份政策文件的核心视角之一。
一、两大框架:从"防止失控"到"谁买单"
整份政策文件的核心,由两个相辅相成的政策框架构成,覆盖了AI治理的一体两面:技术安全和经济分配。
🔒 先进AI框架:给政府"叫停"的权力
先进AI框架(Advanced AI Framework),是整份文件中最具冲击力的部分。Amodei明确呼吁:当某个前沿AI模型在强制性安全测试中不过关时,美国政府应当拥有合法的权力来阻止或撤回其部署——而且这种权力,超越了现行法律和国会已有提案所赋予的一切权限。
具体而言,Anthropic建议监管应当覆盖四类"灾难性风险":
生物风险:AI加速药物研发的能力,同样可能被恶意利用,让攻击者以更低的成本和门槛研发生物武器。
网络风险:前沿AI模型已具备大规模发现高危软件漏洞的能力,关键基础设施如医院和能源网络面临前所未有的防护压力。
失控风险:当AI系统越来越强大,它们可能出现超出开发者控制之外的行为。
自动化研发:AI正在自动化AI本身的研发,这反过来又会加速前三类风险。
这些监管规则并非普适——它们只适用于训练算力超过10²⁵次浮点运算的模型,或者由AI业务年收入超过5亿美元/年研发投入超10亿美元的公司开发的模型。换句话说,Amodei的目标非常明确:只监管最强大的模型和最头部的大厂。
监管模式上,Amodei直接将AI与航空业类比:"前沿AI模型,就像飞机一样,必须经过技术测试和审计;如果它们达不到高标准的安全要求,政府应当像FAA叫停不安全飞机那样,阻止或撤销它们的发布。"
此外,考虑到加州、科罗拉多等多个州已经出台了各自的AI监管法律,Anthropic明确表示:除非国会能制定出至少与自身提案同等力度的联邦法律,否则联邦政府不应架空各州已立法的监管规则。这种"至少不比州法弱"的立场,既是对企业层级监管呼声的呼应,也是对联邦层面立法缓慢的现实警觉。
💼 经济政策框架:AI取代工作后,谁负责?
如果说先进AI框架回答的是"如何防止AI干坏事",那么经济政策框架(Economic Policy Framework)回答的则是"AI干了很多工作之后,人怎么办"。
Amodei敦促国会和各州政府,对失业保险制度进行现代化改革,以应对大规模失业的现实前景。他认为长期的AI性失业不只是一件"不理想"的事,而且本身就是一种危险,因此建议考虑全民基本收入和就业激励等收入支持措施。
与这一框架相配套,Anthropic宣布提供3.5亿美元的新资金,用于支持劳动力转型和再培训等相关项目。
二、暂停机制:协调而非单边投降
除了上述两大框架之外,Anthropic还抛出了一个更具争议性的设想:行业应当建立协调机制,在风险过高时集体暂停或延缓前沿AI的开发。
这一提议的核心逻辑在于:过去Anthropic一直采用"单方面暂停"的方式,但如果只有自己停下、而竞争对手继续狂奔,这种自我约束在商业上难以为继。因此,只有在全球头部AI实验室之间建立起可验证的、可信的"协调性"暂停——确保没有"坏玩家"借机偷跑——这一机制才可能真正落地。
这一构想与Anthropic在今年2月对自身《负责任扩展政策》(Responsible Scaling Policy,RSP)的大幅修订一脉相承。在RSP 3.0中,Anthropic正式删除了此前标志性的"if-then"单边暂停条款,转而将安全承诺拆分为两大部分:(1)无论外界情况如何,自己都能确保履行的承诺;(2)需要行业与政府协同推进的建议方案。
简单来说,Anthropic从"我一个人停下来"转向了"要停大家一起停"——这不仅是一种战略调整,也是对公司自身商业可行性的务实考量。
三、争议与回声:真诚呼吁还是"战略性渲染焦虑"?
这份政策文件一经发布,便引发了截然不同的两极反应。
支持方:先行者的自省
包括著名AI学者Andrej Karpathy在内的支持者认为,Anthropic正视自身产品的风险、主动推动具有约束力的政府监管,是行业领导力的体现。尤其值得称道的是,Anthropic在迭代《负责任扩展政策》时,坦率承认了过去RSP 1.0和2.0的局限——能力阈值的模糊性和单方执行的不可行性——并据此重构了框架。这种"自我否定"式的坦诚,在AI公司中极为罕见。
质疑方:企业利益的自利包装?
批评者的声音同样尖锐。有观点认为,Amodei的文章并非技术报告,更像是一场精心包装的战略公关——通过渲染"AI太危险",为大厂的竞争优势和IPO估值制造有利叙事。不少网友直接将其类比为"现代版的《不扩散核武器条约》",指出渲染焦虑、囤积资源本身就是一种争夺主导权的策略。
OpenAI对此也发表了措辞谨慎的声明,强调"决定AI创新节奏的决定,不应由任何一家实验室、公司或特殊利益集团做出",而是应当由"民主政府——而非私营公司——最终制定规则"。
更尖锐的批评点在于:Anthropic在2026年2月才刚删除了自家的单边安全红线,两个月后又高调发布一篇呼吁行业暂停的论文——这在部分观察者眼中,构成了明显的前后矛盾,难免让人对政策主张的真实诚意打上问号。
还有一点不容忽视:Anthropic本身正在与OpenAI竞速IPO,估值有望接近1万亿美元。在这样一个敏感节点,主动推动监管,究竟是出于安全伦理驱动,还是意在抬高行业准入门槛、限制竞争对手的发展空间?这个问题,有待时间去回答。
四、双重责任:企业还在往前走
尽管争议不断,但从实践来看,Anthropic确实在一边"呼吁刹车",一边继续高速前进。就在政策文件发布前一天,他们发布了史上最强的商用模型Claude Fable 5;而其内部研究机构也已承诺,将与行业合作探索可行的暂停机制。
面对外界"言行不一"的质疑,Amodei的回答颇具深意。在被问及是否将自己类比为"AI界的奥本海默"时,他的回应显得克制而清醒:
"奥本海默被视为一个失败者,是一个本不应存在的案例。要实现一个好的结果,制度必须有制衡。"
这句话,或许也恰好点明了《AI指数级发展政策》背后最核心的态度:没有人能单方面决定AI的未来,越是强大的技术,越需要它之外的制衡力量。
五、写在最后:AI跑在政策前面,然后呢?
《AI指数级发展政策》之所以重要,不是因为它已经给出了最终答案,而是因为它让人们意识到:AI能力与监管之间的差距,已经从"理论担忧"变成了"实际风险"。
从赋予政府"阻止危险模型发布"的法理权,到推动劳动力市场的结构性变革,再到呼吁全球AI行业建立协调性的暂停机制——Amodei的每一条建议,都同时牵动着技术可行性、经济成本、政治意志和国际信任等多重变量,而这些变量之间往往存在深层矛盾。
AI发展的速度还在继续加快。当它可以自主发明新的科学理论、自主提升自己的智能、自主决定攻击还是防御时,我们今天所讨论的这些框架,是否仍足够有效?政策文件里没有给出最终答案,但至少,它把一个迫切的问题清晰地摆上了桌面:当火车跑得比轨道铺设快得多的时候,我们还有多少时间来做决策?
获取更多AI咨询、一人公司、创业读书笔记、Openclaw、Claude Code实战干货,欢迎关注我「Rubin智造社」