Agent才不会“赢家通吃“,证据来了……
2026/5/11 1:25:34 网站建设 项目流程

Claude Code已经赢成这样了,

顺带又做了CMA,

定义下一代企业级Agent infra。

Claude Code『同款』infra,

谁不想用。

谁又不想卖可复用的工具呢。

这样下去,

做Agent infra须有爆款Agent证明自己吗?

肯定很多人反对,

因为随着模型能力持续增强,

Harness的重要性会持续下降。

然而,我还是想说,

让Agent好好干活,

这件事的工程含量极高。

先看一个对话,

客户:

"我想做Agent,且知道做成什么样(才有用)。"

AI infra公司:

"用我的工具,你能做出最好的Agent。"

客户:

"那你拿出一个最好的Agent我看看?"

AI infra公司:

"...我们专注做工具,不做产品"

客户:

"那你怎么知道你的工具能做出好Agent?"

甚至,有更激进的观点,

如果你自己的Agent都做不好,

我凭什么用你的Agent infra?

话糙,理不糙。

更甚者口喷,卖Agent infra的公司,

自家做不出像样的Agent,

你的工具肯定有缺陷。

话糙,理不糙。

这话有理性之处,

因为Agent这件事的复杂度极高,

光看公司品牌部门『捏造的材料』根本判断不了,

只有看你自己做出来的产品,

才能验证你的工具到底能不能用。

而且阵营也有不同,

第一阵营:

有自家爆款Agent,也做Agent infra。

Anthropic公司有爆款ClaudeCode。

反例一下就能找出来。

第二阵营:

LangChain(LangGraph);

Agent框架,但没有自家的爆款Agent代表作;

当然,还有很多Agent框架创业公司。

不过,最近,我观察,又跑出了第三阵营。

一个垂直的科研智能体,Kosmos。

Kosmos是一个极其强的,

垂直Agent案例,

且推到了让Anthropic和OpenAI这些公司,

尤其其通用Agent infra团队都该警惕的位置。

Kosmos的强大,有哪些关键事实?

第一,一次运行能读1500篇论文,

跑42000行分析代码,

在数千万token上保持研究目标的连贯性。

简直令我震惊。

第二,79.4%结论准确率,

Beta用户估计一次运行,

能干完科学家6个月的工作

已经做出7项科学发现,3项重现已有发现,

4项是真实的新贡献,

还包括神经科学、材料科学、统计遗传学。

这也太能干了。

第三,按次收费,不是订阅,

定价200美元/run。

什么是run?

你给它一个研究目标,

它从头到尾跑一遍12 小时的研究循环,

这一整次叫一个"run"。

反正都『自主研究』了,

收费模式也得跟上,

卷王用得强度大,躺平用得少,

订阅费明显不适合;

要我说,钱数简直逆天了。

Agent行业普遍按订阅收费,常见几十美元。

Claude Code月费也才200美元。

为什么敢这么定价?

因为它产出的价值实在太高。

不是自动发个邮件,省5分钟,

自动跑个报销省15分钟,

发个小红书省20分钟,

而这是"替代掉一个专业团队,

几个月的高价值工作"。

Kosmos给所有Agent公司,

一个教科书级别的示范。

打破了Agent收费的天花板。

这个例子,直接验证了前面那个激进观点,

Kosmos背后这家公司(Edison Scientific),

不是先做Agent infra再做Agent,

它是先做出Agent:

"能干6个月科学家活儿"的,

再用这个Agent来证明自己的能力。

爆款是给客户"用你工具能做到什么程度"的证据。

成功归成功,再聊,更深一层的事。

一个是硬科技技术含量,

一个是开辟新赛道。

Kosmos的核心创新是,

"structured world models",

中文是,结构化世界模型,

它发明了一套机制,

让Agent能在数千万token的context上,

保持研究目标的连贯。

结构化世界模型。

这个东西,

是Kosmos团队在科学发现,

这个垂直场景里硬卷出来的。

可理解为,"外部结构化数据库",

这是通用Agent里没有的能力,

是科学实体,关系,

实验结果,未解问题的数据库。

原理很简洁,

不是把所有信息塞进一个超长context,

而是把信息结构化,

存进一个外部数据库(worldmodel),

Agent每次只查相关的部分塞进context,

解决的是LLM之外的问题。

是一个"科考笔记本"系统。

这个需求来自于科学研究的,上下文规模特别大,

动不动读1500篇论文,跑42000行代码。

不仅巨大,而且,需结构化关联,

不是简单的"我之前说过什么"的好记忆力,

而是"基因A和疾病B的关系"这种知识图谱,

总有人说:

"做模型才牛,做Agent就是套个壳";

这个观点大错特错。

Kosmos的"structured world model",
这个零件,

技术门槛极高,

是垂直Harness,

是专为科学研究设计的Harness。

再者,有人只看到Kosmos是产品,

没看到它背后,是一个完整的双层体系:

"Agent产品+Agent infra"。

第一层,Agent产品,子Agent专家团队。

专家不再围观,而是任务专用。

专家Crow:文献问答

专家Falcon:深度文献综述

专家Owl:重复性检查

专家Phoenix:化学实验设计。

这四个Agent,每个都是一个独立的产品。

当然,还有旗舰产品Kosmos。

有产品,收费变现就方便了;

第二,Agent infra其实有两件,

一个开源,一个闭源,

开源框架PaperQA2是Agentic RAG引擎,

吸引研究社区使用,贡献,

反馈,建立技术口碑,

前面讲了,"structured world model",

技术门槛极高。

这玩意肯定闭源了。

所以,Kosmos是经典的,

"开源拉新+闭源变现"策略。

且做了非常聪明的边界:

名称

是否开源

作用

框架:

PaperQA2

开源

做生态

专家智能体:

1.Crow

2.Falcon

3.Owl

闭源

API访问

平台模式

旗舰智能体:

Kosmos

闭源

商业化主力

看出来了吧,Kosmos不只是"垂直爆款Agent",

它是"infra+垂直爆款"的完整一体。

肯定还有不出来的Harness设计。

所有四个专家Agent和智能体Kosmos,

都跑在这套infra之上。

很显然,

当Harness设计出真正的领域创新时,

产品差异化是真实的,巨大的。

所以,Agent infra的护城河,可以是

"针对垂直场景做出独特的Harness零件"。

一个Agent产品公司,

顺手开源了部分infra来做生态。

纯粹做Agent infra的公司,

也就是,只卖工具,不做产品;

目前的商业回报,普遍不如做产品的。

结论很有意思:

Agent infra可能不会"赢家通吃",

反而是通用和垂直并存的格局。

One More Thing

Kosmos这种深耕垂直的Agent,

可能正在另开一个赛道,

这个赛道是Anthropic和OpenAI这种公司,

其通用Agent infra 覆盖不到的。

Kosmos这种垂直爆款,或者说科研爆款,

只对外强调"Agent能力+科学发现质量"。

而且,拿走最多价值,

模型公司只能拿到底层token那一块。

当垂直Agent产品做到Kosmos这样,

它有资格成为模型层的上游,且是议价方。

这Agent时代,

模型公司尴尬处境又多了一个,

要是做不出好的Agent,

那就等着被强大的Agent变成无感层。

当Agent和Harness创新足够强时,

模型回归"水电"。

水电谁都能买,模型谁都能换;

当然,水电也有利润,还不低,

只是利润空间被价值链上游压住了天花板。

《AI产品和技术模块》

1.Kimi Agent产品很厉害,然后呢?

2.搞懂“记忆”必看|吃透Engram,坐等Deepseek新模型

3.实属踩踏了?深水炸弹Seedance掩盖Seed2.0

4.少瞎吹系列:AI智能体基础,infra就不基础

5.Harness内心OS:大模型只管想,剩下烂摊子全我的

6."纠缠软件"是什么?Agent?还是Harness?

7.排行榜是别人的,手感是自己的:Kimi K2.6体感报告

《具身智能》

1.“26年具身智能,根本做不过来”:含陶大程教授独家

2.漫画:大模型“强控”具身智能机器人?

《AI+医疗》

1.独家深度丨夸克健康大模型调研报告

2.熬夜三年肝损害,AI博主也靠AI学“续命”医学知识

3.为什么AI能预警心脏主动脉“血管炸弹”?

4.对话作者:全球首个开源手术视频大模型SurgMotion(第一期)

《AI底层系列》

1.对抗NVLink简史?10万卡争端,英伟达NVL72超节点挑起

2.英伟达:『照抄者死』,阿里华为:AI集群狂飙『全解耦』

3.阿里华为『血战』英伟达AI超节点:悲观者正确,乐观者赚钱

4.抢在英伟达护城河合拢前,硅光的冲刺与最后窗口

5.OCP现场 l 北美AI巨头罕见共识ESUN,为利益『握手』

6.为什么有些『闪断的锅』,硅光不背?

7.为了Token,阿里云竟然出了一个TPN?

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询