林俊旸创业了!一个“Qwen负责人”头衔值135亿
2026/5/14 16:08:54 网站建设 项目流程

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【顶会/顶刊】投稿交流群

添加微信号:CVer2233,小助手拉你进群!

扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用!发论文/搞科研/涨薪,强烈推荐!

梦晨 发自 凹非寺
转载自:量子位(QbitAI)

离职阿里后,前千问大模型负责人林俊旸的最新动态曝光了。

他的下一步,是创业

具体公司还不知道名字,但据说种子轮目标估值已经高达20亿美元(约135亿元人民币)。

根据The Information消息,两家知名投资机构被曝就投资事宜与该实验室进行深入洽谈。

对于一家还没发产品的中国AI初创公司而言,这一估值,几乎没有先例。但相比林俊旸之前同台竞速的硅谷同行,不算贵

Qwen负责人,还是太有含金量了。

Qwen前负责人创业

林俊旸2019年加入阿里,早期研究方向集中在搜索、推荐场景下的自然语言处理和多模态建模。

2020年起,他开始投身大规模预训练模型研究与部署。

此后,他深度参与M6等超大规模预训练模型工作。M6是阿里早期最有代表性的多模态大模型项目之一。

2022年以后,他转向通用大模型方向。

Qwen项目成立后,林俊旸成为技术负责人,带队打造Qwen系列大语言与多模态模型,并主导开源工作。

Qwen后来变成了阿里AI对外最清晰的技术名片之一。

它有不同尺寸的模型,有面向开发者的开源路线,也有持续更新的多模态、代码和轻量化模型版本。对开发者来说,Qwen是真正能下载、能微调、能部署、能二次开发的实用模型。

这也是他创业备受关注的底层原因。

那么,林俊旸下一步到底想做什么?

在有具体消息之前,还可以从他离职后发的一篇长文寻找线索。

首篇长文给出线索:Agentic Thinking

林俊旸离职后的首篇长文,标题为《From “Reasoning” Thinking to “Agentic” Thinking》。

这是他对过去一年模型竞争的复盘,也像是下一阶段创业方向的技术宣言。

他的判断可以压缩成一句话:

上一阶段的AI竞争,是让模型更会思考;下一阶段的竞争,是让模型为了行动而思考。

思考模型花更多推理算力,强化学习得到更稳定的反馈,数学、代码、逻辑等可验证任务成为核心训练场景。

但林俊旸认为,问题已经开始变了。

尤其是在代码和智能体工作流里,真正重要的是代码库导航、计划拆解、错误恢复、工具编排,以及长时间执行任务的质量。

这就引出全文核心概念:Agentic Thinking。

林俊旸把它定义为一种“为了行动而思考”的能力。它不只是让模型在回答前想更久,而是让模型在环境里行动、观察反馈、修正计划,再继续推进。

推理浪潮的第一阶段确立了一件重要的事:

当反馈信号可靠且基础设施能够支撑时,语言模型之上的RL可以产出质的飞跃式的认知能力。

更深层的转变是从推理式思考到智能体式思考:

从想得更久,到为了行动而想。训练的核心对象已经改变了——它变成了模型+环境的系统,或者更具体地说,是智能体和围绕它的编排框架。

这改变了哪些研究要素最重要:

模型架构和训练数据当然仍然重要,但环境设计、轨迹采样基础设施、评估器鲁棒性、以及多智能体之间的协调接口同样关键。

这也改变了“好的思考”的定义:

最有用的轨迹,是能在真实世界约束下维持有效行动的那个——而非最长或最醒目的那个。

这也改变了竞争优势的来源:

在推理时代,优势来自更好的RL算法、更强的反馈信号和更可扩展的训练流水线。

在智能体时代,优势将来自更好的环境、更紧密的训练-推理耦合、更强的编排工程,以及在模型的决策与这些决策产生的后果之间实现闭环的能力。

One More Thing

自林俊旸发长文探讨Agentic Thinking后,个人社交媒体账号就没在发声。

不过转发了一条持续学习基准测试的消息。

难道与创业方向相关?

参考链接:
[1]https://x.com/jingyanghk/status/2054450088400093359

本文系学术转载,如有侵权,请联系CVer小助手删文

何恺明在MIT授课的课件PPT下载

在CVer公众号后台回复:何恺明,即可下载566页课件PPT!大家赶紧学起来!

CVPR 2026 所有论文和代码下载

在CVer公众号后台回复:CVPR2026,即可下载CVPR 2026 所有论文和代码!

CV垂直方向和论文投稿交流群成立

扫描下方二维码,或者添加微信号:CVer2233,即可添加CVer小助手微信,便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。 一定要备注:研究方向+地点+学校/公司+昵称(如Mamba、多模态学习或者论文投稿+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer2233,进交流群 CVer计算机视觉(知识星球)人数破万!如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料,一定要扫描下方二维码,加入CVer知识星球!最强助力你的科研和工作! ▲扫码加入星球学习

▲点击上方卡片,关注CVer公众号 整理不易,请点赞和在看

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询