收藏 | 程序员小白必看:轻松入门AI Agent三层结构,玩转大模型开发
本文详细解析了AI Agent的三层结构:模型、智能体和执行平台,强调了分清这三层对于理解系统、架构决策和故障排查的重要性。文章解释了模型仅负责预测,智能体赋予模型目标并执行推理循环,而执行平台提供执行环境。此外,还阐述了执行平台与智能体框架的区别,并指出掌握这些概念有助于开发者更好地利用大模型进行实际工作。
易被混淆的概念
人们指着 Claude Code 或 Codex CLI 说"这是个 AI Agent"。这话没错,但属于那种在你需要做架构决策、调试故障、解释"同一个模型为什么在这个工具里好用、在那个工具里拉胯"时,会让你摔跟头的简写。
过去一年,厂商市场部门把"Agent"当成了一个筐——凡是比自动补全多做了一点事的东西,都往里装。但在那个筐底下,蹲着三层完全不同的东西,各担各的责,各有各的失败方式,各有各的替换成本。
把名词分清楚不是咬文嚼字。这是"理解你的系统"和"只会用你的系统"的区别。
图 1:用一个词概括三层 vs 把三层分开看
Model:只做预测的引擎
Claude Opus 4.6、GPT-5.3 Codex、Gemini 3 Flash——这些东西的本质是一个统计引擎。喂它一段文本,它告诉你接下来最可能是什么。这是它唯一会做的事。
它不记得刚才聊过什么。它看不见你的文件系统。它不知道现在是几点。它不能跑命令、不能点按钮。给它一个 prompt,返回一个 completion。到此为止。
这层拿走了所有的聚光灯。跑分测的是它,发版公告吹的也是它。模型质量确实重要——弱引擎会让上面两层全都受限。但光有引擎不等于有车。发动机是必要的,但远远不够。
常被忽略的事实
Model 层没有任何状态。每次调用都是一张白纸。它能给出聪明的回答,但它不会主动做任何事——因为它根本没有"主动"这个能力。
图 2:Model 层的唯一能力——输入 prompt,输出 completion
Agent:让模型有了目标
Agent = Model + 推理循环。它把文本预测器变成了一个有目标导向的东西。模型只是回答问题,Agent 会观察局势、制定计划、选择工具、执行动作、评估结果、决定下一步。
推理循环定义了系统的行为特征。ReAct 风格(Reason → Act → Observe)和"先规划再执行"产生的工作模式完全不同。有的 Agent 把问题拆成子任务再分派,有的在试错中快速迭代。选择哪种推理策略,对实际表现的影响不亚于选择哪个模型——甚至更大,因为它决定了模型的智力到底怎么用在问题上。
这里有一个关键的交叉点:模型提供认知马力,Agent 层决定把它指向哪里。
图 3:Agent 的推理循环——从"回答问题"到"追求目标"
Harness:给智能体一个身体
Harness 是执行平台。Claude Code、Codex CLI、GitHub Copilot CLI、Gemini CLI 都属于这一层。它给 Agent 提供文件系统访问、终端执行、权限管理、会话持久化、上下文组装和安全护栏。
当 Agent 决定要读一个文件,是 Harness 执行了cat命令。当 Agent 判断该跑测试了,是 Harness 执行了npm test,并且在执行前问你"允许这条命令吗?"。当 Agent 拟定了一个多步计划,是 Harness 维护了会话状态,让 Agent 不至于忘了三步之前做了什么。
安全也在这里。如果 Agent 推理出了一条破坏性命令,一个设计良好的 Harness 会拦截它。如果 Agent 陷入了测试失败的死循环,Harness 负责打断循环,把控制权交回给人。**模型没法自我约束。Agent 的推理循环不会自发地决定停下来。**边界是 Harness 强制执行的。
图 4:Harness 的六大能力——文件系统、终端、权限、会话、上下文、安全
实例拆解:Claude Code
以 Claude Code + Opus 4.6 为例。API 一次调用同时交付了 Layer 1 和 Layer 2——模型权重做预测(L1),Agentic 推理循环和工具选择接口嵌入在 API 中(L2)。Claude Code 干净地坐在 Layer 3。
它提供文件系统访问、终端执行、权限提示、会话持久化和上下文组装。它不做推理。它给推理提供可以操作的东西。
但这个边界并非总是那么干净。Claude Code 也在做决策:注入什么上下文、怎么切分代码库索引、什么时候打断 Agent 的循环让人类介入。这些决策对 Agent 行为的影响如此之大,以至于 Harness 并不是纯粹被动的基础设施。它是一个编排者——不做推理,但决定了 Agent 接收什么上下文、能调用什么工具、循环什么时候停下来。
图 5:Claude Code 的三层分工——API 承担 L1+L2,Claude Code 负责 L3
Harness ≠ Framework
这两个概念容易混。Claude Code、Codex CLI、Gemini CLI 是 Harness——开箱即用的完整平台。Agent Framework 是另一个物种:用来造 Harness 的工具箱。
当下主流的 Framework 是 LangGraph,LangChain 生态里的 Agent 编排层。它把 Agent 行为建模为状态图——节点是动作,边是转移。数百个组织在生产环境中使用。CrewAI 是另一个选择,走角色路线——每个 Agent 有角色、目标、背景故事,这让多 Agent 协作更直觉,但粒度更粗。
它们的共同点:给你组件——链抽象、工具接口、内存模块、检索模式。但你还是得自己接线:选推理策略、实现权限模型、写上下文组装逻辑、处理会话持久化。这些工作的产出物就是一个 Harness,但 Framework 本身不是 Harness。
这也解释了为什么 Framework 吸引的是那种需要为特定领域构建定制 Agent 系统的团队(客服流水线、文档处理、内部工具),而 Harness 吸引的是想立刻坐下来用 Agent 干活的开发者。
| Harness(成品) | Framework(工具箱) | |
|---|---|---|
| 例子 | Claude Code, Codex CLI, Gemini CLI | LangGraph, CrewAI |
| 拿到手的状态 | 开箱即用,直接干活 | 散装零件,需要组装 |
| 推理策略 | 已选定 | 自己选 |
| 权限模型 | 已实现 | 自己写 |
| 上下文组装 | 已实现 | 自己写 |
| 适合谁 | 想立刻用 Agent 干活的开发者 | 需要定制 Agent 系统的团队 |
为什么分清三层很重要
三层模型的实际后果是可组合性。你可以换模型(L1)而不动 Harness。你可以换推理策略(L2)而不碰执行基础设施。你可以在不同的 Harness 之间迁移(L3),同时保持同一个模型和大致相同的 Agent 模式。
这不是纸上谈兵。当一个团队把 Claude Code 从 Sonnet 切到 Opus 做复杂重构,或者当一个组织评估 Codex CLI 的沙箱执行模型是否比 Claude Code 的本地执行模型更符合他们的安全要求——每次替换都发生在特定的层上。理解你在换哪一层,是"深思熟虑的架构决策"和"蒙着眼睛下注"的区别。
另一个后果是诊断能力。当 AI 编码 Agent 失败时,三层模型给你一套词汇来问对问题:
图 6:三层各有各的失败模式,绝大多数日常失败出在 Layer 3
一句话结论
模型是引擎。Harness 是引擎之外的所有东西。而所有那些"引擎之外的东西",才是活儿真正干出来的地方。
最后
近期科技圈传来重磅消息:行业巨头英特尔宣布大规模裁员2万人,传统技术岗位持续萎缩的同时,另一番景象却在AI领域上演——AI相关技术岗正开启“疯狂扩招”模式!据行业招聘数据显示,具备3-5年大模型相关经验的开发者,在大厂就能拿到50K×20薪的高薪待遇,薪资差距肉眼可见!
业内资深HR预判:不出1年,“具备AI项目实战经验”将正式成为技术岗投递的硬性门槛。在行业迭代加速的当下,“温水煮青蛙”式的等待只会让自己逐渐被淘汰,与其被动应对,不如主动出击,抢先掌握AI大模型核心原理+落地应用技术+项目实操经验,借行业风口实现职业翻盘!
深知技术人入门大模型时容易走弯路,我特意整理了一套全网最全最细的大模型零基础学习礼包,涵盖入门思维导图、经典书籍手册、从入门到进阶的实战视频、可直接运行的项目源码等核心内容。这份资料无需付费,免费分享给所有想入局AI大模型的朋友!
👇👇扫码免费领取全部内容👇👇
部分资料展示
1、 AI大模型学习路线图
2、 全套AI大模型应用开发视频教程
从入门到进阶这里都有,跟着老师学习事半功倍。
3、 大模型学习书籍&文档
4、AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
5、大模型大厂面试真题
整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题,涵盖基础理论、技术实操、项目经验等维度,每道题都配有详细解析和答题思路,帮你针对性提升面试竞争力。
6、大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
- 👇👇扫码免费领取全部内容👇👇
这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】