收藏 | 程序员小白必看:轻松入门AI Agent三层结构,玩转大模型开发
2026/5/14 14:37:12 网站建设 项目流程

收藏 | 程序员小白必看:轻松入门AI Agent三层结构,玩转大模型开发

本文详细解析了AI Agent的三层结构:模型、智能体和执行平台,强调了分清这三层对于理解系统、架构决策和故障排查的重要性。文章解释了模型仅负责预测,智能体赋予模型目标并执行推理循环,而执行平台提供执行环境。此外,还阐述了执行平台与智能体框架的区别,并指出掌握这些概念有助于开发者更好地利用大模型进行实际工作。

易被混淆的概念

人们指着 Claude Code 或 Codex CLI 说"这是个 AI Agent"。这话没错,但属于那种在你需要做架构决策、调试故障、解释"同一个模型为什么在这个工具里好用、在那个工具里拉胯"时,会让你摔跟头的简写。

过去一年,厂商市场部门把"Agent"当成了一个筐——凡是比自动补全多做了一点事的东西,都往里装。但在那个筐底下,蹲着三层完全不同的东西,各担各的责,各有各的失败方式,各有各的替换成本。

把名词分清楚不是咬文嚼字。这是"理解你的系统"和"只会用你的系统"的区别。

图 1:用一个词概括三层 vs 把三层分开看

Model:只做预测的引擎

Claude Opus 4.6、GPT-5.3 Codex、Gemini 3 Flash——这些东西的本质是一个统计引擎。喂它一段文本,它告诉你接下来最可能是什么。这是它唯一会做的事。

它不记得刚才聊过什么。它看不见你的文件系统。它不知道现在是几点。它不能跑命令、不能点按钮。给它一个 prompt,返回一个 completion。到此为止。

这层拿走了所有的聚光灯。跑分测的是它,发版公告吹的也是它。模型质量确实重要——弱引擎会让上面两层全都受限。但光有引擎不等于有车。发动机是必要的,但远远不够。

常被忽略的事实

Model 层没有任何状态。每次调用都是一张白纸。它能给出聪明的回答,但它不会主动做任何事——因为它根本没有"主动"这个能力。

图 2:Model 层的唯一能力——输入 prompt,输出 completion

Agent:让模型有了目标

Agent = Model + 推理循环。它把文本预测器变成了一个有目标导向的东西。模型只是回答问题,Agent 会观察局势、制定计划、选择工具、执行动作、评估结果、决定下一步。

推理循环定义了系统的行为特征。ReAct 风格(Reason → Act → Observe)和"先规划再执行"产生的工作模式完全不同。有的 Agent 把问题拆成子任务再分派,有的在试错中快速迭代。选择哪种推理策略,对实际表现的影响不亚于选择哪个模型——甚至更大,因为它决定了模型的智力到底怎么用在问题上。

这里有一个关键的交叉点:模型提供认知马力,Agent 层决定把它指向哪里。

图 3:Agent 的推理循环——从"回答问题"到"追求目标"

Harness:给智能体一个身体

Harness 是执行平台。Claude Code、Codex CLI、GitHub Copilot CLI、Gemini CLI 都属于这一层。它给 Agent 提供文件系统访问、终端执行、权限管理、会话持久化、上下文组装和安全护栏。

当 Agent 决定要读一个文件,是 Harness 执行了cat命令。当 Agent 判断该跑测试了,是 Harness 执行了npm test,并且在执行前问你"允许这条命令吗?"。当 Agent 拟定了一个多步计划,是 Harness 维护了会话状态,让 Agent 不至于忘了三步之前做了什么。

安全也在这里。如果 Agent 推理出了一条破坏性命令,一个设计良好的 Harness 会拦截它。如果 Agent 陷入了测试失败的死循环,Harness 负责打断循环,把控制权交回给人。**模型没法自我约束。Agent 的推理循环不会自发地决定停下来。**边界是 Harness 强制执行的。

图 4:Harness 的六大能力——文件系统、终端、权限、会话、上下文、安全

实例拆解:Claude Code

以 Claude Code + Opus 4.6 为例。API 一次调用同时交付了 Layer 1 和 Layer 2——模型权重做预测(L1),Agentic 推理循环和工具选择接口嵌入在 API 中(L2)。Claude Code 干净地坐在 Layer 3。

它提供文件系统访问、终端执行、权限提示、会话持久化和上下文组装。它不做推理。它给推理提供可以操作的东西。

但这个边界并非总是那么干净。Claude Code 也在做决策:注入什么上下文、怎么切分代码库索引、什么时候打断 Agent 的循环让人类介入。这些决策对 Agent 行为的影响如此之大,以至于 Harness 并不是纯粹被动的基础设施。它是一个编排者——不做推理,但决定了 Agent 接收什么上下文、能调用什么工具、循环什么时候停下来。

图 5:Claude Code 的三层分工——API 承担 L1+L2,Claude Code 负责 L3

Harness ≠ Framework

这两个概念容易混。Claude Code、Codex CLI、Gemini CLI 是 Harness——开箱即用的完整平台。Agent Framework 是另一个物种:用来造 Harness 的工具箱。

当下主流的 Framework 是 LangGraph,LangChain 生态里的 Agent 编排层。它把 Agent 行为建模为状态图——节点是动作,边是转移。数百个组织在生产环境中使用。CrewAI 是另一个选择,走角色路线——每个 Agent 有角色、目标、背景故事,这让多 Agent 协作更直觉,但粒度更粗。

它们的共同点:给你组件——链抽象、工具接口、内存模块、检索模式。但你还是得自己接线:选推理策略、实现权限模型、写上下文组装逻辑、处理会话持久化。这些工作的产出物就是一个 Harness,但 Framework 本身不是 Harness。

这也解释了为什么 Framework 吸引的是那种需要为特定领域构建定制 Agent 系统的团队(客服流水线、文档处理、内部工具),而 Harness 吸引的是想立刻坐下来用 Agent 干活的开发者。

Harness(成品)Framework(工具箱)
例子Claude Code, Codex CLI, Gemini CLILangGraph, CrewAI
拿到手的状态开箱即用,直接干活散装零件,需要组装
推理策略已选定自己选
权限模型已实现自己写
上下文组装已实现自己写
适合谁想立刻用 Agent 干活的开发者需要定制 Agent 系统的团队

为什么分清三层很重要

三层模型的实际后果是可组合性。你可以换模型(L1)而不动 Harness。你可以换推理策略(L2)而不碰执行基础设施。你可以在不同的 Harness 之间迁移(L3),同时保持同一个模型和大致相同的 Agent 模式。

这不是纸上谈兵。当一个团队把 Claude Code 从 Sonnet 切到 Opus 做复杂重构,或者当一个组织评估 Codex CLI 的沙箱执行模型是否比 Claude Code 的本地执行模型更符合他们的安全要求——每次替换都发生在特定的层上。理解你在换哪一层,是"深思熟虑的架构决策"和"蒙着眼睛下注"的区别。

另一个后果是诊断能力。当 AI 编码 Agent 失败时,三层模型给你一套词汇来问对问题:

图 6:三层各有各的失败模式,绝大多数日常失败出在 Layer 3

一句话结论

模型是引擎。Harness 是引擎之外的所有东西。而所有那些"引擎之外的东西",才是活儿真正干出来的地方。

最后

近期科技圈传来重磅消息:行业巨头英特尔宣布大规模裁员2万人,传统技术岗位持续萎缩的同时,另一番景象却在AI领域上演——AI相关技术岗正开启“疯狂扩招”模式!据行业招聘数据显示,具备3-5年大模型相关经验的开发者,在大厂就能拿到50K×20薪的高薪待遇,薪资差距肉眼可见!

业内资深HR预判:不出1年,“具备AI项目实战经验”将正式成为技术岗投递的硬性门槛。在行业迭代加速的当下,“温水煮青蛙”式的等待只会让自己逐渐被淘汰,与其被动应对,不如主动出击,抢先掌握AI大模型核心原理+落地应用技术+项目实操经验,借行业风口实现职业翻盘!

深知技术人入门大模型时容易走弯路,我特意整理了一套全网最全最细的大模型零基础学习礼包,涵盖入门思维导图、经典书籍手册、从入门到进阶的实战视频、可直接运行的项目源码等核心内容。这份资料无需付费,免费分享给所有想入局AI大模型的朋友!

👇👇扫码免费领取全部内容👇👇

部分资料展示

1、 AI大模型学习路线图

2、 全套AI大模型应用开发视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

3、 大模型学习书籍&文档

4、AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、大模型大厂面试真题

整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题,涵盖基础理论、技术实操、项目经验等维度,每道题都配有详细解析和答题思路,帮你针对性提升面试竞争力。

6、大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

  • 👇👇扫码免费领取全部内容👇👇

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询