本文深入解析AI Skill的运行机制,通过智能错题本案例,揭示Skill如何与AI Agent载体协同工作。文章详细介绍了Skill的构成要素,包括描述与触发条件、Workflow处理步骤、MCP调用、脚本执行及SubAgent触发,帮助读者直观理解Skill≈Prompt+Workflow+MCP+Script。此外,还深入OpenClaw架构与源码,还原Skill的运行时真相,为技术选型或自建系统提供实践参考。
但当你真正动手时,却发现事情没那么简单:为什么同样的Skill在不同工具里表现各异?为什么有的能跑脚本、有的只能聊?网上到处是“渐进式披露”“与Prompt对比”“与MCP关系”的理论分析,读完依然一头雾水。
其实,大多数人都忽略了一个关键前提:Skill本身不能独立运行,它必须依附于一个AI Agent载体——比如OpenClaw、CodeBuddy、Hermes Agent、LangChain的Deep Agent等等。脱离这些载体,Skill只是一堆静态配置。
那么,Skill到底是什么形态?它如何被加载、检索、执行?它是怎么运行脚本、怎么调MCP?
本文选择OpenClaw作为载体,搭建一个智能错题本的应用案例,以拆解一个Skill的完整构成:描述与触发条件、Workflow处理步骤、MCP调用、脚本执行、SubAgent触发,让你直观理解:Skill ≈ Prompt + Workflow + MCP + Script。
紧接着,我们会深入OpenClaw架构与源码,还原Skill的运行时真相。无论你是技术选型还是自建系统,这篇文章都将给你一份可参考的实践地图。
一、案例业务背景
1.1 痛点场景
对于中小学生家长而言,错题管理一直是学习辅导中的难题:
- 📷 错题收集难:孩子做题出错后,拍照、整理、归类耗时耗力
- 📅 复习规划难:不知道如何科学安排复习时间,经常是"想起来才看"
- 📊 掌握度跟踪难:不清楚哪些知识点真正掌握了,哪些还在反复出错
- ⏰ 主动提醒缺位:家长忙于工作,容易错过孩子的复习时间节点
1.2 智能错题本
为了解决上述痛点,我计划实现一个智能错题本,让AI 成为学生 全天候的"智能学习管家",学生能通过不断复习巩固错题来查漏补缺、提升成绩;家长能从繁琐的错题整理工作中解放出来,并能及时了解孩子的薄弱环节与进步情况,查看学习报告,监督复习进度。
系统面向两类角色:
| 角色 | 说明 | 主要功能 |
| 学生 | 主要使用者 | 上传试卷、答题复习、查看批改报告 |
| 家长 | 监督辅助者 | 查看学习报告、监督复习进度、接收周报 |
系统应包含以下核心功能:
📷 试卷图片批改:上传试卷自动批改打分,记录错题
📅 艾宾浩斯复习规划:根据掌握度自动安排复习
📚 智能试卷生成推送:每日自动推送复习卷
📊 学习效果分析:知识点掌握度可视化、错因分析
1.3 业务方案
现在人工智能浪潮如火如荼,各种各样的 AI 智能体纷纷涌现。如果我能够利用 AI 智能体实现这一方案,更能帮助我了解大模型、智能体、Skill、MCP 服务这些组件是如何协同工作的,它们的内部实现原理到底是怎样的。
为此,本方案采用多角色协作模式,将传统需要一个团队才能完成的学习辅导工作,拆解并分配给多个专职 AI Agent,通过聊天消息作为统一交互入口,实现端到端的自动化服务。
方案包含三大核心业务流程,具体流程如下:
方案采用多角色协作模式——将传统需要一个团队才能完成的学习辅导工作,拆解并分配给多个专职 AI Agent,每个 Agent 只负责一件事。角色分工如下:
| AI Agent 角色 | 角色分工 |
| 系统协调员 | 流程编排与用户交互,不承担具体业务逻辑 |
| 学业评估师 | 专注试卷批改,完成 OCR文字识别 + 评分 + 错误分析 |
| 复习规划师 | 专注复习规划,基于艾宾浩斯算法安排复习节奏、生成试卷并推送 |
1.4 核心价值
基于大模型构建的智能错题本系统,通过 AI Agent + Skill + MCP 服务实现端到端自动化:
| 功能 | 传统方式 | 智能错题本 |
| 错题录入 | 手动抄写/拍照存档 | 📷 图片上传 → 一站式错题批改 |
| 批改评分 | 家长逐题检查 | ✍️ AI 自动批改(OCR + 切题 + 评分 + 分析) |
| 复习规划 | 凭感觉安排 | 🧠 艾宾浩斯遗忘曲线自动生成 |
| 试卷推送 | 手动出题 | 📚 每日自动推送个性化复习卷 |
| 学习报告 | 期末总结 | 📈 实时知识点掌握度可视化 |
二、系统设计与实现
2.1 系统架构图
2.2 关键组件列表
| 组件 | 职责 | 位置/配置 |
| OpenClaw Gateway | 消息处理、Skill 匹配、MCP 调用 | OpenClaw 智能体 |
| wrong-question-notebook | 智能错题本主Skill | wrong-question-notebook/SKILL.md |
| academic-evaluator | 学业评估师Skill | academic-evaluator/SKILL.md |
| review-planner | 复习规划师Skill | review-planner/SKILL.md |
| system-coordinator | 系统协调员Skill | system-coordinator/SKILL.md |
| mcporter | MCP 客户端工具 | OpenClaw 调用MCP CLI 工具 |
| tencent-ocr-correction | 试题批改MCP服务 | tencent-ocr-correction-mcp/ |
2.3 目录结构
智能错题本采用多 Agent 协作架构,每个子代理有独立的 SKILL.md:
wrong-question-notebook/ # 智能错题本(主Skill) ├── SKILL.md # 主 Skill 描述 ├── core/ # 核心逻辑 │ └── engine.py # 核心引擎 ├── subagents/ # 子代理 │ ├── academic-evaluator/ │ │ ├── SKILL.md # 学业评估师 │ │ └── references/ │ │ └── mcp_reference.md # MCP 调用参考文档 │ ├── review-planner/ │ │ └── SKILL.md # 复习规划师 │ ├── system-coordinator/ │ │ └── SKILL.md # 系统协调员 └── cron/ └── review_cron.py # 定时任务2.4 主 Skill 示例形态
智能错题本 wrong-question-notebook/SKILL.md 如下:
# 智能错题本 智能错题管理助手,通过对话完成错题录入、批改、复习规划。 ## 触发条件 - 用户上传试卷/错题图片 - 消息包含:录入错题、添加错题、今日复习、复习计划、查看错题、开始答题、学习报告、帮助 ## 架构 ### 子代理 | 子代理 | 职责 | |--------|------| | 学业评估师 | 接收试卷图片,调用试题批改 MCP 服务,输出批改结果 | | 复习规划师 | 根据批改结果安排艾宾浩斯复习,生成试卷并推送 | | 系统协调员 | 流程编排、用户交互 | ### 调用流程用户上传图片
↓
学业评估师─调用─>tencent-ocr-correction MCP服务
│ │
│ └── 腾讯云API处理:
│ OCR 识别
│ 切题定位
│ 批改评分
│ 错误分析
│ 知识点识别
│
↓
输出:单题结果 + 批改报告
↓
复习规划师 ──设置──> 艾宾浩斯复习节点
### 外部服务依赖 | MCP 服务 | 调用方式 | 说明 | |----------|----------|------| | `tencent-ocr-correction` | `mcporter call` | 试题批改MCP服务,学业评估师调用 | ## 使用方式 直接在对话中发送命令或上传图片即可。2.5 学业评估师 Skill 示例形态
学业评估师是本案例中唯一调用 MCP 服务的子代理,它的目录结构如下:
academic-evaluator/ ├── SKILL.md # 学业评估师 └── references/ └── mcp_reference.md # MCP 调用参考文档学业评估师 academic-evaluator/SKILL.md 如下:
# 学业评估师 (Academic Evaluator) ## 技能概述 本技能通过调用 试题批改 MCP Server,实现试卷图片的端到端批改处理(OCR + 切题 + 评分 + 分析)。 | MCP Server | 职责 | 本技能使用的工具 | |------------|------|----------------| | 试题批改 (tencent-ocr-correction) | 试卷图片 OCR 识别、切题、批改、错误分析 | `correct_paper_sync` · `submit_paper_correction` · `get_correction_result` | 适用场景: - 用户上传试卷/错题图片 - 复习卷答题图片批改 - "帮我批改这张试卷" - "批改答题图片" --- ## 工作流程 ### Step 1:接收试卷图片 从系统协调员获取试卷图片(URL 或 Base64)。 ### Step 2:调用试题批改 MCP ```json { "tool": "correct_paper_sync", "arguments": { "image_url": "<试卷图片URL>", "question_config_map": {"KnowledgePoints": true, "TrueAnswer": true} } }Step 3:处理批改结果
- 将返回的批改结果转换为错题本标准格式
- 映射错误类型(分析关键词 → 标准错误类型)
- 输出两份数据:
-单题结果列表 → 给复习规划师
-批改报告 → 给用户
详细的 MCP 调用参数和返回值说明见
references/mcp_reference.md。
为什么分离?
SKILL.md 会被注入到 LLM 的 System Prompt 中,过长会导致 token 浪费。
将详细的调用参数文档放在 reference 中,LLM 只在需要时才读取,既节省 token 又保证完整性。
2.6 试题批改MCP 服务
试题批改 MCP 服务是一个独立开发的 Python 项目,提供MCP服务接口,供学业评估师调用,它内部实现逻辑是调用腾讯云OCR接口,其源码结构如下:
tencent-ocr-correction-mcp/ ├── mcp_server.py # MCP Server 主代码 ├── requirements.txt # 依赖 └── README.md # 部署文档它对外暴露三个 MCP 工具:
| 工具名 | 说明 | 使用场景 |
| submit_paper_correction | 提交批改任务(异步) | 大试卷/需要并发处理 |
| get_correction_result | 查询批改结果 | 异步模式轮询 |
| correct_paper_sync | 同步批改(一步到位) | 便捷调用,推荐使用 |
三、OpenClaw 的 Skill 发现和匹配机制
3.1 Skill 发现机制
OpenClaw 的Skill发现过程如下图所示:
启动时扫描skills/目录加载所有 SKILL.md,使用渐进式披露机制,解析每个Skill的元数据,提取name、description、location等信息,构建可用技能列表,注入 System Prompt。
3.2 LLM 自主决策匹配
OpenClaw 将 Skill 信息注入到 System Prompt 中,由 LLM 根据用户输入自主判断需要使用哪个Skill:
| 用户输入 | LLM 决策 | 调用 |
| “帮我批改这张试卷” | 匹配 上传试卷 触发条件 | ✅ 激活 主Skill |
| “上传错题图片” | 匹配 上传错题 触发条件 | ✅ 激活 主Skill |
| “你好” | 无匹配 | ❌ 通用回复 |
四、Skill 如何调用 MCP 服务
上一章介绍了 OpenClaw 如何发现和匹配 Skill。那么,Skill 内部又是如何调用外部 MCP 服务的呢?本章以学业评估师调用试题批改MCP服务为例,拆解完整链路。
4.1 OpenClaw MCP 全局配置
┌─────────────────────────────────────────────────────────────────┐ │ 试题批改 MCP 配置(当前实际使用)│ │ │ │1. ~/.openclaw/mcp-config.json(核心 MCP 配置)│ │2. ~/.openclaw/openclaw.json(Gateway 配置,含 Skills 入口)│ │3. mcporter.json(MCP 客户端配置)│ └─────────────────────────────────────────────────────────────────┘# 1. 核心 MCP 配置# 位置: ~/.openclaw/mcp-config.json{"mcp":{"servers":[{"name":"tencent-ocr-correction","command":"python","args":["mcp_server.py","--mode","stdio"],"cwd":"/root/.openclaw/workspace/tencent-ocr-correction-mcp","env":{"TENCENT_SECRET_ID":"your_secret_id","TENCENT_SECRET_KEY":"your_secret_key"}}]}}# 2. OpenClaw Gateway 配置,含 Skills 入口# 位置: ~/.openclaw/openclaw.json{"skills":{"entries":{"mcporter":{"enabled":true,"env":{"MCPORTER_CONFIG":"/root/.openclaw/workspace/node_modules/mcporter/config/mcporter.json"}},"qveris-coding":{"enabled":true,"apiKey":"sk-..."},"baidu-search":{"enabled":true,"apiKey":"bce-v3/..."}}}}# 3. MCP 客户端 mcporter扩展配置# 位置: ~/.openclaw/workspace/node_modules/mcporter/config/mcporter.json{"mcpServers":{"tencent-ocr-correction":{"url":"http://127.0.0.1:8000/mcp"}},"imports":["cursor","claude-code","claude-desktop","codex"]}4.2 OpenClaw 获取 MCP 工具列表
通过以上全局配置,OpenClaw 在运行时会获取可用的 MCP 工具列表。OpenClaw 发现并加载 MCP 工具的核心源码如下:
// 源码位置: src/agents/pi-embedded-runner/run/attempt.ts // 1. 获取 MCP 运行时 const bundleMcpSessionRuntime = awaitgetOrCreateSessionMcpRuntime({ sessionId: params.sessionId, sessionKey: params.sessionKey, workspaceDir: effectiveWorkspace, cfg: params.config, }); // 2. 将 MCP 工具物化为 Agent 可执行的工具 const bundleMcpRuntime = awaitmaterializeBundleMcpToolsForRun({ runtime: bundleMcpSessionRuntime, reservedToolNames: [...tools.map((tool) => tool.name)], }); // 3. 合并到 Agent 的有效工具列表 const effectiveTools = [ ...tools, // 内置工具 ...(bundleMcpRuntime?.tools ?? []), // MCP 工具 ];4.3 学业评估师 Skill 调用 MCP 的完整流程
总结与回顾
业务逻辑总结
传统学习方法中,错题管理是拉开差距的关键环节——但大多数孩子和家长做不到系统化的错题整理和科学复习。
这篇文章拆解的智能错题本,本质上构建了一套自动化的学霸养成系统:
- 试卷 OCR + AI 批改:秒级完成错题识别、评分、错误分析,替代家长人工检查
- 艾宾浩斯遗忘曲线:科学安排复习节奏,在最佳记忆节点推送复习题
- 多 Agent 协作:学业评估师、复习规划师、系统协调员各司其职,就像一个全天候在线的学习团队
- 端到端自动化:从拍照上传到生成学习报告,全程无需人工干预
而这些能力,全部由 OpenClaw Skill + MCP 两个核心机制驱动——这正是本文要带你拆解的底层原理。
技术原理回顾
回顾全文,我们可以清晰地看到 AI Agent、Skill 与 MCP 服务三者协同的底层原理:
| 组件 | 本质 | 作用 |
| Skill | 能力描述文件(SKILL.md) | 定义 Agent 能做什么、何时触发、如何执行 |
| MCP | 外部服务接口协议 | 为 Skill 提供底层能力(OCR、搜索、数据库等) |
| Agent | 智能体本身 | 加载 Skill、调度执行、管理上下文 |
调用链路:用户输入 → LLM 匹配 Skill 触发条件 → 激活对应 Skill → Skill 调用 MCP 工具 → 返回结果给 Agent → 输出给用户。
这种架构的核心优势在于职责分离:Skill 专注业务逻辑描述,MCP 专注外部服务接入,Agent 专注流程编排——三者松耦合,可独立演进。
理解了这个架构,你不仅掌握了错题本的实现方式,更获得了一套可复用的 AI Agent 应用开发范式。无论是教育、办公还是其他业务场景,Skill + MCP 的组合都能帮你快速构建出真正落地的 AI 应用。
最后
如果说程序员已经是高薪职业,那么干AI的程序员,就是高薪中的高薪。
现在的市场,已经用数据给程序员指明了方向:学AI大模型,就是冲刺高薪的最优解!
看着身边越来越多的同行转型大模型、拿到高薪offer,很多人心里都动了心,但真正的难题来了:零基础小白不知道从哪入门?有基础的程序员找不到系统学习路径?实战项目练手无门?面试不知道考什么?
别慌!今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包,覆盖从入门到实战、从理论到面试、从基础到进阶的全流程,所有资料均已整理归档,无冗余、无套路,免费分享给每一位想抓住AI风口的程序员和小白!
👇👇扫码免费领取全部内容👇👇
1、大模型系统化学习路线
2、大模型学习书籍&文档
3、AI大模型最新行业报告
4、大模型项目实战&配套源码
5、大模型大厂面试真题
四阶段精细化学习规划(附时间节点,可直接照做)
结合上述资源,给大家整理了一份可直接落地的四阶段学习规划,总时长约2个月,小白可循序渐进,程序员可根据自身基础调整节奏,高效掌握大模型核心能力,快速实现从“入门”到“能落地、能面试”的跨越。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
👇👇扫码免费领取全部内容👇👇
6、这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】