小白程序员必看：轻松掌握大模型Skill，收藏这份实践指南！-创锋一号

本文深入解析AI Skill的运行机制，通过智能错题本案例，揭示Skill如何与AI Agent载体协同工作。文章详细介绍了Skill的构成要素，包括描述与触发条件、Workflow处理步骤、MCP调用、脚本执行及SubAgent触发，帮助读者直观理解Skill≈Prompt+Workflow+MCP+Script。此外，还深入OpenClaw架构与源码，还原Skill的运行时真相，为技术选型或自建系统提供实践参考。

但当你真正动手时，却发现事情没那么简单：为什么同样的Skill在不同工具里表现各异？为什么有的能跑脚本、有的只能聊？网上到处是“渐进式披露”“与Prompt对比”“与MCP关系”的理论分析，读完依然一头雾水。

其实，大多数人都忽略了一个关键前提：Skill本身不能独立运行，它必须依附于一个AI Agent载体——比如OpenClaw、CodeBuddy、Hermes Agent、LangChain的Deep Agent等等。脱离这些载体，Skill只是一堆静态配置。

那么，Skill到底是什么形态？它如何被加载、检索、执行？它是怎么运行脚本、怎么调MCP？

本文选择OpenClaw作为载体，搭建一个智能错题本的应用案例，以拆解一个Skill的完整构成：描述与触发条件、Workflow处理步骤、MCP调用、脚本执行、SubAgent触发，让你直观理解：Skill ≈ Prompt + Workflow + MCP + Script。

紧接着，我们会深入OpenClaw架构与源码，还原Skill的运行时真相。无论你是技术选型还是自建系统，这篇文章都将给你一份可参考的实践地图。

一、案例业务背景

1.1 痛点场景

对于中小学生家长而言，错题管理一直是学习辅导中的难题：

📷 错题收集难：孩子做题出错后，拍照、整理、归类耗时耗力
📅 复习规划难：不知道如何科学安排复习时间，经常是"想起来才看"
📊 掌握度跟踪难：不清楚哪些知识点真正掌握了，哪些还在反复出错
⏰ 主动提醒缺位：家长忙于工作，容易错过孩子的复习时间节点

1.2 智能错题本

为了解决上述痛点，我计划实现一个智能错题本，让AI 成为学生全天候的"智能学习管家"，学生能通过不断复习巩固错题来查漏补缺、提升成绩；家长能从繁琐的错题整理工作中解放出来，并能及时了解孩子的薄弱环节与进步情况，查看学习报告，监督复习进度。

系统面向两类角色：

角色	说明	主要功能
学生	主要使用者	上传试卷、答题复习、查看批改报告
家长	监督辅助者	查看学习报告、监督复习进度、接收周报

系统应包含以下核心功能：

📷 试卷图片批改：上传试卷自动批改打分，记录错题
📅 艾宾浩斯复习规划：根据掌握度自动安排复习
📚 智能试卷生成推送：每日自动推送复习卷
📊 学习效果分析：知识点掌握度可视化、错因分析

1.3 业务方案

现在人工智能浪潮如火如荼，各种各样的 AI 智能体纷纷涌现。如果我能够利用 AI 智能体实现这一方案，更能帮助我了解大模型、智能体、Skill、MCP 服务这些组件是如何协同工作的，它们的内部实现原理到底是怎样的。

为此，本方案采用多角色协作模式，将传统需要一个团队才能完成的学习辅导工作，拆解并分配给多个专职 AI Agent，通过聊天消息作为统一交互入口，实现端到端的自动化服务。

方案包含三大核心业务流程，具体流程如下：

方案采用多角色协作模式——将传统需要一个团队才能完成的学习辅导工作，拆解并分配给多个专职 AI Agent，每个 Agent 只负责一件事。角色分工如下：

AI Agent 角色	角色分工
系统协调员	流程编排与用户交互，不承担具体业务逻辑
学业评估师	专注试卷批改，完成 OCR文字识别 + 评分 + 错误分析
复习规划师	专注复习规划，基于艾宾浩斯算法安排复习节奏、生成试卷并推送

1.4 核心价值

基于大模型构建的智能错题本系统，通过 AI Agent + Skill + MCP 服务实现端到端自动化：

功能	传统方式	智能错题本
错题录入	手动抄写/拍照存档	📷 图片上传 → 一站式错题批改
批改评分	家长逐题检查	✍️ AI 自动批改（OCR + 切题 + 评分 + 分析）
复习规划	凭感觉安排	🧠 艾宾浩斯遗忘曲线自动生成
试卷推送	手动出题	📚 每日自动推送个性化复习卷
学习报告	期末总结	📈 实时知识点掌握度可视化

二、系统设计与实现

2.1 系统架构图

2.2 关键组件列表

组件	职责	位置/配置
OpenClaw Gateway	消息处理、Skill 匹配、MCP 调用	OpenClaw 智能体
wrong-question-notebook	智能错题本主Skill	wrong-question-notebook/SKILL.md
academic-evaluator	学业评估师Skill	academic-evaluator/SKILL.md
review-planner	复习规划师Skill	review-planner/SKILL.md
system-coordinator	系统协调员Skill	system-coordinator/SKILL.md
mcporter	MCP 客户端工具	OpenClaw 调用MCP CLI 工具
tencent-ocr-correction	试题批改MCP服务	tencent-ocr-correction-mcp/

2.3 目录结构

智能错题本采用多 Agent 协作架构，每个子代理有独立的 SKILL.md：

wrong-question-notebook/ # 智能错题本（主Skill） ├── SKILL.md # 主 Skill 描述 ├── core/ # 核心逻辑 │ └── engine.py # 核心引擎 ├── subagents/ # 子代理 │ ├── academic-evaluator/ │ │ ├── SKILL.md # 学业评估师 │ │ └── references/ │ │ └── mcp_reference.md # MCP 调用参考文档 │ ├── review-planner/ │ │ └── SKILL.md # 复习规划师 │ ├── system-coordinator/ │ │ └── SKILL.md # 系统协调员 └── cron/ └── review_cron.py # 定时任务

2.4 主 Skill 示例形态

智能错题本 wrong-question-notebook/SKILL.md 如下：

# 智能错题本 智能错题管理助手，通过对话完成错题录入、批改、复习规划。 ## 触发条件 - 用户上传试卷/错题图片 - 消息包含：录入错题、添加错题、今日复习、复习计划、查看错题、开始答题、学习报告、帮助 ## 架构 ### 子代理 | 子代理 | 职责 | |--------|------| | 学业评估师 | 接收试卷图片，调用试题批改 MCP 服务，输出批改结果 | | 复习规划师 | 根据批改结果安排艾宾浩斯复习，生成试卷并推送 | | 系统协调员 | 流程编排、用户交互 | ### 调用流程

用户上传图片
↓
学业评估师─调用─>tencent-ocr-correction MCP服务
│ │
│ └── 腾讯云API处理：
│ OCR 识别
│ 切题定位
│ 批改评分
│ 错误分析
│ 知识点识别
│
↓
输出：单题结果 + 批改报告
↓
复习规划师 ──设置──> 艾宾浩斯复习节点

### 外部服务依赖 | MCP 服务 | 调用方式 | 说明 | |----------|----------|------| | `tencent-ocr-correction` | `mcporter call` | 试题批改MCP服务，学业评估师调用 | ## 使用方式 直接在对话中发送命令或上传图片即可。

2.5 学业评估师 Skill 示例形态

学业评估师是本案例中唯一调用 MCP 服务的子代理，它的目录结构如下：

academic-evaluator/ ├── SKILL.md # 学业评估师 └── references/ └── mcp_reference.md # MCP 调用参考文档

学业评估师 academic-evaluator/SKILL.md 如下：

# 学业评估师 (Academic Evaluator) ## 技能概述 本技能通过调用 试题批改 MCP Server，实现试卷图片的端到端批改处理（OCR + 切题 + 评分 + 分析）。 | MCP Server | 职责 | 本技能使用的工具 | |------------|------|----------------| | 试题批改 (tencent-ocr-correction) | 试卷图片 OCR 识别、切题、批改、错误分析 | `correct_paper_sync` · `submit_paper_correction` · `get_correction_result` | 适用场景： - 用户上传试卷/错题图片 - 复习卷答题图片批改 - "帮我批改这张试卷" - "批改答题图片" --- ## 工作流程 ### Step 1：接收试卷图片 从系统协调员获取试卷图片（URL 或 Base64）。 ### Step 2：调用试题批改 MCP ```json { "tool": "correct_paper_sync", "arguments": { "image_url": "<试卷图片URL>", "question_config_map": {"KnowledgePoints": true, "TrueAnswer": true} } }

Step 3：处理批改结果

将返回的批改结果转换为错题本标准格式
映射错误类型（分析关键词 → 标准错误类型）
输出两份数据：
-单题结果列表 → 给复习规划师
-批改报告 → 给用户

详细的 MCP 调用参数和返回值说明见references/mcp_reference.md。
为什么分离？
SKILL.md 会被注入到 LLM 的 System Prompt 中，过长会导致 token 浪费。
将详细的调用参数文档放在 reference 中，LLM 只在需要时才读取，既节省 token 又保证完整性。

2.6 试题批改MCP 服务

试题批改 MCP 服务是一个独立开发的 Python 项目，提供MCP服务接口，供学业评估师调用，它内部实现逻辑是调用腾讯云OCR接口，其源码结构如下：

tencent-ocr-correction-mcp/ ├── mcp_server.py # MCP Server 主代码 ├── requirements.txt # 依赖 └── README.md # 部署文档

它对外暴露三个 MCP 工具：

工具名	说明	使用场景
submit_paper_correction	提交批改任务（异步）	大试卷/需要并发处理
get_correction_result	查询批改结果	异步模式轮询
correct_paper_sync	同步批改（一步到位）	便捷调用，推荐使用

三、OpenClaw 的 Skill 发现和匹配机制

3.1 Skill 发现机制

OpenClaw 的Skill发现过程如下图所示：

启动时扫描`skills/`目录加载所有 SKILL.md，使用渐进式披露机制，解析每个Skill的元数据，提取name、description、location等信息，构建可用技能列表，注入 System Prompt。

3.2 LLM 自主决策匹配

OpenClaw 将 Skill 信息注入到 System Prompt 中，由 LLM 根据用户输入自主判断需要使用哪个Skill：

用户输入	LLM 决策	调用
“帮我批改这张试卷”	匹配上传试卷触发条件	✅ 激活主Skill
“上传错题图片”	匹配上传错题触发条件	✅ 激活主Skill
“你好”	无匹配	❌ 通用回复

四、Skill 如何调用 MCP 服务

上一章介绍了 OpenClaw 如何发现和匹配 Skill。那么，Skill 内部又是如何调用外部 MCP 服务的呢？本章以学业评估师调用试题批改MCP服务为例，拆解完整链路。

4.1 OpenClaw MCP 全局配置

┌─────────────────────────────────────────────────────────────────┐ │ 试题批改 MCP 配置(当前实际使用)│ │ │ │1. ~/.openclaw/mcp-config.json(核心 MCP 配置)│ │2. ~/.openclaw/openclaw.json(Gateway 配置，含 Skills 入口)│ │3. mcporter.json(MCP 客户端配置)│ └─────────────────────────────────────────────────────────────────┘# 1. 核心 MCP 配置# 位置: ~/.openclaw/mcp-config.json{"mcp":{"servers":[{"name":"tencent-ocr-correction","command":"python","args":["mcp_server.py","--mode","stdio"],"cwd":"/root/.openclaw/workspace/tencent-ocr-correction-mcp","env":{"TENCENT_SECRET_ID":"your_secret_id","TENCENT_SECRET_KEY":"your_secret_key"}}]}}# 2. OpenClaw Gateway 配置，含 Skills 入口# 位置: ~/.openclaw/openclaw.json{"skills":{"entries":{"mcporter":{"enabled":true,"env":{"MCPORTER_CONFIG":"/root/.openclaw/workspace/node_modules/mcporter/config/mcporter.json"}},"qveris-coding":{"enabled":true,"apiKey":"sk-..."},"baidu-search":{"enabled":true,"apiKey":"bce-v3/..."}}}}# 3. MCP 客户端 mcporter扩展配置# 位置: ~/.openclaw/workspace/node_modules/mcporter/config/mcporter.json{"mcpServers":{"tencent-ocr-correction":{"url":"http://127.0.0.1:8000/mcp"}},"imports":["cursor","claude-code","claude-desktop","codex"]}

4.2 OpenClaw 获取 MCP 工具列表

通过以上全局配置，OpenClaw 在运行时会获取可用的 MCP 工具列表。OpenClaw 发现并加载 MCP 工具的核心源码如下：

// 源码位置: src/agents/pi-embedded-runner/run/attempt.ts // 1. 获取 MCP 运行时 const bundleMcpSessionRuntime = awaitgetOrCreateSessionMcpRuntime({ sessionId: params.sessionId, sessionKey: params.sessionKey, workspaceDir: effectiveWorkspace, cfg: params.config, }); // 2. 将 MCP 工具物化为 Agent 可执行的工具 const bundleMcpRuntime = awaitmaterializeBundleMcpToolsForRun({ runtime: bundleMcpSessionRuntime, reservedToolNames: [...tools.map((tool) => tool.name)], }); // 3. 合并到 Agent 的有效工具列表 const effectiveTools = [ ...tools, // 内置工具 ...(bundleMcpRuntime?.tools ?? []), // MCP 工具 ];

4.3 学业评估师 Skill 调用 MCP 的完整流程

总结与回顾

业务逻辑总结

传统学习方法中，错题管理是拉开差距的关键环节——但大多数孩子和家长做不到系统化的错题整理和科学复习。

这篇文章拆解的智能错题本，本质上构建了一套自动化的学霸养成系统：

试卷 OCR + AI 批改：秒级完成错题识别、评分、错误分析，替代家长人工检查
艾宾浩斯遗忘曲线：科学安排复习节奏，在最佳记忆节点推送复习题
多 Agent 协作：学业评估师、复习规划师、系统协调员各司其职，就像一个全天候在线的学习团队
端到端自动化：从拍照上传到生成学习报告，全程无需人工干预

而这些能力，全部由 OpenClaw Skill + MCP 两个核心机制驱动——这正是本文要带你拆解的底层原理。

技术原理回顾

回顾全文，我们可以清晰地看到 AI Agent、Skill 与 MCP 服务三者协同的底层原理：

组件	本质	作用
Skill	能力描述文件（SKILL.md）	定义 Agent 能做什么、何时触发、如何执行
MCP	外部服务接口协议	为 Skill 提供底层能力（OCR、搜索、数据库等）
Agent	智能体本身	加载 Skill、调度执行、管理上下文

调用链路：用户输入 → LLM 匹配 Skill 触发条件 → 激活对应 Skill → Skill 调用 MCP 工具 → 返回结果给 Agent → 输出给用户。

这种架构的核心优势在于职责分离：Skill 专注业务逻辑描述，MCP 专注外部服务接入，Agent 专注流程编排——三者松耦合，可独立演进。

理解了这个架构，你不仅掌握了错题本的实现方式，更获得了一套可复用的 AI Agent 应用开发范式。无论是教育、办公还是其他业务场景，Skill + MCP 的组合都能帮你快速构建出真正落地的 AI 应用。

最后

如果说程序员已经是高薪职业，那么干AI的程序员，就是高薪中的高薪。

现在的市场，已经用数据给程序员指明了方向：学AI大模型，就是冲刺高薪的最优解！

看着身边越来越多的同行转型大模型、拿到高薪offer，很多人心里都动了心，但真正的难题来了：零基础小白不知道从哪入门？有基础的程序员找不到系统学习路径？实战项目练手无门？面试不知道考什么？

别慌！今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包，覆盖从入门到实战、从理论到面试、从基础到进阶的全流程，所有资料均已整理归档，无冗余、无套路，免费分享给每一位想抓住AI风口的程序员和小白！

👇👇扫码免费领取全部内容👇👇

1、大模型系统化学习路线

2、大模型学习书籍&文档

3、AI大模型最新行业报告

4、大模型项目实战&配套源码

5、大模型大厂面试真题

四阶段精细化学习规划（附时间节点，可直接照做）

结合上述资源，给大家整理了一份可直接落地的四阶段学习规划，总时长约2个月，小白可循序渐进，程序员可根据自身基础调整节奏，高效掌握大模型核心能力，快速实现从“入门”到“能落地、能面试”的跨越。

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

👇👇扫码免费领取全部内容👇👇

6、这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

企业官网建设流程全解析