AI需求调研、大模型技术体系及FastGPT实战全总结（调研方法论+LLM+RAG+Agent+产品落地）-创锋一号

一、AI需求调研全套方法论

在AI项目落地前期，规范的需求调研是保障项目顺利推进的核心，本文整合TOGAF ADM、需求工程六步法、4W1H调研法以及完整落地流程，适配AI类项目调研场景。

（一）TOGAF ADM 需求管理

该体系主打持续性、迭代性、可追溯性，同时兼顾优先级管控、变更管理与干系人驱动，分为三大执行步骤：

1. 问题调查：梳理业务现存痛点与现状

2. 方案研究：结合AI能力设计初步解决方案

3. 方案验证：校验方案可行性、匹配度

（二）需求工程六步法

标准化需求处理全流程，适配企业级AI架构项目：

1. 统一收集记录：通过访谈、问卷、工作坊等形式收集所有干系人需求，统一录入需求库

2. 优先级排序：结合业务价值、实施难度、风险等级划分需求优先级

3. 识别受影响元素：梳理业务架构、信息系统架构、技术基础设施架构等受影响的EA架构模块

4. 检查与验证：校验需求完整性、一致性、可行性，消除歧义与冲突

5. 分析关联性：梳理需求与项目变更之间的关联关系

6. 重新定义基线：根据最终需求更新项目基线

（三）需求调研核心分析维度

调研时从6大维度切入，全面覆盖业务与技术要求：

1. 业务目标维度

2. 干系人维度

3. 功能需求维度

4. 数据需求维度

5. 技术约束维度

6. 治理合规维度

（四）Agent场景专属 4W1H 调研法

面向智能体类AI项目，用4W1H明确落地边界：

- WHAT（做什么）：明确任务目标、待解决问题、最终产出物

- WHY（为什么）：梳理业务动机、预期价值、问题不解决的潜在代价

- WHO（谁参与）：确定服务对象、交互人员、负责人、最终决策者

- WHEN（何时）：划分需求优先级、确定时间窗口与关键里程碑

- HOW（如何做）：梳理业务流程、自动化程度、需对接的第三方系统

（五）调研完整实施步骤

1. 准备阶段：组建调研团队、划定调研范围、制定执行计划、准备工具、对接干系人

2. 收集阶段：采用访谈、问卷、工作坊、流程观察、文档研读等方式采集信息

3. 分析阶段：整理、拆解、归类收集到的需求

4. 验证阶段：和干系人核对需求，确认无偏差

5. 文档化阶段：输出标准化调研文档，归档留存

二、人工智能与大语言模型基础认知

（一）AI发展四大阶段

1. 1950年：人工智能概念诞生

2. 1980年：机器学习兴起

3. 2010年：深度学习快速发展

4. 2020年：大语言模型（LLM）全面普及

（二）大语言模型（LLM）核心知识

1. 模型参数能力划分（单位：B，十亿）

- 8B：支持问答、基础语言理解

- 10B：开始具备涌现能力

- 62B：问答、语言理解、代码补全、文本总结、翻译、感知解释

- 540B：覆盖上述能力，额外支持通用知识理解、长文本阅读总结、图案识别、智能对话、常识解读等

2. 模型分类

主流类别：语言模型、视觉模型、嵌入模型、重排序模型、图像模型

3. 模型训练四阶段

预训练 → 监督微调 → 奖励建模 → 强化学习

4. 大模型三大核心支柱

数据、算力、算法

5. 常见基础概念解答

1. 大模型的“大”指什么？

主要指数据体量庞大、模型参数量巨大，参数量单位为B（十亿）。

2. 模型幻觉及成因

模型在输入无对应答案时，受底层机制限制必须输出内容，进而生成虚假、错误回答。

3. Token概念

比单词更细的文本切分单位，用于适配模型输入规则，平均1 Token ≈ 0.65个英文单词。

4. 上下文窗口

模型单次对话中，输入+输出Token的总和上限。

5. 训练 vs 微调区别

- 训练：使用海量、宽泛的通用数据，覆盖面广但精准度不足，资源消耗极大；

- 微调：基于细分业务数据（如问答对）定向优化，提升场景专属精准度。

6. 训练与推理

- 训练：用数据迭代优化模型参数，让模型学习知识；

- 推理：训练完成后，模型接收用户请求并输出结果的过程。

（三）AI应用范式演进（5大范式及区别）

从简单到复杂，是当前AI落地的主流技术路线：

1. 提示词工程：最简单，依靠自然语言指令控制模型

2. RAG检索增强生成：依托外部知识库检索内容，辅助模型问答，解决幻觉问题

3. Workflow工作流：按照固定流程执行任务，逻辑死板、灵活性低

4. Agent智能体：自主规划、调用工具执行任务，灵活性远高于工作流

5. 模型微调：基于业务专属数据对基座模型二次训练，深度适配场景

三、提示词工程（Prompt Engineering）

（一）核心概念

通过自然语言向模型下发任务、指令、设定角色，实现对模型的交互与控制。

（二）核心价值

控制模型行为、提升输出质量与准确率、提升使用效率、实现场景定制化。

（三）两大角色划分

1. 系统提示词：由开发者配置，属于底层规则，用户不可见，用于约束模型基础行为。

2. 用户提示词：终端用户输入，约束能力较弱。

（四）编写核心原则

指令清晰、补充上下文、指定角色、明确任务、规定输出格式。

（五）实用编写技巧

清晰指令、赋予角色、少样本提示、思维链引导、控制输出长度与格式。

（六）高级用法：Shot 与思维链

1. Shot 分类

- Zero-shot：零样本，不提供案例，直接下发指令

- One-shot：一样本，提供1组输入输出案例

- Few-shot：少样本，提供1~5组案例参考

2. 思维链（CoT）

引导模型先展示推理过程，再给出最终答案，适用于推理、计算类场景，可大幅提升模型准确率。

3. 思维链细分：零样本思维链、一样本思维链、少样本思维链。

（七）落地实践步骤

从简单指令入手 → 补充上下文 → 设定角色 → 引用示例 → 引导逐步思考 → 明确输出内容与格式。

（八）提示词解决模型幻觉

1. 要求输出内容标注信息来源；

2. 提示模型：无对应知识时主动询问用户，不编造答案。

四、RAG检索增强生成技术

（一）基础原理

将文档、对话文本通过嵌入模型向量化，存入向量数据库；用户提问后，检索相似向量内容，结合问题一同输入大模型，最终生成回答。核心分为检索、生成两大环节。

（二）Embedding 嵌入模型

1. One-hot编码：向量稀疏，无法表达词语语义、关联关系，维度拓展能力差。

2. Word Embedding（词嵌入）

将词汇映射到N维向量空间，用向量表达词语语义与关联。相比One-hot，可精准表达词语语义、上下文关系与高维信息。

3. 嵌入模型核心功能：对数据向量化，通过向量计算匹配最优结果。

（三）主流RAG分支及特性

1. 传统RAG

基于Text2Vec+近邻算法检索，简单问答场景效果好；缺点：长文本上下文丢失、检索量增大后性能下降、难以关联碎片化信息。

2. GraphRAG（图检索增强生成）

核心优势：将文本转化为知识图谱，依托实体、关系图谱处理复杂关联问题，弥补传统RAG短板。

完整工作流：

文本切片 → 实体识别 → 关系挖掘 → 文本嵌入向量化 → 社区/层级聚类 → 构建索引入库 → 检索图谱信息 → 模型生成回答。

3. 多模态RAG

适配视频、音频、图片、表格、PDF等非纯文本场景。

核心步骤：

1. 文档解析：结构化各类异构文件；

2. 多模态信息提取：OCR、语音识别、图像标注提取有效信息；

3. 跨模态嵌入+存储：统一向量化，存入向量库；

4. 跨模态检索+重排序：匹配相关内容，交给模型生成答案。

核心技巧：将各类文档统一转为Markdown格式再检索。

4. Agentic RAG

在传统RAG中接入Agent智能体，当本地知识库无对应数据时，由Agent调用外部工具/接口补充数据，拓展数据来源，区别于仅依赖本地库的传统RAG。

（四）关键指标：文档召回率

检索阶段，模型从知识库中匹配到用户查询相关内容的成功率。

（五）检索方式对比

1. 语义检索

优点：理解语义、支持跨语言、适配多模态；

缺点：关键词敏感度低、强依赖模型、可解释性差。

2. 全文检索

基于关键词精准匹配，优点：速度快、可解释性强；

缺点：无法理解语义，对拼写错误、口语化表达敏感。

3. 混合检索

自定义语义检索、全文检索权重，兼顾两者优势；缺点：架构复杂、硬件性能要求高。

五、AI Agent 智能体

（一）核心概念

具备自主理解目标、制定执行计划、调用外部工具能力的智能程序，可理解为自动化AI助理。

（二）Agent 五大核心基石

1. 提示词&上下文工程：控制Agent行为逻辑；

2. 沙盒：独立安全运行环境，提供权限控制、环境隔离、行为监控审计；

3. 记忆体：弥补大模型记忆短板，分为短期记忆（当前会话上下文）、长期记忆（外部数据库存储用户偏好、历史数据）；

4. MCP（模型上下文协议）：标准化工具调用协议，解决不同模型、不同组件之间代码/调用不兼容问题；

5. 技能（Skill）：封装专业能力与使用规则，拆分元数据、核心指令、附属文件，解决上下文窗口限制问题；

6. AI网关：整体系统安全防护。

（三）Workflow 工作流 vs Agent 智能体

- Workflow：流程固定、逻辑死板，仅能按预设步骤重复执行任务；

- Agent：自主性强，可自主判断、规划流程、灵活调用工具，适配复杂、非标准化场景。

六、FastGPT 深信服商业版产品落地

（一）核心产品能力

知识库管理、Agent应用搭建、应用测评、平台统一管理。

（二）部署架构

1. 部署模式：SaaS部署、本地私有化部署；

2. 模型调用：支持线上模型/本地私有模型；

3. 必备组件：大语言模型、Embedding嵌入模型（RAG为可选组件）。

（三）应用搭建三环节

应用构建 → 发布保障 → 持续运营。

（四）数据源对接

支持本地文件、飞书、企业微信、钉钉、网页、API、各类数据库等多类数据源。

（五）知识库体系

1. 知识库分类：通用知识库、Web站点知识库、数据库知识库、第三方对接知识库；

2. 结构层级：库 → 集合 → 数据，最小搜索单位为单条数据；

3. Web站点同步：适用于公开网页、资讯站点、官网等静态/半动态网站；

4. 多向量映射：为同一份数据生成多组向量，增加检索匹配路径，提升召回率。

（六）知识库优化与问题处理

1. 复杂PDF解析：文件解析 → 文本切片 → 内容提取 → 向量化 → 入库索引；

2. 问答对提取：将业务问答整理为标准问答对入库，提升检索匹配度与问答效率；

3. 用户提问不精准：通过问题优化模块，补充背景、自动补全、改写问题，标准化用户输入；

4. 智能评测：支持手动编写测试用例、系统自动生成测试数据，完成应用效果评估；

5. 检索采用Token上限而非TopK：单纯限制条数（TopK）易丢失关键语义，基于Token限制可保证上下文完整性。

（七）流程与节点能力详解

1. 问题分类节点：基于语义/关键词对问题分类，实现自动化流程分支跳转；

2. 工具调用：需具备调用权限、接口适配、参数合规三大核心条件；

3. 代码运行节点：仅支持JS、Python语言，网络仅开放白名单，和日常编程相比有严格环境与网络限制；

4. 温度参数 & 上下文窗口：温度控制模型输出随机性（值越高越发散）；上下文窗口限制单次对话Token总量；

5. 智能问答 vs 工作流

- 逻辑控制：智能问答无固定流程，仅应答问题；工作流有完整分支、循环等逻辑；

- 配置方式：智能问答依托知识库+提示词配置；工作流可视化拖拽编排节点；

- 典型案例：智能问答用于客服问答、知识咨询；工作流用于固定审批、批量数据处理

企业官网建设流程全解析

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

热门文章

文章分类

标签云

相关文章

IDEA老用户转投Save Actions插件后，我的代码整洁度提升了200%

蓝牙调试器App自定义协议详解：手把手教你为STC8单片机设计可靠的数据包（附完整库文件）

MySQL 8.0实战：一条SQL搞定用户签到，详解ON DUPLICATE KEY UPDATE

需要专业的网站建设服务？