AI需求调研、大模型技术体系及FastGPT实战全总结(调研方法论+LLM+RAG+Agent+产品落地)
2026/6/10 3:43:44 网站建设 项目流程

一、AI需求调研全套方法论

在AI项目落地前期,规范的需求调研是保障项目顺利推进的核心,本文整合TOGAF ADM、需求工程六步法、4W1H调研法以及完整落地流程,适配AI类项目调研场景。

(一)TOGAF ADM 需求管理

该体系主打持续性、迭代性、可追溯性,同时兼顾优先级管控、变更管理与干系人驱动,分为三大执行步骤:

1. 问题调查:梳理业务现存痛点与现状

2. 方案研究:结合AI能力设计初步解决方案

3. 方案验证:校验方案可行性、匹配度

(二)需求工程六步法

标准化需求处理全流程,适配企业级AI架构项目:

1. 统一收集记录:通过访谈、问卷、工作坊等形式收集所有干系人需求,统一录入需求库

2. 优先级排序:结合业务价值、实施难度、风险等级划分需求优先级

3. 识别受影响元素:梳理业务架构、信息系统架构、技术基础设施架构等受影响的EA架构模块

4. 检查与验证:校验需求完整性、一致性、可行性,消除歧义与冲突

5. 分析关联性:梳理需求与项目变更之间的关联关系

6. 重新定义基线:根据最终需求更新项目基线

(三)需求调研核心分析维度

调研时从6大维度切入,全面覆盖业务与技术要求:

1. 业务目标维度

2. 干系人维度

3. 功能需求维度

4. 数据需求维度

5. 技术约束维度

6. 治理合规维度

(四)Agent场景专属 4W1H 调研法

面向智能体类AI项目,用4W1H明确落地边界:

- WHAT(做什么):明确任务目标、待解决问题、最终产出物

- WHY(为什么):梳理业务动机、预期价值、问题不解决的潜在代价

- WHO(谁参与):确定服务对象、交互人员、负责人、最终决策者

- WHEN(何时):划分需求优先级、确定时间窗口与关键里程碑

- HOW(如何做):梳理业务流程、自动化程度、需对接的第三方系统

(五)调研完整实施步骤

1. 准备阶段:组建调研团队、划定调研范围、制定执行计划、准备工具、对接干系人

2. 收集阶段:采用访谈、问卷、工作坊、流程观察、文档研读等方式采集信息

3. 分析阶段:整理、拆解、归类收集到的需求

4. 验证阶段:和干系人核对需求,确认无偏差

5. 文档化阶段:输出标准化调研文档,归档留存

二、人工智能与大语言模型基础认知

(一)AI发展四大阶段

1. 1950年:人工智能概念诞生

2. 1980年:机器学习兴起

3. 2010年:深度学习快速发展

4. 2020年:大语言模型(LLM)全面普及

(二)大语言模型(LLM)核心知识

1. 模型参数能力划分(单位:B,十亿)

- 8B:支持问答、基础语言理解

- 10B:开始具备涌现能力

- 62B:问答、语言理解、代码补全、文本总结、翻译、感知解释

- 540B:覆盖上述能力,额外支持通用知识理解、长文本阅读总结、图案识别、智能对话、常识解读等

2. 模型分类

主流类别:语言模型、视觉模型、嵌入模型、重排序模型、图像模型

3. 模型训练四阶段

预训练 → 监督微调 → 奖励建模 → 强化学习

4. 大模型三大核心支柱

数据、算力、算法

5. 常见基础概念解答

1. 大模型的“大”指什么?

主要指数据体量庞大、模型参数量巨大,参数量单位为B(十亿)。

2. 模型幻觉及成因

模型在输入无对应答案时,受底层机制限制必须输出内容,进而生成虚假、错误回答。

3. Token概念

比单词更细的文本切分单位,用于适配模型输入规则,平均1 Token ≈ 0.65个英文单词。

4. 上下文窗口

模型单次对话中,输入+输出Token的总和上限。

5. 训练 vs 微调区别

- 训练:使用海量、宽泛的通用数据,覆盖面广但精准度不足,资源消耗极大;

- 微调:基于细分业务数据(如问答对)定向优化,提升场景专属精准度。

6. 训练与推理

- 训练:用数据迭代优化模型参数,让模型学习知识;

- 推理:训练完成后,模型接收用户请求并输出结果的过程。

(三)AI应用范式演进(5大范式及区别)

从简单到复杂,是当前AI落地的主流技术路线:

1. 提示词工程:最简单,依靠自然语言指令控制模型

2. RAG检索增强生成:依托外部知识库检索内容,辅助模型问答,解决幻觉问题

3. Workflow工作流:按照固定流程执行任务,逻辑死板、灵活性低

4. Agent智能体:自主规划、调用工具执行任务,灵活性远高于工作流

5. 模型微调:基于业务专属数据对基座模型二次训练,深度适配场景

三、提示词工程(Prompt Engineering)

(一)核心概念

通过自然语言向模型下发任务、指令、设定角色,实现对模型的交互与控制。

(二)核心价值

控制模型行为、提升输出质量与准确率、提升使用效率、实现场景定制化。

(三)两大角色划分

1. 系统提示词:由开发者配置,属于底层规则,用户不可见,用于约束模型基础行为。

2. 用户提示词:终端用户输入,约束能力较弱。

(四)编写核心原则

指令清晰、补充上下文、指定角色、明确任务、规定输出格式。

(五)实用编写技巧

清晰指令、赋予角色、少样本提示、思维链引导、控制输出长度与格式。

(六)高级用法:Shot 与思维链

1. Shot 分类

- Zero-shot:零样本,不提供案例,直接下发指令

- One-shot:一样本,提供1组输入输出案例

- Few-shot:少样本,提供1~5组案例参考

2. 思维链(CoT)

引导模型先展示推理过程,再给出最终答案,适用于推理、计算类场景,可大幅提升模型准确率。

3. 思维链细分:零样本思维链、一样本思维链、少样本思维链。

(七)落地实践步骤

从简单指令入手 → 补充上下文 → 设定角色 → 引用示例 → 引导逐步思考 → 明确输出内容与格式。

(八)提示词解决模型幻觉

1. 要求输出内容标注信息来源;

2. 提示模型:无对应知识时主动询问用户,不编造答案。

四、RAG检索增强生成技术

(一)基础原理

将文档、对话文本通过嵌入模型向量化,存入向量数据库;用户提问后,检索相似向量内容,结合问题一同输入大模型,最终生成回答。核心分为检索、生成两大环节。

(二)Embedding 嵌入模型

1. One-hot编码:向量稀疏,无法表达词语语义、关联关系,维度拓展能力差。

2. Word Embedding(词嵌入)

将词汇映射到N维向量空间,用向量表达词语语义与关联。相比One-hot,可精准表达词语语义、上下文关系与高维信息。

3. 嵌入模型核心功能:对数据向量化,通过向量计算匹配最优结果。

(三)主流RAG分支及特性

1. 传统RAG

基于Text2Vec+近邻算法检索,简单问答场景效果好;缺点:长文本上下文丢失、检索量增大后性能下降、难以关联碎片化信息。

2. GraphRAG(图检索增强生成)

核心优势:将文本转化为知识图谱,依托实体、关系图谱处理复杂关联问题,弥补传统RAG短板。

完整工作流:

文本切片 → 实体识别 → 关系挖掘 → 文本嵌入向量化 → 社区/层级聚类 → 构建索引入库 → 检索图谱信息 → 模型生成回答。

3. 多模态RAG

适配视频、音频、图片、表格、PDF等非纯文本场景。

核心步骤:

1. 文档解析:结构化各类异构文件;

2. 多模态信息提取:OCR、语音识别、图像标注提取有效信息;

3. 跨模态嵌入+存储:统一向量化,存入向量库;

4. 跨模态检索+重排序:匹配相关内容,交给模型生成答案。

核心技巧:将各类文档统一转为Markdown格式再检索。

4. Agentic RAG

在传统RAG中接入Agent智能体,当本地知识库无对应数据时,由Agent调用外部工具/接口补充数据,拓展数据来源,区别于仅依赖本地库的传统RAG。

(四)关键指标:文档召回率

检索阶段,模型从知识库中匹配到用户查询相关内容的成功率。

(五)检索方式对比

1. 语义检索

优点:理解语义、支持跨语言、适配多模态;

缺点:关键词敏感度低、强依赖模型、可解释性差。

2. 全文检索

基于关键词精准匹配,优点:速度快、可解释性强;

缺点:无法理解语义,对拼写错误、口语化表达敏感。

3. 混合检索

自定义语义检索、全文检索权重,兼顾两者优势;缺点:架构复杂、硬件性能要求高。

五、AI Agent 智能体

(一)核心概念

具备自主理解目标、制定执行计划、调用外部工具能力的智能程序,可理解为自动化AI助理。

(二)Agent 五大核心基石

1. 提示词&上下文工程:控制Agent行为逻辑;

2. 沙盒:独立安全运行环境,提供权限控制、环境隔离、行为监控审计;

3. 记忆体:弥补大模型记忆短板,分为短期记忆(当前会话上下文)、长期记忆(外部数据库存储用户偏好、历史数据);

4. MCP(模型上下文协议):标准化工具调用协议,解决不同模型、不同组件之间代码/调用不兼容问题;

5. 技能(Skill):封装专业能力与使用规则,拆分元数据、核心指令、附属文件,解决上下文窗口限制问题;

6. AI网关:整体系统安全防护。

(三)Workflow 工作流 vs Agent 智能体

- Workflow:流程固定、逻辑死板,仅能按预设步骤重复执行任务;

- Agent:自主性强,可自主判断、规划流程、灵活调用工具,适配复杂、非标准化场景。

六、FastGPT 深信服商业版产品落地

(一)核心产品能力

知识库管理、Agent应用搭建、应用测评、平台统一管理。

(二)部署架构

1. 部署模式:SaaS部署、本地私有化部署;

2. 模型调用:支持线上模型/本地私有模型;

3. 必备组件:大语言模型、Embedding嵌入模型(RAG为可选组件)。

(三)应用搭建三环节

应用构建 → 发布保障 → 持续运营。

(四)数据源对接

支持本地文件、飞书、企业微信、钉钉、网页、API、各类数据库等多类数据源。

(五)知识库体系

1. 知识库分类:通用知识库、Web站点知识库、数据库知识库、第三方对接知识库;

2. 结构层级:库 → 集合 → 数据,最小搜索单位为单条数据;

3. Web站点同步:适用于公开网页、资讯站点、官网等静态/半动态网站;

4. 多向量映射:为同一份数据生成多组向量,增加检索匹配路径,提升召回率。

(六)知识库优化与问题处理

1. 复杂PDF解析:文件解析 → 文本切片 → 内容提取 → 向量化 → 入库索引;

2. 问答对提取:将业务问答整理为标准问答对入库,提升检索匹配度与问答效率;

3. 用户提问不精准:通过问题优化模块,补充背景、自动补全、改写问题,标准化用户输入;

4. 智能评测:支持手动编写测试用例、系统自动生成测试数据,完成应用效果评估;

5. 检索采用Token上限而非TopK:单纯限制条数(TopK)易丢失关键语义,基于Token限制可保证上下文完整性。

(七)流程与节点能力详解

1. 问题分类节点:基于语义/关键词对问题分类,实现自动化流程分支跳转;

2. 工具调用:需具备调用权限、接口适配、参数合规三大核心条件;

3. 代码运行节点:仅支持JS、Python语言,网络仅开放白名单,和日常编程相比有严格环境与网络限制;

4. 温度参数 & 上下文窗口:温度控制模型输出随机性(值越高越发散);上下文窗口限制单次对话Token总量;

5. 智能问答 vs 工作流

- 逻辑控制:智能问答无固定流程,仅应答问题;工作流有完整分支、循环等逻辑;

- 配置方式:智能问答依托知识库+提示词配置;工作流可视化拖拽编排节点;

- 典型案例:智能问答用于客服问答、知识咨询;工作流用于固定审批、批量数据处理

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询