ms-swift：一站式大模型开发框架，从推理到LoRA微调实战-创锋一号

1. 项目概述：当开源大模型遇见“瑞士军刀”

如果你最近在折腾大语言模型（LLM），无论是想在公司内部部署一个智能客服，还是想自己动手微调一个能写代码的助手，大概率都绕不开一个核心问题：如何高效、低成本地把一个动辄几十GB的“庞然大物”跑起来，并且让它听话地完成你指定的任务？从模型下载、环境配置、推理部署，到后续的微调、评估、服务化，每一步都像在走钢丝，稍有不慎就是满屏的报错和数小时的调试。就在这个背景下，我发现了ModelScope社区推出的ms-swift。这名字起得挺有意思，Swift是“迅速”的意思，也让人联想到苹果那个高效的编程语言。实际用下来，我感觉它更像是一把为AI应用开发者量身定制的“瑞士军刀”，目标很明确：让大模型应用的开发，变得像调用一个普通函数那样简单、快速。

ms-swift不是一个独立的模型，而是一个大模型开发框架与工具链。它深度集成在ModelScope这个国内领先的模型开源社区中。你可以把它理解为大模型时代的“Spring Boot”或者“Django”，只不过它服务的对象不是Web应用，而是各种预训练的大语言模型、多模态模型。它的核心价值在于，提供了一套统一的、高层的API和命令行工具，把底层那些繁琐、复杂且容易出错的步骤全部封装起来。无论是千问、ChatGLM、Baichuan，还是Llama、Qwen等国际主流模型，在ms-swift的视角里，它们都可以用相似的方式进行加载、对话、微调和部署。

我最初接触它，是因为需要快速对比几个不同模型在特定任务上的效果。按照传统做法，我得为每个模型准备一套独立的环境，写不同的加载和推理脚本，光是统一输入输出格式就够头疼的。而ms-swift通过一个简单的配置文件，就能让我用几乎相同的代码，切换不同的模型进行测试，效率提升了不止一个量级。对于算法工程师、全栈开发者，甚至是具有一定技术背景的产品经理来说，ms-swift极大地降低了AI应用的原型验证和工程化门槛。它解决的，正是从“模型好玩”到“模型好用”之间那条鸿沟。

2. 核心设计理念与架构拆解

2.1 为什么需要`ms-swift`？—— 解决大模型应用的“碎片化”之痛

在ms-swift出现之前，大模型的应用开发处于一种“碎片化”的状态。每个模型家族（比如Qwen系列、GLM系列）往往都有自己的代码仓库、自己的加载方式、自己的微调方案（如LoRA、QLoRA的实现）和自己的对话模板。这种碎片化带来了几个显著的痛点：

学习成本高昂：开发者需要为每一个想尝试的模型，去学习其特定的代码库和API，无法形成统一的开发心智。
工程效率低下：构建一个支持多模型的后端服务，需要为每个模型编写适配层，代码冗余且难以维护。
微调门槛高：虽然LoRA等参数高效微调技术理论上通用，但不同框架的实现细节、数据格式要求千差万别，调试过程异常痛苦。
部署复杂：将训练好的模型转化为可提供API服务的在线应用，涉及模型转换、服务框架封装、资源管理等诸多环节，每一步都容易踩坑。

ms-swift的设计目标，就是标准化。它试图定义一套“公约”，让不同的模型都能在这套公约下被操作。它的架构可以粗略分为三层：

最上层：开发者接口（CLI & Python SDK）。这是开发者直接接触的部分，提供了swift命令行工具和丰富的Python API。你可以通过一条命令完成模型下载、推理、微调、评估等全流程操作，无需关心底层实现。
中间层：核心框架层。这是ms-swift的“大脑”，包含了模型加载器（Model）、处理器（Processor，负责文本的tokenize和detokenize）、训练器（Trainer）、评估器（Evaluator）等核心组件。它抽象了各类模型的共性操作，并通过插件化机制兼容差异。
最下层：模型与后端适配层。这一层直接与Hugging Face的transformers库、peft（参数高效微调库）、deepspeed、vllm等底层引擎对接。ms-swift为每个支持的模型编写了适配器（Adapter），确保上层的统一调用能正确映射到底层模型的具体实现上。

这种架构带来的最大好处是解耦。作为开发者，你只需要和ms-swift的API打交道，而ms-swift团队负责维护与日新月异的底层模型和训练框架的兼容性。当有新的优秀模型或训练技术出现时，你通常只需要更新ms-swift，而无需重写自己的业务代码。

2.2 核心功能全景图：不止于推理

很多人第一次使用ms-swift，可能只是用它来快速体验一下模型的对话能力。这确实是其最基础的功能，但它的能力远不止于此。我们可以将其核心功能归纳为四个主要板块：

极简推理与对话：支持通过命令行或几行Python代码，启动与任意已支持模型的交互式对话。这对于快速验证模型的基础能力、进行效果对比，或者单纯地“玩一玩”模型，都非常方便。
全流程微调支持：这是ms-swift的强项。它集成了当前主流的参数高效微调（PEFT）方法，特别是LoRA及其变种（如QLoRA）。你只需要准备好数据（支持JSON、JSONL、CSV等格式），写一个简单的配置文件，就可以启动微调。它自动处理了梯度检查点、混合精度训练、学习率调度等复杂细节，甚至支持在消费级显卡（如单卡24G的3090/4090）上微调70B级别的大模型。
模型评估与量化：训练完模型，效果怎么样？ms-swift内置了与主流评测集（如C-Eval, MMLU）的对接能力，可以方便地对模型进行能力评估。同时，它也支持模型量化（如GPTQ, AWQ），帮助你将庞大的模型“瘦身”，从而在资源受限的环境（如边缘设备、低成本云服务器）中部署。
一键部署与服务化：模型微调好了，量化完了，最终要上线提供服务。ms-swift可以与vllm、TGI（Text Generation Inference）等高性能推理引擎集成，或者导出为标准的Hugging Face格式，方便你集成到FastAPI、Gradio等Web框架中，快速构建演示界面或API服务。

注意：ms-swift虽然功能强大，但它并非要取代transformers或peft这样的底层库。相反，它建立在它们之上，提供了一个更友好、更集成化的“开箱即用”体验。当你需要极度定制化的训练逻辑或模型结构修改时，可能仍需深入底层库。

3. 从零开始：环境配置与第一个对话

3.1 环境搭建：避坑指南

理论说了这么多，我们直接上手。第一步永远是环境配置。ms-swift强烈推荐使用Python 3.8及以上版本，并通过pip安装。但这里有几个关键点，直接关系到你后续能否顺利运行：

# 1. 创建并激活一个独立的虚拟环境（强烈建议，避免包冲突） conda create -n swift python=3.10 conda activate swift # 2. 安装ms-swift核心包 pip install ms-swift -U

看起来很简单，对吧？但坑往往就在这里。ms-swift依赖的底层库（如torch,transformers,peft）对版本非常敏感。特别是PyTorch的版本，需要与你的CUDA驱动版本匹配。如果你在安装后遇到类似“CUDA version mismatch”的错误，需要先明确你的显卡驱动支持的CUDA最高版本。

一个更稳妥的安装顺序是：

# 步骤一：根据你的CUDA版本，从PyTorch官网获取正确的安装命令 # 例如，对于CUDA 11.8 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 # 步骤二：安装ms-swift，它会自动安装兼容版本的transformers和peft pip install ms-swift -U # 步骤三：如果需要使用vllm进行高性能推理，单独安装（注意vllm对torch版本也有要求） # pip install vllm

实操心得：我建议在安装ms-swift之前，先单独安装好正确版本的PyTorch。很多环境问题都是由于PyTorch版本不对引起的。可以使用nvidia-smi查看驱动版本，然后去PyTorch官网查找对应的安装命令。如果网络环境导致从官方源下载慢，可以考虑配置镜像源。

3.2 第一个对话：与Qwen2.5-7B-Instruct聊天

环境搞定后，我们来跑通第一个对话。ms-swift的CLI工具设计得非常直观。假设我们想和最新的Qwen2.5-7B-Instruct模型聊聊天，只需要一行命令：

swift chat --model_id_or_path Qwen/Qwen2.5-7B-Instruct

当你第一次执行这条命令时，会发生以下几件事：

模型下载：ms-swift会自动从ModelScope Hub（默认）或Hugging Face Hub（如果指定）下载Qwen/Qwen2.5-7B-Instruct模型的所有文件（包括模型权重、配置文件、tokenizer）。这会消耗一定时间和磁盘空间（本例约15GB）。
加载与准备：下载完成后，框架会自动识别模型类型，加载对应的transformers模型和tokenizer，并做好对话准备。
启动交互界面：完成后，会进入一个命令行交互界面。你输入问题，模型生成回答，循环往复。

在交互界面里，你可以进行多轮对话。ms-swift会自动维护对话历史。输入/clear可以清空历史，输入/exit退出。

但是，如果你没有一张足够大的显卡（比如显存小于8GB），直接运行上述命令很可能会爆显存。这时，我们就需要用到ms-swift的量化或设备映射功能。

# 使用4位精度加载（QLoRA风格的量化），大幅降低显存占用 swift chat --model_id_or_path Qwen/Qwen2.5-7B-Instruct --load_4bit # 或者，如果显存实在太小，可以使用`--device_map auto`，让transformers自动将模型层分配到CPU和GPU上 # 这种方式推理速度会慢很多，但能让你在低显存机器上跑起来 swift chat --model_id_or_path Qwen/Qwen2.5-7B-Instruct --device_map auto

4. 核心实战：使用LoRA微调你的专属模型

对话只是开始，真正的威力在于让模型适应你的专属任务。比如，我想让Qwen模型学会用我们公司内部的风格写周报，或者根据特定的产品描述生成广告文案。这就需要用到微调。ms-swift让这个曾经复杂的过程变得异常清晰。

4.1 数据准备：格式是关键

微调的第一步是准备数据。ms-swift支持多种格式，但最推荐的是JSONL格式，即每行一个JSON对象。对于指令微调（SFT），通常需要包含instruction（指令）、input（可选输入）、output（期望输出）这几个字段。

假设我们要做一个“礼貌客服话术生成器”，数据文件data.jsonl内容如下：

{"instruction": "用户投诉快递延误了三天，非常生气。请生成一段安抚用户的客服回复。", "input": "", "output": "尊敬的客户，非常抱歉给您带来了不好的体验。关于您反馈的快递延误问题，我们已高度重视并紧急联系物流方核查。我们理解您的焦急心情，在此真诚致歉。为表歉意，我们将为您申请一张10元无门槛优惠券，预计24小时内到账。我们会持续跟进此单物流，并第一时间向您同步进展。感谢您的监督与反馈！"} {"instruction": "用户询问订单为什么还没发货。请生成一段解释原因的客服回复。", "input": "订单号：ORD20231027001， 原因：商品缺货，预计明天补货后发出。", "output": "您好，查询到您的订单ORD20231027001因部分商品暂时缺货，正在紧急调拨中，预计明天补货完成后会立即为您安排发出。让您久等了，非常抱歉！发货后我们会第一时间更新物流信息，请您留意。感谢您的耐心等待！"} // ... 更多数据

注意事项：

数据质量大于数量：对于SFT，几百条高质量、多样化的数据，远胜于几万条重复、低质的数据。确保你的output是精心编写的、符合目标的范例。
字段名可自定义：ms-swift的配置文件可以指定数据中对应的字段名，不一定非要叫instruction和output。
文本清洗：确保数据中没有多余的空格、换行符或特殊字符，这些可能会干扰tokenizer。

4.2 配置文件：微调的“总指挥”

ms-swift采用配置文件驱动的方式，这是其设计的一大亮点。所有关于模型、数据、训练超参数、LoRA设置的选项，都集中在一个YAML文件中。这带来了极好的可复现性和可管理性。

我们创建一个名为lora_train.yaml的配置文件：

# 模型配置 model_type: qwen2.5-7b-instruct # 指定模型类型，swift会根据这个自动选择正确的tokenizer和模板 model_id_or_path: Qwen/Qwen2.5-7B-Instruct # 模型ID或本地路径 # 数据配置 dataset: - custom: # 自定义数据集 data_files: # 数据文件路径 - path/to/your/data.jsonl format: json # 文件格式 columns: # 映射字段 instruction: instruction input: input output: output # 训练参数配置 output_dir: ./output # 输出目录 num_train_epochs: 3 # 训练轮数 per_device_train_batch_size: 2 # 每设备训练批大小，根据显存调整 gradient_accumulation_steps: 4 # 梯度累积步数，用于模拟更大batch size learning_rate: 1e-4 # 学习率 lr_scheduler_type: cosine # 学习率调度器 warmup_ratio: 0.05 # 预热比例 logging_steps: 10 # 每多少步打印一次日志 save_steps: 200 # 每多少步保存一次检查点 # LoRA 配置 (核心！) lora: r: 8 # LoRA的秩（rank），影响参数量和能力，通常8、16、32 target_modules: [ 'q_proj', 'k_proj', 'v_proj', 'o_proj', 'gate_proj', 'up_proj', 'down_proj' ] # 要对哪些模块应用LoRA，通常是注意力层和FFN层 lora_alpha: 32 # LoRA缩放因子，通常设置为r的2-4倍 lora_dropout: 0.1 # Dropout率，防止过拟合 # 量化配置（可选，用于在消费级显卡上微调大模型） quantization: quant_method: bitsandbytes # 量化方法 load_in_4bit: true # 使用4位量化加载基础模型 bnb_4bit_compute_dtype: float16 # 计算数据类型 bnb_4bit_quant_type: nf4 # 量化类型

这个配置文件几乎涵盖了微调的所有关键决策。其中lora部分的target_modules选择至关重要，它决定了LoRA适配器将附着在模型的哪些线性层上。对于大多数Decoder-only的LLM，选择注意力机制中的Q、K、V、O投影层以及前馈网络（FFN）中的门控、上、下投影层是一个通用且有效的策略。

4.3 启动训练：一行命令的事

有了数据和配置，启动训练只需要一行命令：

swift sft \ --config lora_train.yaml \ --gradient_checkpointing true \ # 启用梯度检查点，用时间换显存 --deepspeed default_zero2 \ # 可选，使用DeepSpeed ZeRO-2优化显存，多卡训练时尤其有用

训练开始后，你会在终端看到损失（loss）下降的日志。所有的输出，包括最终的LoRA权重（通常是一个safetensors文件）、训练日志、配置文件副本，都会保存在./output目录下。

实操心得：在开始长时间训练前，强烈建议先跑一个“试运行”。可以通过在配置文件中设置max_train_samples: 50（只取50条数据）和num_train_epochs: 1，快速验证整个数据流和训练循环是否能正确跑通，避免因数据格式错误或配置问题浪费几个小时甚至几天时间。

5. 模型评估、合并与部署

5.1 评估微调效果：不只是看Loss

训练完成后，损失曲线看起来不错，但模型真的学会新任务了吗？我们需要评估。

方法一：人工交互测试。使用训练好的LoRA权重进行对话，这是最直接的方法。

swift chat \ --model_id_or_path Qwen/Qwen2.5-7B-Instruct \ --lora_model_path ./output/checkpoint-xxx \ # 指定LoRA权重路径 --load_4bit # 如果训练时用了量化，推理时也需要

然后输入你在训练数据中准备过的指令，观察输出是否接近你期望的output。再输入一些训练数据之外的、但属于同一任务的指令，测试模型的泛化能力。

方法二：使用内置评估脚本。ms-swift支持在标准评测集上评估模型。例如，评估微调后模型在中文理解任务上的表现（注意：这需要额外下载评测数据集）：

swift eval --model_id_or_path Qwen/Qwen2.5-7B-Instruct \ --lora_model_path ./output/checkpoint-xxx \ --eval_dataset ceval \ --load_4bit

方法三：构建自己的评估集。准备一个eval.jsonl文件，格式与训练数据类似，但不包含output字段。然后写一个简单的脚本，用微调后的模型为每个instruction生成回答，再与你预先准备好的标准答案（或通过人工）进行对比，计算BLEU、ROUGE或基于GPT-4的评分。

5.2 模型权重合并：从LoRA到完整模型

LoRA训练产生的是一组小的适配器权重（adapter_model.bin或.safetensors），它需要和原始的基础模型一起加载才能工作。但在某些部署场景下，我们可能希望得到一个独立的、融合了LoRA权重的完整模型文件，以简化服务加载流程。

ms-swift提供了便捷的合并功能：

swift merge-lora \ --model_id_or_path Qwen/Qwen2.5-7B-Instruct \ --lora_model_path ./output/checkpoint-xxx \ --save_path ./merged_model \ --save_safetensors true # 保存为更安全的safetensors格式

执行后，./merged_model目录下就是一个完整的、可以直接用transformers库加载的模型了。合并后的模型体积与原始基础模型相同，但具备了微调学到的能力。

5.3 服务化部署：让模型提供API

模型最终要投入使用。ms-swift可以与多种推理引擎和Web框架结合，实现服务化。

方案A：使用vllm进行高性能推理服务化vllm以其高效的PagedAttention和连续批处理闻名，非常适合高并发API服务。首先，你需要将模型合并（如上一步），或者直接使用基础模型+LoRA（vllm最新版本已支持LoRA动态加载）。

# 1. 安装vllm pip install vllm # 2. 启动一个OpenAI兼容的API服务器（使用合并后的模型） python -m vllm.entrypoints.openai.api_server \ --model ./merged_model \ --served-model-name my-polished-qwen \ --port 8000 \ --api-key your-api-key-here

启动后，你就可以通过http://localhost:8000/v1/completions或/v1/chat/completions接口，以与OpenAI API完全兼容的格式调用你的模型了。

方案B：集成到FastAPI或Gradio如果你需要更灵活的控制，或者想快速构建一个演示界面，可以将ms-swift加载的模型包装到Web框架中。

# 示例：使用FastAPI创建一个简单的聊天接口 from fastapi import FastAPI, HTTPException from pydantic import BaseModel from transformers import AutoTokenizer, AutoModelForCausalLM from peft import PeftModel import torch app = FastAPI() # 加载模型和tokenizer (基础模型 + LoRA) model_path = "Qwen/Qwen2.5-7B-Instruct" lora_path = "./output/checkpoint-xxx" tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True) base_model = AutoModelForCausalLM.from_pretrained( model_path, torch_dtype=torch.float16, device_map="auto", trust_remote_code=True ) model = PeftModel.from_pretrained(base_model, lora_path) model.eval() class ChatRequest(BaseModel): message: str history: list = [] @app.post("/chat") async def chat(request: ChatRequest): try: # 使用ms-swift推荐的模板构造输入（此处简化，实际应使用对应模型的processor） inputs = tokenizer(request.message, return_tensors="pt").to(model.device) with torch.no_grad(): outputs = model.generate(**inputs, max_new_tokens=512) response = tokenizer.decode(outputs[0], skip_special_tokens=True) return {"response": response} except Exception as e: raise HTTPException(status_code=500, detail=str(e))

方案C：使用ms-swift内置的Web UIms-swift也提供了一个基于Gradio的快速Web UI，非常适合内部演示或轻量级应用。

swift web-ui --model_id_or_path Qwen/Qwen2.5-7B-Instruct --lora_model_path ./output/checkpoint-xxx

6. 避坑实录与进阶技巧

在实际使用ms-swift的过程中，我踩过不少坑，也总结出一些能提升效率和效果的经验。

6.1 常见问题与排查表

问题现象	可能原因	排查步骤与解决方案
`OutOfMemoryError`(OOM)	1. 模型太大，显存不足。 2.`batch_size`或`max_length`设置过大。 3. 未使用量化或梯度检查点。	1. 使用`--load_4bit`或`--load_8bit`量化加载模型。 2. 减小`per_device_train_batch_size`，增大`gradient_accumulation_steps`。 3. 在配置中启用`gradient_checkpointing: true`。 4. 使用`--device_map auto`或`--device_map balanced`进行CPU/GPU混合加载。
训练Loss不下降或为NaN	1. 学习率 (`learning_rate`) 设置过高。 2. 数据格式错误，模型无法学到有效信号。 3. 梯度爆炸。	1. 尝试降低学习率，如从`1e-4`降到`5e-5`或`1e-5`。 2. 检查数据文件，确保`instruction`和`output`字段内容正确，没有乱码或空值。用`swift chat`快速验证几条数据。 3. 启用梯度裁剪 (`max_grad_norm: 1.0`)。
模型生成无关或胡言乱语	1. 微调数据量太少或质量差。 2. 过拟合。 3. 推理时温度 (`temperature`) 参数过高。	1. 增加高质量训练数据。 2. 减少训练轮数 (`num_train_epochs`)，或增加LoRA的`dropout`。 3. 在推理时，设置`temperature: 0.1`或`top_p: 0.9`来降低随机性，使输出更确定。
`swift`命令找不到或报错	1. 虚拟环境未激活。 2.`ms-swift`未正确安装或版本冲突。	1. 确认已使用`conda activate swift`激活环境。 2. 尝试重新安装：`pip uninstall ms-swift -y && pip install ms-swift -U`。 3. 检查Python和pip版本。
加载LoRA权重后模型行为无变化	1. LoRA权重路径错误或文件损坏。 2. 推理时未正确加载LoRA权重。 3.`target_modules`配置与模型结构不匹配。	1. 确认`--lora_model_path`指向正确的目录（包含`adapter_config.json`和`adapter_model.safetensors`）。 2. 确保推理命令中包含了`--lora_model_path`参数。 3. 对于非常见模型，可能需要查看其结构来调整`target_modules`。可以尝试设置为`ALL`（谨慎，参数量会大增）。

6.2 进阶技巧与心得

数据才是王道：微调的效果，70%取决于数据质量。指令要清晰多样，输出要精准、符合预期风格。必要时，可以先用GPT-4等更强模型来辅助生成或润色你的训练数据。
LoRA超参数调优：r（秩）和alpha是关键。通常r=8或16是一个不错的起点，alpha可以设为2*r。更大的r和alpha意味着更强的适应能力，但也更容易过拟合。如果数据量很少（<1000条），可以尝试更小的r（如4）和更高的dropout（如0.2）。
使用--gradient_checkpointing和--deepspeed：它们是微调大模型的“救命稻草”。梯度检查点会稍微增加训练时间，但能显著减少显存占用。DeepSpeed ZeRO-2/3则能实现更极致的显存优化，支持微调更大的模型。
保存与版本控制：每次实验的配置文件、训练日志和最终权重，都应该妥善保存。可以在output_dir中使用包含日期、模型名、超参数的子目录名，例如./output/qwen7b-lora-r8-lr1e4-epoch3-20240527。这有助于你回溯和比较不同实验的结果。
从社区获取帮助：遇到棘手的问题，可以去ModelScope社区的GitHub仓库或论坛搜索Issues和Discussions。你遇到的问题很可能别人已经遇到并解决了。

ms-swift这套工具链，真正让我感受到了大模型应用开发的“工业化”味道。它把那些脏活累活封装起来，让开发者能更专注于数据、任务定义和效果迭代本身。从最初的手忙脚乱到现在的得心应手，这个过程也印证了一个道理：在AI工程化落地的路上，好的工具和标准化的流程，和算法创新一样重要。如果你正准备将大模型的能力集成到你的产品中，或者只是想高效地探索不同模型的可能性，花点时间熟悉ms-swift，很可能会让你事半功倍。

企业官网建设流程全解析

1. 项目概述：当开源大模型遇见“瑞士军刀”

2. 核心设计理念与架构拆解

2.1 为什么需要`ms-swift`？—— 解决大模型应用的“碎片化”之痛

2.2 核心功能全景图：不止于推理

3. 从零开始：环境配置与第一个对话

3.1 环境搭建：避坑指南

3.2 第一个对话：与Qwen2.5-7B-Instruct聊天

4. 核心实战：使用LoRA微调你的专属模型

4.1 数据准备：格式是关键

4.2 配置文件：微调的“总指挥”

4.3 启动训练：一行命令的事

5. 模型评估、合并与部署

5.1 评估微调效果：不只是看Loss

5.2 模型权重合并：从LoRA到完整模型

5.3 服务化部署：让模型提供API

6. 避坑实录与进阶技巧

6.1 常见问题与排查表

6.2 进阶技巧与心得

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

1. 项目概述：当开源大模型遇见“瑞士军刀”

2. 核心设计理念与架构拆解

2.1 为什么需要ms-swift？—— 解决大模型应用的“碎片化”之痛

2.2 核心功能全景图：不止于推理

3. 从零开始：环境配置与第一个对话

3.1 环境搭建：避坑指南

3.2 第一个对话：与Qwen2.5-7B-Instruct聊天

4. 核心实战：使用LoRA微调你的专属模型

4.1 数据准备：格式是关键

4.2 配置文件：微调的“总指挥”

4.3 启动训练：一行命令的事

5. 模型评估、合并与部署

5.1 评估微调效果：不只是看Loss

5.2 模型权重合并：从LoRA到完整模型

5.3 服务化部署：让模型提供API

6. 避坑实录与进阶技巧

6.1 常见问题与排查表

6.2 进阶技巧与心得

热门文章

文章分类

标签云

相关文章

Pixel2Geo™像素地理映射技术白皮书——铸就智慧港口厘米级空间感知巅峰

两相液冷：从“能跑起来”到“稳得下来”，满足智算中心对热管理的期待

计算机毕业设计 | SpringBoot+vue流浪宠物管理 小动物救助领养平台(附源码+论文)

需要专业的网站建设服务？

2.1 为什么需要`ms-swift`？—— 解决大模型应用的“碎片化”之痛

计算机毕业设计 | SpringBoot+vue流浪宠物管理小动物救助领养平台(附源码+论文)