大模型从0到精通：蒙眼下山法-AI如何一步步“摸索”到最优解？-创锋一号

本文是《大模型从0到精通》系列第一卷“奠基篇”的第三章。上章我们建立了“错题山谷”和评分标准（损失函数），但怎么找到山谷最低点？本章将引入梯度下降——AI在“错题山谷”中蒙眼下山的寻路算法，这是驱动所有AI（包括千亿参数大模型）学习的核心引擎。

想象你蒙着眼，站在“错题山谷”的某个山坡上（一组随机的a,b初始值）。四周漆黑一片，你怎么走到谷底？

你只能靠脚感受坡度：

这就是梯度下降的核心思想：不知道全局地形，只靠局部信息，一步步摸索到最低点。

用脚感觉坡度是物理直觉，数学上怎么表达？

梯度（Gradient）= 山谷在每个点的“最陡下坡方向指南针”

对于我们的奶茶模型：

梯度是一个向量：

关键操作：我们取梯度的反方向，因为我们要下降，不是上升。

假设在点(a=3, b=30)处：

知道了方向，走多远？

学习率（Le

企业官网建设流程全解析