为什么晋升答辩越来越像一场表演?
2026/6/11 1:23:55
机器学习模型在现实世界中的可靠部署,面临一个根本性挑战:训练数据所代表的“已知世界”与测试数据可能来自的“未知世界”之间存在差异。当模型遇到与训练分布不一致的样本时,其预测往往会变得不可靠甚至完全错误,这对自动驾驶、医疗诊断等高安全性领域构成了严重威胁。因此,识别并妥善处理这些分布外样本,成为构建稳健人工智能系统的核心任务。
本节将系统阐述分布外检测的三大核心范畴:异常检测、新颖性检测与领域适应。它们共同构成了从“发现问题”到“适应问题”的完整技术链路。我们将首先辨析其内在关联与差异,然后深入剖析各类核心方法,并结合典型应用案例,最终梳理出该领域的知识要点与未来方向。
异常检测、新颖性检测与分布外检测等术语常被混用,但它们在问题设定和目标任务上存在微妙而关键的区别。一个统一的广义分布外检测框架有助于厘清这些概念。
为更清晰地区分,下表概括了三者的主要特征:
表:异常检测、新颖性检测与分布外检测对比
| 维度 | 异常检测 | 新颖性检测 | 分布外检测 |
|---|---|---|---|
| 训练数据假设 | 可能包含异常点 | 仅为正常/已知样本 | 来自特定分布(通常为正常样本) |
| 核心目标 | 发现数据中的罕见模式或错误 | 识别未见过的全新类别或状态 | 判断样本是否偏离训练分布 |
| 典型输出 | 异常/正常二分类标签 | 新颖/已知二分类标签 | OOD/ID二分类标签或分数 |
| 问题侧重点 | 数据清洗、故障发现 | 开放世界识别、安全预警 | 模型可靠性、预测校准 |
分布外检测方法多样,可从不同角度分类。本部分将介绍几种主流且具有代表性的技术路径。
该方法假设模型(如自编码器)能够良好地重构分布内数据,而难以有效重构分布外数据。通过比较原始输入与重构输出的差异(即重构误差)作为OOD分数。
一个典型的自编码器旨在学习一个编码函数EEE和解码函数DDD,最小化重构损失Lrec=∥x−D(E(x))∥2\mathcal{L}_{rec} = \|x - D(E(x))\|^2Lrec=∥x−D(E(x))∥2。对于测试样本xtestx_{test}xtest