深度神经网络之数据归一化处理

大语言模型微调及其应用的探索 跟踪前沿的技术

深度神经网络之数据归一化处理

输入数据归一化的好处

  1. 加快收敛速度: 归一化使不同特征大小相似
  2. 避免梯度消失: 归一化可以防止输入范围过大或过小
  3. 提高模型的稳定性和泛化性
  4. 简化特征空间的映射关系

## 经典图与效果图

下列图示展示常见的归一化方法及其对特征分布与训练收敛的影响。

归一化方法示意

归一化效果对比

简要说明:

## 条件数与损失面示意

下图参考示意:左为未归一化时的损失面(扁长椭圆,对应高条件数),右为归一化后的对称损失面(低条件数)。

归一化对损失面的影响

简要说明:

## 更清晰的示意(推荐)

我按你的参考重画了一张更清晰的图,直接展示:

归一化清晰示意

该图意在直观显示归一化如何改变数据分布及损失面的几何形状,从而影响优化器的行为。

外部参考图像(示例与来源)

下面是从公开资源收集的示意图(供教学参考)。在公开发布或转载时,请根据下列来源页面核验并遵守具体许可条款。

插图预览:

Gradient descent 等高线示意

Error surface 示例

Himmelblau 等高线示意

CS231n: Data Preprocessing 示例

使用与版权说明

如需我把每张图的来源链接和许可文本直接写入文末的引用列表(带可点击 URL),我可以继续替你抓取并自动插入。