大语言模型微调及其应用的探索 跟踪前沿的技术
## 经典图与效果图
下列图示展示常见的归一化方法及其对特征分布与训练收敛的影响。
normalization_methods.svg(Min-Max、Z-score 等)normalization_effects.svg(归一化前后分布与 Loss 收敛对比)简要说明:
## 条件数与损失面示意
下图参考示意:左为未归一化时的损失面(扁长椭圆,对应高条件数),右为归一化后的对称损失面(低条件数)。
简要说明:
## 更清晰的示意(推荐)
我按你的参考重画了一张更清晰的图,直接展示:
该图意在直观显示归一化如何改变数据分布及损失面的几何形状,从而影响优化器的行为。
下面是从公开资源收集的示意图(供教学参考)。在公开发布或转载时,请根据下列来源页面核验并遵守具体许可条款。
deeplean_tran/external_images/Gradient_descent.svg — Gradient descent 等高线示意(来源:Wikimedia Commons,通常为 CC BY/CC BY-SA,详情见文件页面)。deeplean_tran/external_images/Error_surface_of_a_linear_neuron_with_two_input_weights.png — 线性神经元的误差面示意(来源:Wikimedia Commons)。deeplean_tran/external_images/Himmelblau_contour.svg — Himmelblau 函数等高线(示例损失面,来源:Wikimedia Commons)。deeplean_tran/external_images/Contour2D.svg — 通用等高线示例(Wikimedia Commons)。deeplean_tran/external_images/cs231n_prepro1.jpeg — CS231n 课程:数据预处理示意(中心化 + 标准化)。deeplean_tran/external_images/cs231n_prepro2.jpeg — CS231n 课程:PCA / Whitening 示例。deeplean_tran/external_images/cs231n_svm_all.jpg — CS231n 课程:SVM 损失 2D/等高线示意。deeplean_tran/external_images/cs231n_stepsize.jpg — CS231n 课程:步长/学习率示意图。插图预览:


使用与版权说明:
如需我把每张图的来源链接和许可文本直接写入文末的引用列表(带可点击 URL),我可以继续替你抓取并自动插入。