深度神经网络之梯度参数调优

大语言模型微调及其应用的探索跟踪前沿的技术

深度神经网络之梯度参数调优

动量梯度下降
RMSProp
Adam

动量梯度下降：提出了参考历史梯度来平滑梯度震荡
RMSProp: 提粗了通过历史梯度的倒数控制学习率控制震荡
Adam: 动量梯度下降 + RMSProp 的结合