深度神经网络之梯度参数调优

大语言模型微调及其应用的探索 跟踪前沿的技术

深度神经网络之梯度参数调优

  1. 动量梯度下降
  2. RMSProp
  3. Adam