深度网络之L2正则化

大语言模型微调及其应用的探索 跟踪前沿的技术

深度网络之L2正则化

为了让模型更“规则” 或 “平滑”从而得到更稳定,泛化能力更强的模型

作用是降低更过拟合问题