权值衰减

（工学 | 信息与通信工程）

权值衰减（weight decay），工学-信息与通信工程-模式识别-统计模式识别-深度学习-权值衰减，调节模型复杂度对损失函数的影响的方法。是限制模型的权值变得过大，提升模型的泛化性能。在模式识别与机器学习任务中，如果训练数据规模较小或者模型权重参数量过大，就会导致模型的复杂度上升，容易出现过拟合问题。该问题的出现是由于一些权重值为了使得模型训练误差尽量减小而逐渐变大，但这样会导致模型的测试误差变大，泛化性能降低。使用权值衰减的目的是限制模型的权值变得过大，维持模型的复杂度在较低的水平，从而可以缓解过拟合问题，提升模型的泛化性能。在实际操作中，权值衰减通常作为一个系数出现在损失函数中正则项的前面。其中正则项一般是模型所有权重值的平方和，指示模型的复杂度大小。最小化权值衰减系数与正则项的乘积可以惩罚变得过大的权重值，调节模型复杂度对损失函数的影响。