
深度学习训练中出现Overfitting 和 Underfitting 问题,过拟合问题怎么解决?
首先所谓过拟合,指的是一个模型过于复杂之后,它可以很好地“记忆”每一个训练数据中随机噪音的部分而忘记了去“训练”数据中的通用趋势。训练好后的模型过拟合具体表现在:模型在训练数据上损失函数较小,预测准确率较高;但是在测试数据上损失函数比较大,预测准确率较低。解决办法如下:
数据增强, 增加数据多样性;
正则化策略:如 Parameter Norm Penalties(参数范数惩罚), L1, L2正则化;
dropout;
阅读全文 → 2022-11-22