如何确定是否出现神经网络梯度爆炸?

训练过程中出现梯度爆炸会伴随一些细微的信号,如:


模型无法从训练数据中获得更新(如低损失)。


模型不稳定,导致更新过程中的损失出现显著变化。


训练过程中,模型损失变成 NaN。


如果你发现这些问题,那么你需要仔细查看是否出现梯度爆炸问题。


以下是一些稍微明显一点的信号,有助于确认是否出现梯度爆炸问题。


训练过程中模型梯度快速变大。


训练过程中模型权重变成 NaN 值。


训练过程中,每个节点和层的误差梯度值持续超过 1.0。


蓝海大脑 京ICP备18017748号-1