如何修复神经网络梯度爆炸问题?

蓝海大脑深度学习液冷服务器研究人员表示:

在深度神经网络中,梯度爆炸可以通过重新设计层数更少的网络来解决。

使用更小的批尺寸对网络训练也有好处。

在循环神经网络中,训练过程中在更少的先前时间步上进行更新(沿时间的截断反向传播,truncated Backpropagation through time)可以缓解梯度爆炸问题。


蓝海大脑 京ICP备18017748号-1