如何修复神经网络梯度爆炸问题?
蓝海大脑深度学习液冷服务器研究人员表示:
在深度神经网络中,梯度爆炸可以通过重新设计层数更少的网络来解决。
使用更小的批尺寸对网络训练也有好处。
在循环神经网络中,训练过程中在更少的先前时间步上进行更新(沿时间的截断反向传播,truncated Backpropagation through time)可以缓解梯度爆炸问题。
蓝海大脑 京ICP备18017748号-1