NVIDIA DGX-1 深度学习超级计算机如何助力大规模深层次跨模态数据分析?

跨模态数据分析通常包含图像处理和文本处理两个通路。在图像处理方向,我们选用当前最强大的 152 层残差网络来进行特征学习。由于所使用的网络比较深,因此将模型放到多个 GPU上进行并行学习。网络包含的卷积操作可以用 DGX-1 中的P100 GPU 来进行加速,并且 DGX-1 超强的性能使得 GPU 并行操作比一般的传统机器要快很多。


在文本通路方面,使用 LSTM 网络来对数据进行序列化建模,即把每个词语当作 LSTM 每个时刻的数据。随着时间进行,最终预测全部的词语或者得到文本的整体特征表示。由于数据量较大,我们将数据放到多个 GPU 上进行分别训练,使得模型训练效率得到进一步提升。


NVIDIA DGX-1 深度学习超级计算机包含八个 P100 GPU,这给大规模深层次跨模态数据分析提供了非常强大的计算能力。通过实验发现,DGX-1 完全可以高效地处理大规模训练数据,使得模型可以很快地拟合,并取得非常好的结果。通过使用DGX-1,我们可以将原始的上百个 CPU 分布式计算 1~2 周时间缩短为单 DGX-1 的 3 天时间,大大提升了计算效率且减少了计算成本。


由于高性能 DGX-1 所带来的时间优势,我们能在短时间内得到结果,方便调试,并最终取得很好的跨模态分析结果。这为我们与国内互联网公司已经开展的合作研究奠定了坚实的基础,是为了进一步深入合作的计算平台保障。未来我们将收集网络上更大规模并的跨模态数据,并设计更深层次的网络模型,以便更好地发挥 DGX-1 高性能的优势,进而进一步提升数据分析的结果。


蓝海大脑 京ICP备18017748号-1