对一个大型应用程序,在深度学习GPU上并行加速的时候,一般的步骤都有哪些?

对一个大型应用程序在深度学习GPU上并行加速的时候,不要直接就往上移植,最好是先好好分析一下这个程序,先把问题、结构和流程搞清楚。然后再把GPU移植所要采取的手段和方法也想清楚,之后再动手。我们一般说性能优化,包括三个方面:应用、算法和硬件体系结构。那么移植也差不多,先把应用搞明白,再去移植,然后再考虑如何用算法来实现,最后再结合高性能GPU和硬件来做这件事情。

蓝海大脑 京ICP备18017748号-1