在深度学习大规模分布式训练过程中，如何做到计算和通信重叠？

公司介绍
动态资讯
热点问题
加入我们

在高性能GPU里面的话，因为通信的过程中和训练过程中其实底层都是CUDA。对于CUDA，它可以通过多流的方式做到有计算是一个或一些kernel，然后放在一个Stream里，通信可以放到另外一个Stream里。Stream之间可以是它原生的，可以去根据GPU资源做到一个通信和计算的隐藏，然后可以做一个比较好的性能的增加，这个是通过Stream去做的。

网络研讨会

了解更多

注册以接收蓝海大脑活动/网络研讨会邀请

创新
卓越
共赢

: 扫一扫
关注官方微信

: 扫一扫
关注官方知乎

: 扫一扫
关注官方百家号

地址：北京市海淀区东北旺南路29号蓝海中心

联系电话：010－82770520

联系邮箱：marketing@lanhy.cn