介绍下TAO里关于内存访问密集型layer的优化？

这里的优化原则就是对于访问密集型计算可以进行一定fusion，用于减少访存量。当然也没有那么简单，比如把相应的kernel结合在一起，如果底层没有Kernel支持，我们会有CUDA代理的支持类，自动产生相当于跟fuse的多样的pattern可以匹配的一个Kernel。

网络研讨会

了解更多

注册以接收蓝海大脑活动/网络研讨会邀请

地址：北京市海淀区东北旺南路29号蓝海中心

联系电话：010－82770520

联系邮箱：marketing@lanhy.cn