为什么高性能计算 GPU 没有分支预测?
因为不需要,深度学习高性能 CPU 需要分支预测,是因为很多在高性能液冷CPU服务器上运行的代码,不需要多线程执行,只能单线程运行,因此单核性能非常重要,分支预测可以大幅提高单核的效率。而在深度学习GPU液冷服务器上运行的代码,都是多线程并行的,单线程效率不重要。比如我现在使用的电脑,CPU是i7-9700K,只有8个核心。而我的显卡是RTX2060,有1926个CUDA cores,比高性能CPU计算的核心数高出几个量级。要提高深度学习液冷GPU工作站的性能,最关键的一点就是猛堆核心数量,核心越多,性能就越高。不需要分支预测这种花里胡哨的东西。
蓝海大脑 京ICP备18017748号-1