加速计算有哪些解决方案？

针对加速计算提供了不同类型的解决方案，每一种解决方案都有其自己的优势和不足。选择的解决方案将取决于应用需求。

GPU 是加速某些 CPU 执行起来效率较低的数据处理任务的专业芯片。GPU 与 CPU 的协同方式是在应用中帮助 CPU 分担大量原始数据处理。得益于其并行处理架构，GPU 可同时处理大量数据。

顾名思义，GPU 旨在加速图形渲染。今天，GPU 的可编程性和灵活性得到了前所未有的提升，不同行业的开发商正在将其用于人工智能 (AI) 和创造性生产。此外，您还可以在超级计算机和工作站中同时使用多个 GPU，以加速视频处理、3D 渲染、仿真以及机器学习模型的训练。

GPU 适合离线数据处理，如 AI 训练和非实时分析等。但它们并没有针对实时视频流媒体以及 AI 推断等低时延应用进行优化。

TPU 是实现必要控制及算术逻辑来执行机器学习 (ML) 算法的专业电路。它们的算术逻辑单元（执行算术运算和逻辑运算的数字电路）彼此直接相连。因此可直接传输数据，无需使用任何内存。

与没有针对加速 ML 代码进行优化的 GPU 不同，TPU 对其进行了优化。但它们主要用于加速 Tensorflow、谷歌开源 ML 和 AI 软件库。因此，TPU 的灵活性极低。

自适应计算是唯一一种硬件在制造过程中不会永久固定的加速计算类型。相反，自适应计算涉及的硬件可以针对特定应用甚至特定加速功能定制。

自适应计算是一个新类别，建立在现有现场可编程门阵列 (FPGA) 技术基础上。FPGA 包含经过精心设计，在制造后可配置的器件，因此被称为“现场可编程”。通过根据确切需求定制其架构，它们实现应用的效率比 GPU 和 CPU（是通用固定架构的器件）都高。

这种灵活应变性使自适应计算成了加速计算的理想之选。

640 (1).png