深度学习复杂计算分析的挑战有哪些?
蓝海大脑深度学习液冷工作站研究人员表示:
底层计算的资源主要是CPU、内存、网络和存储等I/O,以及GPU、DSA等加速器。复杂计算的核心挑战在于:如何把种类繁多并且架构/接口不一致的资源汇集成池。
个体的硬件,需要支持非常好的扩展性。个体硬件包括各种异构的处理器资源,可以形成小的资源池;并且支持数以万计的个体资源连成一片,形成更大的资源池。
硬件个体需要支持系统的连接和融合,根据程度的高低,分为四个阶段:
阶段一,孤岛。所有设备各自独立的工作;
阶段二,互联。把设备连到一起,设备和设备之间可以通信;
阶段三,协同。C/S架构是典型的协同;有了协同,也就有了云网边端。
阶段四,融合。协同通常是静态的,随着时间推移,初始任务划分不一定能适应系统的发展;融合代表着动态以及更多自适应性;协同代表着多个系统的协同,而融合代表了多个系统融合成一个大系统。
站在宏观大系统的视角,云服务器、边缘服务器、终端设备,以及网络设备,都是一致性的硬件。通过软件编排,选择尽可能最优的资源,组成最适合软件运行的逻辑平台。
算力芯片是水滴,算力网络是海洋。我们要思考的是,这滴水如何设计的更好,更好地融入到这片海洋,让海洋更加浩瀚宏大。
蓝海大脑 京ICP备18017748号-1