为什么高性能绿色计算十分重要? 蓝海大脑高性能计算数据中心研究人员表示: 绿色计算是应对气候变化的重要工具,而气候变化是这个时代的生存威胁。 在过去的一个世纪中,全球气温上升了约 1.2 摄氏度,这使冰川融化,进而导致海平面上升约 20 厘米,并增加了极端天气事件的频率和严重性。 用电量的增加是引起全球变暖的原因。虽然数据中心目前的用电量为每年 200 太瓦时,只占总用电量的约 1%,但这个数字却在不断增加,需要引起重视。 强大、节能的计算机是解决方案的一部分。它们正在推动科学的发展和生活质量的提高,包括人们理解 阅读全文 → 2022-11-28
什么是高性能绿色计算? 绿色计算或可持续计算指在设计和使用计算机芯片、系统和软件的过程中,最大限度地提高能效并减轻对环境的影响。 绿色计算也被称为绿色信息技术、绿色 IT 或可持续 IT,它涵盖了整条供应链,从用于制造计算机的原材料到系统的回收方式。 在工作过程中,绿色计算机必须以最少的能源完成最多的工作。通常是以每瓦特性能来衡量绿色计算机的效率。 阅读全文 → 2022-11-28
深度学习训练模型时,液冷GPU显存不够怎么办? 对于大模型在小显存的 GPU 上训练,通常需要调小 batch size,但是这就意味着更低的准确率。在保持 batch size 不变的情况下正常训练,通常只有两种方法:升级装备(用金钱换显存),用时间换显存。说到性价比,现在一块 32G 的 V100 至少要 6W 起步,而一块 11G 的 1080Ti 大约是 6K 左右,你需要多花 10 倍的金钱才可以让显存容量提升到原来的 3 倍左右。但是,有了 MegEngine v1.4 之后,你 阅读全文 → 2022-11-28
影响算力发展的相关因素? 实际总算力 = (单个处理器的)性能 x 处理器的数量 x 利用率 这样,跟算力相关的需要优化的因素就可以简单总结为三个层次: 第一个层次,单芯片性能。单芯片性能的提升,简单地来说,主要有三个办法:工艺进步、Chiplet封装以及架构/微架构创新。 第二个层次,芯片的落地规模,即数量。要想芯片大规模落地,首先要考虑的不是简单的建设数据中心,买更多的服务器,而是要考虑芯片是否能够支持大规模落地。例如,受AI算法快速多变和算法众多的原因,目前A 阅读全文 → 2022-11-25
“黄金年代”之后,计算机体系结构将何去何从? 一、从分离到融合 DPU目前已经成为行业一个重要的处理器类型,DPU跟智能网卡最大的区别在于:智能网卡是单领域的加速卡,而DPU是多领域加速的集成平台。DPU的出现,说明了,计算机体系结构在从DSA的分离向融合转变: 第一阶段,CPU单一通用计算平台; 第二阶段,从合到分,CPU+GPU/DSA的异构计算平台; 第三阶段,从分到合的起点,以DPU为中心的异构计算平台; 第四阶段,从分到合,众多异构整合重构的、更高效的超异构融合计 阅读全文 → 2022-11-25
深度学习复杂计算分析的挑战有哪些? 蓝海大脑深度学习液冷工作站研究人员表示: 底层计算的资源主要是CPU、内存、网络和存储等I/O,以及GPU、DSA等加速器。复杂计算的核心挑战在于:如何把种类繁多并且架构/接口不一致的资源汇集成池。 个体的硬件,需要支持非常好的扩展性。个体硬件包括各种异构的处理器资源,可以形成小的资源池;并且支持数以万计的个体资源连成一片,形成更大的资源池。 硬件个体需要支持系统的连接和融合,根据程度的高低,分为四个阶段: 阶段一,孤岛。所有设备各自独立的工作; 阶段二,互联。把设备连到一起 阅读全文 → 2022-11-25