
在云平台中,如何有效的管理深度学习GPU阵列?
第一是说在虚拟化平台里面虚拟化,可以让资源切割的颗粒度更细致,在云平台里可以满足更多不同用户的需求,第二个是说在云平台里面支持不同的液冷GPU管理,可以从物理层面对高性能计算GPU做监控管理,这是和传统直接使用物理风冷GPU的一个区别。
阅读全文 → 2022-11-15
第一是说在虚拟化平台里面虚拟化,可以让资源切割的颗粒度更细致,在云平台里可以满足更多不同用户的需求,第二个是说在云平台里面支持不同的液冷GPU管理,可以从物理层面对高性能计算GPU做监控管理,这是和传统直接使用物理风冷GPU的一个区别。
阅读全文 → 2022-11-15
蓝海大脑深度学习液冷事业部研究人员表示:对于OpenCL与CUDA,APU的性能与英特尔的CPU+GPU不相上下,现在主流GPU主要是AMD和英伟达,英伟达因为已经形成了CUDA的生态环境,比如丰富的数学库,各类成熟的软件包,很多的商业软件也支持CUDA编程。OpenCL是一种通用的加速卡,不光是英伟达GPU支持,AMD的也支持,但是AMD支持的动态环境不是特别好。蓝海大脑液冷服务器事业部认为要是学习并行计算,还是建议从GPU,用CUDA来学比较好,如果上手的话,一开始可以从OpenACC切入,随着学习的
阅读全文 → 2022-11-11
蓝海大脑深度学习液冷服务器事业部研究人员表示:大家应该知道,Intel代号Sapphire Rapids的下一代Xeon处理器最高TDP将达到350W,AMD EPYC4功耗也是同级水平。上图中时间点应该是早些时候标的,众所周知Sapphire Rapids跳票了,所以AMD这一代应该会在前面正式上市。从风冷350W到冷板式液冷的600W
上半部分的蓝色梯形指的风冷。在ASHRAE A2(最高35℃进风温度)环境下,标准2U风冷服务器可以支持2颗350W TDP CPU,1U通用型服务器大约在300W左
阅读全文 → 2022-11-11
其实早期得互联网公司曾经不仅是Oracle 客户,还都是大客户,最典型的代表有两个,一个是亚马逊,一个是阿里巴巴,后来两者都纷纷去掉了O,可见并
阅读全文 → 2022-11-11
一直在关注半监督文本分类方向,说说我个人的想法。欢迎大家讨论。伪标签的本质,其实是熵最小化原则,基于一个假设:模型的性能越好,他的输出就应该越接近one-hot(不知道理解的对不对)。所以,筛选出置信度较高的样本,把他们对应的one-hot向量作为伪标签,然后让模型输出的soft output,去接近hard target,让输出的熵(不确定性)降低,从而达到提高模型训练效果的目的,这是我认为伪标签方法的本质。以上的讨论,需要注意的是,要筛选出较高置信度的样本,也就是说,这些样本模型的预测可以近似认为是正
阅读全文 → 2022-11-11
重度参与过 OLTP(MySQL) 和 OLAP(ClickHouse) 的内核研发,手写过好几个数据库原型,正好借这个问题谈谈个人的一些感受。
首先可以确定的是:数据库方向是非常有前(钱)途的,是门手艺活,学好可以吃一辈子(还可以传承到下一代)。
CPU/操作系统/数据库三大基础软件中,数据库是个人/小公司最有条件先做起来的。
数据库还有一个重要的地方:非常迷人,一旦入门,一发不可收拾,我是从十多年前一路狂奔到现在,每周都会写上一些内核代码。
另外
阅读全文 → 2022-11-11
蓝海大脑 京ICP备18017748号-1