国产通用服务器硬件是否支持NV link和NV switch?是否需要NVDIA整机? 国产通用服务器硬件大多数都支持NVLink和NVSwitch技术,作为AI计算的重要组成部分,NVLink和NVSwitch是NVIDIA推出的两种高速互联技术,可以提高多个GPU之间的数据传输速度和带宽。例如华为Atlas、浪潮DeepStation、蓝海大脑HD210系列等。不需要购买NVIDIA整机,只需要选择支持NVLink和NVSwitch技术的服务器硬件即可。 阅读全文 → 2023-03-24
对于NLP大模型训练应用,用NV link和NV switch的性能与传统PCI e通信,性能差别有多少? NVLink和NVSwitch是NVIDIA推出的高速互联技术,用于连接GPU和其他设备,如CPU、网络等。相比传统PCIe通信,NVLink和NVSwitch具有更高的带宽和更低的延迟,因此在NLP大模型训练应用中,它们可以提供更好的性能。 具体来说,NVLink可以提供高达300GB/s的带宽,而PCIe 4.0只能提供64GB/s的带宽。此外,NVLink的延迟也比PCIe低得多,这对于需要频繁通信的应用非常重要。NVSwitch则更进一步,可以提供高达2.4TB/s的带宽和低至100ns的延迟, 阅读全文 → 2023-03-24
A800集群能否与现有V100集群集成? 可以通过CUDA或者其他GPU计算框架搭建集群。A800集群适用于大规模数据处理和分析,而V100集群适用于深度学习和人工智能等领域。需要注意的是,确认A800和V100的计算能力和内存大小是否相似,以确保在集群中的负载均衡;A800集群采用的是InfiniBand网络架构,而V100集群采用的是NVLink网络架构,要注意网络修改网络架构;总之,混合使用A800和V100需要仔细考虑硬件和软件的兼容性,以确保集群的性能和稳定性。 阅读全文 → 2023-03-24
深度学习常用方法有哪些? 现在在应用领域应用的做多的是DNN,CNN和RNN。 DNN是传统的全连接网络,可以用于广告点击率预估,推荐等。其使用embedding的方式将很多离散的特征编码到神经网络中,可以很大的提升结果。 CNN主要用于计算机视觉(Computer Vision)领域,CNN的出现主要解决了DNN在图像领域中参数过多的问题。同时,CNN特有的卷积、池化、batch normalization、Inception、ResNet、DeepNet等一系列的发展也使得在分类、物体检测、人脸识别、图像分割等众多领域有了 阅读全文 → 2023-03-23
GPU的加速和编程用到了哪些物理原理,现在的理论瓶颈有哪些?技术突破点在哪里? GPU相对CPU,编程优势还是很明显。第一是架构效果特别明显,第二成本比较低,并且现在国内与国际应用生态已经很丰富了,不管从GPU各类的数学库,还是各类开源的软件包,以及商业包来讲,生态已经做的很好。不足的地方是设计上的问题,比如内存是有限的,另外一个是和CPU之间的数据通讯,英伟达提出的NVlink能够部分缓解CPU和GPU之间的数据通讯,跨界数据的交换。 阅读全文 → 2023-03-23
深度学习需要大量的样本,当识别效果不佳时,如何判断是样本问题和还是算法问题? 由于在大数据训练的过程当中,无法知道是数据集不合适还是算法不合适。这个时候不需要花太多精力去用一个不能定义的标准来判断另外一个不能定义的物体,而最好的办法就是带着你的数据去找一个模型进行迁移式训练的判断。比如在某个行业中,了解到谁在做差不多的模型,把这个模型拿过来,然后把数据放进去。如果这个数据是收敛的,那一定是算法问题,如果这个数据跑不通,那肯定是数据集的问题。 阅读全文 → 2023-03-23