探秘英伟达显卡的制造之路 | 英伟达断供GPU,中国大模型何去何从? 在当今时代,人工智能技术正以前所未有的速度发展,推动着各个领域的创新与变革。作为人工智能技术的核心引擎之一,高性能GPU扮演着至关重要的角色。在这个领域,英伟达的H100无疑是一款备受瞩目的高端产品。它针对高性能计算和人工智能应用而设计,具备强大的计算能力和高内存容量,以及先进的互连技术,可以有效提升集群中的计算效率,加速深度学习、计算机视觉、自然语言处理等领域的AI训练和推理任务。 阅读全文 → 2023-11-03
一文详解多模态大模型发展及高频因子计算加速GPU算力 | 英伟达显卡被限,华为如何力挽狂澜? 近年来,全球范围内的芯片禁令不断升级,给许多企业和科研机构带来了很大的困扰,需要在技术层面进行创新和突破。一方面,可以探索使用国产芯片和其他不受限制的芯片来替代被禁用的芯片;另一方面,可以通过优化算法和架构等方法来降低对特定芯片的依赖程度。 阅读全文 → 2023-10-26
大模型AI芯片 群雄逐鹿,谁主沉浮?英伟达NVIDIA?AMD?华为? 随着人工智能、大数据、高性能计算、生成式AI和大语言模型的快速发展,芯片技术和服务器市场变得越来越重要。大模型需要高性能芯片支持,而芯片技术的发展又为大模型应用和推广提供可能。在这篇文章中,我们将探讨推进芯片快速发展的技术(稳态微聚束加速器光源)、华为和英伟达显卡的对比以及赋能生成式AI和LLM大模型负载L40S服务器。 阅读全文 → 2023-10-19
高性能计算与多模态处理的探索之旅:英伟达GH200性能优化与GPT-4V的算力加速未来 随着人工智能技术的不断发展,多模态大模型成为越来越重要的发展趋势。GPT-4V(GPT-4 近日开放的视觉模态)大型多模型(LMMs)扩展大型语言模型(LLMs)以增强多感知技能(如视觉理解等)从而实现更强大的通用智能。本文着重对GPT-4V进行深入分析,以进一步深化对LMM的理解。在此本文分析核心是GPT-4V可以执行的任务,同时包含用于探测其能力质量和通用性的测试样本。 阅读全文 → 2023-10-19
深度学习模型部署与优化:策略与实践;L40S与A100、H100的对比分析 随着生成式AI应用的迅猛发展,我们正处在前所未有的大爆发时代。在这个时代,深度学习模型的部署成为一个亟待解决的问题。尽管GPU在训练和推理中扮演着关键角色,但关于它在生成式AI领域的误解仍然存在。近期英伟达L40S GPU架构成为了热门话题,那么与A100和H100相比,L40S有哪些优势呢? 阅读全文 → 2023-10-06
高性能计算环境下的深度学习异构集群建设与优化实践 随着人工智能在工业和学术界大规模的应用,深度学习训练需求日益迫切。各组织机构投入大量资金购置和搭建配置GPU和InfiniBand网卡异构计算集群。集群管理系统(也称平台)支持模型训练,提供作业、数据和模型管理,并提供资源隔离。资源管理系统是深度学习系统的基础,企业级场景下,上层框架和应用通常在资源管理系统提供的资源上运行。 阅读全文 → 2023-09-24