微软 Azure ND H100 v5 VM 虚拟机即将发布,现已有预览
据微软 Azure 官方发布,微软将过去十年的超级计算经验和支持超大型 AI 训练工作负载的经验应用于搭建具备大规模化高性能的 AI 基础架构。
微软 Azure ND H100 v5 VM 虚拟机即将发布,现已有预览
微软 Azure 智能云为微软及其客户的生成式 AI 发展奠定了基础,特别是以图形处理单元(GPU)加速的虚拟机(VM)。目前,微软推出了全新的 ND H100 v5 VM,这是 Azure 迄今更强大和高度可伸缩的 AI 虚拟机系列。该虚拟机支持的按需配置可达 8 至上千个 NVIDIA H100 GPU,通过 Quantum-2 InfiniBand 网络互连,可以明显提高 AI 模型的性能。与上一代 ND A100 v4 VM 相比,本次推出的虚拟机包含了许多创新技术,如:
8 块 NVIDIA H100 Tensor Core GPU,通过下一代 NV Switch 和 NV Link 4.0 互连。
每个 GPU 搭载 400 Gb / s NVIDIA Quantum-2 CX7 InfiniBand,在无阻塞胖树网络中,每 VM 可以达到 3.2Tb / s 的性能。
微软表示,大规模 AI 已内置于 Azure 的 DNA 中。为生成式 AI 的问世做好了充分准备,Azure 在大型语言模型研究(如图灵)的初始投资和云中构建第一台 AI 超级计算机等里程碑方面做出了投资。Azure 机器学习等 Azure 服务让客户能够访问 AI 超级计算机进行模型训练。Azure OpenAI 服务使客户能够利用大规模生成式 AI 模型的强大功能。微软一直在优化 Azure 的 AI 基础设施,将规模作为其优化目标之一。现在,微软为各种规模的初创公司和企业带来了无需大量物理硬件或软件投入的超级计算功能。