微软Azure成为首个NVIDIA Blackwell"GB200"AI服务器的云平台

摘要:

微软宣布,其 Azure 云平台将成为全球首个运行英伟达全新Blackwell GB200 AI 服务器的平台。微软今天展示了为Azure人工智能云计算平台打造的英伟达Blackwell GB200服务器。 微软Azure的官方账号发布消息称,他们是首个拥有GB200人工智能服务器的云系统,可用于扩展高级人工智能模型。

Hot-Chips-Exploded-View-Blackwell-Custom.jpg

Microsoft Azure 是第一个运行 @nvidia 的 Blackwell 系统和 GB200 驱动的 AI 服务器的云。 我们利用 Infiniband 网络和创新的闭环液冷技术,在每一层都进行了优化,以支持世界上最先进的人工智能模型。 在 MS Ignite 了解更多信息。 pic.twitter.com/K1dKbwS2Ew

- Microsoft Azure (@Azure) 2024 年 10 月 8 日

Microsoft-Azure-GB200-Server.jpg

Microsoft Azure 为客户提供虚拟机、人工智能处理等服务,用于管理应用程序。 这样,用户就可以扩展和升级其应用程序,而无需自己拥有硬件。 通过使用最新的NVIDIA Blackwell B200 GPU,Azure为用户提供了前所未有的高性能。

搭载GB200的人工智能服务器将使用旗舰级数据中心B200 GPU,该GPU采用GB200芯片,提供192 GB HBM3e内存。 该 GPU 是一款高性能芯片,主要用于深度学习、训练大型人工智能模型和处理大型数据集等高级和繁重的工作负载,同时比其前代产品更加高效。

GB200-NVL72-featured.jpg

通过使用 B200 GPU,Azure 可以更快地训练人工智能模型,确保其性能在所有其他云计算平台中处于领先地位。 如图所示,该公司拥有一个装有多个 B200 GPU 的服务器机架。 我们不知道这台服务器内使用了多少个 B200 GPU,也不知道该公司已经部署了多少个。

该服务器采用液体冷却解决方案来保持较低的温度,这看起来像是微软为了解如何在商用服务器中实施液体冷却而进行的初步测试阶段。

需要注意的是,展示的这台服务器并非 GB200 NVL72,英伟达为其准备了 36 个 Grace CPU 和 72 个 B200 GPU。 该机架非常强大,可以构建一个强大的平台,产生高达 3240 TFLOPS 的 FP64 张量核性能,并将用于台湾富士康最快的超级计算机。

我们最近报道了OpenAI 在 X 上展示 DGX B200 系统,看起来还有更多的公司正在加入使用 NVIDIA Blackwell 芯片的竞赛。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan