面向GB300服务器的NVIDIA Blackwell Ultra"B300"AI GPU可能采用插槽式设计

摘要:

NVIDIA的Blackwell Ultra B300 GPU可能会在GB300服务器上采用插座式设计,这将使维护和升级变得更加容易。NVIDIA目前的数据中心高性能芯片采用了OAM设计,即板载解决方案。 通过这种设计,GPU 芯片被永久焊接到服务器主板上,如 GB200,用户可以在一块主板上同时找到 Grace CPU 和 Blackwell GPU。

NVIDIA-Blackwell-_5.png

不过,这可能是最后一个采用板载设计的系列,因为一些报道称 NVIDIA 可能会在用于 GB300 服务器的 Blackwell B300"Ultra"GPU上采用不同的设计。 根据 MoneyDJ  和Economic Daily News(通过Trendforce)的说法,B300 GPU 可能采用基于插座的设计,这将允许用户从主板上安装或卸载 GPU。

据悉,英伟达的 Blackwell Ultra"B300"AI GPU 采用插座式设计可简化英伟达的制造流程,并使多家公司受益,尤其是生产互连组件和插座的富士康。 目前的 Blackwell GPU 是直接焊接到主板上的,过渡到插座式设计后,B300 GPU 可以像 CPU 一样从主板上拆卸下来。

这种过渡将带来多种好处,包括提高良品率和实现灵活生产,因为 GPU 无需焊接到插座上,NVIDIA也无需依赖表面贴装技术。 此外,由于在出现与 GPU 相关的问题时无需更换整个主板,因此该流程将简化维护和售后服务。

NVIDIA-AI-GPU-Roadmap.png

因此,升级可以减少更换 GPU 时的整体停机时间,有助于公司为客户提供更可靠的服务器。 不过,预计新的插座设计会带来一些性能下降,因为这会带来更高的延迟。 尽管如此,如果能改善维护、升级和提高产量,那么这种权衡还是值得的。

B300 的另一个重要变化是采用了 FP4,这有利于推理过程。 推理是经过训练的模型对数据进行预测的方式,是人工智能计算的一个重要方面。 B200已经在人工智能工作负载中表现出色,并已被多家公司部署。

与此同时,B300"Blackwell Ultra"有望大幅提升性能,但它却并不是首款采用基于插槽设计的产品,因为 AMD 已经在 2023 年推出的MI300A 芯片中引入了这种设计。

GB200-Custom.jpg

查看评论
created by ceallan