NVIDIA首批Blackwell GB200 NVL72服务器机架顶着散热问题报告发货
据报道,英伟达公司的 Blackwell NVL72 服务器机架正面临散热问题,而该公司已开始向市场供应主流产品。继架构缺陷之后,NVIDIA的Blackwell现在又面临服务器机架设计问题,但首批采用液冷技术的NVL72 AI服务器机架已开始发货。
NVIDIA的Blackwell架构尽管被寄予厚望,但从一开始就成为了开发障碍的受害者。 最初,有消息称Blackwell芯片面临板载互连技术的问题,最终促使台积电等供应链公司修改了生产方法。 这个问题不仅限制了 Blackwell 的供应,而且现在,根据 The Information 的报道,NVIDIA 似乎再次面临另一个障碍。
报道称,Blackwell 的服务器机架是一个平台,多个 Blackwell 接口相互堆叠,组合成"GB200"AI 服务器。 据说,问题明显出现在更高端的 NVL72 配置的 Blackwell 服务器上,据说从创收和客户利益的角度来看,这对英伟达来说是更"重要"的配置。 如果问题持续存在,鉴于 NVL72 服务器的需求量很大,我们可能会对英伟达的服务器营收前景持看淡态度。
英伟达对此回应,公司正在与领先的云服务提供商合作,"这是我们工程团队和流程不可分割的一部分。 工程迭代是正常的,也是意料之中的。"
目前还没有具体说明是哪方面的原因导致了这一问题,但据称这一问题可能源于所使用的冷却方法,英伟达已经敦促其供应商立即解决这一问题,因为它已经严重扰乱了供应链。
鉴于NVIDIA拥有庞大的资源和广泛的供应链结构,我们怀疑这个问题不会持续太久,因为制造商很可能正在修改服务器机架的设计。
有趣的是,英伟达公司的核心合作伙伴戴尔公司已经开始出货 Blackwell 服务器机架,特别是 PowerEdge XE9712 服务器,这是业界首批企业级英伟达 GB200 NVL72 服务器。 因此,除非服务器机架问题得到解决,否则英伟达最有可能采取的措施就是在初期限制供应。
尽管存在暂时的障碍,英伟达的Blackwell产品线仍将成为公司历史上"最成功"的产品,预计将创造数十亿美元的收入。 随着市场倾向于构建"人工智能集群",这推动了对该架构的巨大需求,并最终转化为更高的营业额。