由英特尔和 AMD 等公司发起的超级加速器连接联盟 (UALink) 已正式成立,该联盟旨在为 AI 数据中心服务器之间的高速和低延迟通信创建新标准。其董事会成员来自英特尔、AMD、思科、慧与 (即惠普企业)、Meta、AWS、谷歌、微软和 Astera Labs 等,同时联盟还在积极寻找更多贡献者成员。
超级加速器连接联盟将为众多 AI 加速器扩展连接的行业开放标准,以此对抗英伟达专有的 NVLink 技术,后者是英伟达用于服务器或服务器内 GPU 到 GPU 通信的解决方案。
UALink 联盟主席也在公开信中鼓励有兴趣的公司以贡献者成员的身份加入联盟以支持联盟的使命,即为 AI 工作负载建立一个开放且高性能的加速器互联。
值得注意的是虽然联盟刚刚才成立但相关技术方案已经有了研究,UALink 1.0 版技术规范将在年内向会员开放,该规范将为 AI pod 内多大 1024 个加速器实现高达每通道 200Gbps 的连接。
假设 NVIDIA HGX 类型的服务器内部有 8 个 AI 加速器,则 UALink 可以在一个 pod 中连接多达 128 台这样的机器,不过通常 UALink 最后可能经常以较小的规模使用,大约 8 个服务器的 pod 通过 UALink 相互通信,进一步的升级则由超级以太网处理。
UALink 标准将于 2025 年 1 季度正式发布,与超级以太网的第 1 版同步发布,AMD 最近已经宣布推出业界首款支持超级以太网的 400GbE 连接器。
无论是 AMD 的超级以太网还是 UALink 都是为了推翻英伟达在 AI 基础设施领域的统治地位,当然最终效果如何还有待观察。