GPU 性能超过英伟达?AMD 这次又YES了?
一觉醒来,感觉整个朋友圈都被 AMD 和 苏妈刷屏了。一开始还有点奇怪,最近AMD 也没发什么新的游戏 CPU 和显卡啊。点进去才知道原来是前两天,AMD 在大洋彼岸的加州圣何塞召开自己的年度 AI 盛会 Advancing AI 。
吓得我赶紧去补看了下我 “女神” 苏妈又带来了什么新鲜玩意儿。
在练了两个小时的英语听力之后,我逐渐感觉到,事情好像不太对劲啊 ——
怎么会上发的都是服务器GPU,开发者平台这些东西,好像跟我这个臭打游戏的,还有广大的普通消费者没什么关系啊。
苏妈,你变了!
可当我又回过头去研究了下,才发现 AMD 看着是一本正经地在讲 AI,但是整个 keynote 透露出来的味道还是我们熟悉的那种 AMD YES 的感觉。
按照我们的习惯,我们还是先来看看这次新发布的产品吧。
首先是这两年大家关注比较多的 GPU,最新的 AI 芯片 Instinct MI350 系列。
该系列中的 MI355 被苏妈单独拎了出来讲,只见苏妈满脸自豪地给我们介绍:
MI355 采用 3nm 制程及 3D 先进封装技术,集成了 1850 亿个晶体管,搭载 288GB HBM3e 内存,内存带宽为 8TB/s,在 FP4、FP6 精度下峰值算力达 20PFLOPS,单个 GPU 可运行 5200 亿个参数的大模型。
整体的 AI 能力上,MI355X 跑 LLama 3.1 的神经网络吞吐量比上一代 MI300X 高出了 35 倍。
用来跑具体的大模型的话,MI355X 的性能同样出色。在Deepseek-R1、Llamma 4 Maverick 和 Llama 3.3 70B 上,MI355X 的性能分别是前代产品的3倍、3.3 倍和 3.2 倍。
可能苏妈自己也知道这样叽里咕噜地讲参数跟自己上一代比一比,大家看了会觉得很无聊,所以干脆不装了 ——
直接拉上隔壁老黄家的产品进行了一个我们熟知的赛博斗蛐蛐。
按照苏妈的说法,AMD MI350 系列的内存容量是英伟达 GB200 的 1.6 倍。
具体的AI的性能表现上,运行 DeepSeek-R1 或 Llama3.1 时,AMD MI355X 每秒产生的 tokens 比英伟达 B200 多 20%~30%。
不光是性能,AMD 在传统强项上也没放过英伟达:MI355X 每美元可提供的 tokens 比英伟达 B200 产品多 40%。
主打一个性能我跟你差不多,但我比你便宜,可以说相当适合那些嫌英伟达太贵的企业买回来搭自己的 AI 数据中心了。
但是细心的差友,应该发现了 —— 不对啊苏妈,这个 B200 我怎么记得是英伟达上一代的产品了?
还真是,托尼查了下发现,B200是英伟达在2024 年在英伟达年度开发者盛会 GTC 上发布的。GB200 也是在这场大会上发布的,它由两颗 B200 GPU 与一颗 Grace CPU 芯片组合而成。
而英伟达的当代产品,是今年 3 月 19 日在英伟达年度开发者大会上发布的 B300 和 GB300。
好在即使是面对英伟达当代的产品,苏妈的 MI355X 也丝毫不虚。
单从 FP4、FP6 精度下的峰值算力原始数据,MI355X 以 20PFLOPS 领先于 英伟达的B300 的 15PFLOPS 。
而GB300 由于是一个集成化的计算平台,与单芯片 MI355X 的直接算力对比需结合实际系统部署场景。
不过就推理性能提升幅度而言,GB300 相比 GB200 提升 1.5 倍,在复杂 AI 推理任务的实际运行中,可能也就和 MI355X 打的有来有回吧。
看来虽然我们不知道为啥苏妈在发布会上怂了,只敢对比友商上一代的产品,但我们仍然可以放心的喊出那句:
AMD, YES!
然而喊完这句之后,托尼仍然要说一句,AMD 当下在 AI 市场的处境,仍然不算乐观。
根据财报统计,2024 年一年,AMD 旗下的数据中心业务收入为 126 亿美元,全年增长 94%。
图片来自:< AMD公布2024年第四季度及年度财报 > - AMD
光看这个数字的确是够惊人了,但盖不住老黄更猛:
英伟达在2024年与 AMD 增速相同,规模却达到 1152 亿美元,是 AMD 的 10 倍左右。
图片来源:
而在去年的全球数据中心 GPU 市场中,英伟达靠一己之力直接拿下了94% 的份额,而 AMD 仍然只有可怜的 4%。
图片来源:Wells Fargo Equity Research via Next Platform
显然,AMD 也是能看到这样这样的处境的,所以在这次的 Advancing AI 2025 上,我们也看到了它的努力。
不光是在GPU 性能上努力追上了英伟达,在生态建设上,也开始一步一步地往前走了。
比如推出全新 AI 软件栈 ROCm 7.0。相比前代,ROCm 7.0 的推理性能提升至 4 倍以上,训练性能提升 3 倍 。
性能上的提升倒是其次,最重要的是它对 GPT、Llama 4、DeepSeek 等多款主流大模型提供 Day 0 级支持,意味着但凡这些大模型发布了更新版本,开发者们都能借助 ROCm 7.0 迅速开展相关开发工作,大大缩短了开发周期。
看来 AMD 还是一如既往地贴心。
不光如此 AMD 还推出了 AMD 开发者云,他们的这么做的设想是,能让开发者无需自行搭建复杂的硬件环境,通过云平台即可便捷地获取 AMD 先进的 AI 硬件资源,
这对广大的 AI 开发者,尤其对于小型团队和个人开发者而言,无疑是个更大的好消息。
另外,苏妈在 Advancing AI 的现场给我们带来了另一个惊喜:
下一代 AI 芯片 MI400 系列将于明年发布,MI400 系列将由 AMD 和 OpenAI 联合研发,OpenAI 为 MI400 系列的训练和推理需求提供了重要反馈 。
所有这些加起来,看着是不是有点当年 AMD 在消费级 CPU 那味儿了。
想当年,看着英特尔在消费级 CPU 领域一家独大,接过烂摊子的苏妈,硬是顶住了压力微微一笑, 先是抱住了台积电的 “大腿”,转身又拿出了 “ Zen ” 架构,性能哐哐的就追上了英特尔。
更绝的是,AMD 性能追上来了,但价格反而要比英特尔更划算。那句经典的 AMD YES 就是这么来的。
看到 AMD 锐龙处理器这么能打,游戏本厂商们也坐不住了。以前大家基本都围着英特尔转,现在纷纷开始推出搭载 AMD 处理器的游戏本。
就这样 AMD 靠着制程工艺的突破、架构的革新、超高的性价比,当然啦游戏本厂商的支持,成功在消费级 CPU 市场,尤其是游戏本市场,把英特尔从神坛上拉了下来,上演了一场精彩绝伦的逆袭大戏。
虽然 AI 和云计算领域玩法和逻辑不一定跟当年的消费级 CPU 完全一样,现在的英伟达也不见得就是当年的英特尔。
在这些领域,AMD 能不能再来一次大逆袭,还不可知。
但我们还是很开心地看到,AMD 即使处在不利的地位,也依然能保持清醒,脚步踏实地走自己的路。
托尼也很希望,AMD 能够继续保持,找准时机在 AI 和云计算领域啃下更多的市场。
虽说这跟我一个臭打游戏的没啥关系,但总想着这个市场老是只能看到老黄穿着皮衣在上面侃侃而谈,多少有点无聊。
总得多点别的身影嘛,我看苏妈这会这套红色的装扮就挺不错的