GPU芯片的巨变前夜

摘要:

曾经,GPU在AI领域炙手可热,但步入2025年,它迅速遭遇了多重严峻考验。在过去半个月的时间里,GPU领域遭遇了两大主要挑战。首先,美国政府出台了新的禁令措施,对GPU的发展构成了直接限制。其次,ASIC等定制芯片的迅速崛起,给GPU市场带来了显著的冲击与竞争压力。

接下来,半导体产业纵横将深入探讨这两大因素如何具体影响着GPU市场。

挑战一:美国进一步收紧AI芯片出口

首先来看GPU面临的第一个挑战。

1月13日晚,拜登政府正式宣布加码对AI芯片及相关关键技术的出口管制,限制中国等竞争对手获取先进GPU的能力。

根据已公布的信息,新规按照受管制程度高低,将世界各国和地区划分为三大类别。日本、英国、韩国和荷兰、加拿大等18个美国亲密盟友和合作伙伴得到豁免,可以自由采购先进AI芯片;新加坡、以色列、沙特阿拉伯、印度、巴西和波兰等120多个国家和地区,将被施加AI芯片出口的配额限制;中国、俄罗斯、伊朗和朝鲜等,则被完全禁止获取高端AI芯片和先进的封闭权重模型(Closed-weight models)。

管制新规进一步明确,小批量订单不受配额影响:如果芯片订单的总算力未超过大约1700个先进GPU,那么就不需要获取美国的许可,并且不会计入特定国家或地区进口芯片的限额,以使得来自大学、医疗机构和研究组织的AI芯片订单可以继续进行。

另据美国商务部工业与安全局 (BIS) 官网披露,美国企业的海外数据中心建设亦将受到限制。新规要求像亚马逊、微软、Google这样的云服务提供商,必须在美国境内部署一半的受管制AI芯片;部署在美国亲密盟友和合作伙伴之外的受管制芯片规模,则不得超过25%;而且,在美国亲密盟友和合作伙伴以外的任何单一国家和地区部署的受管制芯片规模,不得超过7%。

美国商务部长雷蒙多称:“美国当前在AI开发和AI芯片设计领域处于世界领先地位,维持这种局面至关重要。”她还称,管制新规无意切断世界与AI创新的联系,而是专门限制海外最先进AI技术的发展。

这份AI出口管制新规设置了120天的意见征询期,并且内容可以修改,意味着后续将由特朗普政府最终决定先进AI芯片的出口规则。

众所周知,美国已多轮出击,对中国大陆获取 GPU 芯片实施管制。这一做法,一方面拖累了中国大陆 AI 能力的发展进程,另一方面,也悄然改写着 GPU 的市场格局。

受此影响,GPU 市场呈现两大变化。

GPU市场的两大变化

第一点,中国大陆本土 GPU 制造能力增强。

近年来,中国国内的许多GPU企业开始崭露头角。通过持续的投入和努力,国产GPU在性能、功能和应用领域等方面都有了提升,逐渐赢得了市场的认可和用户的信任。国产GPU不仅在传统图形处理领域取得了进展,也能够在人工智能、高性能计算等新兴领域展现出一定的竞争力。

主要厂商包括景嘉微、寒武纪、海光信息、天数智芯等。


虽然国产GPU芯片在技术上取得了显著进步,但与国际巨头如英伟达相比,仍存在性能差距。

未来随着计算需求的不断增长和算法的不断优化,国产GPU芯片需要不断提升其性能以满足更广泛的应用场景。通过加大研发投入,引入更先进的制造工艺和设计理念,国产GPU芯片有望在未来实现技术突破。

第二点,英伟达等 GPU 行业龙头的出货能力受到拖累。

早在2022年10月、2023年10月,美国商务部工业和安全局(BIS)两次更新对中国的先进半导体和计算设备的出口管制,英伟达中国特供版GPU产品A800、H800芯片均已受到管制。与此同时,AMD发布的性能最强的MI300X、MI300A、MI250X、MI250等多款 AI 芯片也不再能出口到中国了。

美国的出口管制政策使得英伟达无法向中国市场提供最先进、性能最强的 GPU 产品,这限制了其在华业务的拓展,特别是在人工智能、云计算等对高性能 GPU 需求旺盛的领域。中国作为全球最大的半导体市场之一,失去了这部分市场份额,对英伟达的营收增长带来了一定压力。

尽管英伟达之后试图通过推出一些替代产品来维持在中国市场的份额,如 HGX H20 GPU,但整体出货能力仍受到较大影响。

同时,这也可能引发全球 GPU 市场格局的调整,其他国际竞争对手可能会趁机抢占英伟达和 AMD 在中国市场留下的空白,进一步加剧全球 GPU 市场的竞争态势。

AI芯片出口管制新规的发布也引发了英伟达的批评。

英伟达政府事务副总裁Ned Finkle在1月13日一篇博文中指出,基于美国的技术,AI得以在世界各地广泛应用,推动了国内外各行各业的进步与发展。但拜登政府试图推行的“人工智能扩散”(AI Diffusion)规则,是前所未有和具有误导性的,这可能会破坏全球创新和经济增长。

Ned Finkle批评称,管制新规不会缓解任何威胁,只会削弱美国的全球竞争力,动摇那种使美国保持领先的创新能力。

挑战二:定制芯片ASIC的兴起,冲击GPU

年初,一股ASIC热席卷全球。

ASIC热潮兴起的原因主要有三点:

其一,GPU已成为AI芯片领域竞争的核心焦点。目前,英伟达所产出的GPU主要被各大科技巨头所垄断。

第二点,GPU价格的飙升使得这些科技巨头在采购芯片时需要支付更高的成本。

第三点,从另一角度来看,即便科技巨头暂且将成本因素置于次要地位,英伟达本身的供应不足状况仍使这些科技巨头忧心不已。

彼时寻找价格更为亲民、供应更具稳定性且能满足自身 AI 运算需求的芯片,成为了众多科技巨头的当务之急,而 ASIC 芯片的出现,恰到好处地契合了这些需求。

ASIC 热潮突如其来,追根溯源,去年 12 月是关键转折点。彼时,作为 ASIC 领域极为重要的概念股,博通的股价强势上扬,从 180 美元一路飙升至 250 美元,市值一举突破万亿美元大关。与之形成鲜明对比的是,英伟达风光不再,股价一路下行,甚至跌破 130 美元。

Google 公司大名鼎鼎的TPU(Tensor Processing Unit,张量处理单元),还有前几年很火的比特币矿机,英特尔的 Gaudi 2 ASIC 芯片,IBM 的 AIU,AWS 的 Trainium,都属于 ASIC 芯片。此外,这几年非常火的 DPU(Data Processing Unit,数据处理单元)和 NPU(Neural Processing Unit,神经网络处理单元),也是 ASIC 芯片。

倘若一定要知道两者各自有哪些优势,本文将在这里将ASIC与GPU做一个详细对比。

ASIC 专为特定 AI 算法定制,在执行特定任务时性能卓越,像 Google 的 TPU 针对深度学习矩阵运算优化,计算效率极高。它能效比出色,能降低能耗成本,且大规模处理数据时吞吐量高、延迟低。大规模使用时,其单位算力成本远低于 GPU,如Google的 TPUv5、亚马逊的 Trainium2 单位算力成本仅为英伟达 H100 的 70% 和 60%。不过,ASIC灵活性差,功能固定,算法改变就需重新设计,开发难度大,软件生态单一

GPU 通用性强,能应对多种计算任务,在科学计算、游戏渲染等领域广泛应用。其并行计算能力强大,适合处理复杂神经网络模型。而且,它拥有成熟丰富的软件生态,借助 CUDA 等,开发者易于上手。然而,GPU 在特定任务上效率逊于 ASIC功耗较高,会增加能耗成本。高端 GPU价格高昂,如英伟达 H100 售价 2.5 万至 3 万美元,获取难度大,且存在时延较高的问题。

GPU,会迎来淘汰吗?

那么有了ASIC,会很快就淘汰GPU吗?

笔者认为,非也。

综合多家第三方机构的统计可见,在GPU市场,英伟达目前占据了大约90%份额,AMD虽然也在积极发布GPU产品,但因为在软件生态建设方面不够完善,到目前为止仅个位数百分比市场份额。

凭借性能、生态、集成能力等方面的优势,英伟达的 GPU 仍然会是中短期内的 AI 芯片首选。英伟达的软硬件网络整套方案都很成熟,技术和资金实力太强,GPU 的存量和出货量依然很大,市场地位难以撼动。

ASIC 的崛起速度虽然很快,但仍需要一定的时间走向成熟。AI ASIC 芯片的研发,也具有很高的风险。即使研发成功,也需要时间被用户所接受。

这就意味着,在很长的一段时间内,GPU 和 ASIC 都将处于共存状态。基于不同的场景,用户会选择最适合自己的芯片。发展自研 ASIC,更多是有利于厂商们和英伟达进行谈判砍价。

AMD首席执行官苏姿丰也曾对这一问题发表过观点,苏姿丰表示:“目前,GPU是大语言模型的首选架构,因为GPU在并行处理方面非常高效,但在可编程性方面有所欠缺。五年多后它还会是首选架构吗?我认为情况会发生变化。”

苏姿丰预计,五年或七年时间内GPU还不会失势,但会出现GPU以外的新势力。

如此来看ASIC或许会是最优选之一。在未来一段时间内,ASIC芯片将处于快速发展阶段,摩根士丹利预计,AI ASIC市场规模将从2024年的120亿美元增长至2027年的300亿美元,年复合增长率达到34%。

当然,除了 ASIC 之外,像 FPGA 等其他类型的 AI 芯片也可能崭露头角,共同改变未来 AI 芯片的市场格局。GPU 虽然当前在 AI 领域占据重要地位,但随着技术的不断革新,其面临的挑战日益严峻,未来的 AI 芯片架构领域将充满更多变数与可能性。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan