英特尔显卡上新 这波能否在消费级AI市场分到一杯羹?
在台北国际电脑展上,英特尔正式发布锐炫Pro B系列显卡,该系列在发布前就已经受到了许多的关注。不过并非因为AI性能,而是传闻锐炫Pro B系列将以消费级的价格,提供更大的显存和同级别领先的AI算力,这就足以让不少个人用户感到兴奋了。
先来看看本次发布的产品规格,锐炫Pro B系列首发共有两款产品,分别是B50和B60,规格上有着不少区别。其中B50拥有16个Xe核心和128个XMX引擎,峰值算力可达170 TOPS,配备16GB DDR6显存,显存带宽为224GB/s,TDP仅为70W,并且支持PCIe 5.0×8连接,售价仅299美元(人民币2156元)。
图源:英特尔
B60则拥有20个Xe核心和160个XMX引擎,峰值算力可达197TOPS,并且配备24GB DDR6显存,显存带宽为456GB/s,主板功耗支持在120~200W之间调整,同样支持PCIe 5.0 x8接口,售价则是500美元(人民币3605元)。
图源:英特尔
对比锐炫Pro A系列,B系列不管是AI性能还是通用性能都有了大幅度的增长,部分性能的涨幅达到130%,彻底弥补了前代性能不足的弊端。而且,与前代专注于AI运算不同,B50的图形工作性能直接提高了3.4倍,甚至可以满足更复杂的图形运算需求。
单从算力性能来看,B50和B60都不算突出,即使是B60也就勉强摸到了RTX 4060的水平,但是消费级显卡本就因为采用了新的张量核心而在AI算力上具有优势。比如最新的50系显卡,即使是最低端的RTX 5060也有614的AI算力,与英伟达的专业计算卡A100差不多,前者价格只要2499元,后者价格则直接跳到五位数。
如果把B50和B60拿去对比英伟达的专业卡,基本可以对标A5000和A4000两款显卡,价格分别在10000元和6000元左右,分别是B60的三倍和B50的两倍多。说实话,即使有英伟达的CUDA生态加持,对于普通用户和小型企业来说,英特尔依然提供了更具诱惑力和性价比的选择。
英特尔要掀翻个人AI市场?
自从AI大模型火了之后,本地部署端侧模型就成为不少PC爱好者的折腾方向,但是大家很快发现端侧部署AI大模型,面临的最大问题不是算力不足,而是“显存”不足。很多人觉得AI大模型的端侧体验取决于算力,其实这个看法并不完全正确,对于个人使用的本地AI模型来说,显存的重要性其实要更高一些。
因为显存直接决定了你可以运行多大规模的AI大模型,以小雷自己的RTX 4070Ti Super为例,显存是16GB,那么在确保使用体验的情况下,最大可以部署32B参数量的模型,与满血版的DeepSeek有着接近20倍的参数量差距,基本上体验是大打折扣的。
简单来说,即使显卡的AI算力爆表,如果显存不足以运行大参数量的AI大模型,那么最终的体验都不会好,因为AI算力只能决定生成token的速度,也就是回复你的用时更短,而模型参数量则直接决定回答的质量和准确性。
反之,如果你有足够的显存去部署大参数量的AI模型,那么即使算力性能一般,无非就是生成回答的速度慢一些,个人使用的话忍忍也就过去了。如今的个人AI市场基本上处于“算力诚可贵,显存价更高”的状态,毕竟单看算力的话RTX 5090几乎是A100 80G版的两倍,前者售价三万就已经被不少人吐槽了,后者价格却接近十八万。
图源:淘宝
所以,显存的重要性应该不用小雷再过多叙述了吧?对于普通用户来说,花十几万买一张专业卡显然是不划算的,但是消费级显卡在互联协议上的阉割,让用户无法通过多卡串联来拓展显存,也就让端侧部署AI的体验变得十分尴尬。
为了解决显存问题,甚至出现了改装显存的RTX 2080Ti 22G版(原版为11G),因为其支持完全版本的NVLink,可以实现显存共享,按单位显存成本和算力来看,算是个人AI服务器里性价比最高的选择之一。
但是,在英特尔的B50和B60面世后,这些经过改装的RTX 2080Ti 22G版估计就要失业了,毕竟2080Ti本身的算力也就130TOPS,而且改装的显存存在不稳定等隐患。作为对比,拥有24G显存和197TOPS算力的B60只要3600+,而且支持PCIe 5.0协议下的8卡互联,推理和训练速度都远超老方案。
图源:英特尔
对于普通用户来说,只需要不到一万的成本,就可以得到一台能够部署中等参数规模AI大模型的PC,在8卡互联的情况下,196GB的显存甚至可以勉强满足1.58-bit 量化版的满血DeepSeek本地部署,显卡成本也就不到三万(服务器主板等另算)。
可以说,B50和B60对于个人AI爱好者而言,无疑是真正的“性价比之选”,如果不考虑模型训练效率等问题,它可以轻松让你在家里搭建一个小型AI服务器。
生存压力下,英特尔另辟蹊径
前段时间,英特尔公布了第一季度财报,报告显示,英特尔第一财季营收为127亿美元(约合人民币916亿元),与上年同期的127亿美元相比持平;应占净亏损为8亿美元(约合人民币57亿元),与上年同期的应占净亏损4亿美元(约合人民币29亿元)相比扩大115%
可以说生成的压力迫使英特尔加速业务的推进,并且寻找更多的利润增长点。不过,虽然英特尔的B50和B60两款消费级AI显卡都有着不错的性价比,与英伟达的差距仍然没有缩小多少,巨头的订单仍然会像雪片一样涌向英伟达而不是英特尔。
无他,对于大型企业来说,价格并非关键,算力效率才是关键,因为这决定了他们能否更早完成AI训练,在下一轮AI竞赛中领先对手。
所以,英特尔显然不打算与英伟达争夺大型企业用户,而是瞄准了小型企业和个人市场。就像我前面说的那样,对于个人用户来说,锐炫Pro B系列显卡确实是不错的选择,对于小型工作室和企业而言也是如此。
图源:英特尔
试想一下,花上十来万你就可以部署一个拥有数百G显存,理论上支持部署主流大型AI模型的服务器,这将比以往所有同级别的AI服务器方案都便宜得多(目前的主流方案一般需要数百万的成本)。
换言之,英特尔直接把小型企业的AI转型门槛抹去了大半,仅留下了“技术问题”,毕竟熟悉AI领域的人才如今都是香馍馍,想招到人手并不容易。当高昂的硬件成本不复存在,那么还有什么理由不去尝试着拥抱一下AI呢?
虽然小型企业的单个采购份额远不能和大型企业相比,但是从市场角度来说,小型企业的数量也是非常可观。而且英特尔可以与各种服务器供应商如浪潮、联想等合作,为企业提供一步到位的AI解决方案,这些基于英特尔AI计算卡设计的方案将因为低廉的硬件成本而更容易被客户所接受。
可以说,在英伟达忽略的市场里,英特尔正在用自己的方式为显卡业务找寻新的出路,而且真的有可能成功,对于英特尔来说,这个新的业务已是难得的增长点,必须牢牢把握住。
不过,英特尔可能并非唯一这么想的企业,AMD也在台北国际电脑展上发布了Radeon AI PRO R9700,这款AI计算卡基于消费级核心打造,拥有32GB的显存并最高支持四卡串联,虽然上限与英特尔有所差距,但是也有着更强的算力。
此外,还有诸如Arm等半导体企业,也对消费级的AI市场“虎视眈眈”,Arm去年就已经宣布与众多合作伙伴一起推动Arm架构的AI芯片生态发展与研发,同时开发属于自己的AI芯片。这些产品不仅面向服务器市场,也将面向消费级市场,依赖Arm架构的出色能效比,或许有一天我们可以实现小型设备上的大规模AI模型部署也说不定。
AI的浪潮里,科技企业不进则退,对于已经深陷漩涡之中的半导体企业来说更是如此,谁能抓住机遇跨入下一阶段,谁就能够在未来领导这个行业。