《Without Your Shotgun》复古又动感的旋律戛然而止,穿着闪亮的新夹克,英伟达CEO黄仁勋走向CES的舞台中央。“Are you excited in Las Vegas(你们喜欢拉斯维加斯吗)?”“Do you like my jacket(你们喜欢我的夹克吗)?”
作者|王艺 苏霍伊
编辑|王博
发自美国拉斯维加斯CES 2025现场
而在此之前,整个拉斯维加斯都在屏息以待,直到黄仁勋掏出了RTX 50系列消费级显卡(GPU),会场才被掌声与欢呼声淹没。
这是黄仁勋时隔多年再次来到CES(Consumer Electronics Show,国际消费类电子产品展览会)发表主题演讲,上一次还是在2019年,他在CES上发布了RTX 20系列显卡。
当地时间下午2点,距离活动开始还有4个小时,就有参会者来到了演讲会场Mandalay Bay Arena。演讲开始前,会场门口已经排起了看不到头的队伍,在人群中,一位观众对「甲子光年」调侃:“这几个小时我已和旁边人唠成朋友,再等下去就快成兄弟了。”
黄仁勋演讲会场门口的“长龙”,图片来源:UASC Semi
全世界的媒体也将目光聚焦在英伟达。
“我主要期待英伟达在芯片、机器人和在汽车方面的新动作。”一位来自日本的电视记者对「甲子光年」说道。而来自印度报业托拉斯的记者Yashita则表示,去年10月英伟达推出印地语AI模型,所以她更关注这次新发布会对印度AI产业带来的促进与影响。
这一次,黄仁勋的主题演讲有以下重点内容:
发布史上最快的消费级显卡RTX 5090;
提出Scaling Law仍在继续,并表示要创建一个名为Grace Blackwell NVLink72的巨型芯片;
在NIM微服务中新增Nemotron系列模型和用于视频搜索和摘要的AI代理,入局Agentic AI;
发布Nvidia Cosmos世界基础模型平台,以助推Physical AI的发展;
发布人形机器人合成数据蓝图Isaac GR00T Blueprint和新一代智驾芯片Thor;
发布全球最小的个人AI超级计算机Project DIGITS。
FPSolution VC创始合伙人、SpaceX前华裔高管Lewis Hong在听了黄仁勋的演讲后做了一个大胆的推断:“英伟达接下来也许会直接吃掉所有‘Magnificent 7’的‘饼’,或许唯一可以跟他们抗衡的只有Elon Musk(埃隆·马斯克)了。”
“Magnificent 7” 指的是当前科技领域最具影响力的七家公司:微软(MSFT)、亚马逊(AMZN)、Meta Platforms(META)、Alphabet(GOOGL)、苹果(AAPL)、特斯拉(TSLA)、英伟达(NVDA)。
1小时35分钟的演讲,黄仁勋的每一句都像是一枚精准投射的芯片,深深嵌入了观众的脑中,而这些“芯片”包括了英伟达的阳谋与野心。
1.史上最快的消费级显卡
黄仁勋在这次演讲中发布的产品,最受关注的莫过于RTX 5090。
RTX 5090是迄今为止最快的GeForce RTX GPU,在Blackwell架构创新和DLSS 4的加持下,RTX 5090的性能是RTX 4090的2倍。
它在多款热门游戏中都表现优异,这些游戏包括《赛博朋克 2077》《黑神话:悟空》等,同时在D5 Render渲染器上也有不错的表现。
RTX 5090和RTX 4090性能对比
但也有现场观众对「甲子光年」表示,这些游戏的测试结果参考价值有待商榷。比如,《瘟疫传说:安魂曲》这款游戏在使用了DLSS 3(NVIDIA的深度学习超级采样技术第三代)和光追技术(RT)的情况下,RTX 5090性能提升也不到50%,其相对于RTX 4090的性能提升低于预期,特别是光栅化性能增长幅度较小,光追性能也没有得到充分验证。
从参数上来说,RTX 5090拥有920亿个晶体管,具备4000 AI TOPS(每秒万亿次操作)的性能,能够实现380 RT TFLOPS(每秒万亿次浮点运算)的光线追踪性能,具备1.8 TB/s的内存带宽,能够快速地读取和写入数据,具有125 Shader TFLOPS的着色器性能。
与RTX 5090 GPU一同发布的是RTX 50全系列产品,包括RTX 5080、RTX 5070 Ti、RTX 5070等。值得注意的是,与4090发布时的1599美元相比,售价为1999美元的5090还是涨价了。
与此同时,搭载了RTX 5070的AI PC也在CES上发布。这台5070笔记本电脑具有与4090相当的性能,但能耗只有4090的一半。
“很难以置信对吧,我们把一个4090显卡缩小并塞到了这台笔记电脑里!”黄仁勋有些得意地说。
黄仁勋表示,之所以能实现这一技术,是因为英伟达使用Tensor Core(张量计算核心)生成了大部分像素,先回溯需要的像素,然后再用AI生成其他像素,“能源效率已经超出预期,计算机图形学的未来是神经渲染,它是人工智能和计算机图形学的融合。”
RTX 50系列AI PC的价格也随之公布,其中搭载了RTX 5090显卡的AI PC售价为2899美元。
2.超级芯片队长
发布完RTX 50系列显卡后,黄仁勋话锋一转,开始大谈AI。
在关于Scaling Law是否“撞墙”的讨论络绎不绝的当下,黄仁勋坚信Scaling Law仍在继续,而且除了Pre-Training Scaling Law(预训练缩放定律)之外,还出现了后两个阶段的Scaling Law,分别是Post-training Scaling law(后训练缩放定律)和Test-Time Scaling Law(测试时间缩放定律)。
这个表态并不让人意外,毕竟Scaling Law与英伟达的生意息息相关。
黄仁勋表示,从ChatGPT到OpenAI o1、OpenAI o3、再到Genimi 1.5 Pro,这些新模型的强大能力都印证了Scaling Law的延续。
在演讲现场,黄仁勋还向大家展示了包括液冷、风冷、x86服务器等在内的Blackwell全系列产品。
“当然,我们需要的计算量是惊人的,我们希望社会有能力扩展计算量,以生产越来越多更新、更好的产品。Scaling Law正在推动对Nvidia计算的巨大需求,也推动了对Blackwell架构芯片的巨大需求。”黄仁勋从自己的角度说了大实话。
介绍完Blackwell全系列产品后,黄仁勋拿出了一个巨大的芯片,并摆出了一个惊讶全场的造型,俨然成为了漫威电影中的“美国队长”。
他手里拿着的是GB200 NVLink 72的展示样品。这个巨大的晶圆上有72个Blackwell GPU和144个芯片,拥有14TB的内存,和1.2PB/s的带宽,AI 浮点性能达到了1.4 ExaFLOPS,与上一代相比每瓦性能提高了4倍。
“基本上全世界的互联网流量都能在这个芯片上进行处理。”尽管听起来有些夸张,但“超级芯片队长”黄仁勋就是这么说的。
3.代理型AI助力企业工作流自动化
基座模型是生成式AI的基石。
在演讲现场,黄仁勋推出了基于Llama的一系列模型,包括Llama Nemotron Nano、Super和Ultra。它们涵盖从PC和边缘设备到大型数据中心等所有领域。
英伟达还发布了运行在NVIDIA RTX AI PC上的基础模型,可增强数字人、内容创造、生产力和开发能力。
这些模型都以NIM微服务的形式提供。NIM微服务是由Black Forest Labs、Meta、Mistral 和 Stability AI等顶级模型开发商为RTX AI PC开发的关键组件,可以部署在RTX PC、工作站和云端。其用例涵盖大型语言模型 (LLM)、视觉语言模型、图像生成、语音、用于检索增强生成 (RAG) 的嵌入模型、PDF 提取和计算机视觉等。
同时,NIM微服务还将与顶级AI开发和代理框架兼容,包括AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、Langflow和LM Studio。
总结来看,英伟达为帮助生态系统构建代理型AI做了三件事:
Nvidia Nims,它基本上是一个打包好的人工智能微服务;
Nvidia Nemo,本质上是一个数字员工入职和培训评估系统,英伟达可以帮助客户的数字员工(人工智能代理)做培训、以适应客户公司的具体业务;
Nvidia AI Blueprints,它提供了一整套蓝图,用于将PDF转换为播客,以及另一个用于构建视频搜索和摘要的AI代理。此外,还有四个额外的NVIDIA Omniverse蓝图,使开发人员能够更轻松地为物理AI构建可用于模拟的数字孪生。
在发布会现场, 黄仁勋还展示了Project R2X。这是一个支持视觉的PC化身,可以将信息放在用户的指尖,协助桌面应用程序和视频会议通话,阅读和总结文档等。
4.AI的下一个前沿是物理AI
演讲过半,黄仁勋突然向现场观众提出了一个问题。
“想象一下,你正在给大模型做上下文提示,按照我的习惯,我可能会在问问题之前上传几个PDF文件。这些PDF被大模型转换成tokens,因此这些PDF文件可能被转换成数十万个tokens,并且通过Transformer的每一层进行处理。但如果我上传的不是PDF,而是周围的环境怎么办?如果你在上传之后你给大模型的不是提示,而是一个请求,让它去某地拿起一个盒子并且把它带回来怎么办?”
黄仁勋其实是想引出AI与物理世界的关系。
「甲子光年」去年5月就曾提出,能源、信息和行为是现代社会和自然界中三个基本而相互关联的概念——科技的进步,就是三者之间转化能力加强的反映。随着AI对物理世界映射能力的不断优化,将会在实践中构建一条AI影响世界发展的动态平衡线。
图片来源:《张一甲:AI创生时代,2024中国AI新风向30条判断》
2024年,让AI理解物理世界,成为了AI产业界的新浪潮。
曾经在英伟达工作过的群核科技董事长黄晓煌告诉「甲子光年」:“这几年随着深度神经网络的发展,用机器模拟人脑已经获得了巨大突破,标志性事件就是ChatGPT的诞生。但我们也意识到,我们发展AI本来是希望AI能替代人类打扫卫生、做家务,现在却是人类在打扫卫生、做家务,而AI在写诗作画。所以,让AI从虚拟世界走入物理世界,去帮人类执行物理世界的任务,是技术发展的必经之路。”
这次CES上,黄仁勋揭幕了英伟达的下一代重磅产品——Nvidia Cosmos世界基础模型平台。
世界基础模型 (WFM) ,指的是通过输入多种模态的数据(包括文本、图像、视频和动作)来生成和模拟虚拟世界,从而准确地模拟场景中物体的空间关系及其物理交互的模型。
Nvidia Cosmos是一个用来加速物理AI(能够让机器人和自动驾驶汽车等自主机器感知、理解和执行物理世界中的复杂动作的AI)开发的平台,它由一套开源的扩散(Diffusion)和(Auto-regressive)模型组成,用于生成物理感知视频。这些模型在2000万小时的现实世界人际互动、环境、工业、机器人和驾驶数据之上训练而成,包含9000万亿个tokens。
该平台将模型分为了三类:
Nano,针对实时、低延迟推理和边缘部署进行了优化的模型;
Super,针对高性能基线模型;
Ultra,针对最高质量和保真度,最适合用于提炼自定义模型。
具身智能创业者Edward告诉「甲子光年」,他这次最关注的是开源的世界模型,Cosmos World Foundation Model开源模型让训练的门槛变低了,对数据的需求减少了,这对于机器人开发非常重要。
“通过‘Sim-to-Real’的方式,我们可以更快地实现像自动驾驶领域那样的突破。特别是英伟达在这方面的优化,让‘Sim-to-Real’的质量更高了,这对整个行业的进展帮助很大。”Edward说。
除了帮助生成大型数据集外,Nvidia Cosmos还能通过将图像从3D扩展到真实场景,缩小仿真与现实之间的差距。将Omniverse(一个用于构建3D应用程序和服务的应用程序编程接口和微服务开发平台)与Cosmos相结合至关重要,通过其高度可控、物理精确的仿真提供关键保障,有助于最大限度地减少世界模型常见的幻觉问题。
目前Nvidia Cosmos已在Github上开源。开发人员可以根据自己的需求,直接使用Cosmos平台上的模型来生成基于物理的合成数据,也可以用NVIDIA NeMo框架通过自己的视频对模型进行微调,以适应特定的物理AI设置。
Nvidia Cosmos主要用于机器人和自动驾驶场景,目前,1X、Agility Robotics等机器人公司和XPENG、Uber和Waabi等自动驾驶公司都已经与Cosmos合作开发模型。
“The next frontier of AIis Physical AI。(AI的下一个前沿是物理AI)”这句话,去年年中黄仁勋就说过,这一次在CES 2025,他又一次面向世界强调了一遍。
5.合成数据与新一代智驾芯片
人形机器人是一个380亿美元的超级市场,英伟达自然不会放过这一超级风口,很早就发布了一系列机器人基础模型、数据管线和仿真框架,以加速下一代人形机器人的开发进程。
“通用机器人的ChatGPT时刻即将到来。”黄仁勋在演讲中下了判断。
他宣布英伟达正式推出用于合成运动生成的NVIDIA Isaac GR00T Blueprint,该Blueprint可帮助开发者生成海 量的合成运动数据,以便通过模仿学习来训练人形机器人。
模仿学习是机器人学习的一个子集,它能让人形机器人通过观察和模仿人类专家的示范来获取新技能。在真实世界中收集这些广泛、高质量的数据集既繁琐又耗时, 而且成本往往高得令人却步。通过用于合成运动生成的Isaac GR00T Blueprint,开发者只需少量人类示范,就能轻松生成海量的合成数据集。
自动驾驶汽车同样是英伟达关注的焦点。在演讲中,黄仁勋宣布英伟达推出下一代智驾芯片“Thor”。此前,英伟达Thor芯片原本计划于2024年年中量产,但后来进度大幅推迟。
1月7日,极氪汽车宣布,未来新车型将搭载NVIDIA Thor智驾芯片。此外,极氪与自动驾驶公司Waymo基于SEA-M架构联合开发的全球首款量产原生无人驾驶汽车——ZEEKR RT将在2025年开启大规模交付。
值得注意的是,在现场公布的将搭载Thor智驾芯片的车企中没有蔚来,这或许与蔚来去年7月宣布其自研的智驾芯片“神玑NX9031”正式流片有关。
英伟达还展示了其最新的自动驾驶平台——Hyperion 9以及DriveOS系统。Hyperion 9平台基于英伟达最新的Blackwell架构打造,它配备了12个摄像头、9个雷达、1个激光雷达、12个超声波传感器,在传感器配置和处理能力上都有显著提升。
6.全球最小的个人AI超级计算机
在演讲的最后,黄仁勋发布了一款令人眼前一亮的产品——AI超级计算机Project DIGITS。
就像变魔术一样,黄仁勋把一个超级计算机“变小”,然后拿了出来。
该计算机是基于此前的AI超级计算机DGX-1升级而成,但体积更小,功能更强。通过Project DIGITS,用户可以使用自己的桌面系统开发和运行模型推理,然后在加速云或数据中心基础设施上无缝部署模型。
Project DIGITS搭载了全新的Grace Blackwell超级芯片(GB10),在FP4精度下可以提供高达1千万亿次浮点运算的AI性能。GB10 采用NVIDIA Blackwell GPU,配备最新一代 CUDA核心和第五代Tensor核心,通过NVLink-C2C芯片到芯片互连连接到高性能 NVIDIA GraceCPU,其中包括20个采用Arm架构构建的节能核心。
GB10超级芯片使Project DIGITS仅使用标准电源插座即可提供强大的性能。每台Project DIGITS都具有128GB的统一、一致内存和高达4TB的NVMe存储。借助这台超级计算机,开发人员可以运行多达2000亿个参数的大型语言模型,从而增强 AI 创新。此外,使用NVIDIA ConnectX网络,两台Project DIGITS AI超级计算机可以连接起来,运行多达4050亿参数的模型。
正如前文所说,1小时35分钟的演讲,黄仁勋的每一句都像是一枚精准投射的芯片,深深嵌入了观众的脑中。
而这一枚枚芯片又如同种子一样在观众脑海中快速生根发芽,并开出了未来之花。
这是一种很难用语言形容这样的感受,直到会场里的标语提醒了我们——“Step Into Tomorrow”(走向明天)。