现场直击黄仁勋CES 2025演讲：疯狂的观众与超级芯片队长

《Without Your Shotgun》复古又动感的旋律戛然而止，穿着闪亮的新夹克，英伟达CEO黄仁勋走向CES的舞台中央。“Are you excited in Las Vegas（你们喜欢拉斯维加斯吗）？”“Do you like my jacket（你们喜欢我的夹克吗）？”

作者｜王艺苏霍伊

编辑｜王博

发自美国拉斯维加斯CES 2025现场

而在此之前，整个拉斯维加斯都在屏息以待，直到黄仁勋掏出了RTX 50系列消费级显卡（GPU），会场才被掌声与欢呼声淹没。

这是黄仁勋时隔多年再次来到CES（Consumer Electronics Show，国际消费类电子产品展览会）发表主题演讲，上一次还是在2019年，他在CES上发布了RTX 20系列显卡。

当地时间下午2点，距离活动开始还有4个小时，就有参会者来到了演讲会场Mandalay Bay Arena。演讲开始前，会场门口已经排起了看不到头的队伍，在人群中，一位观众对「甲子光年」调侃：“这几个小时我已和旁边人唠成朋友，再等下去就快成兄弟了。”

黄仁勋演讲会场门口的“长龙”，图片来源：UASC Semi

全世界的媒体也将目光聚焦在英伟达。

“我主要期待英伟达在芯片、机器人和在汽车方面的新动作。”一位来自日本的电视记者对「甲子光年」说道。而来自印度报业托拉斯的记者Yashita则表示，去年10月英伟达推出印地语AI模型，所以她更关注这次新发布会对印度AI产业带来的促进与影响。

这一次，黄仁勋的主题演讲有以下重点内容：

发布史上最快的消费级显卡RTX 5090；

提出Scaling Law仍在继续，并表示要创建一个名为Grace Blackwell NVLink72的巨型芯片；

在NIM微服务中新增Nemotron系列模型和用于视频搜索和摘要的AI代理，入局Agentic AI；

发布Nvidia Cosmos世界基础模型平台，以助推Physical AI的发展；

发布人形机器人合成数据蓝图Isaac GR00T Blueprint和新一代智驾芯片Thor；

发布全球最小的个人AI超级计算机Project DIGITS。

FPSolution VC创始合伙人、SpaceX前华裔高管Lewis Hong在听了黄仁勋的演讲后做了一个大胆的推断：“英伟达接下来也许会直接吃掉所有‘Magnificent 7’的‘饼’，或许唯一可以跟他们抗衡的只有Elon Musk（埃隆·马斯克）了。”

“Magnificent 7” 指的是当前科技领域最具影响力的七家公司：微软（MSFT）、亚马逊（AMZN）、Meta Platforms（META）、Alphabet（GOOGL）、苹果（AAPL）、特斯拉（TSLA）、英伟达（NVDA）。

1小时35分钟的演讲，黄仁勋的每一句都像是一枚精准投射的芯片，深深嵌入了观众的脑中，而这些“芯片”包括了英伟达的阳谋与野心。

1.史上最快的消费级显卡

黄仁勋在这次演讲中发布的产品，最受关注的莫过于RTX 5090。

RTX 5090是迄今为止最快的GeForce RTX GPU，在Blackwell架构创新和DLSS 4的加持下，RTX 5090的性能是RTX 4090的2倍。

它在多款热门游戏中都表现优异，这些游戏包括《赛博朋克 2077》《黑神话：悟空》等，同时在D5 Render渲染器上也有不错的表现。

RTX 5090和RTX 4090性能对比

但也有现场观众对「甲子光年」表示，这些游戏的测试结果参考价值有待商榷。比如，《瘟疫传说：安魂曲》这款游戏在使用了DLSS 3（NVIDIA的深度学习超级采样技术第三代）和光追技术（RT）的情况下，RTX 5090性能提升也不到50%，其相对于RTX 4090的性能提升低于预期，特别是光栅化性能增长幅度较小，光追性能也没有得到充分验证。

从参数上来说，RTX 5090拥有920亿个晶体管，具备4000 AI TOPS（每秒万亿次操作）的性能，能够实现380 RT TFLOPS（每秒万亿次浮点运算）的光线追踪性能，具备1.8 TB/s的内存带宽，能够快速地读取和写入数据，具有125 Shader TFLOPS的着色器性能。

与RTX 5090 GPU一同发布的是RTX 50全系列产品，包括RTX 5080、RTX 5070 Ti、RTX 5070等。值得注意的是，与4090发布时的1599美元相比，售价为1999美元的5090还是涨价了。

与此同时，搭载了RTX 5070的AI PC也在CES上发布。这台5070笔记本电脑具有与4090相当的性能，但能耗只有4090的一半。

“很难以置信对吧，我们把一个4090显卡缩小并塞到了这台笔记电脑里！”黄仁勋有些得意地说。

黄仁勋表示，之所以能实现这一技术，是因为英伟达使用Tensor Core（张量计算核心）生成了大部分像素，先回溯需要的像素，然后再用AI生成其他像素，“能源效率已经超出预期，计算机图形学的未来是神经渲染，它是人工智能和计算机图形学的融合。”

RTX 50系列AI PC的价格也随之公布，其中搭载了RTX 5090显卡的AI PC售价为2899美元。

2.超级芯片队长

发布完RTX 50系列显卡后，黄仁勋话锋一转，开始大谈AI。

在关于Scaling Law是否“撞墙”的讨论络绎不绝的当下，黄仁勋坚信Scaling Law仍在继续，而且除了Pre-Training Scaling Law（预训练缩放定律）之外，还出现了后两个阶段的Scaling Law，分别是Post-training Scaling law（后训练缩放定律）和Test-Time Scaling Law（测试时间缩放定律）。

这个表态并不让人意外，毕竟Scaling Law与英伟达的生意息息相关。

黄仁勋表示，从ChatGPT到OpenAI o1、OpenAI o3、再到Genimi 1.5 Pro，这些新模型的强大能力都印证了Scaling Law的延续。

在演讲现场，黄仁勋还向大家展示了包括液冷、风冷、x86服务器等在内的Blackwell全系列产品。

“当然，我们需要的计算量是惊人的，我们希望社会有能力扩展计算量，以生产越来越多更新、更好的产品。Scaling Law正在推动对Nvidia计算的巨大需求，也推动了对Blackwell架构芯片的巨大需求。”黄仁勋从自己的角度说了大实话。

介绍完Blackwell全系列产品后，黄仁勋拿出了一个巨大的芯片，并摆出了一个惊讶全场的造型，俨然成为了漫威电影中的“美国队长”。

他手里拿着的是GB200 NVLink 72的展示样品。这个巨大的晶圆上有72个Blackwell GPU和144个芯片，拥有14TB的内存，和1.2PB/s的带宽，AI 浮点性能达到了1.4 ExaFLOPS，与上一代相比每瓦性能提高了4倍。

“基本上全世界的互联网流量都能在这个芯片上进行处理。”尽管听起来有些夸张，但“超级芯片队长”黄仁勋就是这么说的。

3.代理型AI助力企业工作流自动化

基座模型是生成式AI的基石。

在演讲现场，黄仁勋推出了基于Llama的一系列模型，包括Llama Nemotron Nano、Super和Ultra。它们涵盖从PC和边缘设备到大型数据中心等所有领域。

英伟达还发布了运行在NVIDIA RTX AI PC上的基础模型，可增强数字人、内容创造、生产力和开发能力。

这些模型都以NIM微服务的形式提供。NIM微服务是由Black Forest Labs、Meta、Mistral 和 Stability AI等顶级模型开发商为RTX AI PC开发的关键组件，可以部署在RTX PC、工作站和云端。其用例涵盖大型语言模型 (LLM)、视觉语言模型、图像生成、语音、用于检索增强生成 (RAG) 的嵌入模型、PDF 提取和计算机视觉等。

同时，NIM微服务还将与顶级AI开发和代理框架兼容，包括AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、Langflow和LM Studio。

总结来看，英伟达为帮助生态系统构建代理型AI做了三件事：

Nvidia Nims，它基本上是一个打包好的人工智能微服务；

Nvidia Nemo，本质上是一个数字员工入职和培训评估系统，英伟达可以帮助客户的数字员工（人工智能代理）做培训、以适应客户公司的具体业务；

Nvidia AI Blueprints，它提供了一整套蓝图，用于将PDF转换为播客，以及另一个用于构建视频搜索和摘要的AI代理。此外，还有四个额外的NVIDIA Omniverse蓝图，使开发人员能够更轻松地为物理AI构建可用于模拟的数字孪生。

在发布会现场，黄仁勋还展示了Project R2X。这是一个支持视觉的PC化身，可以将信息放在用户的指尖，协助桌面应用程序和视频会议通话，阅读和总结文档等。

4.AI的下一个前沿是物理AI

演讲过半，黄仁勋突然向现场观众提出了一个问题。

“想象一下，你正在给大模型做上下文提示，按照我的习惯，我可能会在问问题之前上传几个PDF文件。这些PDF被大模型转换成tokens，因此这些PDF文件可能被转换成数十万个tokens，并且通过Transformer的每一层进行处理。但如果我上传的不是PDF，而是周围的环境怎么办？如果你在上传之后你给大模型的不是提示，而是一个请求，让它去某地拿起一个盒子并且把它带回来怎么办？”

黄仁勋其实是想引出AI与物理世界的关系。

「甲子光年」去年5月就曾提出，能源、信息和行为是现代社会和自然界中三个基本而相互关联的概念——科技的进步，就是三者之间转化能力加强的反映。随着AI对物理世界映射能力的不断优化，将会在实践中构建一条AI影响世界发展的动态平衡线。

图片来源：《张一甲：AI创生时代，2024中国AI新风向30条判断》

2024年，让AI理解物理世界，成为了AI产业界的新浪潮。

曾经在英伟达工作过的群核科技董事长黄晓煌告诉「甲子光年」：“这几年随着深度神经网络的发展，用机器模拟人脑已经获得了巨大突破，标志性事件就是ChatGPT的诞生。但我们也意识到，我们发展AI本来是希望AI能替代人类打扫卫生、做家务，现在却是人类在打扫卫生、做家务，而AI在写诗作画。所以，让AI从虚拟世界走入物理世界，去帮人类执行物理世界的任务，是技术发展的必经之路。”

这次CES上，黄仁勋揭幕了英伟达的下一代重磅产品——Nvidia Cosmos世界基础模型平台。

世界基础模型 (WFM) ，指的是通过输入多种模态的数据（包括文本、图像、视频和动作）来生成和模拟虚拟世界，从而准确地模拟场景中物体的空间关系及其物理交互的模型。

Nvidia Cosmos是一个用来加速物理AI（能够让机器人和自动驾驶汽车等自主机器感知、理解和执行物理世界中的复杂动作的AI）开发的平台，它由一套开源的扩散（Diffusion）和（Auto-regressive）模型组成，用于生成物理感知视频。这些模型在2000万小时的现实世界人际互动、环境、工业、机器人和驾驶数据之上训练而成，包含9000万亿个tokens。

该平台将模型分为了三类：

Nano，针对实时、低延迟推理和边缘部署进行了优化的模型；

Super，针对高性能基线模型；

Ultra，针对最高质量和保真度，最适合用于提炼自定义模型。

具身智能创业者Edward告诉「甲子光年」，他这次最关注的是开源的世界模型，Cosmos World Foundation Model开源模型让训练的门槛变低了，对数据的需求减少了，这对于机器人开发非常重要。

“通过‘Sim-to-Real’的方式，我们可以更快地实现像自动驾驶领域那样的突破。特别是英伟达在这方面的优化，让‘Sim-to-Real’的质量更高了，这对整个行业的进展帮助很大。”Edward说。

除了帮助生成大型数据集外，Nvidia Cosmos还能通过将图像从3D扩展到真实场景，缩小仿真与现实之间的差距。将Omniverse（一个用于构建3D应用程序和服务的应用程序编程接口和微服务开发平台）与Cosmos相结合至关重要，通过其高度可控、物理精确的仿真提供关键保障，有助于最大限度地减少世界模型常见的幻觉问题。

目前Nvidia Cosmos已在Github上开源。开发人员可以根据自己的需求，直接使用Cosmos平台上的模型来生成基于物理的合成数据，也可以用NVIDIA NeMo框架通过自己的视频对模型进行微调，以适应特定的物理AI设置。

Nvidia Cosmos主要用于机器人和自动驾驶场景，目前，1X、Agility Robotics等机器人公司和XPENG、Uber和Waabi等自动驾驶公司都已经与Cosmos合作开发模型。

“The next frontier of AIis Physical AI。（AI的下一个前沿是物理AI）”这句话，去年年中黄仁勋就说过，这一次在CES 2025，他又一次面向世界强调了一遍。

5.合成数据与新一代智驾芯片

人形机器人是一个380亿美元的超级市场，英伟达自然不会放过这一超级风口，很早就发布了一系列机器人基础模型、数据管线和仿真框架，以加速下一代人形机器人的开发进程。

“通用机器人的ChatGPT时刻即将到来。”黄仁勋在演讲中下了判断。

他宣布英伟达正式推出用于合成运动生成的NVIDIA Isaac GR00T Blueprint，该Blueprint可帮助开发者生成海量的合成运动数据，以便通过模仿学习来训练人形机器人。

模仿学习是机器人学习的一个子集，它能让人形机器人通过观察和模仿人类专家的示范来获取新技能。在真实世界中收集这些广泛、高质量的数据集既繁琐又耗时，而且成本往往高得令人却步。通过用于合成运动生成的Isaac GR00T Blueprint，开发者只需少量人类示范，就能轻松生成海量的合成数据集。

自动驾驶汽车同样是英伟达关注的焦点。在演讲中，黄仁勋宣布英伟达推出下一代智驾芯片“Thor”。此前，英伟达Thor芯片原本计划于2024年年中量产，但后来进度大幅推迟。

1月7日，极氪汽车宣布，未来新车型将搭载NVIDIA Thor智驾芯片。此外，极氪与自动驾驶公司Waymo基于SEA-M架构联合开发的全球首款量产原生无人驾驶汽车——ZEEKR RT将在2025年开启大规模交付。

值得注意的是，在现场公布的将搭载Thor智驾芯片的车企中没有蔚来，这或许与蔚来去年7月宣布其自研的智驾芯片“神玑NX9031”正式流片有关。

英伟达还展示了其最新的自动驾驶平台——Hyperion 9以及DriveOS系统。Hyperion 9平台基于英伟达最新的Blackwell架构打造，它配备了12个摄像头、9个雷达、1个激光雷达、12个超声波传感器，在传感器配置和处理能力上都有显著提升。

6.全球最小的个人AI超级计算机

在演讲的最后，黄仁勋发布了一款令人眼前一亮的产品——AI超级计算机Project DIGITS。

就像变魔术一样，黄仁勋把一个超级计算机“变小”，然后拿了出来。

该计算机是基于此前的AI超级计算机DGX-1升级而成，但体积更小，功能更强。通过Project DIGITS，用户可以使用自己的桌面系统开发和运行模型推理，然后在加速云或数据中心基础设施上无缝部署模型。

Project DIGITS搭载了全新的Grace Blackwell超级芯片（GB10），在FP4精度下可以提供高达1千万亿次浮点运算的AI性能。GB10 采用NVIDIA Blackwell GPU，配备最新一代 CUDA核心和第五代Tensor核心，通过NVLink-C2C芯片到芯片互连连接到高性能 NVIDIA GraceCPU，其中包括20个采用Arm架构构建的节能核心。

GB10超级芯片使Project DIGITS仅使用标准电源插座即可提供强大的性能。每台Project DIGITS都具有128GB的统一、一致内存和高达4TB的NVMe存储。借助这台超级计算机，开发人员可以运行多达2000亿个参数的大型语言模型，从而增强 AI 创新。此外，使用NVIDIA ConnectX网络，两台Project DIGITS AI超级计算机可以连接起来，运行多达4050亿参数的模型。

正如前文所说，1小时35分钟的演讲，黄仁勋的每一句都像是一枚精准投射的芯片，深深嵌入了观众的脑中。

而这一枚枚芯片又如同种子一样在观众脑海中快速生根发芽，并开出了未来之花。

这是一种很难用语言形容这样的感受，直到会场里的标语提醒了我们——“Step Into Tomorrow”（走向明天）。