首页 > 实时讯息 >

英伟达推理火力全开 黄仁勋如何重塑“Next AI”叙事?

时间:

自上周日起,圣何塞这座被誉为“硅谷之心”的城市便沉浸在了英伟达的绿色海洋中。英伟达的标志性绿色横幅随处可见,绿色小车穿梭于街道之间,为这座城市披上了一层流动的绿色外衣。

这一切都是为了迎接一年一度的科技盛会——英伟达GTC2025。当地时间3月18日,英伟达创始人兼CEO黄仁勋在SAP中心发表了演讲,现场座无虚席。他幽默地将今年的GTC称为“Super Bowl of AI”,AI界的超级碗。

黄仁勋一如既往地身着黑色皮衣,宛如摇滚明星般吸引了全球科技界的目光。全球科技人士纷纷前来,追踪这位AI领域的“代言人”,试图一窥AI的未来。今年的关键词无疑是“推理”和“token”,明显可以看出,AI的叙事重心正从训练阶段转向推理阶段。

在演讲的开场部分,黄仁勋再次详细阐述了三个scaling定律,并表达了对它们的持续看好。他指出,关于AI scaling放缓的讨论几乎“全世界都搞错了”。他认为,得益于新的scaling技术,AI的进化速度比以往任何时候都要快。

面对推理市场,英伟达采取了双线作战的策略。在硬件方面,推出了Blackwell Ultra GPU、下一代架构Rubin、CPO交换机以及“AI PC”桌面端超级计算机;在软件方面,则推出了推理框架Dynamo、Llama Nemotron系列推理模型以及人形机器人基础模型GROOT N1等。

Forrester副总裁兼首席分析师戴鲲在接受21世纪经济报道记者采访时表示:“本次大会有三个方向值得关注:一是面向后训练和推理的加速计算;二是面向企业级智能代理开发的Agentic AI;三是Physical AI,即AI在物理世界中的应用,如何赋能机器人和自动驾驶,是很有潜力的领域。”

黄仁勋强调,生成式人工智能改变了计算的方式,人工智能的推理能力可能成为下一个重大突破,而token可用性的提高是其中重要的一部分。人工智能正在经历一个转折点,它变得更加智能,应用更加广泛。

图片来源:本报记者 倪雨晴 摄

芯片家族登场:Blackwell Ultra、Rubin

正如市场预期,英伟达在本次GTC大会上发布了Blackwell Ultra系列芯片及下一代GPU架构Rubin。

下一代平台Vera Rubin NLV144计划于2026年下半年上线,Rubin Ultra NVL576则将在2027年下半年面世。去年,黄仁勋已经预告了Rubin和Blackwell Ultra GPU以及最新的Vera CPU的发布。按照英伟达的AI发展蓝图,英伟达正在加速前行,以往通常是每两年更新一代。

此次发布会的重点更多聚焦在Blackwell的产品矩阵上。黄仁勋表示,Grace Blackwell目前已全面投入生产,各大OEM厂商均使用该公司的硬件制造和销售产品。与此同时,新平台特别强化了推理能力。英伟达称,Blackwell Ultra在训练和测试时间缩放推理(Test-Time Scaling Inference)方面实现了突破,并将其称为“AI工厂平台”,将开启AI推理新时代。

具体来看,Blackwell Ultra(GB300)包含GB300 NVL72机架级解决方案和HGX B300 NVL16系统。其中,GB300 NVL72将72颗Blackwell Ultra GPU与36颗基于Arm Neoverse架构的Grace CPU互联,形成一个超大规模的AI计算单元。

与GB200 NVL72相比,GB300 NVL72的AI性能提升了1.5倍,并使AI工厂的收益机会相比Hopper平台提高了50倍。英伟达表示,GB300 NVL72预计将集成至DGX Cloud,DGX SuperPOD(企业级AI基础设施)也将采用GB300 NVL72机架架构,提供开箱即用的AI工厂解决方案。

据悉,DGX SuperPOD可扩展至数万颗Grace Blackwell Ultra超级芯片,通过NVLink、Quantum-X800 InfiniBand和Spectrum-X以太网实现超高速互联,以提供强大的AI训练与推理计算能力。

再看HGX B300 NVL16,英伟达给出的数据显示,相较Hopper代际产品,在大语言模型推理方面,推理速度提高11倍、计算能力提升7倍、内存容量扩大4倍。这些突破使其能够高效运行最复杂的AI任务,特别适用于AI推理计算、深度推理及超大规模推理工作负载。

整体而言,这款面向AI推理时代的旗舰级GPU平台,不仅是英伟达Blackwell架构的又一力作,也标志着AI计算,从大模型预训练向深度推理与复杂推理的转变,将为数据中心、企业AI工厂及自动驾驶、机器人等领域提供强劲的计算能力。

“AI已经迈出了巨大的飞跃,推理AI和代理AI对计算性能的需求呈指数级增长。”黄仁勋表示,“我们正是为这个关键时刻设计了Blackwell Ultra——这是一款全能AI平台,能够高效执行预训练、后训练和推理等任务。”

去年,Blackwell架构刚刚发布,GB200系列在上个季度为英伟达带来110亿美元的营收。接下来,最新的Blackwell Ultra能够接棒GB200再创新高?

瑞银(UBS)在3月17日的报告中指出,Blackwell系列的需求依然非常强劲,GB200机架的残存的瓶颈现已完全解决,英伟达正加快B300/GB300(Blackwell Ultra)的推出时间,预计将在第一季度提前量产,并在2025年第三季度实现大规模出货。

英伟达表示,基于Blackwell Ultra的产品预计将于2025年下半年开始由合作伙伴陆续推出。思科、戴尔、惠普、联想和超微将率先推出基于Blackwell Ultra的服务器。浪潮旗下Aivres、华擎机架、华硕、富士康、技嘉、英业达、和硕、广达、纬创和纬颖等硬件制造商也将提供Blackwell Ultra服务器解决方案。

值得一提的是,在发布会现场,黄仁勋还放出了一张全球数据中心资本支出的统计图,与英伟达数据中心业绩进行了对比。预计到2028年,数据中心的投资将超过一万亿美元,暗示英伟达仍有巨大的增长空间。

软件大升级:一切为了推理和AI Agent

黄仁勋强调:“人工智能将无处不在。”英伟达重点关注领域包括机器人、自动驾驶、边缘计算、6G、企业IT、云服务、GPU云等。

今年,AI Agent的兴起和AI硬件的火热,都表明AI应用正在加速爆发。尤其是随着DeepSeek等技术的推出,成本逐渐降低,进一步推动了生成式AI滚滚向前。

而生成式AI正改变计算的方式,在黄仁勋看来,计算机已经成为token的生成器,而不是文件的检索器,数据中心也演变成了AI工厂,只负责生成token,并将其转化为音乐、文字、研究等。

在发布会现场,黄仁勋用DeepSeek和其他大模型进行了对比演示。在回答同一个问题时,与传统的大语言模型相比,DeepSeek的推理模型需要多20倍的token和150倍的计算资源,但得出了更准确的答案。黄仁勋指出,随着下一代模型可能包含数万亿个参数,对英伟达Blackwell NV72等系统的需求也将大幅增加。同时,在强化推理过程中,软件起到了很关键的作用。

英伟达新推出了AI推理服务软件Dynamo,黄仁勋指出:“这本质上是人工智能工厂的操作系统。”在Dynamo的支持下,Blackwell在推理性能上实现了巨大飞跃,其推理性能可达上一代Hopper的40倍。因此,黄仁勋再次强调:“买得越多,省得越多。”

IDC助理研究总监崔凯表示,黄仁勋重点强化了“token经济学”(token=收入),将复杂系统简化为可量化、易传播的商业故事。类似于5G建网时强调的“单比特成本大幅下降”的逻辑,效率提升价值,规模摊薄成本,延续“buy more and save more”的价值主张。

Dynamo能够最大化AI工厂在推理AI模型中的token收益。它通过协调并加速数千颗GPU之间的推理通信,采用分离式推理架构(Disaggregated Serving),使大语言模型的输入处理(Processing Phase)和推理生成(Generation Phase)分别在不同GPU上运行。这种设计使每个阶段能够根据自身需求进行独立优化,确保GPU资源的最大化利用,从而实现更高效的AI推理计算。

此外,英伟达还通过一系列NIM服务支持企业和开发者构建AI Agent。例如,英伟达推出了Llama Nemotron系列推理模型,包括Nano、Super和Ultra三个版本,能够执行更复杂的推理任务,并具备可调节的推理模式。这些模型基于Meta的Llama架构,并经过英伟达的独特优化,在数学推理、指令跟随及复杂任务处理方面表现出色,适用于自动化客服、商业分析、科学研究等领域。

为了帮助企业更高效地构建AI代理系统,英伟达还发布了AI-Q(NVIDIA IQ Blueprint),这是一种开放式的AI代理架构,支持查询多模态数据(文本、图像、视频等)并连接外部工具,如Web搜索和数据库。AI-Q能够提升AI代理的推理能力,使其具备更强的逻辑推理和问题解决能力,减少企业在AI应用中的开发成本和部署难度。

英伟达的核心护城河——CUDA,也是一套强大的软硬件体系。黄仁勋在发布会上详细介绍了CUDA库的广泛应用,如今英伟达已经拥有从量子化学到基因测序等各个领域的AI工具。黄仁勋表示:“我们已经达到了计算的临界点,CUDA使之成为可能。”

能否扭转AI市场情绪?

回顾过去的一个季度,AI领域可谓波澜起伏,风向和叙事悄然生变。尤其是自DeepSeek爆火以来,关于推理、算力、成本和效率的讨论从未停止。再加上美国政策的变化,为全球AI产业的发展增添了新的变量。

今年的GTC大会上,“what’s next in AI starts here”的标语高高悬挂。大家都在期待,面对日新月异的AI技术和擂台挑战,黄仁勋将如何描绘AI的未来。

整体来看,英伟达在GTC2025大会上带来了规模庞大的技术发布,涵盖了AI推理计算、AI Agent、物理AI(机器人与自动驾驶)、数据中心基础设施以及数字孪生等多个领域。然而,发布会结束后,截至记者发稿时,英伟达股价下跌了3.43%。事实上,黄仁勋在发布会上还提到了股价问题,开玩笑地表示股价低时是投资的好时机。

摩根大通近日的报告指出,总体来看,由于对2025年数据中心AI支出峰值的担忧、GPU与ASIC竞争以及近期CoWoS订单削减的忧虑,整体AI市场情绪仍显偏空。我们认为,GTC大会有望提振部分对AI股票的正面情绪,同时改善下游供应链中Blackwell系统的供应状况。

报告还表示,尽管对2026年AI数据中心资本支出增长的担忧可能需要更长时间才能解除,但在DeepSeek之后对AI资本支出下降的担忧并未真正显现。我们预计2026年将在美国CSP资本支出持续增长、中国CSP的增量资本支出回升以及企业AI采用增加的共同作用下,继续保持健康增长。

对于DeepSeek的影响,黄仁勋此前表示,DeepSeek的崛起实际上将对英伟达带来整体上的积极影响,因为这将加速人工智能技术的广泛应用。他还指出,像OpenAI的o1这样高能耗的推理模型的增长,是英伟达下一座需要攀登的高峰。

本届GTC是英伟达近年来最重要的技术发布之一,其核心主题围绕AI推理时代展开,从计算架构(Blackwell GPU、Rubin、Dynamo)、企业AI应用(Llama Nemotron、AIQ),再到数据中心(Photonics、交换机)、机器人和自动驾驶(Isaac Groot、NVIDIA Drive),英伟达正在构建一个完整的AI生态体系。

在AI的推动下,企业和个人的生产力将迎来新一轮的变革,而英伟达作为这一变革的核心推动者,也在不断加速技术创新。

更多内容请下载21财经APP