米兰·(milan)中国官方网站- 推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

2026-03-15 01:55:13

　　导语：GTC2025，英伟达带来Blackwell Ultra、Rubin等全新发布。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

雷峰网(公家号：雷峰网)动静，北京时间3月19日凌晨，英伟达公司开创人兼CEO黄仁勋于GTC集会上发表主题演讲。

DeepSeek爆火后，英伟达被推优势口浪尖，对于在AI成长是否会带来更年夜数目级的算力需求，市场生出隐忧。演讲开场，黄仁勋便做出回覆：“全球都错了，Scaling law有更强的韧性，此刻的计较量是去年同期的100倍。”

推理让AI具有“思维链”，模子相应需求时会对于问题举行拆解，而不是直接给出谜底，对于每一个步调举行推理必将让孕育发生的Token数目增长。模子变患上越发繁杂，为了包管原本的推理速率以和相应能力，便对于算力提出了更高的要求。

Token是AI的基本单位，推理模子素质上是一座出产Token的工场，提高Token的出产速率就是提高工场的出产效率，效率越高，好处越年夜，算力要做的就是摸索出产效率的界限。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

而具有自立推理能力的Agentic AI成长趋向之下，必将动员物理AI的成长。GTC集会上，英伟达带来Blackwell Ultra、推理体系Dynamo、Blackwell NVLink 7二、下一代AI芯片Rubin等全新发布，用机能回应需求。

AI芯片将「年更」，Rubin机能达Hopper「900倍」

AI的成长让数据中央的本钱支出不停爬升，数据显示，2028年纪据中央本钱支出将到达1万亿美元，黄仁勋称：“这此中的年夜部门增加可能还有会加快。”本钱支出增长、盈利能力晋升，带来的是英伟达于数据中央范畴的营收增长。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

为了让计较机成为更强的“Token天生器”，英伟达发布新一代“最强AI芯片” Blackwell Ultra。

单从硬件上看，Blackwell Ultra相较在GB200带来的最年夜进级是采用12层重叠的HBM3e内存，成为全世界首个显存到达288GB的GPU。对于此，有动静称，SK海力士将独家供给Blackwell Ultra。

高效相应推理模子，对于算力、内存和带宽提出更高的要求。英伟达推出Blackwell Ultra GB300 NVL72机架级解决方案，集成72个Blackwell Ultra GPU及36个Grace CPU，满意AI推理事情负载对于算力及内存的要求。

Blackwell Ultra GB300 NVL72将在2025年下半年发布，其机能为GB200 NVL72的1.5倍、40TB快速闪存为前代1.5倍，14.4TB/s带宽为前代2倍。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

要更好开释硬件的算力，软硬件协同变患上越发主要，为此，英伟达推出漫衍式推理办事库NVIDIA Dynamo，经由过程协调并加快数千个GPU之间的推理通讯，为部署推理AI模子的AI工场最年夜化其token收益。

于GPU数目不异的环境下，Dynamo可以实现Hopper平台上运行Llama模子的AI工场机能及收益翻倍，于由GB200 NVL72机架构成的集群上运行DeepSeek-R1模子时，Dynamo的智能推理优化能将每一个GPU天生的Token数目提高30倍以上，并让Blackwell的机能相较在Hopper晋升了25倍。

黄仁勋暗示，Dynamo将彻底开源并撑持PyTorch、SGLang、NVIDIA TensorRT-LLM及vLLM，使企业、草创公司及研究职员可以或许开发及优化于分散推理时部署AI模子的要领。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

于推理模子中，Dynamo则让Blackwell的机能到达Hopper的40倍，黄仁勋笑称：“当Blackwell批量发货时，就不要再拿Hopper去送人了。”

以功率为100兆瓦的AI工场为例，其能供能45000个H100芯片，总计1400个H100 NVL8机架，出产力为3亿个Token。划一功率下，其能供能85000个GB200芯片，总计600个机架，出产力为120亿个Token。相较在H100 NVL8，GB200 NVL72不仅带来更强的算力，并且于功耗及空间占用上更有上风。

“买患上越多，免得越多。”黄仁勋又说出了他的带货名言，此次还有增补道，“买患上越多，赚患上越多。”

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

旗舰版AI芯片作为GTC的“最年夜看点”，仅仅公布Blackwell Ultra很难满意外界预期。对于此，黄仁勋宣布了英伟达旗舰芯片的全新线路图，芯片架构的更新周期正于加快，由每一两年推出新的产物线调解为“每一年一更”的产物节拍。

每一代产物更新均基在全栈解决方案、依托同一架构，并秉持“CUDA无处不于”的理念推进。根据线路图计划，黄仁勋提早预报了下一代AI芯片“Rubin”，遵照以往采用科学家名字定名架构的惯例，本次新架构以美国天文学家“Vera Rubin”的姓氏定名，以记念其证明了暗物资存于的卓着孝敬。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

Vera Rubin NVL144估计将于2026年下半年发布，于举行FP4精度的推理使命时，机能到达3.6ExaFLOPS，举行FP8精度的练习使命时，机能为1.2ExaFLOPS，与GB300 NVL72比拟，机能晋升了3.3倍。

Vera Rubin NVL144配备HBM4，带宽到达13TB/s，拥有到达前代1.6倍的75TB快速闪存。撑持NVLink6及CX9，带宽均到达前代2倍，实现数据传输效率的晋升。

黄仁勋暗示，Blackwell的机能相较在Hopper晋升了68倍，而Rubin的机能将到达Hopper的900倍。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

与Blackwell同样，除了了尺度版本，英伟达还有规划在2027年下半年推出Rubin Ultra NVL576，于举行FP4精度的推理使命时，其机能到达15ExaFLOPS，举行FP8精度的练习使命时，机能为5ExaFLOPS，与GB300 NVL72比拟，机能晋升了14倍。

Vera Rubin NVL144将配备HBM4e，带宽到达4.6PB/s，拥有到达前代8倍的365TB快速内存。撑持NVLink7，带宽1.5PB/s，为前代12倍。撑持CX9，带宽115.2TB/s，为前代8倍。

CPU部门，Vera芯片搭载88个定制Arm焦点，撑持176线程，具有1.8TB/s的NVLink - C2C（芯片到芯片）带宽，于多芯片互联等场景下能高效传输数据。GPU方面，Rubin Ultra集成4个Reticle-Sized GPU，每一颗GPU拥有100PF的FP4算力，搭配1TB HBM4e显存，于机能及内存容量上到达新高。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

于练习、推理和运用部署等要害环节，AI芯片平台都需要收集为其提供高速不变的数据传输。英伟达推出Spectrum-X及Quantum-X硅光收集互换机，为全世界开始进的AI云和AI工场提供撑持。

Spectrum-X收集互换机有多种配置，最高配置512端口800Gb/s或者2048端口200Gb/s，总吞吐量达400Tb/s。与之配套的Quantum - X收集互换机基在200Gb/s SerDes技能，提供144端口800Gb/s的InfiniBand毗连，与上一代比拟，速率晋升2倍、可扩大性晋升5倍。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

不止AI工场，DGX Spark及DGX Station打造「AI桌面」

为了撑持AI开发者、研究职员、数据科学家及学生等群体，英伟达推出“全世界最小AI超等计较机”DGX Spark，其撑持于台式电脑上对于年夜模子举行原型设计、微和谐推理，用户可以于当地、云或者数据中央基础举措措施中运行这些模子。

DGX Spark是基在GB10 Grace Blackwell打造的小我私家AI超等计较机系列产物，按照台式电脑形状规格举行了针对于性优化，其撑持第五代Tensor Core及FP4，每一秒计较次数到达1000万亿次。GB10采用NVIDIA NVLink-C2C互连技能，带宽是第五代PCIe的五倍，而且可以或许拜候GPU及CPU之间的数据，为内存密集型AI开发者事情负载优化机能。

英伟达的全栈AI平台撑持DGX Spark用户将其模子从台式机迁徙到DGX Cloud、其他加快云和数据中央基础举措措施中，而且无需修改代码，简化了对于其事情流举行原型设计、微和谐迭代的要求。

黄仁勋暗示：“AI转变了每一一层计较仓库。咱们有理由信赖将呈现一类专为AI原生开发者而设计并用在运行AI原生运用的新型计较机。借助全新的DGX小我私家AI计较机，AI可以或许从云办事扩大到台式电脑及边沿运用。”

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

DGX Station是Ultra平台的高机能桌面超等计较机，定位为面向企业及科研机构的高机能AI计较站，可以或许帮忙企业构建私有AI推理体系，相较在DGX Spark，合用在更年夜范围的AI开发范畴。

DGX Station是第一款采用英伟达GB300 Grace Blackwell Ultra桌面超等芯片构建的台式机体系，拥有784GB同一体系内存，撑持800Gb/s收集毗连的ConnectX-8 SuperNIC，AI机能到达20PFLOPS。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

从数据、模子到算力，英伟达「周全驱动」人形呆板人

“呆板人时代已经经到来，其可以或许与物理世界交互并履行数字信息没法完成的使命。”黄仁勋说，“世界正面对严峻的劳动力欠缺，到2030年，全球将欠缺5000万名工人，咱们可能不能不每一年付出5万美元薪水给呆板人。”

物理AI正于转变范围50万亿美元的财产。英伟达推出全新Cosmos世界基础模子，引入开放式、可彻底定制的物理AI开发推理模子，包罗各类模子尺寸并合用在多种输入数据格局，帮忙天生年夜型数据集，能将图象从3D扩大到真实场景，缩小仿真与实际之间的差距。

1X、Agility Robotics、Figure AI、Foretellix、Skild AI及Uber是首批采用Cosmos的企业，可更快、更年夜范围地为物理AI天生更富厚的练习数据。

“正如年夜语言模子转变了天生式及代办署理式 AI，Cosmos世界基础模子是物理AI的一项庞大冲破。”黄仁勋暗示， “Cosmos为物理AI带来了一个开放式、可彻底定制的推理模子，为呆板人及物理工业范畴的冲破性成长带来了机缘。”

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

满意数据需求以外，英伟达推出人形呆板人基础模子Isaac GR00T N1，采用“快速反映”的体系1以和“深度推理”的体系2双架构，黄仁勋暗示，Isaac GR00T N1将开源，呆板人开发者可以用真实或者合成数据举行后练习。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

Isaac GR00T N1基础模子采用广义类人推理及技术举行了预练习，开发者可以经由过程举行后练习，使其满意特定的需求，例如完成差别工场出产线的特定使命以和自立完成差别的家务。

英伟达、googleDeepMind和迪士尼互助开发了开源物理引擎Newton，采用Isaac GR00T N1作为底座驱动了迪士尼BDX呆板人。

推理和机器人，哪一个才是英伟达「AI工厂」的增长故事？

人形呆板人是AI时代下一个增加点，从数据天生、基础年夜模子到算力，英伟达为开发者提供了周全撑持。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

-米兰·(milan)中国官方网站

产品

服务

关于米兰·(milan)中国官方网站

信息公开

产品 +

服务 +

关于米兰·(milan)中国官方网站 +

信息公开 +

投资者关系

加入米兰·(milan)中国官方网站

客户留言