英伟达2026年首款核心产品提前登场。当地时间1月5日美国CES展上,黄仁勋意外发布下一代AI芯片平台“Rubin”,打破其每年3月GTC大会集中公布架构的惯例。
这一平台并非首次预告。2025年3月GTC大会上,黄仁勋已提及“Vera Rubin”超级芯片,明确2026年量产。此次CES上,该平台完成系统性发布,“Rubin”成为最新GPU代号。黄仁勋称:“Rubin的出现恰逢其时,AI对计算的需求在训练与推理端均急剧增长。通过六颗全新芯片的协同设计,我们正推动AI向新前沿迈进。”
平台整合6颗芯片:NVIDIA Vera CPU、Rubin GPU及NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU与Spectrum-6以太网交换芯片,覆盖计算、网络、存储及安全全层级。性能上,较前代Blackwell架构,Rubin训练性能提升3.5倍、运行性能5倍,配备88核新款CPU;推理token成本降低最高90%,训练MoE模型的GPU用量减少75%。
系统命名为NVL72,英伟达高管向21世纪经济报道等记者解释,72个GPU封装单元(每封装含2个Rubin Die共144个Die),规模不变。生态上,AWS、微软、谷歌、OpenAI等头部云厂商及模型公司已首批采用。
提前亮相的原因是提供工程样品、加速生态部署,计划下半年进入量产爬坡,节奏不变。高管表示六颗芯片已到位,系统运行真实负载并获积极结果。
除Rubin外,英伟达还发布推理上下文存储平台,专为推理场景设计,通过新存储层管理KV Cache减少算力浪费。物理AI布局上,机器人领域推出Cosmos Reason 2(推理型视觉语言模型)和GR00T N1.6(类人机器人视觉-语言-动作模型),首款AV车将于Q1在美国推出;自动驾驶领域发布Alpamayo开源模型,配套1700多小时驾驶数据的开源数据集及AlpaSim仿真框架。
此次发布标志英伟达将AI基础设施竞争转向系统工程能力,焦点不再仅是芯片算力,而是架构、系统与生态的整体交付。
来源:21世纪经济报道#晒晒我的2025投资战绩!##存储概念迎烈火烹油!英伟达新方案引爆##13连阳!沪指再刷十年新高#$南方中证半导体产业指数发起C(OTCFUND|020840)$$华宝上证科创板芯片指数发起C(OTCFUND|021225)$