• 最近访问:
发表于 2026-01-07 14:36:59 天天基金网页版 发布于 广东
AI圈炸锅!英伟达3月大法提前2月放,Rubin芯片推理成本直降90%引巨头疯抢

英伟达2026年首款核心产品提前登场。当地时间1月5日美国CES展上,黄仁勋意外发布下一代AI芯片平台“Rubin”,打破其每年3月GTC大会集中公布架构的惯例。
这一平台并非首次预告。2025年3月GTC大会上,黄仁勋已提及“Vera Rubin”超级芯片,明确2026年量产。此次CES上,该平台完成系统性发布,“Rubin”成为最新GPU代号。黄仁勋称:“Rubin的出现恰逢其时,AI对计算的需求在训练与推理端均急剧增长。通过六颗全新芯片的协同设计,我们正推动AI向新前沿迈进。”

平台整合6颗芯片:NVIDIA Vera CPU、Rubin GPU及NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU与Spectrum-6以太网交换芯片,覆盖计算、网络、存储及安全全层级。性能上,较前代Blackwell架构,Rubin训练性能提升3.5倍、运行性能5倍,配备88核新款CPU;推理token成本降低最高90%,训练MoE模型的GPU用量减少75%。

系统命名为NVL72,英伟达高管向21世纪经济报道等记者解释,72个GPU封装单元(每封装含2个Rubin Die共144个Die),规模不变。生态上,AWS、微软、谷歌、OpenAI等头部云厂商及模型公司已首批采用。

提前亮相的原因是提供工程样品、加速生态部署,计划下半年进入量产爬坡,节奏不变。高管表示六颗芯片已到位,系统运行真实负载并获积极结果。

除Rubin外,英伟达还发布推理上下文存储平台,专为推理场景设计,通过新存储层管理KV Cache减少算力浪费。物理AI布局上,机器人领域推出Cosmos Reason 2(推理型视觉语言模型)和GR00T N1.6(类人机器人视觉-语言-动作模型),首款AV车将于Q1在美国推出;自动驾驶领域发布Alpamayo开源模型,配套1700多小时驾驶数据的开源数据集及AlpaSim仿真框架。

此次发布标志英伟达将AI基础设施竞争转向系统工程能力,焦点不再仅是芯片算力,而是架构、系统与生态的整体交付。

来源:21世纪经济报道#晒晒我的2025投资战绩!##存储概念迎烈火烹油!英伟达新方案引爆##13连阳!沪指再刷十年新高#$南方中证半导体产业指数发起C(OTCFUND|020840)$$华宝上证科创板芯片指数发起C(OTCFUND|021225)$

郑重声明:用户在基金吧/财富号/股吧等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500