• 最近访问:
发表于 2026-02-01 12:47:13 东方财富Android版 发布于 山东
易点天下星期一带领AL直冲云顶
发表于 2026-02-01 09:57:00
来源:科创板日报

  随着大模型行业逐渐从大规模训练阶段走向推理落地阶段,业内分析普遍认为,2026年全球AI推理的需求将超过AI训练场景。

  不久前,英伟达以200亿美元收购一家AI推理芯片初创企业Groq的技术授权,并把Groq核心团队招入囊中,来补全推理算力拼图。

  在近日的采访中,曦望董事长徐冰向《科创板日报》记者判断称,至2030年,预计AI推理在整个AI计算市场将占到80%的份额,而聚焦于极致推理的AI芯片,未来会有更强的爆发性,并会对现有的算力系统造成冲击。

  另有AI芯片产业链人士也对《科创板日报》记者表示,未来,推理请求量与并发数将大幅增加,推理算力需求呈指数级攀升。

  推理算力需求呈指数级攀升

  “现阶段正处于以智能体为代表的人工智能新应用爆发初期,未来推理请求量与并发数大幅增加,推理算力需求呈指数级攀升。”一名AI产业链人士向《科创板日报》记者表示,随着推理范式变化,AI智能体将加速落地,其整体算力消耗可达同参数规模大语言模型的10倍以上,对智能算力的需求呈数量级跃迁。

  目前,全球AI算力龙头正处于由训练转向推理的阶段。英伟达此前完成了对AI推理芯片公司Groq的收购,也是其迄今规模最大的一笔收购。

  Groq是一家专注极致推理的AI芯片企业,其创始人Jonathan Ross带领的谷歌TPU原班人马,用七年时间打造出LPU(语言处理单元)架构,曾宣称其推理性能是英伟达H100 GPU 10倍,而成本仅为其十分之一。

  此外,美国的Etched.ai、Groq等也是主打极致推理芯片路线的企业。这类公司的核心逻辑是,大模型架构已经收敛,因此放弃通用训练GPU,更专注于打造最快的AI推理芯片。

  在国内,也有企业瞄准这一方向。

  近日,从商汤科技拆分独立的AI芯片企业——曦望Sunrise,推出了聚焦于大模型推理的GPGPU 芯片启望 S3。在DeepSeek V3/R1满血版等主流大模型推理场景中,S3 的单位 Token 推理成本较上一代降低约 90%。曦望的目标是把百万 Token的推理成本降低至1分钱。为此,曦望联合商汤科技、第四范式等,发起“百万 Token 一分钱”推理成本计划。

  曦望联席CEO王勇认为,AI训练芯片赛道逐渐收敛,已经变成头部玩家的游戏。

  “如今,市场格局越来越清晰,能做预训练大模型的公司数量是有限的,因为门槛越来越高。而推理赛道还没有收敛。既有AI智能体,大语言模型,也有具身智能模型、世界模型等等,都会需要芯片来做推理任务。如果能把算力做到极致性价比,那么在下一代的芯片就占据了极有利的生态。”

  AI应用或借力春节加速落地

  从市场格局来看,相比英伟达在训练端一家独大。在推理端,由于对成本和能效的极致追求,技术路线呈现出百花齐放的态势,为国产AI芯片厂商带来机遇。

  对于后续国产AI芯片的市场格局,曦望联席CEO王湛认为,英伟达的市值达到4万亿美金,而中国或许将出现多家市值数千亿,甚至万亿人民币的GPU公司。

  “相较于美国,中国AI产业呈现出较为明显的区域化发展特征,国内不同GPU企业在各自优势地域市场占据主导.而互联网巨头们除自研芯片外,也在采购国产芯片,并已形成各自的深度合作伙伴关系。尽管中国GPU企业的总市值可能难以达到英伟达4万亿美元的高度,但即便以4万亿人民币计算,市场依然蕴藏着巨大的增长空间。”

  当前,AI产业链企业的高估值,也引发了市场担忧。曾领导瑞士银行商品策略团队的英国分析师朱利安·加兰认为,美国的资本配置不当,AI泡沫的狂热是互联网泡沫的17倍,2008年房地产泡沫的4倍。

  曾经历过互联网泡沫破灭的王湛认为,“当时的互联网泡沫之所以形成,很大程度上是因为尽管市场概念火热,实际用户规模却非常有限。如今,AI应用的月活用户规模已经破亿,其增长速度和行业渗透率,远超当年的互联网产品,也比整个互联网浪潮来得更快、更迅猛。”

  目前,百度、腾讯先后宣布旗下AI应用将在今年春节期间发放数亿元红包。阿里旗下的通义千问也计划加入红包促销行列。花旗在研报中表示,回顾以往,春节活动能有效帮助互联网大厂为其消费级应用吸引大量关注。预计在今年的一系列新春推广活动后,中国AI应用的普及进程有望进一步加速。

  王湛也看好春节对于AI应用的助推作用。“除了腾讯、百度等的红包促销,不少机器人也要上春晚。今年春节过完,中国的AI渗透率、使用率会进一步的提升,这也代表整个AI产业价值的提升。”

  在现阶段的AI产业架构中,最底层的芯片拿到了绝大部分价值。徐冰表示,AI芯片占据了整个AI产业价值70%甚至90%,这是现状。展望未来, AI芯片或许仍会占据整体AGI(通用人工智能)价值的大头。

  “试想一下,一旦AGI时代真的到来,机器人的数量会超过人类。这些机器人需要进行7×24小时的推理,所有的这些应用,包括物理AI、多模态等,会让推理的需求变得没有天花板。随着AGI时代的来临,我们需要构建一个推理的算力网络,让普惠的推理算力,能够为每一台机器人,每一台终端设备,每一个消费者,每一个企业所用。”

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500