智谱新模型流量爆发,月之暗面模型调用量登顶全球,字节跳动视频生成工具震动好莱坞——春节前夕,中国大模型厂商以罕见的密集节奏交出最新答卷。这一切有迹可循,DeepSeek去年春节前夕意外破圈,所以2026年的同一个时间窗口也成为了国产大模型厂商心照不宣的“抢跑点”。
从这波新模型的特点来看,大模型的技术焦点已经从参数竞赛转向工程效率,从通用智能下沉至垂类落地,而全球榜单上也出现了越来越多中国开源模型的名字。这意味着,市场的聚光灯不再只属于单一黑马——这场没有硝烟的春节“卡位战”正悄然提速,为2026年大模型竞赛按下加速键。
春节前纷纷“交卷”
2月12日,上市仅一月出头的智谱股价大涨28.68%至402港元/股;2月13日,智谱涨势延续,股价截至收盘涨20.65%至485港元/股,市值达到2162亿港元。
这是因为2月12日早间,智谱宣布上线并开源GLM-5,并称这款模型为“Agentic Engineering时代最好的开源模型”,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务。
当然,仅仅发布一款新模型,资本市场不至于如此亢奋。股价大涨的原因在于,GLM-5正式推出前,智谱卖了个关子。几天前,全球模型服务平台OpenRouter突然上架一款名为“Pony Alpha”的神秘模型,24小时内登顶平台热度榜首,到2月12日,智谱才揭开谜底,这款神秘模型即GLM-5,在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一。2月12日晚间,智谱又发布公告称,GLM-5一经上线,平台流量呈爆发式增长。
目前,GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配,在国产芯片集群上实现高吞吐、低延迟的稳定运行。
智谱上新前后,科大讯飞和MiniMax也带来新模型。2月11日,科大讯飞发布了基于全国产算力训练的星火X2大模型,据介绍,星火X2通用能力全面升级,整体能力对标国际顶尖模型水平,在数学、推理、语言理解、智能体等能力上媲美国际最优。2月13日,MiniMax发布M2.5模型,该公司表示,相比于前代模型,M2.5在处理复杂任务时展现出了更高的决策成熟度:它学会了用更精准的搜索轮次和更优的token效率去解决问题。当日,MiniMax股价涨15.65%至680港元/股,市值为2133亿港元。
更早一些,1月27日,月之暗面发布并开源Kimi K2.5模型,K2.5是该公司迄今最智能和最全能的模型。据大模型聚合服务平台OpenRouter最新统计,在2月2日至2月8日这一周,K2.5的token调用量达到1.16万亿,排名第一。月之暗面方面向本报记者分享了全球开发者用钱包投票的结果:K2.5的最新数据是调用量达到1.53万亿token,排在全球第一。
当然,提到新模型,不得不提最近大火的Seedance 2.0。Seedance 2.0是字节跳动新一代AI视频生成模型,凭借多模态创作方式、自带运镜的呈现效果,迅速在全球范围内引发高度关注。据报道,多位美国导演或影视从业者在使用Seedance2.0之后,公开表达了诸如“好莱坞要完蛋了”或“这东西说不定真能搞垮好莱坞”的感慨。有消息称,字节跳动火山引擎初步确定在2月14日进行豆包大模型的一系列重要升级发布。
“从众厂商发布新模型的情况来看,AI大模型行业已经进入工程化成熟期,厂商选择同步展示研发成果,强化品牌认知,在全球竞争中凸显中国AI的演进节奏。”深度科技研究院院长张孝荣对《华夏时报》记者表示。
聚光灯轮转各家
虽然2025年春节前也有大模型厂商发布新模型,但远不及今年这般密集。本报记者就选择春节前上新的原因分别采访了智谱、科大讯飞等厂商,截至发稿未收到回复。
“其实春节本来就是流量高峰与口碑传播的黄金窗口,今年发布尤其密集,其实是去年DeepSeek在春节前破圈,厂商也想复制这个成功路径,为全年商业落地抢占先机。”张孝荣说。
2025年1月27日,DeepSeek先是成为美区苹果商店免费下载量第一的App,之后还刷屏了全球市场。凭借更少的算力、不俗的成果、开源的模式等优势,DeepSeek得到了业内众多大咖的称赞,也让国外竞争对手警惕。在DeepSeek出圈之前,国内的“AI六小虎”已相继崭露头角,收获了可观的市场声量与资本追捧,而DeepSeek的一夜爆红,几乎将聚光灯尽数夺走——此消彼长的态势,也成为这一轮大模型竞赛残酷性的生动注脚。
今年春节前夕,DeepSeek暂时还未正式发布任何新模型。不过在2月11日,据多名用户反馈,DeepSeek悄悄对旗舰模型进行了灰度测试,上下文窗口提升至1M Tokens,但用户反馈其风格从之前的“热情风”变为“冷淡风”,如不再称呼自己设定的昵称,而统一称“用户”。有分析称,这是为即将发布的V4版本做最后的压力测试。
从这段时间发布的新模型介绍来看,开源、编程、agent几乎是各个厂商都在聚焦的话题。智谱方面表示,学界与业界正逐渐形成一种共识,大模型从写代码、写前端,进化到写工程、完成大任务,即从“Vibe Coding”变革为“Agentic Engineering”,GLM-5正是这一变革的产物。张孝荣也指出,大模型竞争正从参数规模转向效率与成本,推理能力普及与智能体实用化是今年的焦点,厂商需在长链路任务中证明价值。
随着技术焦点与应用场景的更迭,大模型市场的格局也将随之重塑。不久前,360集团创始人周鸿祎指出,中国开源模型正成为全球AI根技术生态的核心力量,对全球智力资源形成“虹吸效应”,开源将推动AI从科技巨头的特权,转变为全球普惠、特别是“一带一路”国家构建“主权模型”的数字基础设施基座。
而在中国厂商中,张孝荣预测,市场可能将出现分层:通用模型马太效应加剧,字节跳动和阿里巴巴等全栈布局者明显占优;中小玩家则集中于垂直领域寻求发展空间。“总体而言,单一厂商或难以持续全面领先,商业化落地效果将成为终极试金石。”