• 最近访问:
发表于 2025-12-11 18:32:50 股吧网页版
一石千浪:复盘中国大模型2025
来源:财中社

  编者按:

  12月11日起,《财中社》将陆续推出TMT年度复盘。这波澜壮阔的一年,承上启下,既是过去几十年技术积累的破茧而出,更是未来谁与争锋的起点。

  1月20日,DeepSeek-R1发布之时,深度求索(DeepSeek)创始人梁文锋在总理座谈会同步亮相。2月,梁文锋在京亮相民营企业座谈会,一身旧西装的他与腾讯(00700.HK)创始人马化腾比邻而坐。

  当时同座的大咖们,或许有的尚未完全意识到这位85后年轻创业者的“份量”。而今回看,当过短暂“同桌”的马化腾,大概最先能感知DeepSeek将要席卷的风暴。

  业界将此称之为“DeepSeek时刻”,远不止于展示深度求索及幻方量化的卓越效率,它更像一道刺目的闪电,瞬间照亮了中国大模型行业从狂热竞赛转向残酷洗牌的全新格局,并进而引发了国外对中国科技资产重估的大潮。

  从2023年的“百模大战”,到2025年DeepSeek横空出世、跨入Agent元年,中国大模型行业在OpenAI ChatGPT面世后,从跟随到另路并行,实现了一段不小的跨越。以此为开端,一部行业重塑剧,在2025年全面上演。

  技术平权,资本冷暖

  R1发布后不久,DeepSeek发表题为《DeepSeek-V3/R1 推理系统概览》的文章,进一步披露其服务运营的理论日均成本为8.7万美元,而理论日均收入可达56.2万美元,成本利润率高达545%。

  根据DeepSeek团队在2025年9月发表于《自然》(Nature)杂志的同行评审论文,其年初发布的轰动性模型DeepSeek-R1训练使用了512张英伟达H800 GPU,总训练时长约为80小时,训练成本仅为约29.4万美元(折合人民币约208万元)。这仅指R1模型本身的训练开销,其背后所基于的大型语言模型(LLM)的开发成本约为600万美元。

  即便如此,其总成本也远低于业界普遍认为训练顶级模型所需的“数千万美元”级别。作为对比,外界估算OpenAI训练GPT-4的成本超过1亿美元。这种巨大的成本差异,直接挑战了当时“巨额投入是打造顶级AI模型前提”的行业共识。

  在DeepSeek以“低成本高成效”震惊业界的同时,毫不意外,DeepSeek-R1更成为2025年中国资本市场一场系统性“价值重估”的催化剂。

  市场开始重新评估中国科技产业的竞争力与增长潜力,此前长期存在的“估值折价”现象迎来修复契机。资金如潮水般涌入,推动A股科创50指数、港股恒生科技指数以及纳斯达克中国金龙指数全线大涨。

  在这场由算法革命点燃的牛市里,一批与AI算力紧密相关的公司成为市场明星,并被投资者以“易中天”、“纪连海”等戏称津津乐道。

  “易中天”代表光模块核心厂商新易盛(300502.SZ)、中际旭创(300308.SZ)、天孚通信(300394.SZ),截至12月11日,三者年内涨幅最高分别超450%、400%和250%。“纪连海”则指代芯片与硬件巨头寒武纪(688256.SH)、工业富联(601138.SH)、海光信息(688041.SH)。

  其中,寒武纪股价从7月10日520.67元/股低点开始一路高歌猛进,一度超过贵州茅台(600519.SH)股价,高点升至1595.88元/股,后虽有所调整,但股价已然稳定在千元以上,与贵州茅台不分伯仲。到年末,12月5日“国产GPU第一股”摩尔线程(688795.SH)上市,首日收盘600.5元/股虽破发,但后续涨劲十足,5个交易日冲破900元大关。

  伴随这些牛股的崛起,市场投资逻辑也从过去的消费互联网叙事,向AI基础设施和核心技术等“新质生产力”转变。外资机构也纷纷更新观点,认为中国科技股正从“可交易”的波段机会转变为“可投资”的战略性资产。

  7月18日,人民网研究院发布《中国智能互联网发展报告(2025)》,以DeepSeek、阿里巴巴(09988.HK,以下简称“阿里”)Qwen为代表的开源模型在核心性能上已追平甚至超越国际主流产品,完成了从“跟跑”到“并跑”的转变。技术差距的弥合,使得市场竞争的焦点从单纯的性能比拼,迅速转向成本、效率和商业化能力。

  另一方面,全球资本对大模型的投资逻辑正在发生根本性逆转。尽管AI赛道持续吸引巨额资金,但“马太效应”有增无减,资本正以前所未有的力度向头部集中。

  赛迪网统计,2025年一季度,全球VC融资总额达1263亿美元,其中57.9%(731亿美元)流向AI初创公司,二季度相关投资持续攀升至946亿美元,三季度进一步跃升至1200亿美元。其中,2025年第三季度,AI初创公司970亿美元的融资中,46%(446亿美元)流向了Anthropic(130亿美元)、xAI(100亿美元)等头部基础模型开发者。而2024年全年,OpenAI、Anthropic、xAI、CoreWeave和Scale AI五家公司更是吸纳了近三分之一的AI总投资。

  与此同时,“纯技术融资窗口正在关闭”成为行业共识。投资人不再为单纯“烧钱”训练更大参数模型的故事买单,转而要求清晰的商业化路径和可持续的盈利能力。

  “AI 六小虎”生存之战

  在中国,投资“冲击波”率先撼动了从“百模大战”拼杀出来、曾风光无限的大模型玩家。

  在资本与市场的双重压力下,曾被视为中国AI明星的“六小虎”——智谱AI、月之暗面、MiniMax、阶跃星辰、百川智能和零一万物,正经历着一场残酷的生存考验,它们被迫做出截然不同的战略选择,命运轨迹急速分化。

  曾经统一的“通用大模型”叙事已然逐渐瓦解,“AI 六小虎”们已分化为“坚守派”与“转型派”,前者咬定基座模型研发不放松,后者则不同程度地收缩预训练,向小模型或行业应用过渡。

  “坚守派”的核心逻辑是,持续参与基础模型的军备竞赛,以保持技术上的存在感与未来的想象空间。它们的路径各有侧重,但共同点是必须在巨头林立的环境中,快速证明自己的技术实力与商业潜力。

  智谱AI的策略最为系统,在2025年开启“开源年”,2025年4月开源了性能对标DeepSeek R1的推理模型,并陆续开源了包括文生图、基座模型、推理模型在内的多款产品,同时依托其“清华系”背景和全栈能力,大力拓展政企(To G)市场。

  其商业化进展在“六小虎”中相对稳健,成为“六小虎”中几乎唯一在2025年成功获得多轮新融资的公司,融资金额超30亿元,并据传已启动IPO(首次公开募股)流程,估值或将超过400亿元。

  MiniMax则在2025年6月上演了一场“技术反击战”,在五天内连续发布了自主研发的推理模型M1、视频生成模型、智能体等五款产品。其M1模型号称以远低于DeepSeek-R1的算力成本训练而成,并支持高达100万tokens的上下文输入。

  在商业化上,MiniMax主要依赖多个出海C端应用,如Talkie等获得营收,但也开始通过API模式向B端拓展。彭博社6月消息称,其正考虑在港股上市;每经7月消息称,MiniMax也在推进A股上市计划。

  月之暗面与阶跃星辰则分别固守自身的技术长板。

  月之暗面在DeepSeek横空出世前一直以Kimi长文本推理模型知名,遭受冲击后,Kimi市场占有率下滑,To C投流暂停。后续,Kimi开源了代码模型、紧急将Kimi 1.5推至台前,并推出了擅长多轮搜索与推理的Agent产品“Kimi Researcher”,但收效甚微。2025年5月,Kimi月活用户跌至1408万,不足彼时DeepSeek1.69亿月活的十分之一。

  7月,月之暗面毫无预警地开源发布Kimi K2模型,年初DeepSeek给月之暗面带来的阴影似乎稍被驱散。10月末,月之暗面又曝出正在洽谈融资的消息,这是继2024年末月之暗面遭受金沙江创投董事总经理朱啸虎公开“炮轰”后,2025年内月之暗面唯一的一次融资信息。12月初,前金沙江创投主管合伙人张予彤,以月之暗面总裁身份公开亮相;同时,《华尔街日报》引述知情人士称,公司被曝正以40亿美元估值进行新一轮融资,并计划2026年下半年启动IPO,其后续走向仍是未知数。

  阶跃星辰则持续专注于其“多模态”核心优势,将重心从C端应用转向为手机、汽车等终端提供智能体(Agent)解决方案,开始面向B端客户。

  当坚守者仍在牌桌上搏杀时,“转型派”已做出了更现实的抉择——放弃代价高昂的通用模型竞赛,在垂直领域或生态位中寻求生存。

  百川智能创始人王小川在2025年4月的全员信中明确,公司将“All in”医疗健康赛道,聚焦AI儿科、全科、精准医疗等方向。这标志着其战略性收缩了金融、教育等B端业务,押注于一个专业壁垒高但挑战巨大的市场。

  零一万物的转型则更为彻底。创始人李开复公开表示,公司已不再对万亿参数大模型进行投入,转而聚焦于性价比更高的中规模模型,并成为“全面拥抱DeepSeek模型的第一只‘小虎’”。目前,其官网已主推企业级Agent部署定制解决方案,战略上拥抱Agent落地元年。

  由此可见,尽管路径不同,但“六小虎”都面临着相似的巨大压力。

  躲不开的问题便是融资。在DeepSeek以极致成本效率树立新标杆后,一级市场投资者变得异常谨慎。有AI投资人曾坦言,自2024年下半年起,有能力接盘“六小虎”高估值的,“除了国资和中东资本,基本没什么人了”。这使得冲刺IPO成为它们获取“续命弹药”最关键的出路。

  核心人才流失亦成为“六小虎”技术护城河松动的信号。2025年上半年,“六小虎”中已有超过10位核心高管与技术骨干离职,包括首席战略官、模型负责人等关键角色,他们其中的不少都加入了字节等大厂的AI团队。在技术突破放缓、竞争前景不明朗的情况下,人才更倾向于进入能高薪且“遮风避雨”的大厂。

  最终,持续一年的洗牌结果已经显现。

  行业共识认为,有能力持续参与基础大模型竞争的玩家已收敛为新的 “基础大模型五强(基模五强)” ——DeepSeek、阿里、字节跳动(以下简称“字节”)、阶跃星辰和智谱AI。而李开复的预言——“中国最终只会剩下三家大模型公司”——则指向了一个更为残酷和集中的终局。

  对“六小虎”而言,生存之战远未结束,但游戏规则已然改变。从比拼融资规模和用户增速,转向了在有限时间和资源内,于垂直领域或特定生态位上建立不可替代的价值。

  巨头入局,生态竞赛

  “六小虎”艰难求生时,互联网巨头的全面入场,则以另一种方式重塑着行业生态。它们的战略并非简单的模型对标,而是利用自身禀赋,发起一场全方位的生态竞赛。

  中国领先的互联网公司正将大模型能力以惊人的速度和广度注入其超级应用,催生全球最大规模的“AI应用裂变”。

  阿里选择了“开源冲锋”的策略。截至目前,阿里Qwen已累计开源模型超300个,全球下载量突破6亿次,衍生模型数量逾17万个,位居全球开源大模型首位。可以看出,阿里试图通过高频、高质的技术输出,快速占领全球开发者心智,构建牢固的开源生态壁垒。

  到11月中旬,阿里推出“千问”App,在公测一周内下载量即突破1000万,23天内月活突破3000万,迅速登顶全球AI应用增速榜。不仅是单纯的产品成功,同样是其背后通义(Qwen)大模型通过全面开源建立的全球开发者生态向消费端的能量释放。

  《彭博社》称,阿里正将其通义App全面升级并更名为“千问(Qwen)”,旨在统一品牌,打造一个“中国版的ChatGPT”。早前,通义App已上线“超级智能体”,融入深度思考能力,其目标是将Qwen深度嵌入淘宝等电商场景,最终成为一个能独立执行任务的AI代理。阿里集团CEO吴泳铭将其称为“额外AI投资”。

  12月9日,阿里进一步成立千问C端事业群,由阿里集团副总裁吴嘉负责。该事业群由原智能信息与智能互联两个事业群合并重组而来,整合了千问App、夸克、AI硬件、UC、书旗等核心业务。阿里在AI to C领域的战略布局进一步深化,旨在将千问打造为“AI时代用户的第一入口”。

  另一边,字节则凭借其庞大的用户流量和工程化算法优势,发起了“价格革命”。

  自2024年下半年起,创始人张一鸣每月督导字节人工智能Seed团队复盘,强化协同。2025年中,其火山引擎平台将主力模型“豆包”的综合使用成本大幅压低,旨在通过极致的成本控制,迅速抢占企业市场和开发者,将竞争引入商业落地的深水区。

  与此同时,豆包大模型巧妙整合了多个实用工作技能板块,将大模型的纯“Chat”向多模态的“干实事”转变,这也和字节一以贯之的多应用策略相符。目前,豆包、即梦AI和剪映,已然牢牢占据网络创作者常用应用榜单之上。

  在年初DeepSeek爆火后,腾讯的混元大模型“元宝”最先承接了DeepSeek“服务器繁忙,请稍后再试”的流量,在短暂引流后,逐渐深度融入微信、QQ、腾讯文档等国民级应用,构建了覆盖10亿用户的“AI好友圈”。这种基于海量用户和复杂场景的快速迭代与反馈,构成了中国大模型独特的“场景护城河”。

  QuestMobile报告展示了最新的AI应用格局。截至2025年10月,AI原生应用中,字节旗下的豆包DAU(日活跃用户)最高,为5410万;DeepSeek有2860万,元宝仅560万(不包括微信调用)。OpenAI旗下ChatGPT日活大致在1亿-2亿间;而阿里 AI 2 C入口的夸克,10月日活约3370万,计入阿里内部认为未被第三方统计数据,日活大致为5000万-6000万。

  经过一年的震荡与洗牌,中国大模型行业的发展主线在2025年末愈发清晰。

  7月,在WAIC(世界人工智能大会) 2025上,中信智库在其发布的《AI新纪元》报告中明确指出,2025年已成为“Agent(智能体)元年”。这意味着,行业的重心正从“模型本身能做什么”转向“模型如何能自主完成复杂任务”。

  从2025年初DeepSeek在模型中融入“深度思考”,到年中阶跃星辰、智谱等公司纷纷推出各自的智能体产品,再到年末触及亿万普通用户的超级应用与终端入口,Agent所描绘的未来愈发贴近生活。

  字节在年末率先发动了一场“奇袭”。12月初,其联合中兴通讯(000063.SZ)推出的nubia M153工程样机,首次将具备系统级权限的“豆包手机助手”带入现实。这款助手能像真人一样“看懂”屏幕,在多个应用间自动完成比价购物、订票等复杂任务,其展示的“全局记忆”和跨应用执行能力,被业内视为目前最接近理想中AI智能体(Agent)形态的产品之一,也被调侃成苹果(AAPL)Apple Intelligence“眼中的自己”。

  然而,这场旨在抢占AI手机操作系统入口的“试冲锋”,迅速触碰了互联网生态的根基。微信、淘宝、支付宝及多家银行App几乎立即启动了防御机制,以“安全风控”为由,导致用户账号异常退出甚至无法登录。这场“围剿”的本质,是数据、流量与控制权的争夺。

  当AI助手能绕过应用首页、直接执行核心服务,超级App的流量分发和商业模式便面临被“架空”的风险。豆包团队随后宣布对功能进行限制,但冲突已清晰揭示,没有应用生态的配合,再高的系统权限也寸步难行。

  与此同时,智谱颇为戏剧性地“搅局”。智谱明确表示,“这件事只在一家公司做,是不够的。”12月9日,智谱宣布将其核心AI Agent模型——AutoGLM全面开源。这款历经32个月研发、能基于虚拟机操作手机的智能体框架,其能力与豆包手机助手演示的效果高度相似。

  竞争,已悄然延伸到了每个人掌中的屏幕之上。

  AI边疆,未完待续

  如果说2025年是中国大模型行业围绕开源生态和终端入口进行“内战”的一年,那么年末由谷歌(GOOG)Gemini 3引爆、OpenAI即将以GPT-5.2紧急应战的顶级对决,则将竞争推向了决定全球技术权力格局的“终极战场”。

  谷歌在2025年11月18日发布的Gemini 3,看似是一场常规升级,实则是旨在“重置AI领域棋盘格局”的战略宣言。

  在被誉为“AI图灵测试”的ARC-AGI-2基准上,Gemini 3 Pro取得了31.1%的得分,远超GPT-5.1的17.6%。更惊人的是其“深度思考”(Deep Think)模式,在需要解决人类顶级难题的HLE测试中取得45.8%的分数,在数学竞赛级基准MathArena Apex上以23.4%的得分,实现了对竞争对手数十倍的超越。

  在多模态领域这个谷歌的强项上,Gemini 3表现得更为惊人。以MMMU-Pro的81.0%,CharXiv Reasoning的81.4%超越了对手,并在理解截图的测试ScreenSpot-Pro取得72.7%的得分,是Claude Sonnet 4.5的两倍,GPT-5.1的二十倍。

  同时,谷歌还试图定义“模型即Agent(智能体)”(Model-as-Agent)的新标准。Gemini 3被设计成一个能够自主规划、调用工具、执行多步骤任务的通用智能体。其在长期业务模拟测试Vending-Bench 2中表现出的卓越决策一致性,以及能够根据对话上下文理解用户审美偏好并动态生成定制化交互界面的“生成式UI”能力,都体现了AI正从对话工具进化成能主动完成复杂工作的数字实体。

  此外,Gemini 3完全基于谷歌自研的TPU芯片训练,谷歌向市场证明,在英伟达(NVDA)GPU之外存在一条高性能的替代路径,甚至引发英伟达股价单日暴跌超7%。摩根士丹利预测,TPU的外销可能在未来为谷歌云带来百亿美元级的增长。这意味着,谷歌正将其在模型、芯片、云平台乃至搜索、安卓生态的全栈优势整合,构建一个竞争对手难以复制的超级闭环。

  Gemini 3的强势崛起,给OpenAI带来了空前的压力。这促使OpenAI首席执行官萨姆·奥特曼发布内部“红色警报”,并罕见地将GPT-5.2的发布日期从原计划的12月下旬提前数日。

  OpenAI声称,GPT-5.2是一次“专注核心优化”的回应,其重点并非炫目的新功能,而是提升推理速度、多模态处理效率和稳定性等基础体验。公司甚至为此暂停了广告测试和健康自动化功能等非核心项目,以集中所有工程资源。

  GPT-5.2的预发布背后,是OpenAI面临的更深层挑战——巨大的成本压力。2025年上半年,其营收为43亿美元,但成本高达78亿美元。在这场由谷歌、微软(MSFT)等巨头主导的“军备竞赛”中,GPT-5.2的市场表现不仅关乎技术声誉,更将直接影响其正在寻求约1000亿美元的新融资。

  年末的模型对决,是美国AI产业强大动能的一个缩影,最终西海岸的风也将吹到大洋彼岸。2025年7月,美国白宫发布《AI行动计划》,该计划以“加速创新与去监管化”“构建AI基础设施”和“主导国际AI秩序”为三大支柱,旨在系统性巩固其领导地位。

  谷歌Gemini 3的成功,是对“缩放定律”(Scaling Law)是否失效争论的一次有力回击。谷歌DeepMind的研究负责人强调,通过改进预训练和后训练算法,他们实现了从2.5到3.0版本的“巨大跃升”,并且“看不到任何天花板”。与此同时,像Anthropic的Claude Opus 4.5那样,通过引入“计算量”控制参数来实现极致性价比的“务实派”模型也同样活跃。

  与中国在终端入口开启的竞争类似,全球大模型的竞争最终都将是生态系统的竞争。谷歌(TPU+Gemini+安卓+搜索)、微软(Azure+OpenAI/自研模型+企业服务)、甚至特斯拉(Dojo芯片+自动驾驶AI)等巨头,都在构建从底层芯片、云计算、基础模型到终端应用的全栈能力。

  中美AI的竞合态势,正将全球产业分为两个既相互竞争又彼此渗透的体系。美国凭借在基础研究、芯片设计与生态闭环上的先发优势,试图定义全球通用的技术标准与规则。而中国则依托全球最丰富的应用场景、高效的工程化能力、活跃的开源社区和完整的制造业链条,在应用创新、成本控制和产业落地方面形成强大引力。

  中国如Qwen、DeepSeek等追求极致性价比和广泛应用的开源模型,正成为全球开发者,包括美国中小企业和研究机构的重要选项。而美国在智能体(Agent)、具身智能等前沿领域的突破,也迅速被中国产业界吸收和再创新。

  对中国的“基模五强”乃至整个AI产业而言,眼前的挑战不仅是如何在激烈的国内竞争中胜出,更在于如何将自身的应用优势、效率优势和制造优势,转化为参与乃至塑造全球AI下一阶段发展的核心力量。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500