华泰证券研报称,全球主流大模型集中于中美。据Artificial Analysis数据,美国头部模型厂商包括OpenAI、xAI、Anthropic与Google;国内DeepSeek、阿里、智谱、Kimi与MiniMax较为领先。由于国内高性能算力受限,在同样强化学习+后训练范式下,海外模型偏向规模扩展,而国内擅长架构优化。投资建议上,把握算力、存储、电力、应用四个方向,我们认为:1)大模型产业的基座是算力。2)随着多模态模型的普及,存储需求同步提升。3)电力是算力的配套,是大规模集群上线的前提之一。4)AI应用是商业化落地的关键。
全文如下
华泰 | 计算机:大模型后训练 - 中美路径与商业闭环
全球主流大模型集中于中美。据Artificial Analysis数据,美国头部模型厂商包括OpenAI、xAI、Anthropic与Google;国内DeepSeek、阿里、智谱、Kimi与MiniMax较为领先。由于国内高性能算力受限,在同样强化学习+后训练范式下,海外模型偏向规模扩展,而国内擅长架构优化。投资建议上,把握算力、存储、电力、应用四个方向,我们认为:1)大模型产业的基座是算力。2)随着多模态模型的普及,存储需求同步提升。3)电力是算力的配套,是大规模集群上线的前提之一。4)AI应用是商业化落地的关键。
核心观点
与市场不同的观点
1)中美大模型差异并非技术强弱,而是算力结构决定路线:海外依托高密度集群深化后训练与推理扩展,国内在算力约束下以Attention优化、MoE稀疏化和长上下文重构追求单位算力效率,因此跑分不构成统一比较锚。2)AI应用落地并非遥远,OpenAI提出统一模型、Pulse主动Agent与ACP对话内结账已使应用从“能用”进入“可经营”,电商等高频闭环场景率先具备规模化条件。3)市场普遍低估数据标注的价值,ScaleAI、SurgeAI等高收入与高客单价显示标注是模型能力上限的关键投入;需求扩张叠加客户对独立供应链偏好提升,行业定价权仍在抬升。
强化学习+后训练范式下,中美模型迭代路径分化明显
大模型能力演进呈预训练、后训练与推理全链路扩展范式。早期Scaling Law聚焦预训练(参数/数据/算力同步放大);2024年9月OpenAI发布o系列后,强化学习系统性并入后训练,推理端以思维链延长思考时间、生成更多token释放能力。海外以xAI为代表,依托约20万卡级集群,持续在推理端扩算力;国内在算力受限下更侧重架构与算法精修,Qwen、DeepSeek、Kimi等以注意力优化、稀疏化与MoE等提升训练推理效率与性价比。我们认为,两条路径将沿各自要素禀赋持续演进。
商业化已成头部厂商当前重心,应用与生态建设优先推进
OpenAI提出GPT-5统一模型后,后续的模型迭代更多属工程整合、价值再提效,研发重心上移至应用与变现。OpenAI以ACP(与Stripe)实现对话内购买,首批接入Shopify、Etsy,并与Salesforce、Walmart协作,打通“发现-支付”闭环。国内侧阿里Qwen以多模态与场景推动token上量;据云栖大会2025主题演讲,近2-3个月Token消耗倍增、百炼平台过去一年日均调用量增约15倍、FY26Q1云业务收入同比增速25.8%。我们认为,支付闭环叠加生态扩展将主导下一阶段商业化。
投资建议
1)算力:预/后训练迭代推高算力需求,OpenAI规划算力中心合计超36GW;据SCMP,出口限制后NVIDIA在华先进芯片份额95%→0,国产供给接棒。利好海外/国产算力链。2)存储:多模态/长视频抬升容量与带宽(图片1MB、音频5MB、视频≈50MB/分)。3)电力:美国新建大型数据中心并网申请到商运的中位时长继续增加,而矿场改造成本约500-800万美元/兆瓦、落地更快。4)应用:OpenAI ACP实现对话内结账贯通“触达-体验-支付”;国内入口卡位者更易受益:C端用户积累丰富的公司;2B领域,有多样化企业客户的公司。
风险提示:宏观经济波动,技术进步不及预期,中美竞争加剧。研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。