#我已自选浦银科技战队#2025年DeepSeek的横空崛起,让国产大模型一下实现了弯道超车的惊喜走位,这一成果不仅标志着我国AI大模型首次与国际顶尖水平并驾齐驱,更折我国AI产业从“技术跟跑”到“技术并跑”的跨越式发展。回顾过去三年,从2023年春节前ChatGPT的“狼来了”到2024年春节期间Sora引发的“多模态冲击”,再到2025年春节前夕DeepSeek的崛起,我国AI的发展路径正勾勒出一条独特的“跟跑—并跑—局部领跑”曲线。然而,这场竞争的本质并非简单的技术追赶,而是一场覆盖AI产业基础层、技术层、应用层的系统性博弈。
AI基础层是整个AI产业链的基石,涵盖数据、算力和算法三大核心要素。我国在此领域的现状可以用“规模庞大但质量不足”概括,整体仍处于国际跟跑阶段,但局部已显现突破迹象。早期的跟跑,我们可能看不到领跑者的影子,但现在我们已经看到了领跑者的影子了。在数据方面,虽然我国拥有全球最大的数据资源池,但我国数据“大而不强”问题却很突出,包括数据价值密度低、数据孤岛林立、数据标注质量差等。DeepSeek的破局之道在于“四两拨千斤”,其研发团队通过把数据进行总结和分类,经过选择性投喂与处理之后,输送给大模型,提高了训练效率。
在算力方面,虽然我国算力规模已达230EFLOPS(每秒百亿亿次浮点运算),仅略低于美国,但结构性问题显著,包括高端芯片严重依赖进口、超算中心能耗过大、算力资源调度效率低等。DeepSeek的算力突围堪称“小米加步枪的胜利”。面对美国芯片禁令,其研发团队对低配版GPU集群(甚至多源异构算力)进行智能管理,对CPU、GPU甚至边缘计算设备进行协同调度,打破了“大力才能出奇迹”的算力魔咒。
在算法基础理论领域,我国仍高度依赖海外创新。Transformer架构、MoE(混合专家模型)、Diffusion Model(扩散模型)等核心框架均源自美国学术界。DeepSeek的实践展现了它站在巨人肩膀上进行“二次创新”与“集成创新”的潜力。其研发团队在融合混合专家模型、强化学习推理等算法的基础上,构建了从架构设计到工程落地的全流程优化体系,但这还称不上“从0到1”的颠覆性基础理论突破。
回望2023年初,国产大模型开始像下水饺似地遍地开花,但普遍陷入“参数竞赛”误区,智谱AI的GLM-130B、百度的ERNIE 3.0 Titan等模型参数量均超千亿,但实际表现与同时期的GPT3.5相比还是存在1到2个技术代差。
与OpenAI、智谱、百度等打造“全能大模型”的方式不同,DeepSeek的突破在于重新定义技术路线,并进行了基于群智协同的系统级工程优化,主要包括混合专家模型、负载均衡、多头潜在注意力机制、大小模型协同、强化学习推理,以及诸如FP8混合精度和负载均衡、通信优化、内存优化、计算优化等工程优化方法。例如,混合专家模型能够将模型拆分为多个“子专家”,根据任务类型动态激活部分参数,显著提升了推理效率;强化学习推理能够模仿人类“先思考再行动”的认知模式,通过模拟决策树减少无效计算;大小模型协同网络能够让小模型担任“助理”,处理专门任务,从而释放大模型算力。
AI应用层是AI在各领域的融合和应用,集成一类或多类AI技术,面向特定应用场景需求而形成的软硬件产品或解决方案,主要包括在政府、金融、安防、智能家居、医疗、机器人、智能驾驶、新零售等领域的应用。在AI应用层,我国拥有全球最多的产业门类与应用场景,更是已形成全球最活跃的AI商业化生态圈。据工信部数据显示,2024年底,我国人工智能核心产业规模接近6000亿元,这表明我国在AI应用层已经实现全面领跑。DeepSeek引爆全网,更是以“中国速度”席卷全球科技圈,成为现象级APP,在AI应用层掀起了新一轮创新浪潮。2025年2月8日的QuestMobile有关数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,并在2月1日突破3000万大关,成为史上最快达成这一里程碑事件的应用程序。
一方面,DeepSeek已向垂直行业渗透,实现从通用大模型到专用大模型的转化。例如,在金融领域,包括国泰君安、国金证券、中泰证券、兴业证券、国元证券、华福证券在内的多家券商陆续官宣,已完成DeepSeek-R1模型的本地化部署。在医疗领域,包括恒瑞医药、医渡科技等多家医疗公司宣布“牵手”DeepSeek,推动AI医疗加速落地。在制造领域,海尔集团已完成DeepSeek大语言模型和多模态模型的集成,并提供企业私有化部署解决方案,加速企业数字化转型。在通讯领域,中国移动、中国电信、中国联通三家基础电信企业均全面接入DeepSeek开源大模型,实现在多场景、多产品中的应用。
另一方面,作为开源大模型,DeepSeek鼓励全球开发者在其基座模型上进行二次开发和创新,从“卖API”到“生态共建”从而形成一个活跃的生态系统,共同推动大模型技术的进步和应用的多样化。通过开源换生态,DeepSeek吸引了大量的全球开发者参与生态建设,衍生出医疗、法律等成百上千个垂直版本。
随着技术的演变,AI应用从技术突破到商业落地的可行性路径我觉得重点会在B端。AI供应商比如deepseek通过与各行业的领军企业,如汽车制造、医疗卫生和金融服务等,进行深入合作,共同构建行业专属模型,产生了一种按效果付费的商业模式。这种模式不仅实现了企业与客户之间的深度绑定,还通过双方的价值创造实现了双赢。比如截止到2025年2月7日,通过软硬件协同,DeepSeek已与16家国产AI芯片企业(如华为昇腾、沐曦、天数智芯等)完成适配。华为昇腾通过自研推理加速引擎,使DeepSeek模型在昇腾硬件上达到与国外高端GPU相当的部署效果。
与此同时,中小客户群体的潜在市场需求不可忽视。提供开源模型和低代码平台,为这些客户提供便捷的AI解决方案,能够有效降低定制化成本,从而满足更多领域的多样化需求,真正实现市场的全面覆盖。这种策略将推动AI产业进入一个更加成熟和细分的阶段,满足不同层次客户的需求。@浦银安盛基金

