2025年DeepSeek的横空崛起，让国产大模型一下实现了弯道超车的惊喜走位，_浦银安盛港股通量化混合C(of013224)股吧

股吧首页 > 浦银安盛港股通量化...吧 > 正文

最近访问：

浦银安盛港股通量化混合C吧

返回浦银安盛港股通量化混合C吧>>

- 重要股东股权质押数据全览

静谧的蔡三仟

发表于 2025-04-28 23:24:05 天天基金Android版发布于安徽

2025年DeepSeek的横空崛起，让国产大模型一下实现了弯道超车的惊喜走位，

#我已自选浦银科技战队#2025年DeepSeek的横空崛起，让国产大模型一下实现了弯道超车的惊喜走位，这一成果不仅标志着我国AI大模型首次与国际顶尖水平并驾齐驱，更折我国AI产业从“技术跟跑”到“技术并跑”的跨越式发展。回顾过去三年，从2023年春节前ChatGPT的“狼来了”到2024年春节期间Sora引发的“多模态冲击”，再到2025年春节前夕DeepSeek的崛起，我国AI的发展路径正勾勒出一条独特的“跟跑—并跑—局部领跑”曲线。然而，这场竞争的本质并非简单的技术追赶，而是一场覆盖AI产业基础层、技术层、应用层的系统性博弈。

AI基础层是整个AI产业链的基石，涵盖数据、算力和算法三大核心要素。我国在此领域的现状可以用“规模庞大但质量不足”概括，整体仍处于国际跟跑阶段，但局部已显现突破迹象。早期的跟跑，我们可能看不到领跑者的影子，但现在我们已经看到了领跑者的影子了。在数据方面，虽然我国拥有全球最大的数据资源池，但我国数据“大而不强”问题却很突出，包括数据价值密度低、数据孤岛林立、数据标注质量差等。DeepSeek的破局之道在于“四两拨千斤”，其研发团队通过把数据进行总结和分类，经过选择性投喂与处理之后，输送给大模型，提高了训练效率。

在算力方面，虽然我国算力规模已达230EFLOPS（每秒百亿亿次浮点运算），仅略低于美国，但结构性问题显著，包括高端芯片严重依赖进口、超算中心能耗过大、算力资源调度效率低等。DeepSeek的算力突围堪称“小米加步枪的胜利”。面对美国芯片禁令，其研发团队对低配版GPU集群（甚至多源异构算力）进行智能管理，对CPU、GPU甚至边缘计算设备进行协同调度，打破了“大力才能出奇迹”的算力魔咒。

在算法基础理论领域，我国仍高度依赖海外创新。Transformer架构、MoE（混合专家模型）、Diffusion Model（扩散模型）等核心框架均源自美国学术界。DeepSeek的实践展现了它站在巨人肩膀上进行“二次创新”与“集成创新”的潜力。其研发团队在融合混合专家模型、强化学习推理等算法的基础上，构建了从架构设计到工程落地的全流程优化体系，但这还称不上“从0到1”的颠覆性基础理论突破。

回望2023年初，国产大模型开始像下水饺似地遍地开花，但普遍陷入“参数竞赛”误区，智谱AI的GLM-130B、百度的ERNIE 3.0 Titan等模型参数量均超千亿，但实际表现与同时期的GPT3.5相比还是存在1到2个技术代差。

与OpenAI、智谱、百度等打造“全能大模型”的方式不同，DeepSeek的突破在于重新定义技术路线，并进行了基于群智协同的系统级工程优化，主要包括混合专家模型、负载均衡、多头潜在注意力机制、大小模型协同、强化学习推理，以及诸如FP8混合精度和负载均衡、通信优化、内存优化、计算优化等工程优化方法。例如，混合专家模型能够将模型拆分为多个“子专家”，根据任务类型动态激活部分参数，显著提升了推理效率；强化学习推理能够模仿人类“先思考再行动”的认知模式，通过模拟决策树减少无效计算；大小模型协同网络能够让小模型担任“助理”，处理专门任务，从而释放大模型算力。

AI应用层是AI在各领域的融合和应用，集成一类或多类AI技术，面向特定应用场景需求而形成的软硬件产品或解决方案，主要包括在政府、金融、安防、智能家居、医疗、机器人、智能驾驶、新零售等领域的应用。在AI应用层，我国拥有全球最多的产业门类与应用场景，更是已形成全球最活跃的AI商业化生态圈。据工信部数据显示，2024年底，我国人工智能核心产业规模接近6000亿元，这表明我国在AI应用层已经实现全面领跑。DeepSeek引爆全网，更是以“中国速度”席卷全球科技圈，成为现象级APP，在AI应用层掀起了新一轮创新浪潮。2025年2月8日的QuestMobile有关数据显示，DeepSeek在1月28日的日活跃用户数首次超越豆包，并在2月1日突破3000万大关，成为史上最快达成这一里程碑事件的应用程序。

一方面，DeepSeek已向垂直行业渗透，实现从通用大模型到专用大模型的转化。例如，在金融领域，包括国泰君安、国金证券、中泰证券、兴业证券、国元证券、华福证券在内的多家券商陆续官宣，已完成DeepSeek-R1模型的本地化部署。在医疗领域，包括恒瑞医药、医渡科技等多家医疗公司宣布“牵手”DeepSeek，推动AI医疗加速落地。在制造领域，海尔集团已完成DeepSeek大语言模型和多模态模型的集成，并提供企业私有化部署解决方案，加速企业数字化转型。在通讯领域，中国移动、中国电信、中国联通三家基础电信企业均全面接入DeepSeek开源大模型，实现在多场景、多产品中的应用。

另一方面，作为开源大模型，DeepSeek鼓励全球开发者在其基座模型上进行二次开发和创新，从“卖API”到“生态共建”从而形成一个活跃的生态系统，共同推动大模型技术的进步和应用的多样化。通过开源换生态，DeepSeek吸引了大量的全球开发者参与生态建设，衍生出医疗、法律等成百上千个垂直版本。

随着技术的演变，AI应用从技术突破到商业落地的可行性路径我觉得重点会在B端。AI供应商比如deepseek通过与各行业的领军企业，如汽车制造、医疗卫生和金融服务等，进行深入合作，共同构建行业专属模型，产生了一种按效果付费的商业模式。这种模式不仅实现了企业与客户之间的深度绑定，还通过双方的价值创造实现了双赢。比如截止到2025年2月7日，通过软硬件协同，DeepSeek已与16家国产AI芯片企业（如华为昇腾、沐曦、天数智芯等）完成适配。华为昇腾通过自研推理加速引擎，使DeepSeek模型在昇腾硬件上达到与国外高端GPU相当的部署效果。

与此同时，中小客户群体的潜在市场需求不可忽视。提供开源模型和低代码平台，为这些客户提供便捷的AI解决方案，能够有效降低定制化成本，从而满足更多领域的多样化需求，真正实现市场的全面覆盖。这种策略将推动AI产业进入一个更加成熟和细分的阶段，满足不同层次客户的需求。@浦银安盛基金

郑重声明：用户在基金吧/财富号/股吧社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

郑重声明：用户在社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》