DeepSeek:AI 界的超级 “黑马”

最近,科技圈被一个名字彻底点燃 ——DeepSeek。它宛如一颗横空出世的超级新星,以迅雷不及掩耳之势,在全球范围内掀起了惊涛骇浪。就在不久前,DeepSeek 应用强势登顶苹果美国地区和中国地区应用商店免费 APP 下载排行榜,直接把 ChatGPT 甩在了身后。这一成绩,瞬间吸引了全球目光,让所有人都对这个崭露头角的 AI 新秀刮目相看。
更让人震惊的是,它的爆火居然引发了美股的剧烈动荡。美国当地时间 1 月 27 日,美国股市开盘后大幅下跌,科技板块更是惨遭重挫。英伟达股价暴跌约 17%,市值一日内蒸发近 6000 亿美元,创美国历史上任何一家公司的单日最大市值损失。博通公司股价下跌 17%,超威半导体公司(AMD)股价下跌 6%,微软股价下跌 2%。连人工智能领域的衍生品,如电力供应商也未能幸免,美国联合能源公司股价下跌 21%,Vistra 的股价下跌 29%。而这一切动荡的背后,DeepSeek 成为了市场分析认为的核心原因,它的最新突破,就像一把锐利的剑,直接动摇了美国科技行业一直以来的 “无敌” 地位。
自成立以来,DeepSeek 发展势头迅猛,不断推出令人瞩目的大模型。2023 年 11 月 2 日,发布首个开源代码大模型 DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务;11 月 29 日,推出参数规模达 670 亿的通用大模型 DeepSeek LLM,包括 7B 和 67B 的 base 及 chat 版本 。进入 2024 年,DeepSeek 的步伐更快,5 月 7 日,发布第二代开源混合专家(MoE)模型 DeepSeek-V2,总参数达 2360 亿,推理成本降至每百万 token 仅 1 元人民币,因创新的模型架构和性价比而引发热议出圈;12 月 26 日,发布 DeepSeek-V3,总参数达 6710 亿,采用创新的 MoE 架构和 FP8 混合精度训练,训练成本仅为 557.6 万美元,在全球 AI 领域掀起巨大波澜,其在代码、逻辑推理和数学推理能力均名列前茅 。2025 年 1 月 20 日,发布新一代推理模型 DeepSeek-R1,性能与 OpenAI 的 o1 正式版持平,并开源,再次引发全球人工智能领域关注 。
在短短一年多的时间里,DeepSeek 从一家初创公司,成长为全球 AI 领域的焦点,每一次模型的发布,都像是一颗投入湖面的巨石,激起层层涟漪,让世界看到了中国 AI 的创新力量和无限潜力。而在 DeepSeek 耀眼成绩的背后,有 6 大核心企业发挥着关键作用,它们与 DeepSeek 相互成就,共同推动着 AI 技术的发展与变革。
算力基础设施:撑起 DeepSeek 的 “硬实力”

AI 大模型的训练,就像一场超级复杂的 “脑力马拉松”,需要海量的数据处理和超高速的计算能力,这背后,强大的算力基础设施是绝对的核心支撑。在 DeepSeek 的飞速发展中,浪潮信息和中科曙光这两家行业巨头,就像两位超级 “护法”,为其提供了不可或缺的算力保障,撑起了 DeepSeek 的 “硬实力”。
浪潮信息:服务器龙头的深度绑定
浪潮信息,作为全球服务器市场的佼佼者,在 DeepSeek 的发展中扮演着关键角色。它为 DeepSeek 北京亦庄智算中心提供了 H800 GPU 集群,这一集群就像是一座超级 “算力工厂”,拥有强大的并行计算能力,能够在短时间内处理海量的数据,为 DeepSeek 模型的训练提供了澎湃的动力。凭借其在服务器领域的深厚技术积累和强大的研发能力,浪潮信息能够快速响应 DeepSeek 不断增长的算力需求,确保模型训练的高效进行。
浪潮信息不仅仅是提供硬件设备,还通过其自研的 AIStation 平台,为 DeepSeek 提供了全方位的软件支持。AIStation 平台就像是一个智能的 “算力管家”,能够实现对多模态大模型训练的高效管理和调度,优化计算资源的分配,大大提高了训练效率。这种软硬结合的生态协同优势,使得浪潮信息与 DeepSeek 形成了紧密的合作关系,共同推动 AI 技术的发展。
在全球服务器市场,浪潮信息的地位举足轻重。连续多年保持中国服务器市占率第一,全球市占率也持续攀升 。其在 AI 服务器领域更是占据领先地位,2022 年 AI 服务器市占率达到 47% 。凭借其强大的技术实力、完善的产业链布局和卓越的市场口碑,浪潮信息能够为 DeepSeek 提供稳定可靠的算力支持,助力其在 AI 领域不断突破。
中科曙光:液冷技术的保驾护航
在 DeepSeek 的杭州训练中心,中科曙光的身影同样不可或缺。它为训练中心提供了先进的液冷系统,这一系统就像是给算力设备安装了一个超级 “空调”,能够有效地解决高密度算力设备运行时产生的散热问题。在 AI 大模型训练中,服务器等设备会长时间高负荷运行,产生大量的热量,如果不能及时散热,设备性能就会下降,甚至出现故障。中科曙光的液冷系统,通过创新的技术,将冷却液直接引入服务器内部,实现高效散热,确保设备在长时间运行中保持稳定的性能。
中科曙光的液冷系统单机柜功率密度达到 35kW,能源利用效率(PUE)小于 1.15 ,这意味着在提供强大算力支持的同时,能够实现更低的能耗,符合绿色数据中心的发展理念。这种高效的液冷技术,不仅保障了 DeepSeek 模型训练的稳定性和高效性,还降低了运营成本,为 DeepSeek 的可持续发展提供了有力支持。
中科曙光在液冷技术领域拥有深厚的技术壁垒,其研发的液冷技术处于全球领先水平。随着国内对自主可控算力需求的激增,以及政策对国产替代的明确扶持,中科曙光凭借其技术优势和国产替代的趋势,在 DeepSeek 的发展中发挥着越来越重要的作用。
数据与资本:奠定发展根基

数据,是 AI 大模型的 “燃料”,而资本,则是推动其发展的 “引擎”。在 DeepSeek 的成长历程中,每日互动和浙江东方在数据与资本层面,为其提供了坚实的基础,成为其不可或缺的重要力量。
每日互动:数据支撑与股东协同
每日互动,虽不直接持有 DeepSeek 的股份,但它是幻方量化的二股东,而 DeepSeek 正是幻方量化旗下重要的人工智能研发项目。这一独特的股权关系,让每日互动与 DeepSeek 紧密相连。每日互动的联合创始人徐进,同时也是幻方量化的技术负责人,这一人物关联,就像在两者之间搭建了一座坚固的桥梁,为双方在决策、技术交流等方面提供了天然的沟通优势,为深度合作奠定了深厚的基础。
在业务上,每日互动充分发挥自身的数据优势,为 DeepSeek 提供海量用户行为语料数据。这些数据就像是一座蕴藏丰富的 “宝藏”,涵盖了用户在移动应用中的各类行为信息,如浏览习惯、消费偏好、社交互动等。DeepSeek 利用这些丰富的数据进行模型训练和优化,能够更好地学习和理解用户行为模式,从而使模型生成更贴合实际应用场景、更具准确性和实用性的结果。
每日互动还利用其客户资源和市场渠道,帮助 DeepSeek 进行市场推广和商业化应用。每日互动在长期的数据智能服务过程中,积累了庞大的客户群体,涵盖互联网、金融、品牌营销等多个领域。通过与这些客户的合作关系,每日互动能够将 DeepSeek 的技术和产品推荐给潜在用户,加速 DeepSeek 从技术研发走向市场应用的进程,实现商业价值的转化。
浙江东方:早期投资的潜力挖掘
浙江东方在 DeepSeek 发展的早期阶段就展现出了敏锐的洞察力,通过旗下杭州东方嘉富基金参与了 DeepSeek 的天使轮投资。这一具有前瞻性的投资决策,就像是在 AI 大模型领域埋下了一颗希望的种子。作为早期投资者,浙江东方有望在 DeepSeek 的快速成长中分享到丰厚的红利。
从投资布局来看,浙江东方在创投业务上的布局不断深化,2023 年创投利润贡献占比达 18% ,参与 DeepSeek 的天使轮投资,是其在 AI 领域的重要布局之一。随着 DeepSeek 在 AI 领域的影响力不断扩大,其估值也有望持续提升,浙江东方作为早期股东,将有望受益于这一估值跃升,为公司带来可观的投资回报。
在 AI 大模型领域,早期投资的机会相对稀缺,浙江东方能够抓住这一机会,不仅体现了其对行业趋势的准确判断,也为其在 AI 赛道上赢得了先发优势。随着 DeepSeek 的不断发展,浙江东方有望在 AI 领域实现更多的业务拓展和价值提升。
技术合作与应用:助力落地发展

当先进的技术遇到合适的应用场景,就如同星星之火遇到了干柴,会燃起熊熊烈火,照亮产业发展的新道路。在 DeepSeek 的发展蓝图中,飞利信和拓尔思在技术合作与应用落地方面,与 DeepSeek 携手共进,共同探索 AI 技术在不同领域的无限可能。
飞利信:架构创新的协同潜力
飞利信,在技术架构上有着独特的优势,它采用了与 DeepSeek-V2 相似的 MLA(多头潜在注意力机制)技术。这种技术上的相似性,就像两把钥匙找到了同一扇门的锁孔,为双方的技术协同打开了广阔的空间。凭借这一架构创新,飞利信在 AI 领域展现出了强大的技术实力,尤其是在政务和金融领域,已经积累了丰富的 AI 解决方案经验。
在政务领域,飞利信的 AI 技术已经广泛应用于政务办公自动化、智慧城市建设等多个方面。例如,在政务办公自动化中,飞利信的 AI 系统能够实现公文的智能起草、审核和流转,大大提高了政务工作的效率。而 DeepSeek 的大模型在自然语言处理和语义理解方面具有强大的能力,两者结合,有望进一步优化政务办公流程,提升政务服务的智能化水平。
在金融领域,飞利信的 AI 技术可以用于风险评估、客户信用分析等业务。与 DeepSeek 合作后,利用其大模型的强大计算和分析能力,能够更加精准地进行风险预测和客户画像,为金融机构提供更高效、更准确的决策支持。随着 DeepSeek 模型的不断开源和生态的逐步完善,飞利信有望借助这一东风,在政务和金融领域的 AI 应用中取得更大的突破,实现双方的互利共赢。
拓尔思:垂直场景的深度融合
拓尔思与 DeepSeek 的合作,聚焦于垂直场景的深度融合,尤其是在金融舆情大模型的联合开发上,已经取得了显著的成果。双方联合开发的金融舆情大模型,就像一位敏锐的金融 “观察者”,能够实时监测和分析金融市场的舆情动态,为金融机构提供及时、准确的舆情分析和风险预警。
这一金融舆情大模型已经在中信证券等机构部署了智能研报生成系统,通过对海量金融数据和舆情信息的分析,能够快速生成高质量的智能研报,大大提高了研报的生成效率和准确性。拓尔思在政务、金融领域拥有丰富的垂直场景优势和庞大的客户资源,这为 DeepSeek 技术的落地应用提供了广阔的舞台。
在政务领域,拓尔思凭借其多年的行业积累,已经为众多政府机构提供了智能化的解决方案。与 DeepSeek 合作后,能够将其大模型技术融入政务服务中,实现政务咨询的智能问答、政策法规的智能解读等功能,提升政务服务的便捷性和智能化水平。在金融领域,拓尔思可以借助 DeepSeek 的技术,进一步拓展金融风控、投资决策等业务场景,为金融机构提供更全面、更专业的服务。
未来展望:DeepSeek 与核心企业的共生之路

DeepSeek 与这 6 大核心企业的紧密合作,构成了一个充满活力与创新的 AI 生态系统。在这个系统中,算力基础设施企业为 DeepSeek 提供了强大的硬件支撑,让模型训练得以高效运行;数据与资本企业则为其发展注入了源源不断的动力,奠定了坚实的基础;技术合作与应用企业,更是将 DeepSeek 的技术与实际场景深度融合,推动 AI 技术在各个领域的落地生根。
展望未来,随着 AI 技术的不断发展,DeepSeek 有望在这 6 大核心企业的支持下,取得更加辉煌的成就。在算力方面,浪潮信息和中科曙光将继续发挥技术优势,不断提升算力性能,降低成本,为 DeepSeek 的模型训练提供更强大、更高效的支持。数据领域,每日互动将持续挖掘数据价值,为 DeepSeek 提供更丰富、更优质的数据资源,助力模型的优化和创新。浙江东方作为早期投资者,将继续关注 DeepSeek 的发展,在资本层面给予支持,推动其在 AI 领域的拓展。
在技术合作与应用方面,飞利信和拓尔思将与 DeepSeek 进一步深化合作,探索更多的应用场景和创新模式。在政务领域,双方的合作有望推动政务服务的智能化升级,提高政府的治理能力和服务水平;在金融领域,将为金融机构提供更精准的风险评估、客户分析等服务,提升金融行业的效率和安全性。
DeepSeek 与这 6 大核心企业的共生之路,将在未来 AI 浪潮中掀起更大的波澜。它们的合作,不仅将推动 AI 技术的不断进步,还将为各个行业带来深刻的变革,创造出更多的商业价值和社会价值,引领我们走向一个更加智能、美好的未来。
(来源:兰板套利的财富号 2025-01-30 22:49) [点击查看原文]