• 最近访问:
发表于 2025-08-27 20:32:10 股吧网页版
从芯片到超节点 国产算力合纵连横大时代开启
来源:21世纪经济报道

  从DeepSeek主动拥抱国产芯片生态,到一批国产超节点服务器陆续登场,国产算力产业链的合纵连横大时代正在开启。

  2025中国算力大会期间,21世纪经济报道记者多方走访发现,国产算力生态链,一方面在从芯片到服务器再到智算集群的一整条路径上,通过产业聚合方式寻求更高效的解法;另一方面,大模型厂商和平台型厂商也在加速推动应用更快、更好落地。

  一名芯片公司高管对21世纪经济报道记者指出,“我们很高兴看到,UE8M0 FP8这样的路线会被DeepSeek投入到具体应用中,同时也很乐于见到,有DeepSeek这类企业告诉大家哪些是趋势。这可以让我们国产芯片厂商,未来有更多机会与模型厂商发挥协同作用,共同让计算效率提升到新的水平。

  联想集团副总裁、中国基础设施业务群总经理陈振宽接受21世纪经济报道记者采访时则指出,“最近超节点非常热,这个属于Scale up的范畴,我们已开始投入资源来开发超节点技术和产品,重点就是对互联网络技术的研发;在Scale out的集群上,我们重点投入推理场景下的PD分离技术,助力算力集群的Token生产效率。”

  大会期间发布的“年度重大突破成果”,更是凸显出国内计算、通信、电力行业龙头,在大模型时代联手解决大模型跨域训练、落地难、耗电量高等命题。

  这早已不是单点突破的孤军深入,而是多路径并进的协同作战。从芯片架构的原始创新,到超节点间的高速互联,再到系统级的能效重构,整条产业链正形成一种高度耦合、共振前行的生态格局。这不仅是一场场技术攻关,更是一次围绕算力自主的体系性跃迁。

  国产算力抱团

  一条算力产业链的拉通,涉及从底层芯片,到软件生态、服务器整机、智算集群等多个产业环节牵引,彼此开源/开放是破局关键路径之一。

  近期DeepSeek在官方平台发出的简单一句话,就引发了市场热烈关注。

  “DeepSeek虽然只是用了一句话点明UE8MO,但其实已经说得挺明白。这不是一个全新的东西,实际上可以让我们在做一些相对低精度的计算时,帮助恢复一定精度。”前述芯片公司高管对21世纪经济报道记者分析,简单来说,它能够提高计算效率,同时减少存储和数据传输的开销。

  当然,该名高管也对记者指出,对于其所在芯片公司来说,一方面会沿着DeepSeek为代表的精益求精路线,在有限资源范围内,尽可能多推进计算实现;另一方面仍然不可忽视OpenAI“大力出奇迹”的路线。“我们认为两条路线都应重视,只有本身基础设施能力到一定高度后,才能吸引终端应用和生态愿意在你的芯片平台上开发并促成具体实现。

  这是国产算力生态并肩探索的冰山一角。

  在算力大会期间,中国移动、之江实验室、百度等国内数十家运营商、互联网企业、芯片厂商、服务器制造商及科研院所,共同启动智算开放互联OISA生态共建战略合作,并发布OISA 2.0(Omni-directional Intelligent Sensing Express Architecture,智感互联架构)协议,则是从平台型生态方面迈出的更进一步。

  据21世纪经济报道记者了解,OISA技术体系主要是为GPU卡间互联提供高性能方案,也就是可以支撑超节点智算集群的scale up路线。该体系目前正在联合GPU、Switch(交换机)、整机等伙伴推动OISA IP、芯片和超节点研发,进而推动OISA规模落地。

  资料显示,相较于OISA 1.1版本,OISA 2.0将支持的AI芯片数量提升至1024张,带宽突破TB/s级别,AI芯片互联时延缩短至数百纳秒。

  此外,记者在中国移动现场展台看到,面向智算中心scale out路线,公司还原创了全调度以太网(GSE)技术体系,目前已经发布全套技术标准,完成中试验证,发布首套支持千卡级组网能力的商用产品;接下来还将推进技术规范和大容量交换芯片发布等工作。

  一名行业从业者如此对记者分析,在国产芯片亟需补全软件生态能力过程中,从两种集群路线上都搭建统一平台,也是希望强化生态聚合效应。

  同泰怡产品中心总经理马泽则对21世纪经济报道记者表示,公司作为服务器厂商,针对目前市场上多元化的算力需求,做了诸多针对性布局。

  “服务器只是一个底座,其中最重要的就是GPU卡,这主要分为国际和国内两部分。”他进一步指出,国际GPU芯片主要是指英伟达,同泰怡自2022年开始就是英伟达的OEM合作伙伴。对于国产GPU企业而言,更大挑战还是来自生态构建,国产GPU在生态建设上还处于起步阶段,缺乏成熟的软件工具和开发者支持,限制了其市场拓展能力。国产GPU企业需要积极与产业链上下游企业合作,同时通过开放平台等方式吸引开发者加入,形成良性循环。这是一个长期且复杂的过程,需要硬件、软件、应用等多方面的协同努力。

  “我们会积极与这些国产GPU卡进行软硬件适配等工作,给客户提供一个稳定、好用的硬件底座,目前我们与头部国产GPU芯片厂商都有深度合作,希望共同完善国产算力生态。”他进一步指出。

  异构计算优化落地

  当前市场正面临多类型、多厂商AI芯片并存的局面,从智算集群搭建到集成方案落地过程中,如何针对异构计算能力进行兼容优化并真正落地行业应用也是重要命题。

  “算力调度机制不同,融合调度机制将成为实现超智融合过程中,最需要首先解决的问题。”陈振宽对21世纪经济报道记者分析,高性能计算与智算的融合首先体现在硬件架构的深度重构。传统高性能计算以CPU为核心,侧重双精度浮点运算(FP64),而智算依赖GPU/TPU等加速芯片,聚焦半精度(FP16)和整数运算(INT8)。两者的硬件架构和计算范式存在本质差异,这种架构差异在AI for Science场景中形成瓶颈。而高性能计算的“时间复杂度”与智算的“空间复杂度”难以兼容,融合需从芯片设计、存储网络到算法层面实现软硬协同创新。

  “面对高性能计算、智算、通算融合难题,平台化的解决方案似乎成为了当前状态下的最优解。联想通过‘一横五纵’战略框架构建了覆盖通用、科学、AI算力的异构智算平台——联想万全异构智算平台。”他续称。

  算力大会期间发布的《2025智算服务发展报告》也进行了分析,其中提到,当前,我国智算中心建设热度持续高涨,但在推进过程中面临多重挑战,主要集中在基础设施规划建设、大模型开发效能优化以及产业应用深度贯通等方面。

  该报告指出,智算中心服务需重点推进四大举措:推进覆盖建设、开发、应用的全流程标准体系建设;强化基础设施层智能调度、模型层自动化调优、应用层AI智能体等核心技术自主创新;建立“政产学研用”协同生态,打通“硬件研发—算力供给—场景应用”全链条;面向医疗、教育、能源等重点领域开展专项行动,培育算力服务商突破“最后一公里”落地瓶颈。

  除了云端的大规模集群训练推理之外,今年以来再度火热的一体机品类,则更适合端侧推理需求强的行业或场景。

  马泽对21世纪经济报道记者表示,DeepSeek是基础大模型,具体的应用行业有垂域模型,DeepSeek与行业大模型的结合,本质是通过“通用基座+垂直增强”的模式,实现技术能力与行业需求的精准匹配

  “这中间需要花费比较大的精力。”他坦言,在落地应用过程中,需要一体机提供商结合行业用户的具体业务场景,针对性去做模型适配、参数调优、性能测试等工作,由此才能将一体机的能力更好发挥,并真正赋能场景落地。

  据悉,针对国产化场景需求,同泰怡构建了覆盖“轻量化”至“满血版”大模型的全栈解决方案矩阵,并与行业客户开展POC测试,在教育、能源、电网、政务、医疗等行业实现了方案落地,助力客户应用升级优化。

  攻克液冷难题

  对于智算中心建设本身来说,也面临如何更好推进能效优化的命题。在政策指引和市场需求驱动下,冷板式液冷方案正受到广泛关注,当然其还有持续优化空间。

  “目前主流的液冷技术包括冷板式液冷和浸没式液冷,其中冷板式液冷相对来说改造起来更快,浸没式液冷部署时的技术复杂度更高。”马泽对记者表示,目前来看,客户对风冷散热技术的关注度依然较高,其原因在于,液冷技术相对风冷,前期会有较大投入,此外涉及对老旧机房的改造,会让液冷部署受到供电、散热、承重、运维等方面的条件限制。

  “当然目前国家对新建数据中心有明确的PUE(电源使用效率)要求,因此对于这类数据中心建设来说,液冷成为必须攻克的命题。”他进一步分析,液冷技术不仅能大幅降低能耗,还能提升算力密度,让GPU或CPU的性能发挥得更好。实际上从长周期看,部署液冷散热后,可以降低PUE、提高能效比、大幅节电,因此从长周期来说,配备液冷散热技术的数据中心,其长期TCO(总拥有成本)优势更显著。

  中国信通院发布的《智算中心液冷产业全景研究报告(2025年)》提到,根据实验数据,当芯片功率超过300W时,传统风冷系统散热能力便已失效,芯片热失控风险急剧升高。液冷技术利用液体比热容高于空气的优势,通过与发热元器件紧密结合,实现对芯片精准散热,芯片结温可降低约15°C至25°C,充分满足了高密部署场景下的芯片散热需求。

  对于在智算中心的方案落地,该报告中指出,冷板式液冷系统在基础设施架构与运维模式上与风冷系统高度兼容,可充分借鉴成熟的风冷设计与运维经验,具备良好的工程落地基础。此外,对于风冷智算中心改造项目,采用冷板式液冷改造方式,可最大限度保留服务器主板原有形态,方案实施难度低、改造周期短、综合成本可控,具备较强的可操作性与推广价值。

  陈振宽对记者透露,联想在和清华大学合作,开发双循环的浸没式液冷技术,对产品会有很高适应性,非常匹配目前灵活变化的AI算力需求。接下来,联想正推动低成本冷板方案的应用,实现风液同价目标;此外联想也已着手研发相变冷板,以应对未来更高功耗芯片的散热需求。

  此次算力大会期间,联想就展示了今年推出的“双循环”相变浸没制冷系统,实际落地PUE值达1.035。“这意味着,你可以将96.6%的电费,都用在AI训练、推理上。”他续称。

  当前,国产算力产业链正以高度协同的态势,形成跨领域、多层次的产业协作,开放协议、聚合生态是重要方向。这不仅会推动国内算力产业角色的技术螺旋上升,更是一场面向未来的系统进化。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500