21世纪经济报道记者骆轶琪广州报道
AI大模型的快速发展,正推动数据存储从IT系统的“后台配角”跃升为智能经济的重要引擎。与此同时,存储产业链面临周期性波动,上游原厂减少资本开支与AI领域爆发式的数据需求形成碰撞。
在此背景下,存储产业正于新竞争态势中重新构建坐标系,统一标准、协同发展成为破局关键。
在2025数据存储产业大会上,中科曙光出任中电标协数据存储专委会(以下简称“专委会”)当值会长,并宣布为推动中国存储产业在全球竞争中抢占先机,专委会将发起编写AI存储标准、成立Future Storage工作组。
曙光存储总裁何振在接受21世纪经济报道等媒体采访时指出,算力基础设施应用侧在购买来自不同存储厂商的产品后,由于没有实现统一标准,容易出现数据流通困难的问题。
曙光接任数据存储专委会后,计划构建存储技术标准和技术框架,以此期望打破传统模式中的产品孤岛问题。同时,这也将为企业提供更加公平合理的竞争环境,进而向标准适配+生态协同方向转变。
“专委会将逐渐提出和完善AI存储技术标准、框架和适配指南等,这尤其对小型存储企业会形成技术支撑,让他们可以更快速适应国内AI发展对存储的技术需求。”何振分析道,在此基础上,希望进一步推动我国在世界存储领域的话语权。
这意味着,国内存储产业正展现出加速聚合态势,一条从技术追赶到生态引领的路径正愈发清晰。
AI存储演进探路
随着AI技术落地,存储产业的发展方向逐渐形成行业共识。AI的核心始于数据,存储创新直接影响AI工作流效率,其变革体现在多个维度。
华为副总裁、数据存储产品线总裁周跃峰指出,AI始于数据而不是GPU,因此AI时代也是数据的黄金时代,存储创新在此过程中愈发重要。
在他看来,AI的多样化负载,对存储性能提出更高要求。例如在训练环节已经匹配大带宽等能力以满足数据快速传输需求,但在AI推理过程中也需要相应性能,因此对存储性能要逐渐构建起标准。
此外,在AI时代,可扩展性从纵向扩展,走向纵向与横向扩展并重,随着近存计算技术兴起,DPU逐渐成为存储系统的必备部件。
常被人忽视的是数据安全。存储作为数据安全的最后一道防线,支持数据韧性与防勒索能力将成为硬性要求。
存储范式也在发生转变,从单纯支持数据存取的传统模式,向集成推理加速、多模态知识库生成等功能的AI数据平台(AI Data Platform)演进。
随着数据存储需求愈发旺盛,过去根据对数据的快速读取需求,将数据分为热数据、温数据、冷数据三类,其中冷数据通常作为归档用,极少被调出。但在AI时代,所有数据都存在被调用的需求,因此将演变为热数据、温数据两大类的局面。这意味着如今支持温数据的机械硬盘(HDD)也需要新形态,以支持海量数据高效、低成本地留存。
当前,国内存储产业正面临新的产业发展环境。何振总结道,过去,中国整体存储技术在全球处在跟随状态,随着AI技术发展,可能将引发存储行业重新洗牌,进而产生新机遇。
他指出,中国主流存储产品无论从性能、成本还是能效等方面,都已经赶上海外同类产品,后续计划借力专委会,构建中国自己的存储标准,把国内厂商的技术优势转化成标准优势,同时借助国内AI发展机遇,把产品和标准持续在实际生产环境中锤炼,这将对国产存储产品进一步走向海外市场起到助力作用。
近期存储市场的紧俏行情也对国内产业带来启发。
受访时,曙光存储副总裁杨志雷分析道,在AI需求支撑下,寻求更好存储解决方案成为行业变革的核心。
从目前趋势看,多模态数据存储需求将愈发丰富,很难通过技术手段解决市场端的供需不平衡问题,不过在供应链层面,可以围绕市场紧俏的技术和需求深度迭代,聚焦提供行业解决方案。
此外在传统存储市场中,从存储介质到访问方式等方面,过去已经积累了成熟经验,但未来3-5年间,预计AI存储会提出诸多新需求,这也是专委会的意义,即联合生态伙伴共同制定未来的新技术标准。
曙光存储副总裁张新凤则指出,存储系统的纯硬件成本,70%以上都来自存储相关介质,本轮“存储涨价”,幅度高达50%,有的产品甚至达到2倍,对产业后续发展带来不确定性。在AI存储的机会方面,产业界期待更多新技术和企业参与到生态中,推动产业更加健康有序发展,在变化中更加理性、往可控方向发展。
生态链紧密耦合
数据显示,全球数据存储市场空间已超2.6万亿元,要提升中国存储产业的全球竞争力,强化产业协同、构建自主标准体系成为破局关键。
面对AI大模型引发的新一轮机遇,国内存储产业已经在提出应对方案。从早期业界提出先进存力概念,到今年国内推进先进存力中心建设,适配国内AI训练和推理需求的新型存储能力已经在积蓄。
张新凤对21世纪经济报道记者分析道,发展先进计算平台的背后,必然需要先进存力提供支持,于是曙光存储自2021年提出先进存力概念,其核心就是解决AI时代智算中心、超智融合等多方面IT基础设施变革升级对底层存力带来的新挑战。
相比于传统存力建设,先进存力中心建设提出了多方面新要求。
其一是极致的性能提升,即从此前每秒GB为单位升级为目前每秒TB为单位的存储传输带宽,这几乎是提出1000倍的速率提升要求。对此,在端到端NVMe全闪、IO性能方面都需要进行能力支持。
其二是融合协同,在新一代智算中心为代表的项目建设中,由于涉及数据采集、打标签、清洗、训练等全过程,有时还需要进一步进行数据Token化、模型参数归档等。其中诸多环节的协议都不一样,对底层存储IO在每个阶段的要求也不尽相同。“一套存储系统既要满足这么多协议,也要满足每个协议对性能的变化要求。”张新凤补充道。
其三是数据汇聚与流动,在前述数据流动的链条中,倘若涉及多种协议间的多份拷贝,往往存在时效性和空间利用率占用等方面挑战,这都会体现在计算成本上。因此目前客户更希望一份数据在不同流程中采用不同的访问协议,并且匹配数据在热、温不同介质层间能自由流动。
“在AI时代,数据汇聚是必经环节,这与传统数据烟囱的建设方式不同,也是所有行业真正要做智能化的起点。”她分析道,除此之外,数据安全可靠、绿色环保等,都是当前建设先进存力平台提出的新要求。
此前曙光存储与中国移动合作发布“东数西算”存算一体化调度平台,也是为了更好适配AI时代数据跨地域的存算协同需求而生。
张新凤分析道,由于中国移动的业务完全解耦,其采用的云存储也为多个厂商的异构平台,要对这种复杂架构进行打通并实现数据流动,对存储平台提出了较高技术要求。
“我们已经协同中国移动上线了几个试点项目。第一阶段已经实现了数据汇聚、流动、管理,下一步,会围绕源数据的定义和搜索、未来新数据的自动推理策略等展开工作,期望更智能化处理这些数据。”她分析道,其核心是帮助中国移动为代表的数据中心客户,实现将有价值的数据逐步Token化。