• 最近访问:
发表于 2025-04-29 07:30:21 股吧网页版
AI观察|算力饥渴与泡沫
来源:澎湃新闻 作者:张静

  数据中心是信息基础设施中的算力基础设施。一边是DeepSeek撬动AI算力需求,数据中心上架率提高,另一边是微软、亚马逊等科技巨头放缓部分人工智能数据中心项目。全球AI竞赛撕开算力一角,算力究竟过剩还是不够?

  多位业内人士日前在接受澎湃科技采访时表示,DeepSeek出现后推理算力需求增加,计算效率提升,总体算力需求上涨,但同时各地数据中心利用率呈现不均衡状态,设备老化、供需错配、垂直生态体系建设不到位等导致部分算力闲置。

  伴随着人工智能的快速发展,业内人士均认为,算力需求是无止境的,长期趋势仍是供不应求,建不建数据中心的关键在于其能否满足用户需求。

  算力新浪潮

  分布式计算包括超算、智算和以云计算为主的通用计算。在数据智能时代,数据计算需求助推云计算崛起,云计算面向社会经济的各行各业,以计算实现智能。随着人工智能跨越式发展,中高性能的智算成了炙手可热的计算资源。

  国际数据公司(IDC)发布的《中国人工智能计算力发展评估报告》显示,2024年,中国智能算力规模达725.3百亿亿次/秒(EFLOPS),同比增长74.1%,增幅是同期通用算力增幅(20.6%)的3倍以上;市场规模为190亿美元,同比增长86.9%。

  今年以来,DeepSeek的兴起激活了推理算力需求。“在互联网时代,数据中心提供服务器,以数据交换功能为主。现在数据中心转型成智算中心,在原有互联网时代的服务基础上提供智算算力,满足人工智能更大的计算需求。”上海超算中心主任李根国表示,这几年,智算中心建设突飞猛进,大模型特别是DeepSeek的出现,让之前闲置的数据中心也都活过来了。伴随社会对于AI接受度的提升,各地都在部署AI,总的来说算力供不应求。

  2023-2024年间,国内“百模大战”以训练需求为主,“当训练需求收敛,基础模型玩家越来越少,单个用户用量越来越大,要支撑这样的客户,必须具备万卡以上能力,但大部分厂商没有,所以千卡、百卡集群全闲置了。”某智算行业专家向澎湃科技介绍说。早些年各地投建智算,的确是一拥而上,这也是造成算力闲置的原因。但DeepSeek出现后,智算利用率反而有所提高。一是训练算力规模需求有所降低,使得行业模型训练可以更低的成本开展。二是DeepSeek开源极大促进了场景应用和下游模型改进,让闲置的千卡、百卡集群也有了用武之地,目前很多地方都算力供不应求。

  “我们原来在做超算,这两年突然发现智算出现了。智算里一个非常典型的大需求就是大规模训练,这其实也是一个超算应用,所以智算的需求也在拉动超算的需求。”超算云和智算云算力服务商并行科技AI云联合创始人、AI云事业部总经理赵鸿冰说。脱胎于高性能计算的超算主要服务于国家战略,面向航空航天、国防、气象、石油、制造业、生命科学等领域提供计算服务。

  对于目前算力需求的抬升趋势,上述智算行业专家判断,“浪潮不会一下子消退,随着DeepSeek R2的推出和开源,供不应求的现象还会持续一段时间。”他认为,以往数据中心上架率存在需求错配,根本原因在于软件迭代速度快于硬件进化速度,从而使得市场整体供需呈现波浪起伏态势。但从趋势看,供需波动围绕的轴线,即人工智能发展曲线长期向好。

  饥渴与过剩

  “长期来看,人工智能方向没有错,长期趋势一定还是供不应求,但短期内可能会存在错配和冗余。”该智算行业专家对澎湃科技表示。在他看来,智能算力是智能经济发展的基础和瓶颈性制约,需要提前布局,但提前布局就很可能会造成建设浪费,而在产业发展进程中,这种超前建设和浪费又很难避免。

  事实上,对于算力来说,饥渴和过剩一直同时存在。

  根据沙利文的统计数据,中国数据中心整体的上架率从2019年的53%提升到2022年的58%,相当于四成以上的算力在过去数年里被闲置。

  2024年,国家发展改革委联合有关部门印发的《数据中心绿色低碳发展专项行动计划》提出,到2025年底,全国数据中心布局更加合理,整体上架率不低于60%。引导智算中心规范化集群化发展,促进存量分散数据中心集约高效转型。

  从全国范围来看,目前各地数据中心的利用率呈现不均衡状态。部分发达地区的数据中心由于承载了大量互联网业务和AI训练任务,利用率相对较高,甚至接近饱和。而在一些欠发达地区由于业务需求量不足,数据中心利用率相对较低,存在一定的资源浪费现象。

  计算需求在东部,能源在西部,因此催生了东数西算。但算力调度不同于电力调度,服务保障能力、数据传输成本、带宽和延迟问题都限制了西部数据中心的上架率。

  东部地区要使用西部的服务器必须先传输数据,完成计算后结果传回东部。数据一旦超过一定规模,便凸显带宽和延迟问题。“以前生命科学计算和石油勘探计算要用超级计算机计算时,都是人带着数据飞过来,这是最经济的方式。”李根国表示,跨域传输数据费用高昂,点对点的专线费用一年可达上百万元,这意味着西部的数据中心要想服务东部需求还存在种种需要跨越的障碍,目前看来用于区域服务是最经济的。

  李根国还提到,以往各地数据中心建设存在同质化竞争,加之建设周期长,“早期建设数据中心就是把老的服务器一排排摆进去,后来发现没这么多需求,特别是云计算发展以后都使用虚拟服务器了。”到了智算时代,技术迭代周期加快,若跟不上转型,在使用效率和成本方面将面临更大压力。

  上述智算行业专家表示,即便是当下算力需求大增的情况下,通用计算算力仍然存在过剩情况。“过往一拥而上建的传统数据中心,最后要靠自然消化,要么成为云厂商,要么成为云厂商的服务商。但云的自然增长率只有个位数,传统数据中心还是租不出去。”这是因为这样的数据中心“不具备市场服务能力”,而更深层的原因在于垂直生态体系建设不到位,云服务能力跟不上。

  他表示,数据中心是基础设施,资源调度和应用服务要依赖软件服务体系。云厂商自建数据中心,实现IaaS(基础设施即服务)、PaaS(平台即服务)一体化服务,是提升用户体验的基础。“只建设IaaS是AI服务器加价分销模型,没有系统运维和软件服务能力,其利润必然是单薄的,很难实现可持续发展”

  与此同时,数据中心是产业消耗品,老设备耗电大、算力低,建设5年后会被淘汰。“如果一些数据中心是传统老旧的5000瓦以下单机柜功率的服务器,这样的中心只能在硬件层面进行改造。如果原来都是一台台机器的建设方式,恐怕很难适应大规模高性能集群的架构。”另有业内人士对澎湃科技表示。

  不过,中信建投证券认为,中国数据中心市场均存在一定供需和区域不平衡的问题,但已经出现明显缓解。与普通数据中心相比,智算中心支撑的GPU服务器功率密度增大,为传统云计算准备的机柜功率无法很好满足GPU算力的部署需求,同时随着GPU单卡功耗不断提升,对于机柜功率密度的要求也在随之增加,存在大量新建高功率机柜的增量需求。存量旧机房消耗叠加高功率新需求释放,有望开启新一轮周期。

  新生的算力服务中间商

  应对激增的算力需求,除了建设更多的数据中心,还需要不断提升数据中心的运营效率,算力业务正从单一资源提供向综合服务转变。由于各大算力中心缺乏运行服务的能力,代运营算力中心的算力服务中间商应运而生。

  这些中间商提供运维、调度和优化服务,帮助算力中心提高资源利用率和服务质量。在AI大模型训练需求激增的背景下,代运营服务将成为连接供需双方的重要桥梁。

  欲做AI模型算力“超级放大器”的上海无问芯穹智能科技有限公司相关负责人告诉澎湃科技,企业算力业务逐渐从提供传统的机柜租赁、端口服务等基础资源,向算力智能化服务延伸。例如部分服务商开始提供智能化调度、算法优化等增值服务,通过算法预测算力需求、优化异构资源调度效率,填补市场空白,满足AI训练等高阶需求。未来要实现更高效地调度算力,还需要解决算力资源的异构性整合问题,实现不同品牌和型号计算资源的统一调度,同时根据大模型训练任务的实时需求动态调整算力资源。在跨地域算力资源协同方面,要实现不同区域间算力资源的灵活调配和高效利用。未来,具备全栈服务能力的第三方服务商将成为行业主导力量。

  赵鸿冰则认为,算力服务的价值形态包括IaaS、PaaS、SaaS,大模型爆火后又出现了MaaS(模型即服务),算力服务中间商只有深耕这些价值,才能找到深入的场景和规模效益。“我们更希望把已经建成的中心纳入到并行的算力网络中,匹配客户需求,让这些中心发挥出产能和社会效益。”

  “超算支撑了传统科学的计算,智算支撑了数据科学的计算,支持大模型的预训练、后训练和推理,无论是超算还是智算,都由社会需求驱动产生。”赵鸿冰说,算力需求无止境,AI的落地一定会带动算力的利用率,关键在于满足用户需求。要按照市场化需求,依据不同业务类型,在不同区域构建不同的资源和产品形态,例如离线的训练业务可以使用西部绿色算力资源,实时性业务在东部运行,相应的电力成本也会偏高。“按照客户真正的业务特征场景来设计、建设和运营,其实利用率差距是不大的。”

  在上述智算行业专家看来,DeepSeek使算力资源得到中期调整和去泡沫,但真正满足用户需求的算力仍然不足。当前推理算力需求持续增加,模型应用的核心诉求是推理算力能够更好地响应用户、降低成本和提高产出。同时,基础模型仍处于多模态、多模式扩张阶段,高性能算力依然不够,软硬件一体道路是未来唯一的选择,就像DeepSeek以工程优化将硬件性能发挥到极致,软件能力将越来越重要。

  无问芯穹表示,DeepSeek引爆推理需求,未来推理芯片会急剧增多,推理算力需求或是预训练需求的百倍以上,预计训练和推理的算力配比将从8:2发展至2:8。国产芯片会迎来繁荣,应抓住机遇打造全国产AI产业闭环,实现更可控的自主算力发展。要面向国外芯片开展极致的软硬件协同优化,以有限算力实现国产模型能力追赶,推动国产芯片厂商开放底层软件生态,依托国产和国外芯片搭建“异构”AI系统,解决算力缺口。

  “我们对大自然的探索、生命的认识还远远没有到头,科学研究对算力的需求是无止境的。更大的算力可以把模型扩得更大,研究更精细。”李根国表示,算力需求不断增长,但计算形态并未发生本质变化,计算的基础仍是以冯·诺依曼结构为主的存算分立集成电路。未来如果实现存算一体,将改变现有计算模式,突破算力难题,提供更加高效的算力支持。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500