华为云黄瑾：传统计算架构难支撑AI代际跃迁超节点架构是创新_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2025-05-16 23:46:39 股吧网页版

华为云黄瑾：传统计算架构难支撑AI代际跃迁超节点架构是创新

来源：新京报作者：韦博雅

　　新京报贝壳财经讯（记者韦博雅）5月16日，在华为云AI峰会上，华为云副总裁黄瑾表示，随着大模型训练和推理对算力需求的爆炸式增长，传统计算架构已难以支撑AI技术的代际跃迁，超节点架构的诞生不仅是技术的突破，更是以工程化创新开辟AI产业的新路径。

　　黄瑾表示，AI算力的瓶颈，从单卡算力的瓶颈到单机内总线带宽的瓶颈，再到现在集群间通信带宽的瓶颈，需求增长了1万倍。然而过去的8年里，单卡硬件的算力增长了40倍，但是节点内的总线带宽只增长了9倍，跨节点的网络带宽只增长了4倍，这使得集群网络通信成为当前大模型训练和推理的最大挑战。

　　黄瑾介绍，华为云推出的CloudMatrix 384超节点，直面通信效率瓶颈、内存墙制约、可靠性短板三大技术挑战，通过新型高速互联总线实现384张卡互联成为一个超级云服务器，最高提供300Pflops的算力规模，比英伟达NVL72 180Pflops的算力规模提升了67%。

　　同时，华为云CloudMatrix 384超节点具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势。

　　在CloudMatrix 384超节点的分布式推理平台的加持下，通过高速互联总线，能够实现一卡一专家高效分布式推理，单卡的MoE计算和通信效率大幅提升。而MatrixLink服务具有两层网络：超节点内部的ScaleUp总线网络和跨超节点间的ScaleOut网络，可以让超节点内384张卡高速互联，时延低至微秒。

　　除此之外，华为云首创的EMS弹性内存存储，通过内存池化技术，实现显存和算力解绑，可大幅提升资源利用率、性能和吞吐量，比如用EMS替代NPU中的显存，可使得首Token时延降低，最高降幅可达80%；昇腾云脑运维“1-3-10”标准还将硬件故障感知率从40%提升至90%。

（文章来源：新京报） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

郑重声明：用户在社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》