广东电信最近干了一件在业内看来“动静不大但后劲极强”的事——他们联合新华三,完成了国内首个基于DDC架构的智算网络在运营商环境下的端到端落地测试。这事听起来技术味十足,但背后的信号很明确:中国在构建自主可控、高效开放的AI算力底座上,又往前迈出了实质性一步。
这次测试的核心是DDC架构,全称叫Diversified Dynamic-Connectivity(多元动态联接),由新华三提出并主导技术实现。简单来说,它要解决的是当前大模型训练中最头疼的问题之一:算力集群内部的通信瓶颈。随着GPU规模扩大,传统RoCE或InfiniBand方案在扩展性、兼容性和拥塞控制上逐渐显现出短板。而这次实测结果显示,DDC架构在有效带宽上相比传统RoCE提升了24.54%到41.37%,最大甚至接近翻倍,且能实现零丢包、低时延和天然负载均衡。
更关键的是,这套架构具备高度开放性,能够兼容不同品牌、不同架构的AI加速卡,这对于当前动辄数万卡规模的智算中心而言,意味着更高的部署灵活性和更低的运维成本。测试中采用典型的Spine-Leaf组网结构,用H3C S12500AI系列交换机搭建骨干,接入多台GPU服务器,在All-to-All和All-Reduce等典型AI训练通信模式下表现稳定优异,尤其在高并发场景下性能优势更加明显。
从战略角度看,这是运营商首次在真实局点完成此类先进智算网络的验证。广东电信作为中国电信体系内的前沿力量,此举不仅是自身网络能力升级的体现,更可能为全国范围的智算中心建设提供可复制的技术范本。未来支持7万卡级别的平滑扩容能力,也说明这不是一次实验室性质的演示,而是面向大规模商用的设计。
在我看来,这件事的价值远不止于一次技术测试成功。我关注到,当前国内各大云厂商和运营商都在争夺AI基础设施的话语权,而网络互联正是其中最容易被忽视却又最核心的一环。新华三作为紫光股份旗下企业,能在这一领域拿出真正有竞争力的方案,说明国产网络设备厂商已经从“跟随”走向“引领”。而广东电信的选择,也反映出运营商正在主动拥抱变革,不再只是管道提供者,而是试图成为算力服务的关键参与者。
更重要的是,DDC架构的开放性和兼容性,恰恰回应了当前行业对“避免技术锁定”的普遍担忧。在一个多种AI芯片并存的时代,谁能让异构算力高效协同,谁就掌握了构建生态的主动权。这一点,我认为比单纯的性能提升更有长远意义。
当然,技术落地还需经历更大规模、更复杂场景的考验,但我相信,这次测试是一个清晰的信号:中国的智算网络演进,正走出一条不同于西方技术路径的自主之路。