2月3日,云天励飞举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力AI推理芯片战略布局。云天励飞表示,面对人工智能从“基础模型构建”迈向“规模化应用落地”的重要转折点,公司将核心研发资源集中于攻克大模型落地的“成本壁垒”,致力于通过底层架构创新,力争实现百万Tokens推理成本降低99%的目标,推动AI从技术尝鲜走向普惠生产力。
据悉,云天励飞确立了GPNPU技术路线,并提出了“GPNPU=GPGPU+NPU+3D堆叠存储”的核心公式,旨在兼顾通用计算的“通用性”与NPU的“高效性”,在工程层面同时解决可迁移、可部署、可持续降本三大难题。此外,记者了解到,云天励飞正深度研发3D堆叠存储及更前沿的互连技术,以提升带宽与能效,降低推理时延。
云天励飞董事长兼CEO陈宁在演讲中指出,支撑公司跨越周期的是长期积累构筑的商业护城河。他将核心竞争力总结为技术、产能、生态、市场、资本五大关键要素。“这五大维度的协同共振,不仅是云天励飞应对行业激烈竞争的底气,更为未来三年战略的稳步落地提供了坚实的体系化保障。”陈宁说。
针对行业普遍关注的供应链安全问题,云天励飞高级副总裁、CFO兼董秘邓浩然表示,公司目前是国内屈指可数具备充足国产产能保障能力的企业之一,这一战略储备为后续芯片的大规模量产与交付提供了极高的确定性。
陈宁还详细解读了云天励飞的“1+4”架构。“1”指聚焦于AI大算力推理芯片,“4”则是四大事业部。据悉,四大事业部旨在解决芯片从“研发生产、优化打磨到市场推广”的核心难题。其中,政企事业部作为基石,将把战略重点转向推理设备和智算中心的建设。此外,云天励飞还计划打造区域级“千卡集群”,树立城市AI算力赋能的新标杆。
面向未来三年的规划,云天励飞CTO李爱军表示,将不遗余力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐的核心矛盾持续迭代,并按产品节奏梯度覆盖市场需求。路线图将对标国际主流平台的代际演进,聚焦长上下文预填充(Prefill)、低时延解码(Decode)等关键推理阶段的系统优化,在真实负载下持续兑现“更便宜、更稳定、更易部署”的交付目标。