继开源文本大模型M2,上海AI独角兽MiniMax稀宇极智接连发布视频模型Hailuo 2.3、语音模型Speech 2.6和音乐模型Music 2.0。
10月27日,新一代文本大模型MiniMax M2正式发布和开源,这款仅有10B激活参数(总参230B)的轻量级模型在全球权威测评榜单Artificial Analysis (AA)上创造了历史性突破——总分冲入全球前五、开源第一。
同时,该模型综合成本低至约0.53美元/百万Token,不及Claude 4.5 Sonnet的8%,推理速度是其近两倍。
文本模型M2上线仅5天,在API整合平台OpenRouter上的实时调用token量已经排到了全球第四、国产第一;在编程场景中全球第三。
10月28日发布的最新视频生成模型海螺2.3(Hailuo 2.3),在Hailuo 02模型基础上实现全面技术升级的新版本,在动态表现力、风格化呈现以及人物表演细腻度方面取得显著突破。
在语音技术领域,MiniMax发布的Speech 2.6模型针对Voice Agent场景进行了深度优化,将首包响应时间压到了250毫秒。与传统语音指令识别不同,Voice Agent不只是简单将语音转成文字,而是具备完整的交互能力,几乎所有需要“用说话代替打字”的场景,都依赖Voice Agent来承接需求、理解意图并给出反馈。
在音乐生成领域,MiniMax Music 2.0模型不仅能够精准捕捉与还原人声的细腻情绪和器乐的动态张力,更像一位“会唱歌的制作人”,懂节奏,也懂情绪。在人声表现方面也实现了重大突破,音色无限接近真实人声,能够驾驭多种唱法和情感风格。
“AI技术正在改变越来越多人的工作和创作方式,我们希望成为创作者的全能助手和创新先锋,让每一个灵感都能超越形式的限制,生长成各行各业的真实生产力。”MiniMax相关负责人说。