上证报中国证券网讯(记者谭镕)6月17日,总部位于上海的AI独角兽企业MiniMax突然向开源社区投下一枚“重磅炸弹”,正式发布其自主研发的MiniMax-M1系列模型。MiniMax透露,M1的发布仅仅是MiniMax“开源周”的序幕。在接下来的四个工作日里,MiniMax计划每天发布一项新的技术或产品更新。
在业内人士看来,人工智能竞赛进入“下半场”的今天,模型性能的比拼已不再是唯一焦点,高效、低成本、强推理能力正成为定义下一代AI核心竞争力的关键。MiniMax介绍,M1被定义为“开源大规模混合架构推理模型”,在多个核心生产力场景中展现出比肩甚至超越业界顶尖模型的实力,为AI的规模化应用和未来发展路径提供了全新的想象空间。
技术报告显示,M1模型在处理百万级Token的长文本上实现了重大突破;其RL(强化训练)成本下降一个量级,成本仅53万美元,推理效率高;在工具使用场景(TAU-bench)中MiniMax-M1-40k领跑所有开源权重模型。

(开源技术报告)
“性价比新王”“又一次卷到硅谷了”……M1发布后,技术社区和行业观察者表示。不少业内人士关注到M1的极致性价比。
具体来看,M1的性价比体现在API服务上。在0-32k的输入长度的时候,输入0.8元/百万token,输出8元/百万token;在32k-128k的输入长度的时候,输入1.2元/百万token,输出16元/百万token;在最长的128k-1M的输入长度的时候,输入2.4元/百万token,输出24元/百万token。
此外,MiniMax宣布,在其自有的App和Web端,M1模型将保持不限量免费使用,这将极大地推动其技术的普及和应用。
MiniMax介绍,性能上,MiniMax在业内公认的17个主流评测集上对M1进行了全面“大考”,结果显示,M1在软件工程、长文本理解和工具使用等面向生产力的复杂场景中,优势较为突出。在代码能力方面,M1-40k和M1-80k版本分别取得了55.6%和56.0%的成绩,稳居第一梯队。在长文本方面,依托百万级上下文窗口,M1系列在此项任务中表现惊艳;在工具调用方面,在模拟真实世界工具调用的复杂场景中,M1-40k模型领跑开源模型。
据介绍,MiniMax-M1的卓越性能,根植于其独特的架构设计和算法创新。其中,两大核心技术——线性注意力机制(Lightning Attention)混合构架和更快的强化学习算法CISPO,构成了其高效能、低成本的基石。
M1模型原生支持高达100万Token的上下文窗口,同时,还支持业内最长的8万Token推理输出。实现这一突破的关键,在于MiniMax的Lightning Attention混合构架。此外,MiniMax此次提出的CISPO算法,通过裁剪重要性采样权重,而非传统算法中调整Token的更新方式,来提升强化学习的效率和稳定性。
得益于CISPO的高效,M1模型的整个强化学习阶段仅使用了512块英伟达H800 GPU,耗时三周,成本仅为53.5万美元。MiniMax官方表示,这一成本“比最初的预期少了一个数量级”,展示了其技术路线在成本控制上的巨大潜力。
此外,MiniMax表示,完整的M1模型权重、技术报告均已在Hugging Face和GitHub上开放获取。同时,公司正积极与国家超算平台等业界主流开源框架合作,以确保开发者能够轻松、高效地部署和使用M1模型。