
$小米集团-W(HK|01810)$ 小米大模型在多个关键领域取得了显著突破,其成功可通过以下具体数据体现(按能力维度分类):
一、核心推理能力(数学与代码)
1. **数学推理(AIME 24-25竞赛题库)**
- **正确率67.8%**,超越OpenAI闭源模型o1-mini(提升12.3%)。
- 美国数学邀请赛(AIME 2025)得分55.4分,领先o1-mini 4.7分。
2. 代码生成(LiveCodeBench v5)
- **通过率89.1%**,力压阿里320亿参数模型QwQ-32B-Preview(领先近5%)。
---
二、多模态与音频理解
1. 音频推理(MMAU评测集)
- **准确率64.5%**,超越GPT-4o近10个百分点,刷新行业纪录。
- 覆盖27种技能,包括跨场景推理与专业知识检验。
2. **视频理解(Q-Frame技术)**
- 在MLVU评测中,将Qwen2-VL模型准确率从55.5%提升至65.4%;在LongVideoBench上,GPT-4o准确率从53.3%提升至58.6%。
三、中文语言理解(本土化优势)
1. **C-Eval综合评测**
- **平均得分60.2**,排名同参数级第一,超越Qwen-7B(59.6)。
2. **CMMLU中文推理**
- **平均得分60.37**,领先百川Baichuan-13B(54.63)和ChatGLM2-6B(50.79)。
四、效率与落地应用
1. 能效与延迟
- 端侧推理功耗**<5W**,延迟压缩至**300毫秒内**(骁龙8 Gen4芯片)。
- 能耗仅为竞品的**1/5。
2. 训练速度优化
- 自研Seamless Rollout系统提升训练速度2.29倍,验证速度1.96倍。
3. 产品化落地
- 小米SU7智能座舱决策系统:复杂路口98.7%准确率,响应速度达人类1.5倍。
- 小爱同学月活超1.1亿,大模型版本已整合至手机端。
---
总结:成功背后的关键因素
-小而精”路线:仅70亿参数超越320亿模型,证明高质量训练>参数规模。
- 技术创新:三阶段训练法、动态奖励机制(TDDR)、多词汇预测技术提升推理效率。
- 生态整合:深度融入HyperOS、汽车、IoT,实现端-云协同。
- 开源贡献:25万亿训练日志开放,推动开发者生态(欧洲市占率提升7.2%)。
小米大模型的成功百分比虽因任务而异,但其在**效率突破**(能耗降低80%)、**场景落地**(车载决策98.7%准确率)及**开源影响力**(全球开发者采纳)三大维度均达行业顶尖水平,重新定义了轻量化AI的竞争力边界。