红星资本局11月12日消息,前DeepSeek研究员罗福莉加入小米。
11月12日,据澎湃新闻报道,罗福莉在朋友圈发文:“智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的AGI。”
值得注意的是,今年10月,小米AI团队携手北京大学联合发布一篇聚焦MoE与强化学习的论文,其中已经出现罗福莉的名字。
Xiaomi MiMo是小米首个推理大模型。这也是罗福莉正式宣布自己已经加入小米,亦是对此前传言的回应。
2024年底,DeepSeek发布了新一代大语言模型DeepSeek-V3,同时宣布开源。该模型在AI圈爆火后,DeepSeek-V2的关键开发者之一罗福莉走进大众视野,被称为95后AI“天才少女”。
公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。
硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
就在DeepSeek-V3发布前几天,小米创始人雷军已开出千万元年薪招聘罗福莉,领导小米AI大模型团队。
当时有消息称,小米公司正在积极搭建自己的GPU万卡集群,以加大对AI大模型的投入力度。小米大模型团队在成立之初就已拥有6500张GPU资源,而此次搭建GPU万卡集群,将进一步提升小米在AI大模型领域的研发实力。据知情人士透露,该计划已经实施数月之久,雷军在其中扮演了重要的领导角色。他对于AI硬件的重视程度极高,认为手机是AI硬件领域的核心,小米必须全力以赴。
据Xiaomi MiMo公众号消息,今年4月,小米开源了首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”。

据Xiaomi MiMo公众号
文章称,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型 QwQ-32B-Preview。
MiMo是全新成立不久的小米大模型Core团队的初步尝试。小米大模型Core团队称,“2025年虽看似是大模型逐梦的后半程,但坚信AGI的征途仍漫长。我们将从务实创新出发,勇敢探索未知,用思考突破智能边界,用创造回应每一次好奇。”