上证报中国证券网讯(记者孙小程)1月7日,智元机器人合伙人、首席科学家罗剑岚在接受上海证券报等媒体采访时透露,智元2026年将重点在真实世界部署通用机器人,目前业界未有其他企业做到这一步。
智元具身研究中心近日提出SOP(Scalable Online Post-training)——一套面向真实世界大规模部署机器人的在线后训练系统,并在实验中部署了数十台机器人。
罗剑岚透露,与实验中部署的数十台相比,2026年智元会部署几个数量级以上的通用机器人,以真正找到机器人真实场景部署和落地的Scaling law。
部署规模某种程度上决定了机器人的竞争力。“谁部署的机器人最多,谁的真实世界的宝贵数据就更多,谁就能训练出更好的模型。”罗剑岚说。
SOP是实现上述规划的关键支撑。其突破在于,让机器人在真实场景中执行任务时,能够实时收集数据(包括错误数据),通过云端协同训练持续提升模型性能,并快速将更新同步至所有机器人。
通俗而言,一个机器人犯错,几分钟内,成千上万的机器人能够学会如何避免这个错误。
实验结果说明,在各类测试场景下,结合SOP的后训练方法均得到了显著的性能提升。相比预训练模型,结合SOP的HG-Dagger方法在物品繁杂的商超场景中实现了33%的综合性能提升。
罗剑岚认为,过去几年,大模型等技术已让机器人具备了理解复杂指令、处理开放任务的潜力。但真实场景充满意外,环境变量过于复杂,机器人尚且不能稳定、可靠、高效地完成具体工作。
智元的判断是,2026年是机器人从“会做很多事,但每个事做得不太好”,走向“把事情做好并落地”的关键节点。这要求机器人的学习范式从静态离线训练,升级为部署学习再部署的整套数据闭环系统,正是基于这一判断,智元提出了SOP的概念。
在应用场景上,罗剑岚认为,工业场景短期之内是最有效的场景,其有着稳定的工序和生产流程,引入SOP训练可提升成功率和节拍,确保机器人能长时间地可靠运行。
至于商业场景,例如商超补货、仓库分拣等,这些场景比工厂更开放,长尾任务更多,但对失败的容忍度相对较高。SOP的共享经验池机制,能让一家门店里机器人学到的经验,快速赋能给成千上万家门店,极大降低人工介入成本。罗剑岚坦言,他个人的愿望是今年在上海的便利店、超市中,可以看到机器人真正干活。
对于机器人产业而言,这也意味着,商业模式有望从“一次性硬件销售”转向“软硬件持续服务”,类似特斯拉的FSD付费订阅模式。
作为智元首创的方案,SOP是否会向其他机器人本体厂商开放?
罗剑岚称,SOP是个框架、系统,会开放部分关键模块和接口,目前未完全开源,但不排除未来采取开放的合作形式。长远来看,智元希望构建一个开放的机器人在线学习生态,不同的机器人本体均可以接入,让数据共享上传到同一个云端大脑,让数据回传实现机器人不断进化,给不同厂商使用。
“如果能找到行业伙伴,在各自擅长的场景中发挥优势,我们可以共同推动整个机器人行业从静态能力到动态进化的跨越。”罗剑岚说。