让机器人在现实世界“越用越聪明”，智元机器人发布SOP模型_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2026-01-07 08:07:40 股吧网页版

让机器人在现实世界“越用越聪明”，智元机器人发布SOP模型

来源：上观新闻

　　今天，智元机器人具身研究中心发布一项突破性技术——一套面向真实世界部署的在线后训练系统SOP（Scalable Online Post-training）。这是业界首次在物理世界的VLA后训练中，系统性地融合在线学习、分布式架构与多任务通才性，使机器人集群能够在真实环境中持续进化，让个体经验在群体中高效复用，从而将“规模”转化为“智能”。

　　当前，通用机器人迈向大规模真实世界运行面临一个核心矛盾：既要在开放环境中保持稳定可靠，又需应对千差万别的任务。尽管现有VLA预训练模型（即视觉-语言-动作模型）给机器人提供了通用能力，但其“离线、单机、串行”的后训练模式，存在数据采集效率低、任务专精度不足等瓶颈，难以支撑高效、持续的真实世界学习。

　　如果说VLA让机器人第一次具备了通用理解与行动能力，那么SOP所做的，是让众多机器人的经验共同驱动智能的快速成长。它重构了机器人的学习范式，将其从封闭的实验室训练，转向开放的“实战练兵”。

　　该系统的核心在于构建一个“在线、集群、并行”的学习闭环：多台机器人在不同地点同时执行多样任务，实时将成功与失败的经验数据上传至一个云端模型；该云端模型持续在线学习，并定期将参数同步回每一台机器人，实现集体能力的即时跃升。

SOP架构设计

　　实验结果有力验证了SOP的价值。在商超整理、叠衣服、纸盒装配等多样化测试场景中，结合SOP的训练方法带来了显著性能提升。例如，在物品繁杂的商超场景中，系统实现了33%的综合性能提升；在叠衣服任务中，操作吞吐量跃升了114%。SOP让多任务通才的性能普遍提升至近乎完美，不同任务的成功率均提升至94%以上，纸盒装配更是达到98%的成功率。

结合SOP的训练方法在多样化测试场景中给机器人带来了显著性能提升。

　　经SOP训练后的模型，在长达36小时的连续运行中展现出卓越的稳定性和鲁棒性，能够有效应对真实世界中出现的各种疑难杂症。尤为重要的是，当机器人被部署到全新陌生环境时，SOP能在数小时内使其性能快速回升至高效稳健水平。

　　“SOP改变的不仅是训练范式，更是机器人系统的生命周期。”智元机器人表示，机器人不应是“性能固定的标品”，而应成为“在真实世界中持续提升的生命体”，部署不是终点，而是智能化规模进化的起点。

（文章来源：上观新闻） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》