• 最近访问:
发表于 2026-01-07 08:07:40 股吧网页版
让机器人在现实世界“越用越聪明”,智元机器人发布SOP模型
来源:上观新闻

  今天,智元机器人具身研究中心发布一项突破性技术——一套面向真实世界部署的在线后训练系统SOP(Scalable Online Post-training)。这是业界首次在物理世界的VLA后训练中,系统性地融合在线学习、分布式架构与多任务通才性,使机器人集群能够在真实环境中持续进化,让个体经验在群体中高效复用,从而将“规模”转化为“智能”。

  当前,通用机器人迈向大规模真实世界运行面临一个核心矛盾:既要在开放环境中保持稳定可靠,又需应对千差万别的任务。尽管现有VLA预训练模型(即视觉-语言-动作模型)给机器人提供了通用能力,但其“离线、单机、串行”的后训练模式,存在数据采集效率低、任务专精度不足等瓶颈,难以支撑高效、持续的真实世界学习。

  如果说VLA让机器人第一次具备了通用理解与行动能力,那么SOP所做的,是让众多机器人的经验共同驱动智能的快速成长。它重构了机器人的学习范式,将其从封闭的实验室训练,转向开放的“实战练兵”。

  该系统的核心在于构建一个“在线、集群、并行”的学习闭环:多台机器人在不同地点同时执行多样任务,实时将成功与失败的经验数据上传至一个云端模型;该云端模型持续在线学习,并定期将参数同步回每一台机器人,实现集体能力的即时跃升。

SOP架构设计

  实验结果有力验证了SOP的价值。在商超整理、叠衣服、纸盒装配等多样化测试场景中,结合SOP的训练方法带来了显著性能提升。例如,在物品繁杂的商超场景中,系统实现了33%的综合性能提升;在叠衣服任务中,操作吞吐量跃升了114%。SOP让多任务通才的性能普遍提升至近乎完美,不同任务的成功率均提升至94%以上,纸盒装配更是达到98%的成功率。

结合SOP的训练方法在多样化测试场景中给机器人带来了显著性能提升。

  经SOP训练后的模型,在长达36小时的连续运行中展现出卓越的稳定性和鲁棒性,能够有效应对真实世界中出现的各种疑难杂症。尤为重要的是,当机器人被部署到全新陌生环境时,SOP能在数小时内使其性能快速回升至高效稳健水平。

  “SOP改变的不仅是训练范式,更是机器人系统的生命周期。”智元机器人表示,机器人不应是“性能固定的标品”,而应成为“在真实世界中持续提升的生命体”,部署不是终点,而是智能化规模进化的起点。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500