上证报中国证券网讯(记者孙小程)继10月9日宣布与龙旗科技达成深度战略合作后,智元机器人近日再次公布一项技术突破:其研发的真机强化学习技术,已在与龙旗科技合作的验证产线中成功“落地”。
长期以来,精密制造产线面临刚性瓶颈:传统机械臂依赖复杂夹具设计与场地改造,调试周期长、换型成本高;“视觉+力控”等柔性方案虽有改进,却存在参数敏感、部署复杂等问题,难以适配消费电子行业高频产品迭代需求。
智元此次落地的真机强化学习方案,让机器人可在真实产线中自主学习、持续优化作业策略,新技能训练与稳定部署仅需数十分钟,且性能全程不降级。在换线、换型或流线调整时,该系统只需最小的硬件改动和标准化部署流程,即可显著提升柔性、压缩部署时间与成本。
智元机器人合伙人兼首席科学家罗剑岚带领的团队,长期专注于真实世界强化学习的前沿研究,聚焦如何让机器人在真实物理环境中安全、高效地持续学习与适应。在算法与工程的协同推进下,智元机器人仅用一年时间便实现了强化学习在工业场景中的系统化落地。
对于实际效果,罗剑岚在接受上海证券报等媒体采访时透露,在当前龙旗科技工厂的实践中,目前已经处于接近常态化作业的部署状态。“经过双方确认,我们的故障率非常低。事实上,即便是产线上其他自动化方案也存在一定故障率,而我们的方案故障率完全在产线可验收的范围内。”
罗剑岚称,机器人之所以可以迅速学会新技能,是通过预训练模型,结合少量示范和纠错,快速点亮策略,并在工业给定范围内微调参数来达成。
他进一步表示,对于同工序的小幅变化,机器人可以做到零样本或极少量样本的适配。对于幅度较大的变化,比如相近但不完全相同的工序,机器人会通过持续学习和自校准来完成迁移,整个过程大约在十几分钟到三十分钟内。目前智元正在构建工厂内的整体数据闭环机制,以实现多个工序之间的泛化效果。
罗剑岚认为,如果这项技术能大规模推广,将解决一大痛点——换线问题。
他曾走访过深圳某大型手机制造商,该企业一年推出12款手机,每两个月就要换一次线。在他看来,未来若每条产线都要对应一款手机,显然不经济。理想情况下,一条具身智能产线就能满足12款、20款甚至50款手机的生产需求。“全国范围内待自动化的工序数量仍非常庞大,可能有1亿个工位甚至更多,其改造意愿非常强烈。”
此外,在行业标准化方向上,罗剑岚分享了三个维度的展望。一是算法标准化。包括强化学习、感知、控制等模块应遵循统一的数据规范和安全标准。未来智元可能通过OTA方式持续更新,并将预训练模型API化、SDK化,做成标准工具供大家直接调用和复用。
第二,接口标准化。工业产线涉及多种设备和通信标准,目前真机强化学习在产线落地还缺乏统一规范。智元将推动与机器人、相机、力控、PLC等设备的通信和集成接口标准化,避免为每家工厂重复适配。
第三,流程标准化。从学习、验证到上线形成模板,包括性能基准、评估标准等都要流程化,确保达到可上线标准后能够快速复制。
“我国制造业全球领先,应用前景广阔。一旦这些方面实现标准化,将能迅速在全国工厂推广,让更多产线具备学习和自适应能力。”罗剑岚说。