新华财经上海11月28日电(记者王鹤)记者从国家地方共建人形机器人创新中心获悉,乐聚智能近日将自主构建的LET数据集捐赠至OpenLoong开源社区。该数据集作为覆盖真实作业场景的重要数据资源,以规模大、结构规范、场景丰富的特点,具备突出的工程化与研究价值,将为国内人形机器人研发提供有力支撑,同时标志着OpenLoong数据生态建设进入新阶段。
全尺寸真机采集,覆盖多领域真实场景
据介绍,LET数据集由乐聚智能联合合作团队构建,是面向真实作业场景的全尺寸人形机器人真机数据集。其基于乐聚夸父系列全尺寸人形机器人统一采集,覆盖完整真实作业链路,数据规模超60000分钟。
在场景覆盖上,LET数据集跨越工业、商业零售、日常生活三大领域,涵盖汽车工厂、快消场景、酒店服务、3C工厂、生活服务、物流六类真实生产与服务环境。在此基础上,数据集进一步构建了31项任务及117种原子技能,形成结构清晰的任务体系,这些任务目标明确、流程有约束,可有效支撑机器人在多场景、多步骤、多目标条件下的学习与推理训练。
破解行业数据痛点,推动标准化与协作效率提升
国地中心表示,人形机器人正加速从实验室走向真实应用场景,产业链对高质量数据集的需求持续攀升,但行业普遍面临数据来源分散、格式各异、结构不统一等共性问题,既降低了数据集质量、限制模型能力提升,也影响跨机构协作效率。因此,构建体系化数据标准、规范数据全生命周期管理,成为促进高质量数据集流通、激活人形机器人数据价值的关键。
LET数据集的捐赠将为这一痛点提供解决方案。目前,国地中心已建立覆盖数据采集、处理、质量审核、版本管理的全生命周期标准体系,可从源头确保数据质量与可用性,让不同来源的数据在OpenLoong社区以格式一致、标注清晰的形式呈现,为行业提供标准化、易复用的数据资产。
完善生态赋能行业长期研发
作为OpenLoong人形机器人全栈开源项目的重要组成部分,LET数据集将在开放原子开源基金会的孵化下持续运营维护、稳定更新,为行业提供系统化的真实场景数据资源。其加入不仅为 OpenLoong社区补充关键的真实世界数据,还将推动行业在任务建模、技能学习、策略验证等方向的深入研究,同时为开发者提供可用于性能验证的高质量样本。
目前,OpenLoong的数据生态已逐步形成覆盖基础能力训练、任务执行、多场景研究、真实环境验证的多层次体系。未来,社区将持续强化数据基础设施建设,为国内人形机器人行业提供统一可靠的技术支撑,助力产业加速落地。