近日,智元机器人成功通过CR-3-06:2025《人形机器人数据集CR产品认证实施规则》,拿下业内首张人形机器人数据集产品CR认证证书,编号“001”,成为国内首批依据T/SAIAS 024—2025、T/SAIAS 025—2025、T/SAIAS 026—2025、T/SAIAS 027—2025系列团体标准获得认证的企业。

据介绍,本次认证体系全面评估了人形机器人数据集建设的四大核心要素:分类与编码规范、数据标注标准、统一数据集格式要求以及全面质量评价准则。

再看智元机器人推出的AgiBot World数据集,其作为全球首个基于全域真实场景、全能硬件平台、全程质量把控的真机数据集,构建了具身智能领域的“数据基准库”。
该数据集在规模与质量方面实现双重突破:长程数据规模较谷歌Open X-Embodiment数据集高出10倍,从抓取、推拉等基础操作,到搅拌、折叠、熨烫乃至内存条安装、餐具分拣等复杂长程任务,80%的任务时长集中在60-150秒,覆盖从基础操作到复杂长程任务的多组原子技能组合;场景覆盖面扩大100倍,数据质量从实验室级跃升至工业级标准。
在场景与任务覆盖上,AgiBot World数据集实现了全维度拓展。依托智元自建的3000多平方米数据采集工厂与应用实验基地,数据集复刻了家居、餐饮、工业、商超和办公五大核心场景,包含数百种真实子场景与3000多种真实物品。
例如,家居场景再现人类真实住宅布局,包括卧室、客厅、厨房、卫生间等核心空间,可以实现机器人家务清洁、物品整理和厨房任务等。
智元机器人介绍,AgiBot World数据集的高质量,得益于硬核硬件支撑与严苛质控体系。智元机器人为数据采集机器人精灵G1安装了8个环绕式布局的摄像头,让机器人可以实时360度全方位感知周围环境的动态变化。
与此同时,智元机器人数据采集全程遵循“多方参与规划-端云双重筛选-逐帧人工审核-算法二次验证”的严苛流程,从源头保障数据规范性与可用性。
在业内看来,数据已成为当前AI产业发展中最显著的短板之一,尤其在具身智能、机器人等与现实世界深度交互的领域,高质量数据的缺失严重制约了技术迭代与商业化落地。
与大语言模型所需要的数据不同,具身智能需应对现实环境中高度复杂、异构的场景,涉及的变量包括光线、声音、温度等,而此类数据难以通过传统方式大规模获取。
国泰海通证券计算机行业首席分析师杨林此前向上证报记者表示,未来专注于数据生产、处理与交易的企业将迎来重要机遇。当前,上海市等地方政府已开始对数据类企业进行针对性扶持,同时多地建立的大数据交易所,也在推动高质量AI数据的标准化流通与共享,这一领域值得市场重点关注。