高端的机器人数据,往往采用最朴素的采集方法。
据BusinessInsider报道,特斯拉正在利用一支数据采集团队,来训练Optimus机器人如何像人类一样行动。在长达8小时的轮班中,数据采集员需要重复数百次同样的动作,包括拿杯子、擦桌子、拉窗帘等。在工作开始前,他们会收到任务指派文件和操作手册,以确保数据采集工作正确完成。据悉,每名员工每班需要收集至少4个小时的可用视频素材。
值得一提的是,目前特斯拉通过摄像头采集数据,而非像过去一样使用动作捕捉服或手动控制来训练机器人。今年6月,在Optimus项目负责人米兰·科瓦奇(Milan Kovac)离职后,该公司向数据采集团队告知了这一决定:“如果不使用动作捕捉服,数据采集的规模会更大。”
数据采集工作对员工体力提出了较高要求,除了环境周围的摄像头,每名数据采集员工还需在头盔和沉重的背包上搭载约5台摄像头用以全程记录。据知情人士透露,在特斯拉加州弗里蒙特工厂,数据采集员佩戴着耳机和背包,整理车辆零件并在传送带上工作。
长期的体力劳动给员工的身体带来了不小的负担,有员工透露,由于背包重量分布不均,其背部和颈部曾在工作期间受伤。另有员工指出,有数据采集员曾因长时间佩戴头显设备而患上了晕动症。
从数据采集团队规模来看,报道指出,在鼎盛时期,特斯拉拥有超过100名员工从事数据收集工作。在此背后是马斯克的人形机器人宏愿:在今年三季度特斯拉财报会议上,马斯克宣称公司将实现年产100万台Optimus的目标。他还表示,在未来,人形机器人业务将占据特斯拉价值的80%左右。
一直以来,数据都被视作人形机器人泛化能力提升的关键。华创证券指出,多模态训练数据集的融合将大幅提升机器人的环境感知能力和多任务处理能力。分类来看,数据主要分为真实数据与仿真数据,其中真实数据被公认为训练效果最好的“黄金数据”,但采集成本更高,并且格式不统一。相比之下,仿真数据可以大规模生成,成本低廉,但训练出来的模型往往不适应。
值此背景下,“虚实结合”是当下机器人行业采集数据的主流方案。国地共建人形机器人创新中心副总经理刘宇飞表示,已在全国8个省市开展了虚实结合的训练场工作。IDC中国研究经理李君兰判断,行业预计将基于海量高仿真物理数据,结合高质量的真实采集数据,构建坚实的数据底座,从而快速提升智能的泛化能力。
根据Research Nester今年9月发布的《数据采集系统市场规模及预测》报告,2025年数据采集系统市场规模超过24亿美元,预计到2035年将达到39.8亿美元,在预测期内(即2026-2035年)的复合年增长率约为5.2%。2026年,数据采集系统的行业规模估计为25.1亿美元。
不过与此同时,有迹象表明,未来机器人训练有望实现“AI化”。如特斯拉近日官宣在自研世界模型中训练Optimus。东吴证券表示,目前企业多采用世界模型、遥控操作、仿真迁移、模拟训练等方法,但都有局限性,无法获得通用泛化能力。具身智能的学习训练方法还有待探索。
