高端人形机器人的训练数据,往往依赖最基础的人工采集方式。
据BusinessInsider报道,特斯拉正组建专项数据采集团队,用于训练Optimus机器人的类人动作。在8小时轮班中,采集员需重复上百次标准化动作,如端杯子、擦桌子、拉窗帘等;开工前会收到任务文件与操作手册,确保采集精准性,且每班至少需收集4小时有效视频素材。
与早期依赖动作捕捉服或手动操控不同,特斯拉目前改用摄像头采集数据。今年6月Optimus项目负责人米兰科瓦奇离职后,公司明确调整策略:“不依赖动作捕捉服,能扩大数据采集规模。”
数据采集对体能要求极高:除环境摄像头外,采集员头盔与负重背包上还需额外安装约5台摄像头全程记录。据加州弗里蒙特工厂知情人士透露,他们常佩戴耳机和沉重设备,在传送带旁整理零件,长期劳作导致多名员工因背包重量分布不均出现背部、颈部损伤,部分人因长时间佩戴头显患上晕动症。
团队规模峰值时,特斯拉超100人从事数据收集。背后是马斯克的人形机器人野心:今年三季度财报会议上,他宣布目标实现年产100万台Optimus,并表示未来该业务将占特斯拉整体价值的80%。
数据是提升机器人泛化能力的核心。华创证券指出,多模态训练数据的融合应用能显著增强环境感知与多任务处理能力;数据分真实与仿真两类,真实数据被称为“黄金数据”,训练效果最佳,但采集成本高且格式标准不一;仿真数据虽可低成本大规模生成,却因环境模拟局限导致模型适应性较弱。
“虚实结合”成为行业主流方案。国地共建人形机器人创新中心副总经理刘宇飞表示,已在全国8个省市落地虚实结合训练场景;IDC中国研究经理李君兰判断,行业正构建“海量高仿真物理数据+高质量真实采集数据”的混合数据底座,以加速提升智能系统的泛化能力。
据Research Nester今年9月发布的报告,2025年数据采集系统市场规模将超24亿美元,2035年达39.8亿美元,预测期(2026-2035年)复合年增长率约5.2%,2026年行业规模预计25.1亿美元。
不过,机器人训练正朝着“AI化”方向发展。如特斯拉近日官宣在自研世界模型中训练Optimus。东吴证券分析,当前企业虽采用世界模型、远程操控、仿真迁移及模拟训练等技术路径,但均存在局限,难以实现通用泛化能力,具身智能的训练方法仍需进一步突破。
来源:财联社
#11月基金投资策略##AI应用类股票大涨:短剧概念逆势走强##能源金属概念狂飙!锂电大周期来了?#