据《科创板日报》11月5日消息,在第八届虹桥国际经济论坛“人形机器人创新发展合作”分论坛上,宇树科技创始人王兴兴在主题演讲中表示,今年机器人产业呈现火热态势,其个人乐观预测,中国智能机器产业的平均增速至少可达50%-100%。该数据虽源于个人预判,但近期出口数据显示,我国工业机器人出口额同比增长54.9%。“工业机器人领域已实现如此显著的增长,智能机器人领域的增速更应达到100%左右。今年的火热,离不开政策的有力支持。”
他同时指出,当前机器人大模型的研发进度略低于预期,尚未达到技术临界点。“以宇树科技为例,我们在深度强化学习驱动的全身运动控制领域,今年的进步有目共睹,且每个月都在快速迭代。不过在具身大模型及端到端任务执行领域,技术突破速度比预想稍缓,但整体仍在加速推进。”王兴兴认为,当前机器人大模型的发展阶段,与ChatGPT正式发布前1-3年的技术探索期相似,“尽管已明确方向,但尚未出现突破性成果,尚未达到成熟应用的临界点。”
关于具身智能发展中模型与数据的优先级,王兴兴强调两者需协同优化。“目前简单模型结构的优化已较为充分,但泛化能力仍有不足,需在模型架构上寻求创新;同时,行业虽期待更高质量、更大规模的数据支撑,但数据采集及质量评估的难度也实实在在存在。这两方面相辅相成,需长期投入而非盲目追求数据规模或模型体量,当前行业面临的核心挑战在于如何在模型创新、数据采集与质量把控上形成有效协同。”
在谈及何时能实现具身智能领域的“ChatGPT时刻”时,王兴兴提出,这一时刻的标志是机器人能在完全陌生的生活场景中,通过语音或文字指令完成约80%的任务。“这一场景下,机器人无需预训练即可实现高成功率,是极具突破性的进展,也是接近‘ChatGPT时刻’的关键目标。宇树科技计划在未来1-2年内达成这一目标,不过他坦言,当前全球AI技术研发仍存在较大的不确定性,若未来1-2年有企业能实现这一突破,将成为全球领先的具身智能AI模型。”
针对当前具身智能领域的两种主流模型——VLA(视觉语言模型)与世界模型,王兴兴更倾向于后者。他认为,架构相对简洁的VLA+RL模型虽可通过仿真或真实场景训练,是当前主流选择,但泛化能力仍有不足;而基于视频生成的世界模型虽更符合他的技术偏好,却因对算力需求极高(需大量算力卡支持),中小机器人公司难以负担,反倒是具备充足算力资源的大型AI或互联网企业更可能取得突破。
来源:科创板日报
#4000点 到底要不要止盈?##HBM4定价超预期!存储芯片迎超级周期##A股低开高走!国际资本看好中国资产#