如何定义具身智能“ChatGPT时刻”?宇树科技王兴兴:机器人能在陌生场景中完成80%的任务
来源:每日经济新闻
11月5日,在第八届虹桥国际经济论坛“人形机器人创新发展合作”分论坛上,宇树科技创始人兼首席执行官王兴兴发表了主题演讲。
王兴兴认为,今年机器人产业非常火热。不过,他也指出,机器人大模型进展比想象中缓慢,还没有达到临界值。王兴兴表示,具身智能大模型、端到端技术的进步,总体上非常快,但是比他想象的稍微慢一点点。
对于什么才是具身智能发展的临界点,即具身智能“ChatGPT时刻”,王兴兴认为,在陌生的场景中,给机器人发送语音或文字,若机器人能够完成80%左右的任务。这便是突破性技术,基本可以达到“ChatGPT时刻”。
那么,为了早日实现“ChatGPT时刻”,更应该研究模型,还是收集更多的数据?王兴兴表示,目前在模型结构上大家做了很多尝试,发现泛化能力不够,还需要创新。大家也需要收集更大规模的数据、质量更好的数据。但目前,对数据的采集、对数据质量的评判还非常困难。
王兴兴提出,模型和数据需要相辅相成,而不是一股脑采集大量数据,或者一股脑把模型做大。
目前,具身智能主流模型有VLA(视频语言动作)+RL(强化学习)模型和基于视频生成的世界模型。王兴兴表示,前者可以用仿真环境做训练,或者用真实场景做训练,但泛化能力相对来说不是特别够。因此,他更喜欢基于视频生成的世界模型。
然而,王兴兴也认为,该模型面临比较大的挑战。因为基于视频生成的世界模型对算力的需求非常大,需要的算力卡比较多,所以中小型人形机器人公司往往“跑不动”,反而是一些大型AI公司、互联网公司视频模型的资源更加丰富,做出该模型的概率更大。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》