• 最近访问:
发表于 2025-06-29 14:51:59 股吧网页版
千寻智能解浚源:具身智能或处在GPT1-GPT3之间
来源:上海证券报·中国证券网 作者:操子怡

  6月28日,在青年科学家成果转化暨具身智能高质量发展研修会上,千寻智能具身智能部负责人解浚源表示,具身智能现状可能处在类似于GPT1-GPT3之间的阶段,VLA(视觉-语言-动作模型)的兴起为具身智能开启了“Scaling Law”的可能性。

  千寻智能创立于2024年2月,成立4个月就完成近2亿元种子轮+天使轮融资。今年3月,千寻智能刚刚宣布一笔5.28亿元人民币Pre-A轮融资,由阿美风险投资旗下Prosperity7 Ventures(P7)领投,招商局创投、广发信德、靖亚资本、东方富海、华控基金、达晨财智、柏睿资本、弘晖基金等参投。

  在千寻智能两位创始人中,韩峰涛曾任珞石机器人联合创始人CTO,有丰富的机器人制造和量产经验。另一位联合创始人高阳是清华大学交叉信息研究院的助理教授,同时也是千寻智能的首席科学家。

  解浚源表示,具身智能涵盖“本体”与 “运控”,即 “小脑” 与 “大脑”两大核心领域。在本体层面,机器人早已实现灵巧操作与高动态运动,机械性能长期领先于智能算法,而 “大脑” 层面的技术路径曾长期面临瓶颈。

  转折点出现在VLA模仿学习路线的兴起。他表示,Diffusion Policy生成模型解决了传统行为克隆的 “多模行为平均化” 难题,可从随机初始状态生成多元可行路径。而VLM(视觉语言模型)与Diffusion Policy的结合(即VLA范式),借助互联网数据预训练赋予模型 “世界先验知识”,仅需少量真机数据即可实现强泛化能力,为具身智能开启了 “Scaling Law”的可能性。

  大模型训练本质是“用规模换能力”,通过预训练积累通用知识,再通过指令微调与RLHF对齐人类需求,最终依托Scaling Law实现性能突破。

  解浚源表示,受大模型训练范式启发,千寻智能也是采用了类似的范式,通过“互联网数据预训练+真机数据模仿学习+强化学习优化” 的三段式架构:预训练阶段,利用互联网数据隐含的真实世界知识,让模型具备基础认知。模仿学习阶段,通过真机采集数据做模仿学习,最后用强化学习将成功率从95%提升至99%以上,补足最后精度缺口。

  解浚源将当前具身智能发展阶段类比为“GPT1-GPT3之间”,他认为若Scaling Law成立,通过量产与基础设施建设,机器人数据量按每年一个数量级递增。例如,今年百台、明年千台、后年万台,3年至5年内具身智能技术效果有望实现GPT1到GPT4级别的跨越。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500