• 最近访问:
发表于 2026-03-02 20:47:10 股吧网页版
星动纪元陈建宇×斯坦福Chelsea团队发布VLAW 世界模型×VLA协同进化
来源:证券时报网 作者:王小伟

  在这轮具身智能的浪潮中,世界模型始终被寄予厚望,被视为机器人成长路上的“虚拟训练场”。不过也面临物理保真度不足、预测过于乐观等问题。

  记者3月2日获悉,星动纪元创始人陈建宇团队与斯坦福大学教授Chelsea Finn(PI创始人)团队再度合作,发布VLAW框架,首次实现VLA策略与动作条件世界模型的协同迭代优化。

  星动纪元目前拥有全尺寸人形双足机器人星动L7、轮式服务机器人星动Q5及灵巧手星动XHAND系列等三大产品线,其产品已经在海内外物流、商业服务行业投入使用,实现产品规模化交付。

  从陈建宇团队与Chelsea Finn发布VLAW框架来看,该技术通过“真实数据校准世界模型,虚拟数据反哺机器人策略”的闭环机制,突破了传统世界模型“盲目乐观”、物理保真度低的瓶颈,为具身智能的规模化训练提供了新范式。

  业内介绍,世界模型被视为解决机器人试错成本高昂的关键工具——理论上,机器人可在虚拟空间无限次训练,无需担心硬件损耗。然而,现有模型普遍存在两大致命缺陷:训练数据多为成功轨迹导致的“过度乐观”偏见,以及对碰撞、摩擦等接触密集型交互的模拟失真。

  VLAW框架通过四步迭代破解这一难题:首先利用VLA策略在真实环境采集的成败数据微调世界模型,消除其“空想”倾向;继而基于Qwen-VL构建视觉-语言奖励模型,自动评判合成数据质量;随后让机器人在校准后的世界模型中大规模想象式训练;最终混合真实与高质量虚拟数据优化策略。

  在DROID平台的实测中,针对堆叠积木、打开书本、擦除白板等涉及复杂物理交互的任务,经VLAW校准的世界模型在PSNR、SSIM等视频质量指标上全面超越基线模型,假阳性率显著降低。相比传统方法,VLAW支撑下的机器人策略在五类任务中均实现成功率大幅提升。

  研究团队指出,该框架的核心价值在于构建了“越训练越精准”的飞轮效应:VLA策略产生的真实交互数据持续提升世界模型保真度,而高精度的世界模型又能生成更优质的训练数据。未来,随着视频生成模型与机器人数据的进一步融合,“先在虚拟世界满级,再落地真实场景”或将成为通用机器人训练的标准路径。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500