智元机器人发布行业首个动作驱动世界模型开源平台GE_股市实战(gssz)股吧

股吧首页 > 股市实战吧 > 正文

最近访问：

股市实战吧

返回股市实战吧>>

- 重要股东股权质押数据全览

龙哥军机处

发表于 2025-08-15 10:21:00 股吧网页版发布于上海

智元机器人发布行业首个动作驱动世界模型开源平台GE

注：以下信息为市场信息汇总，不代表个人观点、不构成投资建议，请谨慎参考。

智元机器人于8月14日发布了面向真实世界机器人操控的统一世界模型平台——Genie Envisioner（GE），标志着机器人技术的一次重要突破。

1、颠覆传统模式

传统模式：机器人学习需分阶段（数据收集→训练→评估），环节割裂且依赖任务特定调优，泛化能力弱。

GE创新：将未来帧预测、策略学习与仿真评估整合为闭环视频生成架构，实现端到端的“看→想→动”推理

2、关键技术优势

- 视觉空间直接建模：区别于主流VLA（Vision-Language-Action）方法（需将视觉映射到语言空间），GE直接在视觉空间建模机器人与环境交互，完整保留时空动态信息。

- 三大核心能力：

跨本体泛化：仅需1小时（约250次演示）的遥操作数据，即可适配全新机器人平台；

长时序任务执行：在折叠纸盒等复杂任务中成功率达76%，显著超越竞品（0为48%，UniVLA/GR00T为0%）；

记忆机制优化：通过sparse memory模块选择性保留关键历史信息，提升上下文理解精度。

3、平台架构：三位一体闭环系统

E平台由三大组件协同构成闭环

GE-Base

定位：世界基础模型，基于3000小时真实机器人操控视频（超百万条数据）训练。

功能：解析环境空间布局与动作意图，生成未来视频片段。

GE-Act

定位：轻量级动作解码器（160M参数），实现意图到动作的转化。

性能：在200毫秒内生成54步动作序列，满足实时控制需求。

GE-Sim

定位：神经仿真器，复用GE-Base能力实现分层动作条件预测，支持低成本闭环评估与数据生成。

智元机器人已成功完成倒茶、擦桌面和制作三明治等长时序任务，操作成功率突破85%（如微波炉场景），在制造业中有效解决了“作业智能三角矛盾”（即泛化能力、成功率和操作效率），并聚焦于高成功率的商业化路径。此外，智元宣布开源全部代码、预训练模型及评测工具，以推动社区协作。开发者可以基于GE探索在线模型修正、触觉等多模态融合。

GE通过统一世界模型，使机器人从被动执行转变为“想象→验证→行动”的主动决策，开启了认知新纪元，被业内视为物理交互领域的基础模型，预示着具身智能的加速落地。在商业化路径上，智元机器人短期内将拓展传感器模态，支持全身移动与人机协作；长期则聚焦于智能制造（如工业装配）和服务机器人（如4S店销售场景）的闭环应用。同时，智元的生态伙伴涵盖硬件、软件及场景方案商，推动技术、场景和供应链的整合。

市场有风险，投资须谨慎。

#人形机器人产业链深度# $机器人ETF鹏华(SZ159278)$

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》