商汤的“细胞分裂”,这次能成吗?
商汤把具身智能这块最硬的骨头,单独拎出来做一家公司了。
大晓机器人来了,王晓刚亲自挂帅董事长,陶大程任首席科学家,12月18日要正式亮相,同步开源“开悟”世界模型3.0。这步棋,是商汤“1+X”战略的又一次落地——“1”守住现金流,“X”冲出去抢赛道。
问题出在哪?
具身智能最大的瓶颈不是算法,是数据。现在主流靠遥操作,人穿动捕服教机器人,成本高、效率低、泛化差。你不可能让几百万厨师都穿上设备炒菜去喂模型。大晓的破局点就在这:搞“环境式数据采集”。用第一视角和第三视角摄像头,直接从真实场景里提取人类行为逻辑,相当于让AI像婴儿一样“看”着学。这个思路,明显在对标特斯拉Optimus的数据路线。
那它的技术底牌是什么?
两个关键词:Puffin 和 WorldMEM。
Puffin解决的是空间感问题——让AI理解相机位姿,能反推自己移动后会看到什么,实现真正的“预演”。WorldMEM则是打破时间限制,用线性注意力机制,让模型生成几分钟甚至更长的连贯交互视频,物体不会凭空消失。这两项加起来,才撑得起“多模态理解-生成-预测一体化”的架构。
更重要的是,他们选择开源。
“开悟”3.0不仅是国内首个开源且已商业应用的世界模型,还开放API、适配国产芯片,拉云厂商和应用方一起共建生态。这招很像DeepSeek在大模型领域的打法——用开源换规模,用规模换标准。一旦成为行业基座,后续的商业模式自然打开。
但关键变量还是那个:闭环能不能跑通?
技术再强,最终要看能不能在安防、巡检这些工业场景里规模化落地。大晓的具身超级大脑模组A1已经准备上车机器狗,合作方也有了,第一步走的是轻量化、垂直场景。这条路对,因为现阶段市场要的是“能用”,不是“全能”。
所以,核心挑战其实是两个:
一是独立融资后,能否持续投入高强度研发而不掉队;
二是和商汤的协同怎么维持——底层依赖“日日新”大模型和算力,但又要保持市场化敏捷性,平衡不好就会变成“半独立”。
目前颗粒度还不够,具体打法还没看到。但方向是对的:软硬一体、虚实闭环、开源筑基。
这场物理世界的智能革命,真正比拼的,不是谁先发论文,而是谁先把模型放进现实,摔打上千次后还能跑起来。