“端到端的自动驾驶,本质上是模仿我们人类的行为。但它始终面临着两个比较重要的问题。”在近日开幕的2025世界人工智能大会WAIC上,商汤绝影CEO、商汤科技联合创始人王晓刚发表了一场主题演讲。
“第一个问题,是需要采集海量的数据。我们知道特斯拉有700万台的量产车去回流大量数据,这是远远超出我们拥有的量产车辆数据的体量和规模的。第二个呢,它还需要覆盖各种高风险的场景数据。”
王晓刚提到,今天人类驾驶的行为中,只有极少部分数据能对端到端产生训练价值,这就是数据瓶颈。而且,研究者还不能确保训练好的模型能解决特定场景,里面有概率性的问题,特定场景也很难复现。

因而,此次商汤绝影在WAIC 2025亮相的行业首个已量产、可交互的“绝影开悟”世界模型,正是为了解决这些痛点而诞生的。
这也是辅助驾驶领域首个生成式世界模型产品平台,配合该公司发布的业内最大规模的生成式驾驶数据集“WorldSim-Drive”,能大力赋能辅助驾驶行业。
“商汤的世界模型正在将AI的创造力转化为生产力,既为辅助驾驶生成千万级场景数据、打造实时交互训练场,同时也打造具身智能的数据引擎,搭建AI从数字世界通往真实物理世界的桥梁,迈向具身智能的新未来。”王晓刚补充。
在今年WAIC 2025的商汤绝影展台上,现场观众已经体验到了这个世界模型产品平台。它的交互界面简洁易懂,只要输入文本或点选场景图片,就能生成的对应的场景视频,体验到行业领先的辅助驾驶数据集性能。
值得一提的是,“绝影开悟”世界模型的生产效率很高,基于一张A100的GPU,它每天生成的数据就相当于10台真实车或是100台路测车的数据采集能力,比得上500台量产车。根据官方数据,现在商汤绝影有20%的数据都是通过世界模型生产的。
为AI打造4D实时交互训练场
在今年的WAIC现场,各种会思考、会说话、会干活、会打架的机器人登台亮相,博得了无数人的关注。但我们距离它们走进千行百业、千家万户的那一天,依然有着不小的距离。
最大的障碍之一,就是训练数据严重缺失。就像银河通用机器人创始人及CTO王鹤提到的,今天最头部的机器人企业年出货量也只有四位数,其采集的真实数据相当有限,因此他认为,具身智能的训练数据99%都需来源于合成。
“正是自然语言的高知识密度,赋予了模型强大的泛化与通用能力,成为当今通用AI发展的关键基石。”商汤科技董事长兼CEO徐立认为,如今AI模型强大的泛化与通用能力,正是得益于GPT-3处理的文本量相当于人类十万年的创作积累,但当前自然语言数据可能于2027至2028年耗尽,“视觉数据虽丰富,却难以有效提炼知识。事实上,视觉数据的产生速度远落后于算力增长速度,导致模型数据需求出现‘倒挂’。”
人类沉浸在虚拟世界中游戏、训练的场景,大家如今已经不陌生。那要是反过来,让AI在媲美真实物理世界中的虚拟模型中,不断自我学习,进化出适应真实世界的能力,是不是就能解决很大问题?其背后技术的核心关键点又在哪里?

王晓刚认为,首先,这个世界模型必须具有超大尺度的4D空间重建能力。比如,“绝影开悟”能够进行最高可达1km²的真实世界高精度重建,将更多真实空间视角提供给车端模型。
“比如我们可以在模型中生成各种碰撞场景,这些都是非常高风险的,在真实生活中采集这类数据,代价是非常高的。”他继续举例,“另外呢,我们也可以对视频进行任意编辑,比如移除任何一个车辆,增加一个车辆,或者是改变车辆的类型,或是随意控制刹车、转向加速。”
他还提到,商汤如今正在将这个世界模型产品平台化,“把我们的API(应用程序开发接口)释放给我们的客户后,就能够随意输入你想要的各种要素,灵活地去定制。”
“所以说,如果我们能够引入世界模型,模拟我们的大千世界的各种变化,去生成十几个摄像头多模态的数据,并做到精准可控,让端到端模型进行强化学习,他就可以实现自主的进化,去打破人类驾驶行为的上限。”在王晓刚看来,这一平台不仅能应用在智能辅助驾驶的训练上,也可以帮助具身智能领域,让机器人更好地演进。
未来人类会因何而不同?
上世纪50年代,当艾伦·图灵提出“机器可以思考吗?”这个问题时,可能很难想象,半个世纪后AI已经学会了推理,而机器人已经实现了很多之前只存在于科幻小说中的功能。
到了今天,当2025WAIC的观众为展览现场的机器人欢呼时,另一些学界大咖如AI教父辛顿Geofrrey Hinton则提醒人们,与AI的关系要避免陷入养虎为患的境地。
那么,在未来的人机共存时代,有什么方法能让人类保持独特性呢?
在王晓刚看来,这涉及智能的几个层次:“依次是从感知到行为,其实还有一个更高的层次,就是定义规则。比如AlphGo,我们定义了围棋的规则,它就在这个规则范围之内产生各种各样的智能。我觉得,将来机器人一定会在它跟人和环境交互当中产生新的智能,这里比较重要的是,我们要去给它定义规则、它的价值观和文化,让它在规则允许的范围内产生规则,从上而下去约束它。”