上周五,谷歌DeepMind首次开放了“精灵计划”(Project Genie),这是世界模型Genie 3的实验性研究原型,也被看作目前最先进的世界模型之一。
一时间,Genie 3刷屏各大社区,用户通过自然语言输入提示词或上传一张图片,即可生成一个可交互的虚拟空间,可操纵角色自由行动。一名推特用户展示了其用Genie 3生成的复制版任天堂游戏《塞尔达传说:旷野之息》,用户操控主角林克从山顶用滑翔伞飞下,左右转动视角能看见山水环绕,虽仍有粗糙之处,但也足以惊艳。
如果用一句话就能生成一个游戏,游戏引擎的行业核心地位是否将面临颠覆?“精灵计划”开放当天,游戏引擎巨头公司Unity股价暴跌,当地时间1月30日跌幅最高达27%,收盘跌24.22%。市场的担忧情绪延续至本周,当地时间2月2日、2月3日、2月4日,Unity股价收盘分别跌1%、10.2%、3.59%。
与Sora等视频生成大模型不同的是,Genie 3的逻辑是根据用户的动作实时生成前方路径,在这个动态虚拟世界里以每秒24帧的速度渲染环境,分辨率达720P。Genie 3还展现出对物理规律的初步理解,并具备一致性。
“Genie 3确实展现出新的可能性。在游戏引擎中制作游戏通常需要地形编辑、布局场景、设置光照系统、角色原画和建模等等,步骤非常繁琐,但现在用提示词就能生成一个可交互的场景,不需要上述步骤。”一名游戏引擎开发者韩志向蓝鲸科技记者表示。
对于市场的担忧情绪,Unity CEO Matthew Bromberg发文解释称,他们并未将世界模型的发展视为游戏引擎的风险,反而是一种强大的加速器,标志着全行业的人工智能驱动式开发迈出了具有重要意义的一步。Matthew Bromberg还表示,世界模型的编辑主要通过提示词完成,这在一定程度上限制了专业游戏制作所需的确定性与精准度。因此,其生成结果仍具有概率性与非确定性,尚无法应用于对玩家体验有一致性、可重复性要求的游戏开发。
AI世界编辑器《时空码头》负责人李豪表示,目前而言,Genie 3只能生成一段60秒以内、可被键盘操作影响的视频画面,并不是3D场景建模,暂时谈不上对游戏引擎的颠覆。“一个好玩的游戏需要更深度的交互,也需要更好的美术视觉体验。人类开发者最终还是要做好玩的游戏,AI的价值在于提高生产力。”李豪说。
谷歌也承认,目前Genie 3仍处于开发早期阶段,存在60秒时长限制、角色控制延迟、不完全符合现实世界物理规律等缺陷。从用户释出的作品来看,角色只能上下左右移动,游戏性有限。
不过,世界模型发展对游戏引擎公司的影响尚未能下定结论。韩志坦言,作为一线游戏引擎开发者,面对Genie 3是“有危机感的”,在大模型井喷的时代下,自己会在日常工作中“想办法往AI上靠”,运用AI工具给生产流程提效。他表示,目前来看,游戏开发者可能可以借助世界模型完成游戏Demo,却仍需使用游戏引擎完善产品,“但技术的发展边界还在探寻,未来AI和游戏引擎肯定要深度融合。”韩志说。
“Genie与Unity更可能是合作关系。Unity开发者可以将AI生成的素材使用Unity的工具固定位为确定、结构化、可控的体验,提升开发效率。”中信证券研报指出,玩家对于3A游戏的热爱并未被动摇,工具升级只会让公司的游戏开发更快、制作更精良。
除了Genie 3,另一技术路径、李飞飞创业公司World Labs发布的Marble也是备受市场关注的世界模型,Marble的虚拟世界并非实时生成,但精度更高。李豪表示,他考虑到AI技术迭代与世界模型发展之快,目前正全力投入到AI游戏研发之中。
李豪认为,随着世界模型与游戏结合越来越深,构建一个交互场景的成本会变得更低,照此逻辑,一些独立游戏也会变得越来越短。比如,当一个“热梗”发生后,游戏开发者可以用AI快速搭建一个由“热梗”延伸而来的交互游戏,只需一两分钟,用户体验完成即结束,消费闭环会更短。
“我们始终是围绕人的需求来生产消费内容,而不是拿着锤子找钉子。玩家要的是更好的游戏体验,而不是技术本身。真正的落地是考虑用户愿不愿意玩这个游戏,那么开发者只需要找到一个小切入点,而不是都去做一个大世界。”李豪说道。