就在7月27日,世界人工智能大会(WAIC)期间,腾讯那边放了个大招,正式发布了业界首个开源的3D世界生成模型——混元3D世界模型1.0,还非常大方地同步开源了模型能力。
这事儿可以说是腾讯在3D内容生成领域搞出的大突破了,给游戏开发、VR、数字内容创作这些行当,带来了全新的想象空间。当时在腾讯AI论坛上,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声亲自宣布,用户现在只需要输入一句话或者甩一张图,几分钟内就能生成一个可以自由漫游的3D世界,并且直接输出标准化的3D资产。厉害吗?生产周期被大大缩短了。
这东西到底有多牛?
这么说吧,这个混元3D世界模型1.0,号称是业界第一个,注意是第一个,不仅开源,还能让你沉浸式漫游、交互、甚至做仿真的世界生成模型。它支持文本和图像两种输入方式,你给个简单的描述或者参考图,它就能给你吐出一个空间感一致、能让你自由“逛街”的完整3D场景。生成出来的还是个封闭式空间,你可以用键盘控制视角和移动,实现360的自由行走和环视,跟玩游戏似的。
最关键的一点是,输出的结果用的是标准的3D Mesh格式,这意味着什么?意味着能跟Unity、Unreal、Blender这些主流引擎无缝兼容,可以直接拿去做游戏原型验证、动画制作或者仿真建模。我了解到,这模型已经初步用在游戏开发、具身智能仿真、XR内容制作这些场景里了,对简化3D场景构建流程,效果拔群。就算你是个完全没建模经验的小白,通过那个混元3D创作引擎,也能快速搞出沉浸式的视觉空间,还能无缝导入到Vision Pro这种虚拟头显里,体验感直接拉满。
圈内人怎么看?
观点一基本认为:腾讯这波发布加开源的操作,标志着它在3D技术上有了重大突破,而且姿态很开放,要带着大家一起玩。支撑这个看法的依据很实在:首先,混元3D世界生成模型能基于文字或图像,快速生成高质量的3D资产;其次,腾讯选择开源,在全球开发者圈子里关注度很高,据说下载量已经超过了数百万次;最后,这模型已经在游戏、工业设计、虚拟仿真这些领域露了脸,还在腾讯地图这种自家产品里用上了,应用前景很广。
另一个观点则强调:混元3D 2.1大模型的开源,直接把3D内容创作这事儿带到了一个新阶段,大大降低了技术门槛和经济成本。你要知道,这可是业界首个实现“全链路开源”的3D内容生成解决方案。更狠的是,它优化了对消费级硬件的适配,意思是你用自己的普通个人电脑就能跑,不需要什么专业设备。而且生成质量上,它在文生3D和图生3D的好几个评测里都排第一,对复杂3D结构的建模能力也更强。
大家怎么看腾讯这波操作?