AI视频生成赛道又热闹起来了。4月,快手可灵发布2.0视频生成模型,6月,字节跳动发布了即梦3.0 Pro视频模型,就在昨天,谷歌宣布Veo3正式上线,今天MiniMax也加入混战队列,开始卷性价比了。
6月18日,MiniMax在海内外官方平台宣布,新视频生成模型海螺AI(海螺02)上线,同时发布了一段大秀杂技的AI视频。官方表示,这段视频是由3位艺术家耗时1.5天,使用海螺02生成的多个6-10s视频,再拼接剪辑而成。

杂技画面对AI视频生成来说一直是较有难度的内容,此前AI生成画面时往往肢体拼接混乱,无法准确模仿复杂的人类动作。从此次画面效果来看无论是光影、人类动作、物理模仿都完成得很好。
不过,需要指出的是,有AI创作者对第一财经表示,AI视频生成还涉及一个成功率的问题,因此样片是完美的,但过程中他们进行了多少次“抽卡”,外界并不能知晓。所谓抽卡指的是, AI往往不是一次就能成功生成用户想要的画面,可能会有出错的概率,因此行业会选择多次生成直到得到自己想要的画面。
不过,即便如此,上述AI创作者认为,这次海螺AI的更新是不错的,行业整体水平都在提升。
在竞技场Artificial Analysis Video Arena上,目前图生视频的排行榜里,新版的海螺AI排在第二位,第一是字节的视频生成模型 Seedance 1.0 pro,也就是刚更新不久的即梦3.0 Pro。排在第三位的是谷歌最新的Veo3,快手可灵的两个版本排在第四和第五位。

当然,评分不能说明所有问题,有从业者对记者表示,可以将这类竞技场类比成高考,可以通过做题去达到规则的要求,但这些评分至少是个参考。
在X平台,有不少博主用户对海螺02进行了测试,记者发现,大多数博主都提到,海螺02视频模型的物理运动效果很好。有博主评测认为“海螺02似乎是第一个准确呈现泪珠的平台”。

虽然这些画面令人印象深刻,但真正工业化场景用起来还需要更多的测试。一家影视公司@Fugazy Film就表示,他更想看的是剑斗场面,“我们有一个电影项目正在筹备中,但我不知道在这些平台中,是否能把剑斗和电影化的战斗处理做好,否则项目就不能继续推进。”
这次除了性能的提升,海螺AI也卷起了价格。官方表示,得益于架构创新,现在可以给创作者提供业内最优的价格。

从表格来看,不论对比国内大厂,还是海外大厂以及创业公司,海螺AI都是最便宜的,花费1000元能生成1.7万条1080p视频,字节的即梦是1.4万条,可灵是5000条,谷歌的Veo3是2000条。
不过,还要注意的是,除了看价格,还得看“抽卡率”,如果以更高的价格,能以更少地步骤生成想要的视频,这也是另一种性价比。目前还要观察从业者的实际应用体验。
海螺在这次发布时还提到,从去年8月底发布海螺视频,至今为止帮助创作者生成了超过3.7亿个视频。
在4月发布时,快手可灵也公布了一些更丰富的用户创作数据,可以作为比较。截至2025年4月,可灵AI全球用户规模突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今年4月的时间里,可灵AI的月活用户数量增长25倍。
在发布2025年一季度财报时, 快手还透露了可灵AI的赚钱能力——季度营收超过1.5亿元。在视频生成早期达到这一收入,意味着AI视频领域的商业化前景可期,市场潜力巨大。
中金此前发布研报称,可灵AI如独立分拆,估值约为60亿美元,显示出其巨大的商业价值。根据POE调查报告,快手可灵系列AI影片工具在全球市场的占有率为30.7%,逐步渗透专业市场,聚焦高价值用户。
海螺AI在去年9月发布后,在AI创作者群体中有不小的声量,但随着行业各家纷纷迭代新版本,在迅速变化的市场中,海螺AI看起来落后了。此次发布新版本,“在巨大竞争中一步一个脚印地(爬)回到全球SOTA”,重回排行榜前列,太不容易了,MiniMax一位负责人在朋友圈感慨。
在去年MiniMax第一次发布海螺时,第一财经记者曾问及MiniMax创始人闫俊杰,布局视频生成有哪些必要性,闫俊杰彼时认为,人类社会的信息更多体现在多模态内容上,活中字交互只是很的部分,更多的是语和视频交互。
因此,为了能够有非常高的用户覆盖度,以及更高的使用深度,作为大模型厂商,唯一的办法是能够输出多模态的内容,而不是只是输出单纯的基于文字的内容。“一定要能做多模态。” 闫俊杰说。
从这几个月来看,视频生成赛道又开始卷起来了,但这仍然只是技术迭代的初期,最终谁能胜出,抢占市场还未可知。