证券时报记者从快手获悉,12月3日,快手旗下可灵AI正式推出视频生成2.6模型,该模型提供“音画同出”能力,改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程。
据了解,此次模型升级了文生音画、图生音画两大功能。拥有“音画同出”能力的可灵视频生成2.6模型,能够在单次生成中,输出包含自然语言、动作音效以及环境氛围音的完整视频。其重构了当前AI视频的创作工作流,极大提升创作效率。
通过对物理世界声音与动态画面的深度语义对齐,可灵2.6模型在音画协同、音频质量和语义理解上表现亮眼,同时在中文语音生成效果上保持全球领先。目前,语音支持生成中文与英文,生成的视频长度最长可达10秒。
可灵AI公布了多段视频,涉及赛事解说、多人对白、音乐表演等多个场景,视频音画均自然、同步且流畅。
快手可灵AI自诞生以来,已经历多次重要更新迭代。今年9月底,可灵推出2.5 Turbo模型,其在文本响应、动态效果、风格保持、美学质量等多个维度实现提升。
通过不断迭代升级,可灵AI目前已在视频生成领域占据重要“生态位”。可灵AI在商业化营收上也不断取得突破,根据快手公布的数据,预计2025年可灵AI全年收入将达到1.4亿美元(约10亿元人民币),较年初制定的6000万美元(约4.3亿元人民币)目标提升超过100%。
在不久前举行的快手2025年第三季度业绩电话会上,快手科技创始人兼首席执行官程一笑表示,可灵的愿景非常清晰,即“让每个人都能用AI讲出好故事”,公司将聚焦于AI影视创作这一核心目标,聚合资源深入打磨技术与产品能力。
在具体迭代方向上,可灵将围绕技术领先性与产品想象力双线推进,围绕多模态交互理念(如MVL),结合用户需求洞察与技术突破持续升级基础模型与产品能力。
此外,针对投资者普遍关注的AI相关Capex投入与利润率目标问题,快手科技首席财务官金秉表示,今年第三季度,公司在探索AI技术与内外部应用场景结合方面取得了不错的进展,AI在给业务赋能的同时,也在内部组织基建上实现了质效提升。
在可灵收入增长与AI业务整体进展超预期的背景下,金秉表示,公司正在不断追加算力投入。鉴于用户对视频生成模型的需求持续增强,快手已多次扩充可灵在推理侧的算力;同时随着模型加速迭代,公司也开始提升训练算力,以保持可灵在技术上的前沿性和竞争力。
金秉提到,除可灵本身外,快手在其他AI业务赋能方面也同步增加了相关资本开支。综合来看,公司预计2025年集团整体Capex支出将较去年实现中高双位数的增长。