可灵AI发布2.0视频生成模型，全球用户突破2200万_快手-W(hk01024)股吧

股吧首页 > 快手-W吧 > 正文

最近访问：

快手-W吧

返回快手-W吧>>

- 重要股东股权质押数据全览

快手-W资讯

发表于 2025-04-17 08:52:50 股吧网页版

可灵AI发布2.0视频生成模型，全球用户突破2200万

来源：南方都市报

　　近日，快手可灵AI宣布基座模型再次升级，面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。数据显示，自去年6月发布以来，可灵AI已累计完成超20次迭代，截至目前，全球用户规模突破2200万。

　　可灵AI全球用户突破2000万

　　据悉，作为全球首个用户可用的DiT视频生成模型，可灵AI已经累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里，可灵AI的月活用户数量增长了25倍。截至目前，可灵AI全球用户规模已突破2200万。

　　快手高级副总裁、社区科学线负责人盖坤认为，AI在辅助创意表达上拥有巨大潜力，但当前的行业发展现状还远远无法满足用户需求，在AI生成内容的稳定性以及用户复杂创意的精确传达上仍有“很多挑战”。也因此，要真正实现“用AI讲好每一个故事”的愿景，必须对基模型能力进行全方位提升，定义人和AI交互的“全新语言”。

　　在本次2.0模型的迭代中，可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language（MVL），让用户能够结合图像参考、视频片段等多模态信息，将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意，直接高效地传达给AI。

　　基于MVL理念，可灵AI正式推出多模态编辑功能。“从今天起，大家可以在可灵AI的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式表作为输入，生成符合自己想法的创意视频。”盖坤介绍，MMW（多模态描述子）将不只局限于图片和视频，也可以引入其它模态的信息，例如声音、运动轨迹等，让用户实现更加丰富的表达。

　　同时，快手还发布了全新的可灵2.0大师版，全面升级了视频及图像创作可控生成与编辑能力，上线全新的多模态视频编辑功能，能灵活理解用户意图。支持在一段视频的基础之上，通过输入图片或文字，对生成的视频内容实现元素的增加、删减、替换，帮助创作者们实现更加灵活的二次编辑和处理。

　　可灵2.0大师版操作界面

　　可灵AI接入数千家B端商家

　　快手副总裁、可灵AI负责人张迪透露，当前，图生视频约占到可灵AI视频创作量的85%，图片质量也对视频的生成效果产生重要作用。因此，可图2.0文生图能力迎来全面升级，包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上，可图2.0可支持60多种风格化的效果转绘，模型出图创意和想象力实现大幅跃升。

　　同时，可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图，支持图片的增加、修改和修复。在图像的多模态可控生成中，可图2.0还上线了全新的风格转绘功能，只需要上传一张图片加上风格描述，就能一键切换图片的艺术风格，同时精准保留原图的语义内容。

　　值得一提的是，除了C端订阅用户，可灵AI也面向B端商家提供API接入等服务。目前，可灵AI已与小米、亚马逊云科技、阿里云、Freepik、蓝色光标等数千家国内外企业客户建立了合作关系。如今，可灵正在成为AI时代视频创作的新基础设施。AIGC技术的迅猛发展，也正在重构包括广告营销、专业创作、影视、娱乐创意等在内的多个行业。

（文章来源：南方都市报） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

郑重声明：用户在社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》