• 最近访问:
发表于 2025-07-30 15:37:40 股吧网页版
昆仑万维推出并开源Skywork UniPic
来源:证券日报


K图 300418_0

  本报讯 (记者李乔宇)7月30日,昆仑万维科技股份有限公司(以下简称“昆仑万维”)正式推出并开源采用自回归路线的多模态统一预训练模型Skywork UniPic,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力。该模型基于大规模高质量数据进行端到端预训练,具备良好的通用性与可迁移性。

  据悉,Skywork UniPic在单一模型中深度融合图像理解、文本生成图像(T2I)与图像编辑三大核心任务,构建了真正统一的多模态模型架构。

  传统多模态统一模型多依赖VQ或VAE编码器来压缩视觉内容,虽然具备一定效果,但也存在局限性。它们更侧重保留图像的视觉细节而非语义信息,这会在一定程度上削弱模型的图像理解能力。

  为此,Skywork UniPic团队借鉴Harmon架构设计,并在表征方式上做出关键调整。采用MAR编码器作为图像生成路径的视觉表征基础,同时引入SigLIP2作为图像理解路径的主干。

  此外,Skywork UniPic完成端到端优化流程,能够实现生成、理解、编辑三大能力的协同训练和相互促进,突破传统方法中能力权衡的技术瓶颈。这一架构设计不仅保持了自回归模型的简洁高效,更通过共享编码器实现了跨任务的深度协同,为多模态统一模型的实用化部署奠定了基础。

  在追求模型能力极限的同时,Skywork UniPic也坚持效率重要性的设计理念。Skywork UniPic以1.5B的紧凑参数规模,在无CoT(思维链)的情况下取得了SOTA(“当前最佳水平”)分数,逼近部分较大模型带CoT的0.88分;在DPG-Bench复杂指令生图基准上达到85.5分的行业SOTA水平。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500