“准多齐美真”,阿里发布图像模型Qwen-Image-2.0
来源:新京报
新京报贝壳财经讯(记者罗亦丹)2月10日,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。千问视觉生成负责人吴晨飞在线上发布会上以“准多齐美真”形容该模型的能力。
新京报贝壳财经记者参与发布会发现,上述五字可以简要理解为该模型在进行文字或图像生成时“渲染准、指令多、排版美、文字真、排布齐”。
在演示中,新京报贝壳财经记者注意到,该模型可以支持高达1K tokens的文字输出,并在汉字渲染方面展现了优势,如吴晨飞演示了《兰亭集序》的图片生成,结果不仅生成了人物画面,还生成了以王羲之小楷为字体的数百字古文。
吴晨飞演示《兰亭集序》AI图片生成。
在模型评分方面,作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,超过Seedream4.5、Flux2-Max等模型,仅次于谷歌Nano Banana Pro和GPT Image1.5。
不过,新京报贝壳财经记者也注意到,同日,字节旗下的图像生成模型Seedream已经升级至5.0,这预示着阿里和字节旗下的图像生成模型将迎来一场“正面对决”。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》