阶跃星辰开源图像编辑模型 Step1X-Edit
来源:上海证券报·中国证券网
上证报中国证券网讯(记者孙小程)4月27日,阶跃星辰正式发布并开源图像编辑大模型Step1X-Edit。该模型总参数量为19B (7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持11类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。据介绍,Step1X-Edit不只能“改图”,更能“听得懂、改得准、保得住”。
在技术层面,Step1X-Edit采用MLLM(Multimodal LLM)+ Diffusion的解耦式架构,分别负责自然语言理解与高保真图像生成,相比现有图像编辑模型,该架构在指令泛化能力与图像可控性上更具优势。
MLLM模块负责处理自然语言指令与图像内容,具备多模态语义理解能力,可将复杂编辑需求解析为latent控制信号;Diffusion模块作为图像生成器(Image Decoder),根据MLLM生成的latent信号完成图像的重构或局部修改,确保图像细节保真与风格统一。这一结构打破了传统pipeline模型中“理解”和“生成”各自为政的问题,使模型在执行复杂编辑指令时具备更高的准确性与控制力。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》