Вышла новая модель для редактирования изображений Qwen-Image-Edit
Новая модель Qwen-Image-Edit (https://huggingface.co/Qwen/Qwen-Image-Edit) для редактирования изображений создана на базе Qwen-Image 20B.
Она имеет двойной контроль. Для это она использует Qwen2.5-VL (семантика) + VAE Encoder (внешний вид). У модели есть семантическое редактирование. Заключается оно в изменение контента с сохранением смысла (стиль, вращение объекта, создание IP). К тому же есть визуальное редактирование это точное изменение/добавление/удаление элементов без изменения остального изображения. Есть точная работа с текстом. Это даёт прямое редактирование (добавление/удаление/изменение) англ./кит. текста в изображениях с сохранением стиля.
Модель может похвастаться лидирующими результатами(SOTA) в тестах.
Пример работы:
Изначальный промт для Qwen-Image:
Цветок из бусинок под дождём в глиняном горшке, высокая детализация.
Промт редактирования изображения для Qwen-Image-Edit:
Теперь ясная погода и светит солнце.