Вышла новая модель для генерации изображений Ideogram 4.0
Размещена новая открытая модель Ideogram 4.0 (https://huggingface.co/ideogram-ai/ideogram-4-fp8) для дизайна с 9.3B параметров.
Qwen3-VL-8B-Instruct, предназначенный только для текста, сделали текстовым кодировщиком с использованием скрытых состояний с 13 слоями, соединёнными по оси признаков.
Промты отправляются только в структурированном формате JSON (описание, стиль, цветовая палитра, ограничивающие рамки, текстовые элементы) и перед генерацией проверяются пайплайном.
За генерацию отвечают замороженный кодировщик (Qwen3-VL), обучаемый DiT (9.3B), Euler flow-matching сэмплер с асимметричным CFG (безусловный проход полностью отбрасывает текстовые токены) и замороженный VAE-декодер (из латента в пиксели).
Она способна управлять до 16 HEX-цветами палитры на изображении, точно размещать объекты через ограничивающие рамки и писать многострочный текст заданной стилистики, а также поддерживает работу с разрешениями от 256 до 2048 px, гибкими соотношениями сторон и шумовым графиком, адаптирующимся под разрешение.
Безопасность обеспечили за счёт фильтрации обучающих данных, посттренировочных процедур и Hive-модерации промтов и результатов.
В результате точность текста 0.97 на X-Omni OCR оказалась лучшей среди открытых моделей и обошла модели с большим числом параметров. В то же время контроль композиции набрал 0.69 на 7Bench mIoU, пространственное мышление 0.76 на SpatialGenEval, cоответствие промту 0.89 на Prism alignment, а ELO-рейтинг дизайнерских предпочтений 1062 (2-е место в общем зачёте, 1-е среди открытых).
Скала
"Вода вокруг Харибды бурлила, словно в кипящем котле, со свистом и грохотом, пока волны поднимались и сталкивались друг с другом. Когда море уходило вниз, Харибда словно втягивала его обратно в себя - в бездну, где всё перемешивалось с чёрным песком и тиной. В тот же миг Сцилла схватила шестерых моих товарищей, самых сильных и ловких. Я успел лишь увидеть, как они, поднятые в воздух, звали меня по имени, крича в отчаянии, и через миг всё стихло. Ничто из всего, что я видел в странствиях, не сравнится с этим ужасом." - Одиссей.
Рисую акварелью всякое и дарю Огромный файл для самостоятельной печати любой из моих работ случайному подписчику каждый понедельник!
Хочу вам подарить ЗДОРОВЕННЫЙ файл любой из моих работ! Можно напечатать постер, жикле, интерьерную печать до формата А1 или даже фотообои! Свои работы я сканирую в большом разрешении и размер файла будет 7000х9000pix 300dpi и около 200мб весом.
Розыгрыш файла будет каждый понедельник! Чтобы его получить, нужно быть моим подписчиком и оставить абсолютно любой комментарий под этим постом - его я выберу случайным образом и напишу вам.
Посмотреть все мои работы и выбрать можно тут https://vk.com/art_evgeniyabrukish кроме работ с ватермаркой, ну или полистать посты тут на пикабу, если у вас нет вк.
И спасибо вам большое за поддержку и интерес к моему творчеству!











