Модель Z-Image
🔥 Модель Z-Image — это высокоэффективная модель для генерации изображений, она имеет всего 6 млрд. параметров, но за счет передовой архитектуры позволяет генерировать конкурентные по качеству изображения, в сравнении лидерами рынка.
🚀 Z-Image легко помещается в потребительские видеокарты от 12 ГБ видеопамяти и превосходно справляется с фотореализмом, но с другими сложными стилями не очень.
🛠💥 Z-Image содержит под капотом одну из лучших LLM моделей на сегодня Qwen 3 VL, которая позволяет модели понимать различные языки, а так же генерировать текст на различных языках, в том числе и на русском❗️
✔️ЛИЦЕНЗИЯ
Модель распространяется под лицензией Apache 2.0, что даёт гибкость для интеграции, экспериментов, доработок, а так же коммерческого использования.
✔️АРХИТЕКТУРА
Scalable Single-Stream DiT (S3-DiT). В этой архитектуре текст, визуальные семантические токены и VAE изображений образуют единый входной поток, что эффективнее по сравнению с двухпотоковыми старыми подходами.
✔️Benchmark LM-Arena
Z-Image-Turbo показывает себя лучше чем Flux 1.
✔️ЛИНЕЙКА МОДЕЛЕЙ
будет из трёх моделей:
- Z-Image-Turbo — это очень шустрая дистиллированная модель, которая выдает отличное качество генераций.
- Z-Image-Base — базовая модель без дистилляции.
- Z-Image-Edit — это вариант Edit модели, доработанный специально для задач редактирования изображений. Он позволяет точное редактирование на основе подсказок на естественном языке.
👌Модели Base и Edit на данный момент не вышли, но их релиз скоро состоится.
✔️МОДЕЛИ
- Text encoder: HF (https://huggingface.co/unsloth/Qwen3-4B-GGUF/tree/main)
- VAE от Flux.1: HF (https://huggingface.co/OreX/Models/blob/main/Flux-Main/Flux-...)
- Diffusion model:
z_image_turbo_bf16: HF (https://huggingface.co/Comfy-Org/z_image_turbo/tree/main/spl...)
z-image-turbo-fp8-e4m3fn: HF (https://huggingface.co/T5B/Z-Image-Turbo-FP8/blob/main/z-ima...)
👉 Workflow приложу в комментариях к посту: https://t.me/stabledif_lesson/476
ОБЗОР:
🎦 СМОТРЕТЬ НА YOUTUBE (https://youtu.be/5YTa2E3aiPQ)
🎦 СМОТРЕТЬ НА RUTUBE (https://rutube.ru/video/0562e91868f0cfc8f155f2acdc06a404/)
Искусственный интеллект
5.4K постов11.7K подписчиков
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан