StableDif

StableDif

Приветствую вас дорогие друзья. Меня зовут Олег (OreX). Я пишу видеоуроки по Stable Diffusion и софту связанному с искусственным интеллектом. Собираю полезные материалы и делюсь с вами. Мои ресурсы: Видеоуроки YouTube: https://youtube.com/@StableDiff Видеоуроки RuTube: https://rutube.ru/channel/28380669/ Мои курсы с поддержкой по Automatic1111 и COMFYUI: https://stabledif.ru Большой чат для общения: https://t.me/stable_dif Поддержка автора на Boosty: https://boosty.to/stabledif
Пикабушник
в топе авторов на 551 месте
119 рейтинг 41 подписчик 2 подписки 51 пост 0 в горячем
1

Новая сборка Forge Neo

🔤 Обновил сборку Forge Neo

✔️ Теперь сборка Forge Neo на torch 2.9 и Cuda 12.8

Работает быстрее на 10-20% 🚀

✔️ Добавил возможность установки Triton + SageAttention bat файлом из раздела Additions.

✔️ About-UI.bat покажет информацию о сборке.

✔️ RUN.bat для обычного запуска и RUN-Sage.bat для запуска с ключом sage.

✔️ В сборку добавлены presets, но для корректной работы некоторых нужно скачать папку models!

✔️ Для генерации на Z-Image выберите общий preset Lumina, модели z-image, qwen_3_4b, flux vae и пользовательский preset z-image с хорошими настройкам.

✔️ Все расширения работают так же.

✅ Знаю что у многих не скачиваются модели с Huggingface - добавил ссылки на альтернативные ресурсы для всех моделей в этом посте: SD1.5, SDXL, Flux, Flux Kontext, Flux Krea, Wan 2.1, Qwen, Qwen, Lumina, Edit, Z-Image, Vae, Clip, Nunchaku.

Новая сборка доступна в том же посте на boosty:

(https://boosty.to/stabledif/posts/707966d6-b025-4297-8e84-ba...)

Показать полностью
1

Z-Image обучение Lora в UI-Toolkit Portable

☑️ В этом видео вы узнаете как обучить Lora z-image в ostris UI-Toolkit.

👌Я подготовил легко устанавливаемую portable сборку - даже две 🙂.

⏳Обучается z-image великолепно: быстро, с малым VRAM (менее 15,5 ГБ может и на 12ГБ vram заработает) и очень здорово впитывает dataset. На 5090 скорость обучения от 40 до 80 мин. Можно и быстрее, но это хороший результат.

☑️ Скачать бесплатно сборку MINI вы сможете в комментариях к посту телеграмм канала 👉
(https://t.me/stabledif_lesson/477)

☑️ Сборку BIG (с предустановкой) и дополнительное видео о том, как и где скачать модели, чтобы они работали, если заблокирован huggingface найдете на boosty:(https://boosty.to/stabledif/posts/92bc41ea-97cc-447d-9c94-cd...)

🎦 СМОТРЕТЬ НА YOUTUBE (https://youtu.be/4ZlUdhQ5Iqg)

🎦 СМОТРЕТЬ НА RUTUBE (https://rutube.ru/video/820b5726e0e83ba148057a87a4663b61/)

🔐 Ссылки и файлы доступны на Boosty: (https://boosty.to/stabledif/posts/92bc41ea-97cc-447d-9c94-cd...)

Показать полностью 2
4

Модель Z-Image

🔥 Модель Z-Image — это высокоэффективная модель для генерации изображений, она имеет всего 6 млрд. параметров, но за счет передовой архитектуры позволяет генерировать конкурентные по качеству изображения, в сравнении лидерами рынка.

🚀 Z-Image легко помещается в потребительские видеокарты от 12 ГБ видеопамяти и превосходно справляется с фотореализмом, но с другими сложными стилями не очень.

🛠💥 Z-Image содержит под капотом одну из лучших LLM моделей на сегодня Qwen 3 VL, которая позволяет модели понимать различные языки, а так же генерировать текст на различных языках, в том числе и на русском❗️

✔️ЛИЦЕНЗИЯ

Модель распространяется под лицензией Apache 2.0, что даёт гибкость для интеграции, экспериментов, доработок, а так же коммерческого использования.

✔️АРХИТЕКТУРА

Scalable Single-Stream DiT (S3-DiT). В этой архитектуре текст, визуальные семантические токены и VAE изображений образуют единый входной поток, что эффективнее по сравнению с двухпотоковыми старыми подходами.

✔️Benchmark LM-Arena

Z-Image-Turbo показывает себя лучше чем Flux 1.

✔️ЛИНЕЙКА МОДЕЛЕЙ

будет из трёх моделей:

- Z-Image-Turbo — это очень шустрая дистиллированная модель, которая выдает отличное качество генераций.

- Z-Image-Base — базовая модель без дистилляции.

- Z-Image-Edit — это вариант Edit модели, доработанный специально для задач редактирования изображений. Он позволяет точное редактирование на основе подсказок на естественном языке.

👌Модели Base и Edit на данный момент не вышли, но их релиз скоро состоится.

✔️МОДЕЛИ

- Text encoder: HF (https://huggingface.co/unsloth/Qwen3-4B-GGUF/tree/main)

- VAE от Flux.1: HF (https://huggingface.co/OreX/Models/blob/main/Flux-Main/Flux-...)

- Diffusion model:

z_image_turbo_bf16: HF (https://huggingface.co/Comfy-Org/z_image_turbo/tree/main/spl...)

z-image-turbo-fp8-e4m3fn: HF (https://huggingface.co/T5B/Z-Image-Turbo-FP8/blob/main/z-ima...)

👉 Workflow приложу в комментариях к посту: https://t.me/stabledif_lesson/476

ОБЗОР:

🎦 СМОТРЕТЬ НА YOUTUBE (https://youtu.be/5YTa2E3aiPQ)

🎦 СМОТРЕТЬ НА RUTUBE (https://rutube.ru/video/0562e91868f0cfc8f155f2acdc06a404/)

Показать полностью 2
5

Вышла модель FLUX.2 - это совершенно новая модель с новой архитектурой и обученная с нуля!

✅ FLUX.2 поддерживает режимы T2I и I2I. Коротко два в одном - Image и Edit модель.

✔️ ЧТО НОВОГО

- FLUX.2 способен работать в разрешении до 4 МП.

- Поддержка множественных ссылок : возможность ссылаться на 10 изображений одновременно.

- Более высокая детализация, более четкие текстуры и более стабильное освещение.

- Сложная типографика, инфографика, мемы и макеты пользовательского интерфейса с разборчивым мелким.

- Улучшенное следование сложным подсказкам.

- Значительно большие знания реального мира, освещении и пространственной логике, что приводит к созданию более связных сцен с ожидаемым поведением.

✔️ТЕКСТОВЫЙ КОДИРОВЩИК

теперь LLM модель Mistral Small 3.1. Использование одного текстового кодировщика значительно упрощает процесс вычисления вложений подсказок. Поддерживает максимальную длину строки 512 токенов.

✔️VAE

Новый вариационный автоэнкодер для латентных представлений, обеспечивающий оптимальный баланс между обучаемостью, качеством и степенью сжатия.

✔️Архитектура MM-DiT + parallel DiT в целом как и на Flux.1. Но настроена архитектура по другому. Так же сам по себе DiT стал более крупным.

✔️ Требования VRAM

Без какой-либо разгрузки вычислительный процесс занимает более 80 ГБ

✔️ СЕМЕЙСТВО МОДЕЛЕЙ

- FLUX.2 [pro] - топовая модель доступная только на площадках BFL (http://bfl.ai/play), Playground (http://bfl.ai/play), API BFL (http://docs.bfl.ai/flux_2/).

- FLUX.2 [flex] - та же модель что и pro но с гибкими настройками семплера, позиционируется для рендеринга текста и мелких деталей.

- FLUX.2 [dev] - модель с открытыми весами 32B. Модель генерации и редактирования изображений с открытыми весами, объединяющая синтез текста в изображение и редактирование изображений с несколькими входными изображениями в одной контрольной точке. ЭТО МОДЕЛЬ ДЛЯ НАС!

- FLUX.2 [klein] - ОЖИДАЕТСЯ ВЫХОД - модель Apache 2.0 с открытым исходным кодом, созданная на основе базовой модели FLUX.2. Более мощная и удобная для разработчиков, чем аналогичные модели того же размера. Подозревая это Lightning модель.

⬆️ Text encoder: HF (https://huggingface.co/Comfy-Org/flux2-dev/blob/main/split_f...)

⬆️ Diffusion model: HF (https://huggingface.co/Comfy-Org/flux2-dev/blob/main/split_f...)

⬆️ VAE: HF (https://huggingface.co/Comfy-Org/flux2-dev/blob/main/split_f...)

🪢 Страница разработчика: ССЫЛКА (https://huggingface.co/blog/flux-2)

🔑 Все ссылки и файлы доступны на Boosty: ссылка (https://boosty.to/stabledif/posts/f3e54a1e-a703-40fa-8bf9-16...)

👉 Workflow приложен в комментариях к посту: https://t.me/stabledif_lesson/475

🔥Обзор:

🎦 СМОТРЕТЬ НА YOUTUBE (https://youtu.be/JU1dmuyDSks)

🎦 СМОТРЕТЬ НА RUTUBE (https://rutube.ru/video/fcb6ba132e7ba681c93ba08416941b30/)

Показать полностью 2
2

ОБУЧЕНИЕ LORA | Flux Kohya-ss

🛠 В этом видео я научу вас устанавливать и работать с лучшим веб интерфейсом для обучения моделей - kohya ss. 💥

➖ Мы установим StabilityMatrix и с его помощью установим kohya_ss.

➖ Познакомлю вас со StabilityMatrix.

➖ Расскажу вам как подготовить структуру папок и модели для обучения Lora на лицо.

➖ Покажу как создать описания для изображений.

➖ Покажу Preset для обучения Lora.

➖ Расскажу основные параметры, которые влияют на обучение модели и этих параметров большинству их вас будет достаточно, но так же на boosty будет расширенное видео по настройкам обучения Lora👌

🔐 Расширенное видео по настройкам: ссылка (https://boosty.to/stabledif/posts/314939fa-a5ed-4f49-87cd-63...)

🎦 СМОТРЕТЬ НА YOUTUBE (https://youtu.be/ECI08EaiTvo)

🎦 СМОТРЕТЬ НА RUTUBE (https://rutube.ru/video/b493e3174fbc126dcd1f66dc37fd7e5a/)

Показать полностью 2
4

ComfyUI v2.2 - обновленная сборка

Представляю вам обновленную сборку на том же torch 2.7 и python 3.12, cuda 12.8.
- Исправлены все проблемы .
- Обновлены все узлы и установлены проблемные узлы из некоторых моих схем.
- Nunchaku поставил и в корне оставил WHL если на какой-то видеокарте не заведется.
- SageAttention и Triton ставятся так же файлом
For Triton & Sage Install / Install Triton & Sage.bat (генерацию ускоряет существенно).
- Заменен файл стилей sdxl styles.json
- Узлы Orex-nodes обновлены: batch count, batch size, load image и Polination снова принимают на вход изображение для описания через онлайн модель без API.
- Anywere Everywere вещатели обновил, но возможно совсем старые схемы имеют недопустимые версии вещателей, мне такие встречались. Если встретятся кидайте ссылки на схемы - буду править.
- Сборку протестировал на большинстве своих схем: infinity wan, Lynx, Wan 2.2, Qwen Image, Qwen All in one, PulID SDXL, PulID Flux, Flux Tools, Flux Union 2, Sora Watermark Removal, Flux Kontext 3 схемы, Supir 3 схемы и еще с десяток схем.
- Сборка проверена Касперским на вирусы и на ошибки распаковкой и запуском.
- Обновление ComfyUI, всех узлов и Front End от 10.11.2025
- Папка models скачивается отдельно и её я не менял.
- Для тех у кого проблемы с загрузкой HuggingFace сделал зеркало на Telegram группу. Все ссылки и инструкции к сборке в старом посте, они актуальны.
- Оба поста открыты для всех бесплатно.

https://boosty.to/stabledif/posts/d6186e1b-0cac-43af-9ed2-33...

Показать полностью
3

Forge Neo обновлена и исправлена

▫️ Сборка теперь без виртуальной среды: python находится в папке system как в automatic или forge. Дополнительные библиотеки теперь можно ставить в system/python. Reactor починил. Пресет InstantID (генерация с лицами) теперь тоже работает. Другие пресеты поднастроил - должны работать. Добавил дополнительные расширения. И даже Inpaint Anything удалось запустить, но оно сильно нагружает процессор, что-то с ним не так, по этому я его отключил. В Extension можно поставить галочку напротив Inpaint Anything и включить его.

▫️ Qwen Image теперь поддерживается, а также его Nunchaku версия тоже (для слабых видеокарт, то что нужно). Qwen Edit пока не работает.

▫️ Добавил расширение sd-forge-fluxtools-v2 для работы с Flux Canny/Depth и Flux Fill (inpaint модель), но с поддержкой Flux Kontext не особо то и нужное расширение. Добавил расширение forge2_cleaner - аналог волшебного ластика в Photoshop (работает быстро и потребляет мало ресурсов).

▫️ Xformers устанавливать, не стал, так как он делает работу ForgeNeo не стабильной, по крайней мере на моей карте. Установить Xformers очень просто. Откройте папку system\python и в адресной строке напишите CMD и нажмите Enter. введите команду:

python -m pip install xformers

(но высока вероятность сломать сборку)

▫️ Теперь сборка 7Гб и модели 18.7Гб отдельны.

Если у вас была старая сборка, то папка models та же.

📽️ Видео обзор предыдущей сборки: YouTube (https://youtu.be/HRKqmMdYVrY?si=C1IxNFgyLa3VS0Hn) l Rutube (https://rutube.ru/video/f0a9952929deb0edbe2a37933de2623d/?r=...)

🔗 Сборку можно скачать тут: ССЫЛКА (https://huggingface.co/OreX/Automatic1111/resolve/main/Forge...)

Показать полностью 2
4

OVI Video & Audio

🎬 Ovi — это новая локальная модель «всё-в-одном», как Veo 3 или Sora 2.

🛠 Ovi Video может генерировать видео с речью, музыкой и аудио эффектами. Модель поддерживает входные данные: текст и изображение.

👌Это первая локальная модель такого типа, но качество её не такое хорошее. - Продолжительность генерируемого видео 5 сек.

- Потребление Vram от 16Гб на Fp8. Скорость генерации очень высокая даже при таких потреблениях и выгрузке в Ram блоков модели (60 сек в 1 мегапикселе, 5 сек ролик на 5090).

📘 ССЫЛКИ

➖ Страница разработчика: https://github.com/snicolast/ComfyUI-Ovi.git

➖ Схема из видео: https://drive.google.com/file/d/1O6PnlAPivefyMpenH2HBDHGmnBD...

👁Смотреть на Youtube (https://youtu.be/5UN2TDLLnaE)

👁Смотреть на Rutube (https://rutube.ru/video/3535ed87de06ef9acd91c3d11fc510e4/)

Показать полностью 2
Отличная работа, все прочитано!