✔️ Теперь сборка Forge Neo на torch 2.9 и Cuda 12.8
Работает быстрее на 10-20% 🚀
✔️ Добавил возможность установки Triton + SageAttention bat файлом из раздела Additions.
✔️ About-UI.bat покажет информацию о сборке.
✔️ RUN.bat для обычного запуска и RUN-Sage.bat для запуска с ключом sage.
✔️ В сборку добавлены presets, но для корректной работы некоторых нужно скачать папку models!
✔️ Для генерации на Z-Image выберите общий preset Lumina, модели z-image, qwen_3_4b, flux vae и пользовательский preset z-image с хорошими настройкам.
✔️ Все расширения работают так же.
✅ Знаю что у многих не скачиваются модели с Huggingface - добавил ссылки на альтернативные ресурсы для всех моделей в этом посте: SD1.5, SDXL, Flux, Flux Kontext, Flux Krea, Wan 2.1, Qwen, Qwen, Lumina, Edit, Z-Image, Vae, Clip, Nunchaku.
🔥 Модель Z-Image — это высокоэффективная модель для генерации изображений, она имеет всего 6 млрд. параметров, но за счет передовой архитектуры позволяет генерировать конкурентные по качеству изображения, в сравнении лидерами рынка.
🚀 Z-Image легко помещается в потребительские видеокарты от 12 ГБ видеопамяти и превосходно справляется с фотореализмом, но с другими сложными стилями не очень.
🛠💥 Z-Image содержит под капотом одну из лучших LLM моделей на сегодня Qwen 3 VL, которая позволяет модели понимать различные языки, а так же генерировать текст на различных языках, в том числе и на русском❗️
✔️ЛИЦЕНЗИЯ
Модель распространяется под лицензией Apache 2.0, что даёт гибкость для интеграции, экспериментов, доработок, а так же коммерческого использования.
✔️АРХИТЕКТУРА
Scalable Single-Stream DiT (S3-DiT). В этой архитектуре текст, визуальные семантические токены и VAE изображений образуют единый входной поток, что эффективнее по сравнению с двухпотоковыми старыми подходами.
✔️Benchmark LM-Arena
Z-Image-Turbo показывает себя лучше чем Flux 1.
✔️ЛИНЕЙКА МОДЕЛЕЙ
будет из трёх моделей:
- Z-Image-Turbo — это очень шустрая дистиллированная модель, которая выдает отличное качество генераций.
- Z-Image-Base — базовая модель без дистилляции.
- Z-Image-Edit — это вариант Edit модели, доработанный специально для задач редактирования изображений. Он позволяет точное редактирование на основе подсказок на естественном языке.
👌Модели Base и Edit на данный момент не вышли, но их релиз скоро состоится.
✅ FLUX.2 поддерживает режимы T2I и I2I. Коротко два в одном - Image и Edit модель.
✔️ ЧТО НОВОГО
- FLUX.2 способен работать в разрешении до 4 МП.
- Поддержка множественных ссылок : возможность ссылаться на 10 изображений одновременно.
- Более высокая детализация, более четкие текстуры и более стабильное освещение.
- Сложная типографика, инфографика, мемы и макеты пользовательского интерфейса с разборчивым мелким.
- Улучшенное следование сложным подсказкам.
- Значительно большие знания реального мира, освещении и пространственной логике, что приводит к созданию более связных сцен с ожидаемым поведением.
✔️ТЕКСТОВЫЙ КОДИРОВЩИК
теперь LLM модель Mistral Small 3.1. Использование одного текстового кодировщика значительно упрощает процесс вычисления вложений подсказок. Поддерживает максимальную длину строки 512 токенов.
✔️VAE
Новый вариационный автоэнкодер для латентных представлений, обеспечивающий оптимальный баланс между обучаемостью, качеством и степенью сжатия.
✔️Архитектура MM-DiT + parallel DiT в целом как и на Flux.1. Но настроена архитектура по другому. Так же сам по себе DiT стал более крупным.
✔️ Требования VRAM
Без какой-либо разгрузки вычислительный процесс занимает более 80 ГБ
- FLUX.2 [flex] - та же модель что и pro но с гибкими настройками семплера, позиционируется для рендеринга текста и мелких деталей.
- FLUX.2 [dev] - модель с открытыми весами 32B. Модель генерации и редактирования изображений с открытыми весами, объединяющая синтез текста в изображение и редактирование изображений с несколькими входными изображениями в одной контрольной точке. ЭТО МОДЕЛЬ ДЛЯ НАС!
- FLUX.2 [klein] - ОЖИДАЕТСЯ ВЫХОД - модель Apache 2.0 с открытым исходным кодом, созданная на основе базовой модели FLUX.2. Более мощная и удобная для разработчиков, чем аналогичные модели того же размера. Подозревая это Lightning модель.
🛠 В этом видео я научу вас устанавливать и работать с лучшим веб интерфейсом для обучения моделей - kohya ss. 💥
➖ Мы установим StabilityMatrix и с его помощью установим kohya_ss.
➖ Познакомлю вас со StabilityMatrix.
➖ Расскажу вам как подготовить структуру папок и модели для обучения Lora на лицо.
➖ Покажу как создать описания для изображений.
➖ Покажу Preset для обучения Lora.
➖ Расскажу основные параметры, которые влияют на обучение модели и этих параметров большинству их вас будет достаточно, но так же на boosty будет расширенное видео по настройкам обучения Lora👌
📌 Модель Qwen Edit очень круто обновилась до версии 2509 (это дата выхода модели) и стала значительно лучше.
👌 Вам эти изменения точно понравятся, так что посмотрите до конца:
☑️ Поддерживается от 1 до 3 реверенсных изображений
☑️ Поддерживаются подсказки со ссылкой на персонажа, объект и на номер изображения
☑️ Согласованность изображений улучшена
☑️ Модель более цепко держит референсы при генерации. Лучше сохраняются лица
☑️ В модель зашиты ControlNet: карта нормалей, карта глубины, canny, openpose и вы можете попросить сгенерировать эти карты из референсного изображения
☑️ Так же вы можете закинуть например позу из openpose и попросить поставить персонажа в эту позу
☑️ Улучшенная согласованность редактирования текста на английском и китайском
😱 Но и это еще не все.
Теперь мы можем работать в разрешении от 1 до 2 мегапикселей❗️ что улучшает детализацию, которая в первой Qwen Edit сильно хромала.
Бесплатные обучающие ролики по применению Stable Diffusion, Chat GPT и др. — [Перейти на канал Rutube]
Сколько стоит подписка ко всем нейросетям?
Все полезные данные о нейронных сетях и статьи доступны безвозмездно. 👆
Некоторые инструменты в @yes_ai_bot предоставляются безлимитно, например, текстовая нейросеть (аналог Chat GPT) — Gemma 2.
Некоторые инструменты даются бесплатно каждый день — мы ежедневно начисляем ⭐️ баллы всем пользователям, используя которые вы можете создавать картинки и обрабатывать тексты. А ещё ⭐️ баллы можно получать в качестве бонуса — [Перейти в инструкцию]
Те инструменты, которые доступны только на коммерческой основе, предоставляются за 🔅 монеты (внутренняя валюта Yes Ai). Вы можете узнать текущие тарифы, отправив команду /prices в @yes_ai_bot
Как приступить к взаимодействию с нейросетями в Yes Ai?
Самым разумным решением будет старт бесплатного курса по искусственному интеллекту, через него вы не только познакомитесь с возможностями Yes Ai Bot, но и приобретёте полезные навыки по применению потенциала AI.
Для перехода в школу запустите бота Yes Ai, а в нижней панели кликните на «💥 Обучение».