Stable diffusion + Обновление

С этим тегом используют

20 постов сначала свежее

user6488018

2 месяца назад

Stable Diffusion & Flux

Ответ на пост «Stability AI представила Stable Diffusion 3.5: Тестируем новую модель на реальных задачах и сравниваем с SDXL и FLUX»⁠⁠1

Блять, надеюсь никто не будет делать вид, что всё нормально. Вся их четырёхмесячная работа это кромешный пиздец. Пиздец и никак иначе. Ад, нахуй, на земле. Криво, косо, намылено, перехуячено, выебано, изнасиловано и так по списку. По ощущениям выкидыш SD3 medium и то был лучше по общему качеству выдаваемых генераций. Я в душе не ебу чем они занимались там, потому что нихрена не поменялось. Я прям вижу комичную сцену, где руководство Stability, ничего не учтя из тотального провала первого релиза третьей диффузии, даёт верный курс на изничтожение датасета, да так, что бы кровь из жопы пошла. У них есть оф пеппер по этой «исправленной» модели. Там представлены генерации. Это наглый пиздёж и скам. Не выдаёт их модель таких результатов, ну никак прям. Flux выдаёт, а SD3.5 сосёт член. Заявляли что эта модель по качеству между флюксовым шнелем и dev’ом, а по факту между нахуй никому не нужной аурофлов и шнелем, и то стремительно тянущейся к аурефлову. Пиздаболы. Я премного благодарен что из Stability бежали мозги, основали форест лабу и в кратчайшие сроки сделали ахуенный опенсорсный Flux, отнесясь к процессу с умом, а не что бы угодить хуй пойми кому и хуй пойми зачем. Не помогло Stability найденное финансирование. Выблядки.

p.s простите такой накал страстей. Не могу стерпеть откровенного пиздежа, особенно когда пиздят на огромную преданную аудиторию.

Опрос Искусственный интеллект Нейронные сети Stable Diffusion Sdxl Flux Обновление Генерация изображений Арты нейросетей Длиннопост Stability Мат Ответ на пост Текст

Nerual.Dreming

2 месяца назад

Stable Diffusion & Flux

Stability AI представила Stable Diffusion 3.5: Тестируем новую модель на реальных задачах и сравниваем с SDXL и FLUX⁠⁠1

Stability AI представила Stable Diffusion 3.5: Тестируем новую модель на реальных задачах и сравниваем с SDXL и FLUX Опрос, Искусственный интеллект, Нейронные сети, Stable Diffusion, Sdxl, Flux, Обновление, Генерация изображений, Арты нейросетей, Длиннопост, Stability

Привет, друзья, 22 октября Stability AI представила долгожданное обновление своей флагманской модели — Stable Diffusion 3.5. После не самого удачного релиза SD3 Medium в июне этого года, команда взяла паузу для серьёзной переработки архитектуры. Вместо быстрых фиксов разработчики потратили четыре месяца на фундаментальные улучшения. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист и сейчас мы с вами вместе разберемся, что изменилось и действительно ли стоило так долго ждать.

Революция в архитектуре

Ключевым изменением стал переход на архитектуру MMDiT (Multimodal Diffusion Transformer). В отличие от предыдущих версий, новая модель использует сразу три предобученных текстовых энкодера. Это серьезное техническое решение, которое потребовало значительной переработки всей архитектуры.

Технические особенности:

Принципиально новая архитектура MMDiT с тремя специализированными текстовыми энкодерами:
- OpenCLIP-ViT/G для понимания общего контекста и стилей
- CLIP-ViT/L для детального анализа визуальных элементов
- T5-XXL для обработки сложных текстовых описаний и пространственных отношений
Внедрение QK-нормализации для стабилизации работы трансформеров, что позволяет лучше контролировать процесс генерации и упрощает дальнейшую настройку модели
Увеличенная до 256 токенов длина контекста на этапе тренировки, что улучшает понимание детальных промптов
Оптимизированный VAE-декодер с 16 каналами и без постквантизации для лучшей цветопередачи и детализации

Три модели для разных задач

Впервые Stability AI предлагает сразу три варианта модели. Флагман линейки — Stable Diffusion 3.5 Large с 8 миллиардами параметров, способный работать с разрешением до 1 мегапикселя. Для задач, где критична скорость, создана версия Large Turbo, выдающая результаты всего за 4 шага. Модель генерирует на RTX 4090 за 20 секунд.

А 29 октября ожидается релиз Stable Diffusion 3.5 Medium — облегченной версии с 2.5 миллиардами параметров. Эта модель оптимизирована для работы на обычных компьютерах и поддерживает генерацию изображений от 0.25 до 2 мегапикселей.

Честно о компромиссах

Разработчики открыто говорят об особенностях новой версии. Расширение базы знаний и стилей привело к тому, что модель стала менее предсказуемой при работе с неконкретными промптами. Это сознательное решение — сохранить максимально широкую базу знаний в базовых моделях, давая пользователям больше возможностей для тонкой настройки под свои задачи.

Сравнительное тестирование

Мы провели тестирование SD 3.5 в сравнении c SDXL 1.0 и Black Forest FLUX.1 dev. В такой же последовательности ниже представлены результаты - SD 3.5 затем SDXL 1.0 и потом Black Forest FLUX.1 dev. Пишите в комментарии где по вашему лучший результат. Сид и настройки генерации идентичные. Модели SD 3.5 понятно стандартная, запущенная в комфи на этом воркфлоу, SDXL модель это Juggernaut XL V9 на ArtGeneration.me и Flux 1 dev nf4 v2 запущенная в Forge.

Тест фотореализма

1/3

ultra-detailed professional photography: close-up portrait of a weathered elderly craftsman in his workshop, natural window lighting casting dramatic shadows, every wrinkle and skin texture visible, Canon EOS R5, 85mm f/1.2 lens, 4K resolution, hyperrealistic details of wood shavings and tools in background, condensation droplets on nearby water glass, dust particles in sunbeams, {realistic skin pores, subsurface scattering, chromatic aberration}, professional color grading, photojournalistic style, award-winning National Geographic quality, RAW format

Тест цифровой иллюстрации

1/3

epic digital art: futuristic cyberpunk marketplace at golden hour, holographic merchant stalls floating between neon-lit skyscrapers, hundreds of detailed alien species trading exotic goods, volumetric fog effects, ray-traced lighting, cinematic color grading, intricate mechanical details, 8K resolution, created in Unreal Engine 5, {ambient occlusion, global illumination, metal roughness mapping}, concept art quality, trending on ArtStation, otherworldly atmosphere, dynamic composition

Тест аниме-стиля

1/3

high-end anime artwork: magical academy graduation ceremony, cherry blossoms swirling in wind, diverse student characters with unique magical artifacts and detailed uniform designs, golden magic circles appearing in sky, Studio Ghibli quality backgrounds, perfect cel shading, emotional lighting, multi-layered particle effects, {clean line art, detailed eyes, dynamic fabric flow}, masterful composition, vibrant color palette, cinematic aspect ratio, high production value

Тест типографики

1/3

experimental typography design: 'EVOLUTION' text morphing from ancient hieroglyphs into futuristic digital script, each letter contains detailed micro-scenes of human progress, metallic 3D elements with scratch textures, dynamic perspective, precise kerning, neon accents, floating geometric shapes, 32K resolution, {perfect antialiasing, vector precision, multiple light sources}, professional typographic hierarchy, cutting-edge design trends, seamless transitions

Тест точности композиции

1/3

classical concert hall setting, professional orchestra performance scene, female conductor with flowing crimson tailcoat centered in golden ratio, cellist in navy suit and violinist in ivory dress in foreground, pianist in black tuxedo and harpist in silver gown performing, flutist in forest green and clarinetist in burgundy at middle distance, trumpet player in charcoal gray and french horn in purple creating depth, timpanist in white and black, violist in sapphire blue, bass player in russet brown and oboist in slate gray completing background, mahogany-paneled walls, golden baroque details, red velvet curtains, polished hardwood stage, dramatic stage lighting, 8K resolution, hyperrealistic details, concert photography, professional staging

Тест сложной сцены

1/3

steam locomotive train station evening scene, tall station master in burgundy gold-trimmed uniform checking ornate pocket watch at center platform, wealthy family of four (father in navy tailcoat and top hat, mother in emerald bustle dress with parasol, son in brown suit with newsboy cap, daughter in powder blue dress) waiting near left platform, three vendors (copper-vested coffee seller, gray-capped newspaper boy, girl in white apron selling flowers) working near entrance, engineering team in brass uniforms and oil-stained overalls inspecting locomotive, three traveling academics (professor in tweed, assistant in olive dress, student in burgundy uniform) consulting large map, steampunk mechanical details, brass and copper fixtures, billowing steam effects, gas lamps casting warm light, photorealistic quality, 8K resolution, cinematic framing

Доступность и использование

Модель распространяется под Stability AI Community License, которая предполагает свободное использование для исследований и некоммерческих целей. Коммерческое использование разрешено компаниям с годовым доходом до $1 млн, для более крупных организаций предусмотрена Enterprise License.

А что насчет 🔞?

Тут ситуация точная такая же, как и с Flux, из дата сета был убран весь NSFW контент, в результате модель просто не знает что должно быть у людей под одеждой и рисует - что-нибудь типа одежды в лучшем случае, что-нибудь типа человеческой многоножки - в худшем. Как мы видим с Flux - файтюнингом ситуация не решается.

Полезные ссылки и ресурсы

Официальные ресурсы

Модели и код

Прямые ссылки на скачивание моделей

Необходимые энкодеры

Что дальше?

29 октября ожидается релиз Stable Diffusion 3.5 Medium, а следом за ним — выход ControlNet с расширенными инструментами контроля над генерацией. Судя по дорожной карте, команда Stability AI сфокусирована на развитии профессиональных инструментов и улучшении пользовательского опыта.

Новый релиз Stable Diffusion демонстрирует, что команда Stability AI серьезно подошла к работе над ошибками после не самого удачного запуска SD3. Вместо быстрых фиксов они провели фундаментальную работу над архитектурой и представили продукт, учитывающий различные сценарии использования. Но стало ли лучше? Об это судить вам.

Предлагаю протестировать новую версию на своих задачах и поделиться результатами в комментариях. Интересно узнать, как SD 3.5 показывает себя в реальных проектах и стилях.

Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Всех обнял и удачных генераций.

Как вы оцениваете Stable Diffusion 3.5?

Это революция! Наконец-то достойное обновление

Неплохо, но не впечатляет

Разочарован, ожидал большего

Пока не пробовал, но собираюсь

Не интересуюсь SD, использую другие модели

Показать полностью 20 1

[моё] Опрос Искусственный интеллект Нейронные сети Stable Diffusion Sdxl Flux Обновление Генерация изображений Арты нейросетей Длиннопост Stability

AL.MAR1457

4 месяца назад

НР || Нейро-Рендеры

2474-ый день ждём чуда с мисс Полинг⁠⁠

Показать полностью 1

[моё] Арты нейросетей Stable Diffusion Девушки Портрет Team Fortress 2 Game Art Офисные работники Очки Зелёные глаза Плакат Юбка Ожидание Обновление Valve Memes Блузка Anime Art Miss Pauling

Партнёрский материал

specials

Шарите в мировой мифологии?⁠⁠

Проверьте себя, пройдя испытание мудрости. Самые достойные получат приз — награду в профиль на Пикабу.

MMORPG Игры Приз

Nerual.Dreming

4 месяца назад

Stable Diffusion & Flux

Обновление ИИ-генератора Automatic1111 до 1.10.0: поддержка SD3, новшества и возможные проблемы. Стоит ли обновляться?⁠⁠

Всем привет, сегодня вышло обновление популярного интерфейса для генерации изображений на моделях Stable Diffusion - Automatic 1111 до версии 1.10.0. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист и мы с вами рассмотрим стоит ли новое обновление внимания, или его можно пропустить.

Сразу хочу отметить, что это обновление в основном сосредоточено на исправлении ошибок и небольших улучшениях производительности. Самым заметным нововведением является поддержка Stable Diffusion 3, но, к сожалению, у многих пользователей, включая меня, возникли проблемы с его запуском. Несмотря на правильную установку модели, система выдает ошибку.

Кроме того, я столкнулся с проблемами совместимости некоторых расширений. Например, мне пришлось удалить расширение "replacer", так как оно вызывало ошибки. Учитывая эти сложности, я бы пока не рекомендовал спешить с обновлением. Лучше подождать неделю-две, пока не выйдут исправления. Тем более, что SD3 пока не работает, а других существенных нововведений вы, скорее всего, не заметите.

Тем не менее, если вы всё же решите обновиться, вот полный список изменений в версии 1.10.0:

Версия 1.10.0

Особенности:

Множество улучшений производительности (подробнее в разделе "Производительность")
Поддержка Stable Diffusion 3
- Рекомендуется использовать сэмплер Euler; DDIM и другие сэмплеры с временными метками в настоящее время не поддерживаются
- Текстовая модель T5 отключена по умолчанию, её можно включить в настройках
Новые планировщики:
- Align Your Steps
- KL Optimal
- Normal
- DDIM
- Simple
- Beta
Новый сэмплер: DDIM CFG++

Незначительные изменения:

Возможность пропуска CFG на ранних шагах
Добавлена опция --models-dir
Позволяет мобильным пользователям открывать контекстное меню нажатием двумя пальцами
Infotext: добавление имени Lora в виде хэшей TI для встроенной текстовой инверсии
Проверка хэша модели после её загрузки для предотвращения повреждённых загрузок
Дополнительные опции фильтрации тегов расширений
При сохранении в формате AVIF используется настройка качества JPEG
Добавлен шаблон имени файла: [basename]
Добавлена опция включения пропуска clip для clip L на SDXL
Опция для предотвращения перехода экрана в спящий режим во время генерации
Кнопка ToggleLivePreview в просмотрщике изображений
Устранение мерцания интерфейса при перезагрузке и быстрой прокрутке
Опция отключения записи в log.csv кнопки сохранения

Расширения и API:

Добавлен хук process_before_every_sampling
Возврат HTTP 400 вместо 404 при ошибке недопустимого сэмплера

Производительность:

[Производительность 1/6] use_checkpoint = False
[Производительность 2/6] Замена einops.rearrange на нативные операции torch
[Производительность 4/6] Предварительный расчёт флага is_sdxl_inpaint
[Производительность 5/6] Предотвращение ненужного резервного копирования смещений дополнительных сетей
[Производительность 6/6] Добавлена опция --precision half для избежания приведения типов во время вывода
[Производительность] Патчи оптимизации LDM
[Производительность] Хранение сигм на CPU
Проверка на наличие nan в unet только один раз, после завершения всех шагов
Добавлена возможность запуска профилировщика torch для генерации изображений

Исправления ошибок:

Исправление для сеток без полных infotext
Частичное обновление lora предшествует полному обновлению
Исправлена ошибка, когда расширение файла имело дополнительную точку при некоторых обстоятельствах
Исправление зацикливания при начальной загрузке поврежденной модели
Разрешение использования старых имён сэмплеров в API
Улучшена совместимость со старыми планировщиками сэмплеров
Исправление Hypertile xyz
XYZ CSV skipinitialspace
Исправление мягкого инпейнтинга на mps и xpu, torch_utils.float64
Исправление обновления расширений при нахождении не на основной ветке
Обновление безопасных имён файлов для pickle
Использование относительного пути для css webui-assets
При создании виртуального окружения обновление pip в webui.bat/webui.sh
Исправление AttributeError
Использование script_path для корня webui в launch_utils
Исправление режима дополнительной партии P Transparency
Использование цветов темы gradio в css
Исправление перетаскивания текста внутри поля ввода подсказки
Добавление правильного MIME-типа для файлов .mjs
Улучшение обработки проблем с метаданными для моделей SD, Loras и эмбеддингов
Замена wsl-open на wslpath и explorer.exe
Исправление SDXL Inpaint
Многоразмерная сетка
Исправление замены предпросмотра
Возможное исправление неправильного масштаба в декомпозиции весов
Обеспечение использования python из venv на Mac и Linux
Приоритет python3.10 над python3, если оба доступны на Linux и Mac (с запасным вариантом)
Остановка генерации дополнений
Исправление загрузки SD2
Исправление хэшей Lora в infotext для hires fix с разными lora
Исправление предупреждения об автокоррекции планировщика сэмплера
Исправление мерцания интерфейса при перезагрузке и быстрой прокрутке
Исправление логики апскейла
Исправление ошибки при записи изображений в режиме P как JPEG
Другие изменения (включая обновления документации, исправления опечаток, обновления зависимостей и мелкие улучшения)

Если вы всё-таки решили обновиться, несмотря на возможные проблемы, процесс остается таким же, как я описывал для предыдущих версий. Добавьте аргумент запуска "git pull" в ваш файл webui-user.bat, открыв его в блокноте. Если не хотите обновляться при каждом запуске, можете после обновления удалить этот аргумент.

Для пользователей портативной версии: проверьте наличие файла update.bat и запустите его для обновления.

В случае возникновения проблем я рекомендую либо выполнить чистую установку, либо как минимум удалить папку "venv" в директории Automatic1111. Это позволит заново установить все зависимости и может решить возникшие проблемы.

Помните, что стабильность работы важнее новых функций, особенно если эти функции пока не работают корректно. Будьте осторожны с обновлениями и всегда имейте резервную копию вашей рабочей конфигурации.

Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Всех обнял. Удачных генераций!

Показать полностью 3

[моё] Искусственный интеллект Stable Diffusion Нейронные сети Automatic1111 Обновление Арты нейросетей Sdxl Длиннопост Sd3

Nerual.Dreming

6 месяцев назад

Stable Diffusion & Flux

Обновление нейро-интерфейса Fooocus до версии v2.4.1, Hyper-SD и TCD, что еще нового, как обновиться?⁠⁠

Сгенерировано за 2 секунды и за 6 шагов на TCD

Друзья, всем привет! Недавно популярный нейросетевой интерфейс Fooocus обновился сразу до версии v2.4.1. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист. Давайте посмотрим, какие основные нововведения и улучшения появились. Я отдельно озвучу самые заметные обновления и оставлю полный список изменений в конце.

Добавился новый режим Hyper-SD, это еще одна лора чтобы генерировать за 4 шага в ущерб качеству, кому-то пригодится, работает не хуже чем лайтнинг.

Aspect Ratios - разрешения теперь зачем-то свернуты, меня лично это бесит, это не красиво и не удобно.

Random style - случайный стиль при каждой генерации будет включать - случайный стиль, если вам совсем нечем заняться, не забудьте выставить на максимум количество изображений.

На вкладке Debug Menu в разделе Inpaint вы найдете Inpaint brush color, на тот случай если вас всегда бесил белый цвет маски.

Там же в Debug Menu, но уже в разделе Debug Tools появился параметр CLIP Skip, который по умолчанию выставлен на 2, имейте это ввиду.

Там же добавились семплер и планировщик TCD, которые запрашивал ваш покорный слуга. Сначала скачайте и включите вот эту лору, затем в Debug Menu, в разделе Debug Tools поставьте на 1 CFG Mimicking from TSNR, затем Sampler поставьте TCD, а Scheduler - sgm_uniform, ниже Forced Overwrite of Sampling Step поставьте на 6, я нашел это оптимальным значением для соотношения скорость - качество, но вы конечно можете поэкспериментировать и написать в комментариях как работает лучше. Guidance Scale рекомендуется поставить на минимум, но я нахожу что на 1.5-2 изображения получаются интереснее. Изображение с обложки было создано именно в таком режиме всего за 6 шагов и за 2 секунды в разрешении 1280х768, а так и не скажешь. Еще несколько изображений в карусели ниже.

1/6

Изображения созданы в TCD

Все новые функции и улучшения:

Добавлена возможность загружать файлы с Hugging Face через зеркальный сайт.
Обновлен модуль Interposer с v3.1 до v4.0.
Теперь можно переподключиться к интерфейсу без перезагрузки страницы с помощью специальной кнопки.
Появился выбор VAE моделей для генерации.
Добавлен новый стиль "Random Style" для случайного выбора стиля.
Обновлена модель аниме с animaPencilXL_v100 до animaPencilXL_v310.
В историю логов теперь сохраняются полные необработанные промпты (full raw prompts).
При загрузке изображения для апскейла (upscaling) теперь можно автоматически получить его описание.
Добавлена цензура NSFW изображений (отключает предварительный просмотр промежуточного изображения при генерации). Установите значение конфигурации default_black_out_nsfw в True, чтобы всегда включать эту опцию.
Добавлена поддержка встроенных ссылок на LoRA в промптах с поддержкой подпапок, пример: colorful bird lora:toucan:1.2
При описании изображения теперь даются рекомендации по размеру и соотношению сторон.
В инструменте инпейнтинга появился выбор цвета кисти, что удобно, когда изображение и кисть маски имеют одинаковый цвет.
Автоматизирована сборка Docker-образа с помощью Github Actions при каждом релизе.

Планировщики и семплеры:

Добавлен планировщик AlignYourSteps от Nvidia.
Добавлены семплер TCD и планировщик, основанный на sgm_uniform (аналогично lcm).

Производительность:

Добавлена производительность "hyper-sd" на основе 4-шагового LoRA.

Исправления:

Исправлено значение clip skip по умолчанию с 1 на 2.
Добавлена проверка типов на неопределенные значения, использование резервных вариантов, когда нет перевода для соотношений сторон.
Использовано корректное свойство CSS border-radius.
Исправлен незакрытый мета-тег в заголовке HTML.
Удален оставшийся код для тестирования hyper-sd.
Оптимизировано управление моделями для цензуры NSFW изображений.
Улучшена панель прогресса генерации.
Оптимизирована работа со встроенными LoRA.

Настройки интерфейса:

Элементы вкладки настроек стали более компактными.
Добавлен слайдер clip skip.
У большинства полей ввода изображений удалены подписи.
Настройки пользовательского интерфейса стали более компактными.

Прочее:

Изменен владелец кода с @lllyasviel на @mashb1t для автоматического уведомления о проблемах и Merge Requests.
Используются только действительные встроенные LoRA, добавлена поддержка подпапок.
Значение 'CFG Mimicking from TSNR' теперь читается из пресетов.
Изменена конфигурация окончания строк по умолчанию.

Оригинальный список изменений доступен на странице автора.

Как обновиться?

Скорее всего обновление уже произошло автоматически когда вы запускали фокус и никаких специальных действий не требуется. Если в консоли вы видите Already up-to-date, то можно не беспокоиться.

Но в моем случае была вот такая ошибка и я не нашел иного решения как просто скачать новый установщик и после этого все прошло гладко.

Читайте другие мои материалы о нейросети Fooocus:

А если захотите изучить Fooocus профессионально, то приглашаю на мой курс Fooocus.ru, где за 15 уроков вы узнаете всю базу необходимую для дальнейшего развития.

Показать полностью 14

[моё] Искусственный интеллект Нейронные сети Stable Diffusion Fooocus Обновление Sdxl Арты нейросетей Компьютерная графика Дизайн Длиннопост

Nerual.Dreming

8 месяцев назад

Stable Diffusion & Flux

Вышла Stable Diffusion 3 от Stability AI: Лучшая модель для генерации изображений. Но есть нюанс...⁠⁠

1/16

Компания Stability AI анонсировала долгожданный релиз Stable Diffusion 3, включая более быструю версию Stable Diffusion 3 Turbo. Согласно их исследовательской статье, новая модель, основанная на архитектуре Multimodal Diffusion Transformer (MMDiT), использует отдельные наборы весов для представления изображений и языка, что улучшает понимание текста и возможности правописания по сравнению с предыдущими версиями Stable Diffusion. Они заявляют, что Stable Diffusion 3 равна или превосходит современные системы генерации изображений из текста, такие как DALL-E 3 и Midjourney v6, в типографике и следовании промптам, основываясь на оценках человеческих предпочтений. Я собрал для вас лучшие работы созданыне на SD3 с редита, чтобы вы самостоятельно сделали выводы и написали их в комментариях.

Однако, несмотря на значительные улучшения, Stable Diffusion 3 пока доступен только через API на платформе для разработчиков Stability AI, созданной в партнерстве с Fireworks AI. Компания обещает в будущем сделать веса модели доступными для самостоятельного хостинга, но только для членов Stability AI. Это вызывает вопросы о приверженности Stability AI принципам открытости и open-source, которые они продвигали ранее.

1/14

Понятно, что всем компаниям нужно зарабатывать деньги, но такой подход к релизу Stable Diffusion 3 выглядит как отход от изначальных идеалов Stability AI. Не идут ли они по стопам OpenAI, которые переключились на закрытые проприетарные продукты? Это настораживающая тенденция для сообщества, которое ценит открытость и доступность ИИ технологий.

Варианты членства в Stability AI

Stability AI предлагает несколько вариантов членства для доступа к своим моделям:

Бесплатное членство для некоммерческого использования, включающее доступ к полному набору Core Models, ранний доступ к новым моделям, участие в сообществе и специальные мероприятия.
Профессиональное членство за $20 в месяц для коммерческого использования моделей компаниями с доходом менее $1 млн в год. Включает доступ к полному набору Core Models, сообщество для профессионалов и все преимущества бесплатного членства.
Корпоративное членство с индивидуальными условиями для крупных компаний, предлагающее доступ к Core Models, коммерческое использование, кастомный биллинг, корпоративные функции.

Компания сотрудничает с Fireworks AI для предоставления быстрого и надежного API, обещая корпоративное решение с 99.9% доступностью сервиса. Они заявляют о приверженности безопасным и ответственным ИИ практикам, стремясь предложить адаптируемые решения для раскрытия творческого потенциала людей и бизнеса.

1/13

Будем надеяться, что Stability AI в конечном итоге выпустит Stable Diffusion 3 в открытом доступе, как и предыдущие версии. В противном случае, это может оттолкнуть многих энтузиастов и разработчиков, которые поверили в миссию компании по демократизации ИИ.

Пока же нам остается довольствоваться API и ждать дальнейших новостей о судьбе Stable Diffusion 3.

Чтобы быть в курсе всех новостей и обновлений, подписывайтесь на мои YouTube, телеграм и Бусти. Буду рад вашей подписке и поддержке.

Показать полностью 43

[моё] Искусственный интеллект Нейронные сети Stable Diffusion Digital Арты нейросетей Обновление Длиннопост

Nerual.Dreming

8 месяцев назад

Stable Diffusion & Flux

Обновление нейро-интерфейса Automatic1111 версия 1.9.0: что нового и как обновиться?⁠⁠

Привет всем любителям генерации изображений! Недавно вышло обновление популярного интерфейса Automatic1111 для графической нейросети Stable Diffusion.
Хотя заметных нововведений не так много, есть несколько интересных изменений, о которых стоит рассказать.

Одно из самых ярких обновлений - это возможность выбора шедулера (scheduler) прямо в основном интерфейсе рядом с выбором семплера. В большинстве случаев рекомендуется использовать опцию "авто", и подходящий шедулер будет выбран автоматически.

Но что такое семплер и шедулер? Если упростить, семплер - это математический алгоритм отбора данных из латентного пространства, а шедулер - это настройка, определяющая, как часто семплер обращается к модели в латентное пространство. Это очень грубое объяснение, так что не кидайте в меня помидорами, а еще лучше напишите свою версию в комментариях!

В разделе Settings вы найдете вкладку Callbacks, которая позволяет поменять местами порядок вызовов. Это очень удобно для того, чтобы изменить порядок отображения вкладок в интерфейсе. ui_tabs callback priority отвечает за порядок отображение вкладок сверху в основном меню.

Просто выберите желаемый порядок в поле ввода ниже, и вкладки будут расположены соответствующим образом после перезапуска.

Также добавлена поддержка дополнительных видов экстрасетей: LoRa - DoRa и LyCORIS BOFT. Ведут они себя так же как обычные лоры, все форматы кладем в папку LoRa.

А для тех, кто заботится о приватности 😏, предусмотрен новый специальный режим. Достаточно добавить аргумент запуска --no-prompt-history, и история ваших запросов не будет сохраняться, сделаете батник для "особых" генераций.

А теперь давайте подробнее рассмотрим весь список.

Полный список изменений Automatic1111 в версии 1.9.0

Особенности:

Переключение на рефайнер теперь основывается времени генерации, а не на шагах семплирования. Это обеспечит более корректную работу.
Добавлена опция для отображения старого стиля списка директорий вместо древовидного. Также внесены стилистические изменения для элементов управления сортировкой и поиском экстрасетей.
Появился интерфейс для упорядочивания колбэков (callbacks) и возможность указывать порядок колбэков в метаданных расширений.
Добавлена поддержка планировщика Sgm uniform для моделей SDXL-Lightning.
Теперь выбор планировщика (scheduler) доступен в основном интерфейсе.

Другие изменения:

Кнопка "Открыть папку с изображениями" теперь открывает фактическую директорию.
Добавлена поддержка инференса сетей LyCORIS BOFT.
Описание карточек экстрасетей теперь отображается как обычный текст. При необходимости можно включить HTML-формат.
Появилась возможность изменять размер области с экстрасетями.
Добавлены аргументы командной строки для санитизации имен файлов в Unix-стиле и ограничения максимальной длины имен.
Параметры экстрасетей теперь показываются в виде HTML-таблицы вместо сырого JSON.
Реализована поддержка DoRA (weight-decompose) для LoRA/LoHa/LoKr.
Можно отключить историю последних запросов с помощью аргумента --no-prompt-history.
Предпросмотр обновляется при использовании функции Replace Preview.
Обновления загружаются только для активных веток расширений в Git.
Интерфейс постобработки при апскейле помещен в аккордеон.
Поддержка перетаскивания URL для чтения infotext.
Использование библиотеки diskcache для кэширования.
Поддержка PNG-RGBA для вкладки Extras.
Возможность использовать обложки, встроенные в метаданные safetensors.
Более быстрое прерывание при использовании нейросетевого апскейла.

Расширения и API:

Разрешено переопределять параметр масштабирования столбцов в ResizeHandleRow.
Исправлены проблемы с встроенным расширением extra-options-section.
Возможность использовать zoom.js вне контекста веб-интерфейса.
Поддержка вариантов имени расширения в metadata.ini.
Сделана опциональной перезагрузка скриптов интерфейса при Reload UI.
Добавлен параметр request: gr.Request в начало функции img2img, аналогично txt2img.
Функция open_folder доступна как утилита.

Исправления ошибок:

Исправлена ошибка двойного апскейла при инпейнтинге.
Устранена проблема с кнопкой перезагрузки, которая иногда не появлялась для экстрасетей.
Исправлен параметр split_threshold, который не работал при разделении изображений большого размера.
Исправлено поведение изменения размеров для вертикального макета (мобильные устройства).
Улучшен механизм регистрации временных файлов.
Исправлены различные ошибки, связанные с функциями emphasis, Soft Inpaint, встроенной системой LoRA, стилями при использовании Hires prompt и многое другое.

Железо:

Добавлена поддержка обучения и изменен lspci для Ascend NPU.
Обновление до ROCm5.7 и PyTorch.
Улучшен обходной путь для Navi1, удален --pre для Navi3.
Добавлена страница wiki для Ascend NPU.

Прочее:

Обновлен комментарий для Pad prompt/negative prompt v0 с предупреждением об усечении, сделано переопределение реализации v1.
Поддержка изменения размера столбцов для сенсорных устройств (планшетов).
Использование абсолютного пути для нормализованного пути к файлу.
Обработка двойного нажатия в resizeHandle.
Флаг командной строки --dat-models-path.
Добавлена прямая ссылка на бинарный релиз.
Уменьшено ведение журнала в upscaler_utils.
Исправлены различные опечатки с помощью crate-ci/typos.
Обработка ошибок для неподдерживаемой прозрачности.
Добавлено описание модели в искомые термины.
Обновлена версия действия.
Аннотации PEP 604.
Автоматическая установка масштаба по значению при выборе модели апскейла.
Перемещено postprocessing-for-training во встроенные расширения.
Аннотации типов в shared.py.
Обновлен ruff до 0.3.3.
Обновлены утилиты PyTorch Lightning.
Добавлен параметр Size в сетку XYZ.
Использование переменной HF_ENDPOINT для домена HuggingFace с значением по умолчанию.
Повторное добавление update_file_entry.
Разрешение использования индекса и вызываемого объекта в create_infotext, переработка Hires prompt infotext.
Обновление restricted_opts для включения дополнительных опций для --hide-ui-dir-config.

С оригиналом на английском и ссылками на коммиты можно ознакомиться на этой странице.

Как обновиться?

Добавьте аргумент запуска git pull в ваш webui-user.bat, для этого просто откройте файл в блокноте, если не хотите обновляться при каждом запуске (рекомендую оставить), можете после обновления убрать его из файла.

Если у вас портативная версия, то возможно в ней есть update.bat, тогда активируйте его для обновления.

А на этом у меня все, надеюсь, обновление у вас пройдет гладко, и вы сможете насладиться новыми возможностями Automatic1111 версии 1.9.0.

Показать полностью 5

[моё] Искусственный интеллект Stable Diffusion Нейронные сети Automatic1111 Обновление Арты нейросетей Sdxl Длиннопост

Nerual.Dreming

9 месяцев назад

Stable Diffusion & Flux

Вышло обновление Automatic 1111 до версии 1.8.0, что нового и как обновиться?⁠⁠

Всем привет, вчера обновился Automatic 1111 - самый популярный интерфейс для генерации изображений с помощью нейросетей Stable Diffusion. Посмотрим что нового!

Внизу будет полный чейнджлог который я постарался аккуратно перевести, но сперва я расскажу вам о самых заметных и приятных нововведениях, их не много, но они действительно крутые!

Мягкий инпеинтинг и поддержка моделей инпеинтинга для SDXL

Soft инпеинтинг с дополнительным размытием краев позволяет добиться невероятного качества изменения. Переходы теперь идеальные между оригиналом и инпеинтингом. Особенно если использовать модель для инпеинтинга SDXL, поддержка которых теперь доступна из коробки, просто скачайте модель как обычно. Взгляните на результаты, почти как ControlNet Inpainting в Fooocus.

Чтобы все работало хорошо надо поставить на максимум Mask blur, Masked content ставьте Original если хотите изменить то что уже нарисовано, например глаза или волосы, или Fill, если хотите добавить то, чего нет, например одеть очки или шляпу. Может понадобится поиграться с ползунком Denoising strength, в зависимости о задачи хорошо себя показывают значения от 0.5 до 1.

Структура папок при выборе моделей и лор

Поменялся интерфейс в меню экстрасетей (модели, лоры, эмбединги), теперь навигация представлена деревом каталогов и это наконец-то стало удобно.

Поддержка апскейлеров архитектуры DAT

Добавлена нативная поддержка апскейлеров формата DAT, попробуйте скачать 4xLSDIRDAT в папку stable-diffusion-webui\models\DAT, не страшно если её нет, можете создать, она появится при попытке активировать DAT апскейлер на вкладке Extras.

Кнопка быстрого Hires. fix

В txt2img теперь есть кнопка, которая позволяет сделать Hires. fix на уже готовой картинке, при этом сразу начинается апскейл экономя время.

Полный список изменений Automatic1111 версии 1.8.0

Основные особенности

Обновление PyTorch до версии 2.1.2: улучшает общую производительность и добавляет новые функции.
Мягкая заливка (Soft Inpainting): позволяет более естественно заполнять области на изображении.
Поддержка FP8: использует меньшие объемы памяти при тех же вычислительных возможностях.
Поддержка модели SDXL-Inpaint: предназначена для инпеинтинга областей на изображениях, созданных с помощью Stable Diffusion SDXL.
Использование Spandrel: предлагает улучшенное качество результатов масштабирования и восстановления лиц.
Автоматическая совместимость с предыдущими версиями: гарантирует корректную работу при загрузке infotext из старых изображений.
Zero terminal SNR noise schedule option: предоставляет пользователям больший контроль над процессом генерации.
Кнопка [✨] для исправления высокого разрешения: упрощает процесс улучшения качества выбранного изображения в галерее c помощью Hi-Res. Fix. .
Отдельный репозиторий ресурсов: снижает зависимость от внешних сервисов и повышает безопасность.
Официальная поддержка сэмплера LCM: расширяет возможности выбора алгоритмов генерации.
Поддержка моделей апскейлеров DAT: позволяет увеличить детализацию изображений.
Деревовидное представление экстра сетей: упрощает навигацию и управление экстросетями.
Поддержка NPU (нейронных процессоров): ускоряет генерацию изображений на соответствующем оборудовании.
Поддержка комментариев к промптам: облегчает документирование и понимание процесса создания изображений.

Незначительные изменения

Вставка строк WIDTHxHEIGHT: теперь можно вставить строки с указанием ширины и высоты изображения в соответствующие поля.
Живой предпросмотр на весь экран: добавлена опция для просмотра результатов генерации во весь экран.
Сочетания клавиш для управления: добавлены сочетания клавиш для запуска генерации, пропуска и прерывания.
Поддержка TCMALLOC: улучшена поддержка TCMALLOC на разных платформах для более эффективного использования памяти.
Предупреждение о не найденном Lora: теперь появляется предупреждение, если модель Lora не найдена.
Добавление отрицательных подсказок к Lora: появилась возможность добавлять отрицательные подсказки к моделям Lora в дополнительных сетях для более тонкой настройки генерации.
Разные сиды в сетке xyz_grid: теперь можно устанавливать разные значения случайного числа (seed) для каждой оси в сетке xyz_grid.
Преобразование VAE в bfloat16: добавлена опция для преобразования VAE в формат bfloat16, что позволяет экономить память без существенного влияния на качество.
Улучшенная поддержка IPEX: улучшена поддержка библиотеки IPEX для ускорения вычислений на графических процессорах Intel.
Прерывание генерации: появилась возможность прервать генерацию после завершения текущей итерации, а не ждать ее полного окончания.
Управление полноэкранным предпросмотром: добавлено плавное появление/исчезновение элементов управления полноэкранным предпросмотром для более удобного взаимодействия.
Более точный контроль заморозки настроек: теперь можно более точно выбирать, какие настройки будут заморожены и не будут меняться при изменении других параметров.
Увеличение лимитов для апскейлеров: увеличены лимиты для апскейлеров, что позволяет работать с большими разрешениями.
Регулировка размера кисти горячими клавишами: появилась возможность регулировать размер кисти с помощью горячих клавиш.
Информация о модели: добавлена информация о модели в файл журнала CSV при сохранении изображений.
Изменение размера столбцов: теперь можно менять размер большего количества столбцов в интерфейсе.
Отключение наложения исходного изображения при инпеинтинге: добавлена опция не накладывать исходное изображение при инпеинтинге областей, позволяя увидеть результат инпеинтинга без наложения оригинала.
Поддержка DDIM: добавлена опция Pad conds v0 для поддержки совместимости с алгоритмом генерации DDIM, как это было до версии 1.6.0.
Плейсхолдер "Прерывание...": добавлен плейсхолдер "Прерывание..." для информирования пользователя о процессе остановки генерации.
Кнопка обновления списка расширений: добавлена кнопка для обновления списка установленных расширений.
Отключение пост-нормализации: добавлена опция для отключения нормализации изображения после расчета усиления, (disable normalize embeddings after calculating emphasis).
Подсчет токенов: теперь при подсчете токенов учитываются включенные стили.
Конфигурация кнопки [📂]: добавлена возможность настройки кнопки [📂] для управления отображением изображений в галерее.
Вывод изображений с LyCORIS BOFT: добавлена поддержка вывода изображений с использованием сетей LyCORIS BOFT.
Поддержка изменения размера столбцов на сенсорных устройствах: добавлена поддержка изменения ширины столбцов для удобства работы на планшетах.

Расширения и API

Удалены пакеты: больше не требуются пакеты basicsr, gfpgan, realesrgan, а также их зависимости: absl-py, addict, beautifulsoup4, future, gdown, grpcio, importlib-metadata, lmdb, lpips, Markdown, platformdirs, PySocks, soupsieve, tb-nightly, tensorboard-data-server, tomli, Werkzeug, yapf, zipp, soupsieve.
Идентификаторы задач для API: добавлена поддержка идентификаторов задач для API, что позволяет разработчикам отслеживать выполнение задач.
Поддержка override_settings для API infotext: добавлена возможность переопределять настройки API infotext.
Переименование модуля: модуль generation_parameters_copypaste переименован в infotext_utils.
Исправлен сбой: исправлен сбой, вызванный исключением Script init.
Обновление numpy: библиотека numpy обновлена до версии 1.26.2.
Утилита для проверки модели: добавлена утилита для проверки типа данных и устройства модели.
Общий метод forward для lora: реализован общий метод forward для всех методов встроенного расширения lora.
Выполнение model_loaded_callback: callback model_loaded_callback теперь выполняется после перемещения модели на целевое устройство.
self в CFGDenoiserParams: добавлен параметр self для CFGDenoiserParams, что повышает стабильность работы denoiser.
TLS в режиме API: разрешен TLS в режиме API only (--nowebui).
Новый callback: добавлен новый callback postprocess_image_after_composite.
Обновление API modules/api/api.py: добавлена эндпоинт API для обновления списка эмбедингов.
Функция set_named_arg: добавлена функция set_named_arg, позволяющая разработчикам устанавливать значения аргументов по имени.
Callback before_token_counter: добавлен callback before_token_counter, который используется для комментариев к подсказкам.
ResizeHandleRow: добавлена возможность переопределять параметр масштаба столбца ResizeHandleRow.

Производительность

Улучшение производительности: значительно улучшена производительность для каталогов экстрасетей с большим количеством файлов.
Сокращение повторного индексирования: сокращено ненужное повторное индексирование каталога экстрасетей .
Оптимизация вызовов isfile/exists: исключены ненужные вызовы isfile/exists.

Исправления ошибок

Исправлены множественные ошибки, связанные с поддержкой нескольких файлов стилей.
Исправлены ошибки, связанные с использованием Lora.
Восстановлена утерянная настройка (связанная с коммитом e294e46).
Исправлена ошибка капсинга BLIP в Extras.
Теперь информация infotext включается в сохраняемое исходное изображение для img2img.
Исправлена обработка ситуации, когда axis_type в сетке xyz_grid имеет значение None.
Добавлена функциональность IPv6 (когда аргумент Webui не передается).
Исправлены проблемы с потокобезопасностью API для txt2img и img2img.
Исправлена обработка случаев, когда selectable script_index имеет значение None.
Исправлена ошибка загрузки файла config.json.
Исправлено преобразование infotext из строкового типа в float.
Устранена проблема с настройкой GRADIO_ANALYTICS_ENABLED.
Исправлена конфигурация ведения логов.
Исправлена обработка исключения CondFunc при разрешении атрибутов.
Исправлены сбои при больших батчах.
Исправлено использование неправильной модели из-за алиаса.
Добавлен символ # в список недопустимых символов в названиях файлов.
Исправлена проверка зависимостей для рассширений.
Исправлен сброс индексов вкладок после перезапуска интерфейса.
Исправлено вложенное ручное преобразование типов.
Сохраняется выбор апскйлера после перезапуска.
Исправлена фильтрация пустых значений в сетке XYZ, когда axis имеет целочисленный или десятичный тип (например, seed оси int).
Исправлено регулярное выражение CLIP Interrogator topN.
Исправлена ошибка типа данных в слое MHA/изменен механизм проверки типа данных для ручного преобразования.
Обработана ошибка загрузки файла style.csv.
Исправлена ошибка при редактировании карточек экстрасетей.
Исправлена работа метаданных экстрасетей при первом создании файла .json с метаданными.
Функция util.walk_files теперь нечувствительна к регистру расширений.
Запрещено применение настроек, если страница расширений не загружена.
Вызвана правильная функция для подсчета токенов в img2img.
Исправлены ошибки исчезновения поиска/перезагрузки при использовании других расширений ExtraNetworks.
Изящная обработка исключения чтения mtime из кэша.
Прерывание по клавише Escape срабатывает только при видимой кнопке прерывания.
Опция отключения подсчета токенов подсказок действительно отключает подсчет, а не просто скрывает результаты.
Исправлено двойное масштабирования при инпейнте.
Исправлено использование переведенного контента для сопоставления категорий.
Исправлена работа параметра split_threshold при разделении больших изображений.
Исправлена обработка изменения размера для мобильных устройств.

Другие изменения

Добавлен идентификатор для "extra_options". Заменено числовое поле на слайдер.
Изменено сравнение state dict на ref compare.
Обновлена библиотека torch-rocm до версий 5.6/5.7.
Путь к выходным файлам теперь основан на пути к данным.
Изменён порядок модулей препроцессинга в вкладке "Extras".
Удалён код cleanup_models.
Теперь файл конфигурации интерфейса перезаписывается только при наличии изменений.
Исправлена проблема с линтером из коммита 501993e.
Обновлен файл README.md.
Исправлена работа кнопки высокого разрешения и теперь фиксирует сид.
Улучшено ведение логов, включая резервный логгер.
Информация о генерации теперь читается из infotexts, а не из json.
Улучшен метод get_crop_region.
Обновлена версия библиотеки safetensors до 0.4.2.
Добавлены всплывающие подсказки для create_submit_box.
Реализовано подсветка строк таблицы при наведении курсора в вкладке расширения.
Всегда добавляется временная метка к отображаемому изображению.
Добавлена настройка core.filemode=false, чтобы не отслеживать изменения прав доступа к файлам.
Нормализованы пути в аргументах командной строки.
В строке прогресса теперь используется оригинальное название приложения.
Метод register_tmp_file теперь используется также для mtime.

Ознакомиться с оригиналом и прочитать список всех изменения можно на этой странице.

Как обновиться?

Если у вас портативная версия, то возможно в ней есть update.bat, тогда активируйте его для обновления.

В случае если обновление происходит с ошибками может помочь удаление папки venv, после перезапуска автоматик сам перекачает окружение.

Я рассказываю больше о нейросетях и делюсь иллюстрациями у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке.

Показать полностью 6 1

[моё] Искусственный интеллект Нейронные сети Stable Diffusion Automatic1111 Sdxl Обновление Изменения Компьютерная графика Дизайн Видео Без звука Длиннопост

Посты не найдены

1 2 3