Обновление нейро-интерфейса Fooocus до версии v2.4.1, Hyper-SD и TCD, что еще нового, как обновиться?
Друзья, всем привет! Недавно популярный нейросетевой интерфейс Fooocus обновился сразу до версии v2.4.1. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист. Давайте посмотрим, какие основные нововведения и улучшения появились. Я отдельно озвучу самые заметные обновления и оставлю полный список изменений в конце.
Добавился новый режим Hyper-SD, это еще одна лора чтобы генерировать за 4 шага в ущерб качеству, кому-то пригодится, работает не хуже чем лайтнинг.
Aspect Ratios - разрешения теперь зачем-то свернуты, меня лично это бесит, это не красиво и не удобно.
Random style - случайный стиль при каждой генерации будет включать - случайный стиль, если вам совсем нечем заняться, не забудьте выставить на максимум количество изображений.
На вкладке Debug Menu в разделе Inpaint вы найдете Inpaint brush color, на тот случай если вас всегда бесил белый цвет маски.
Там же в Debug Menu, но уже в разделе Debug Tools появился параметр CLIP Skip, который по умолчанию выставлен на 2, имейте это ввиду.
Там же добавились семплер и планировщик TCD, которые запрашивал ваш покорный слуга. Сначала скачайте и включите вот эту лору, затем в Debug Menu, в разделе Debug Tools поставьте на 1 CFG Mimicking from TSNR, затем Sampler поставьте TCD, а Scheduler - sgm_uniform, ниже Forced Overwrite of Sampling Step поставьте на 6, я нашел это оптимальным значением для соотношения скорость - качество, но вы конечно можете поэкспериментировать и написать в комментариях как работает лучше. Guidance Scale рекомендуется поставить на минимум, но я нахожу что на 1.5-2 изображения получаются интереснее. Изображение с обложки было создано именно в таком режиме всего за 6 шагов и за 2 секунды в разрешении 1280х768, а так и не скажешь. Еще несколько изображений в карусели ниже.
![](https://cs14.pikabu.ru/post_img/2024/05/29/2/1716941484125186597.jpg)
![](https://cs13.pikabu.ru/post_img/2024/05/29/2/1716941485193725481.jpg)
![](https://cs13.pikabu.ru/post_img/2024/05/29/2/1716941484158992792.jpg)
![](https://cs14.pikabu.ru/post_img/2024/05/29/2/1716941485124278092.jpg)
![](https://cs13.pikabu.ru/post_img/2024/05/29/2/1716941483195150755.jpg)
![](https://cs14.pikabu.ru/post_img/2024/05/29/2/1716941486159010947.jpg)
Изображения созданы в TCD
Все новые функции и улучшения:
Добавлена возможность загружать файлы с Hugging Face через зеркальный сайт.
Обновлен модуль Interposer с v3.1 до v4.0.
Теперь можно переподключиться к интерфейсу без перезагрузки страницы с помощью специальной кнопки.
Появился выбор VAE моделей для генерации.
Добавлен новый стиль "Random Style" для случайного выбора стиля.
Обновлена модель аниме с animaPencilXL_v100 до animaPencilXL_v310.
В историю логов теперь сохраняются полные необработанные промпты (full raw prompts).
При загрузке изображения для апскейла (upscaling) теперь можно автоматически получить его описание.
Добавлена цензура NSFW изображений (отключает предварительный просмотр промежуточного изображения при генерации). Установите значение конфигурации default_black_out_nsfw в True, чтобы всегда включать эту опцию.
Добавлена поддержка встроенных ссылок на LoRA в промптах с поддержкой подпапок, пример: colorful bird lora:toucan:1.2
При описании изображения теперь даются рекомендации по размеру и соотношению сторон.
В инструменте инпейнтинга появился выбор цвета кисти, что удобно, когда изображение и кисть маски имеют одинаковый цвет.
Автоматизирована сборка Docker-образа с помощью Github Actions при каждом релизе.
Планировщики и семплеры:
Добавлен планировщик AlignYourSteps от Nvidia.
Добавлены семплер TCD и планировщик, основанный на sgm_uniform (аналогично lcm).
Производительность:
Добавлена производительность "hyper-sd" на основе 4-шагового LoRA.
Исправления:
Исправлено значение clip skip по умолчанию с 1 на 2.
Добавлена проверка типов на неопределенные значения, использование резервных вариантов, когда нет перевода для соотношений сторон.
Использовано корректное свойство CSS border-radius.
Исправлен незакрытый мета-тег в заголовке HTML.
Удален оставшийся код для тестирования hyper-sd.
Оптимизировано управление моделями для цензуры NSFW изображений.
Улучшена панель прогресса генерации.
Оптимизирована работа со встроенными LoRA.
Настройки интерфейса:
Элементы вкладки настроек стали более компактными.
Добавлен слайдер clip skip.
У большинства полей ввода изображений удалены подписи.
Настройки пользовательского интерфейса стали более компактными.
Прочее:
Изменен владелец кода с @lllyasviel на @mashb1t для автоматического уведомления о проблемах и Merge Requests.
Используются только действительные встроенные LoRA, добавлена поддержка подпапок.
Значение 'CFG Mimicking from TSNR' теперь читается из пресетов.
Изменена конфигурация окончания строк по умолчанию.
Оригинальный список изменений доступен на странице автора.
Как обновиться?
Скорее всего обновление уже произошло автоматически когда вы запускали фокус и никаких специальных действий не требуется. Если в консоли вы видите Already up-to-date, то можно не беспокоиться.
Но в моем случае была вот такая ошибка и я не нашел иного решения как просто скачать новый установщик и после этого все прошло гладко.
Читайте другие мои материалы о нейросети Fooocus:
А если захотите изучить Fooocus профессионально, то приглашаю на мой курс Fooocus.ru, где за 15 уроков вы узнаете всю базу необходимую для дальнейшего развития.
Обновление нейро-интерфейса Automatic1111 версия 1.9.0: что нового и как обновиться?
Привет всем любителям генерации изображений! Недавно вышло обновление популярного интерфейса Automatic1111 для графической нейросети Stable Diffusion.
Хотя заметных нововведений не так много, есть несколько интересных изменений, о которых стоит рассказать.
Одно из самых ярких обновлений - это возможность выбора шедулера (scheduler) прямо в основном интерфейсе рядом с выбором семплера. В большинстве случаев рекомендуется использовать опцию "авто", и подходящий шедулер будет выбран автоматически.
Но что такое семплер и шедулер? Если упростить, семплер - это математический алгоритм отбора данных из латентного пространства, а шедулер - это настройка, определяющая, как часто семплер обращается к модели в латентное пространство. Это очень грубое объяснение, так что не кидайте в меня помидорами, а еще лучше напишите свою версию в комментариях!
В разделе Settings вы найдете вкладку Callbacks, которая позволяет поменять местами порядок вызовов. Это очень удобно для того, чтобы изменить порядок отображения вкладок в интерфейсе. ui_tabs callback priority отвечает за порядок отображение вкладок сверху в основном меню.
Просто выберите желаемый порядок в поле ввода ниже, и вкладки будут расположены соответствующим образом после перезапуска.
Также добавлена поддержка дополнительных видов экстрасетей: LoRa - DoRa и LyCORIS BOFT. Ведут они себя так же как обычные лоры, все форматы кладем в папку LoRa.
А для тех, кто заботится о приватности 😏, предусмотрен новый специальный режим. Достаточно добавить аргумент запуска --no-prompt-history, и история ваших запросов не будет сохраняться, сделаете батник для "особых" генераций.
А теперь давайте подробнее рассмотрим весь список.
Полный список изменений Automatic1111 в версии 1.9.0
Особенности:
Переключение на рефайнер теперь основывается времени генерации, а не на шагах семплирования. Это обеспечит более корректную работу.
Добавлена опция для отображения старого стиля списка директорий вместо древовидного. Также внесены стилистические изменения для элементов управления сортировкой и поиском экстрасетей.
Появился интерфейс для упорядочивания колбэков (callbacks) и возможность указывать порядок колбэков в метаданных расширений.
Добавлена поддержка планировщика Sgm uniform для моделей SDXL-Lightning.
Теперь выбор планировщика (scheduler) доступен в основном интерфейсе.
Другие изменения:
Кнопка "Открыть папку с изображениями" теперь открывает фактическую директорию.
Добавлена поддержка инференса сетей LyCORIS BOFT.
Описание карточек экстрасетей теперь отображается как обычный текст. При необходимости можно включить HTML-формат.
Появилась возможность изменять размер области с экстрасетями.
Добавлены аргументы командной строки для санитизации имен файлов в Unix-стиле и ограничения максимальной длины имен.
Параметры экстрасетей теперь показываются в виде HTML-таблицы вместо сырого JSON.
Реализована поддержка DoRA (weight-decompose) для LoRA/LoHa/LoKr.
Можно отключить историю последних запросов с помощью аргумента --no-prompt-history.
Предпросмотр обновляется при использовании функции Replace Preview.
Обновления загружаются только для активных веток расширений в Git.
Интерфейс постобработки при апскейле помещен в аккордеон.
Поддержка перетаскивания URL для чтения infotext.
Использование библиотеки diskcache для кэширования.
Поддержка PNG-RGBA для вкладки Extras.
Возможность использовать обложки, встроенные в метаданные safetensors.
Более быстрое прерывание при использовании нейросетевого апскейла.
Расширения и API:
Разрешено переопределять параметр масштабирования столбцов в ResizeHandleRow.
Исправлены проблемы с встроенным расширением extra-options-section.
Возможность использовать zoom.js вне контекста веб-интерфейса.
Поддержка вариантов имени расширения в metadata.ini.
Сделана опциональной перезагрузка скриптов интерфейса при Reload UI.
Добавлен параметр request: gr.Request в начало функции img2img, аналогично txt2img.
Функция open_folder доступна как утилита.
Исправления ошибок:
Исправлена ошибка двойного апскейла при инпейнтинге.
Устранена проблема с кнопкой перезагрузки, которая иногда не появлялась для экстрасетей.
Исправлен параметр split_threshold, который не работал при разделении изображений большого размера.
Исправлено поведение изменения размеров для вертикального макета (мобильные устройства).
Улучшен механизм регистрации временных файлов.
Исправлены различные ошибки, связанные с функциями emphasis, Soft Inpaint, встроенной системой LoRA, стилями при использовании Hires prompt и многое другое.
Железо:
Добавлена поддержка обучения и изменен lspci для Ascend NPU.
Обновление до ROCm5.7 и PyTorch.
Улучшен обходной путь для Navi1, удален --pre для Navi3.
Добавлена страница wiki для Ascend NPU.
Прочее:
Обновлен комментарий для Pad prompt/negative prompt v0 с предупреждением об усечении, сделано переопределение реализации v1.
Поддержка изменения размера столбцов для сенсорных устройств (планшетов).
Использование абсолютного пути для нормализованного пути к файлу.
Обработка двойного нажатия в resizeHandle.
Флаг командной строки --dat-models-path.
Добавлена прямая ссылка на бинарный релиз.
Уменьшено ведение журнала в upscaler_utils.
Исправлены различные опечатки с помощью crate-ci/typos.
Обработка ошибок для неподдерживаемой прозрачности.
Добавлено описание модели в искомые термины.
Обновлена версия действия.
Аннотации PEP 604.
Автоматическая установка масштаба по значению при выборе модели апскейла.
Перемещено postprocessing-for-training во встроенные расширения.
Аннотации типов в shared.py.
Обновлен ruff до 0.3.3.
Обновлены утилиты PyTorch Lightning.
Добавлен параметр Size в сетку XYZ.
Использование переменной HF_ENDPOINT для домена HuggingFace с значением по умолчанию.
Повторное добавление update_file_entry.
Разрешение использования индекса и вызываемого объекта в create_infotext, переработка Hires prompt infotext.
Обновление restricted_opts для включения дополнительных опций для --hide-ui-dir-config.
С оригиналом на английском и ссылками на коммиты можно ознакомиться на этой странице.
Как обновиться?
Добавьте аргумент запуска git pull в ваш webui-user.bat, для этого просто откройте файл в блокноте, если не хотите обновляться при каждом запуске (рекомендую оставить), можете после обновления убрать его из файла.
Если у вас портативная версия, то возможно в ней есть update.bat, тогда активируйте его для обновления.
А на этом у меня все, надеюсь, обновление у вас пройдет гладко, и вы сможете насладиться новыми возможностями Automatic1111 версии 1.9.0.
Отличник или двоечник? Узнайте свой уровень подготовки к Евро-2024
Для всех поклонников футбола, Hisense подготовил крутой конкурс в соцсетях. Попытайте удачу, чтобы получить классный мерч и технику от глобального партнера чемпионата.
А если не любите полагаться на случай и сразу отправляетесь за техникой Hisense, не прячьте далеко чек. Загрузите на сайт и получите подписку на Wink на 3 месяца в подарок.
Реклама ООО «Горенье БТ», ИНН: 7704722037
Как писать промты для Stable Diffusion для генерации картинок
В данной статье мы рассмотрим как писать промты для нейросети Stable Diffusion, которая способна генерировать изображения на основе текстовых описаний. Эта информация будет полезной для желающих достичь высокой точности в передаче своих идей нейросети для получения впечатляющих изображений. Мы изучим разнообразные подходы, включая весовые коэффициенты, и проведем сравнение между SDXL и знаменитой SD 1.5.
Отмечу, что особенно высокой популярностью пользуется Stable Diffusion версии 1.5, так как она стала одной из первых высококачественных нейросетей, доступных для бесплатной установки на персональном компьютере.
SD 1.5 занимает лидирующие позиции среди лучших, поэтому мы подробно остановимся на методике создания запросов для нее.
Как писать промты для Stable Diffusion - пошаговое руководство
Запрос (промт) — это текстовое описание изображения, оно может быть как простым (например, 'жираф в лесу'), так и содержать более сложные элементы, такие как весовые коэффициенты, смешивание, LoRA и др.
Как составить простой промт для Stable Diffusion 1.5
Для базового понимания работы нейросети Stable Diffusion достаточно отправить ей краткий текст с названием объекта или существа для визуализации и минимальным описанием сцены (хотя последнее необязательно).
Пример:
👉 джентельмен сидит на скамейке в парке
Главное правило — в начале промта следует указывать основной объект изображения: человека, существо, предмет и т.д. Затем в запросе описывается окружение и, при необходимости, стиль, что представляет собой более продвинутый уровень формулировки промтов, который мы рассмотрим далее.
Отметим: у SD имеется множество функций, использование которых может быть сложным для новичков, поэтому я настоятельно рекомендую пользоваться профессиональными инструментами, адаптированными и упрощенными их создателями. В качестве такого инструмента я буду использовать этого бота в Telegram. Именно на примере этого бота я продемонстрирую написание запросов для Stable Diffusion, позволяя вам непосредственно тестировать описываемые принципы.
Более того, бот поддерживает обработку запросов на любом языке, включая русский, поэтому далее я буду представлять примеры именно на этом языке для вашего удобства.
В случае использования Stable Diffusion на личном компьютере или на различных платформах, необходимо формулировать запросы на английском языке, поскольку это основной язык для данной нейросети.
Структура для написания промтов в Stable Diffusion
Для создания изображений высокого качества и профессионального уровня, рекомендуется следовать данной схеме:
👉 Субъект, пространственное расположение, поза, детали субъекта, контекст, визуальные эффекты, стиль
Субъект (или несколько субъектов) — ключевой элемент, на который должно быть направлено внимание ИИ, например: 'мужчина' или 'собака в сапогах'.
Пространственное расположение — текстовым описанием определяется расстояние от главного субъекта до камеры.
Поза — это не обязательный элемент, который позволяет задать определенное положение объекта в пространстве. Например, можно указать, что объект "идет", "лежит", "прыгает" и так далее.
Детали субъекта — здесь вы перечисляете особенности главного элемента изображения. Например, это может быть мужчина в синем костюме, с короткими черными волосами, стройный, с серебряными аксессуарами.
Контекст — это описание пространства вокруг объекта и самого объекта. Например, мужчина в городском парке, утренний свет, скамейка, газета, утки в пруду, деревья.
Визуальные эффекты — это ключевые слова, которые помогут искусственному интеллекту создать нужную атмосферу изображения. Например, "ray tracing", "высокое разрешение", "динамичное окружение".
Стиль — это важный элемент, который позволяет ввести конкретный художественный стиль или упомянуть имена известных художников или фотографов. Примеры могут включать "в манере Ван Гога", "в духе Сальвадора Дали", "гиперреализм", "манга", "абстракционизм", "наивное искусство", "сюрреализм" и так далее.
Примечание: Элементы, указанные в этой 'формуле' для написания промтов, не являются обязательными. Это означает, что при формировании промтов для Stable Diffusion нет необходимости включать детали, которые кажутся вам несущественными, например, можно исключить стиль или контекст.
Создание промтов для Stable Diffusion с использованием коэффициентов важности
Искусственный интеллект SD, особенно его версия 1.5, оснащен функцией использования коэффициентов важности. Эти коэффициенты позволяют усилить или ослабить внимание к определенным объектам, характеристикам и т.д., упомянутым в запросе.
Увеличение важности через использование круглых скобок
Чтобы повысить акцент на конкретном аспекте запроса, можно использовать круглые скобки. Каждая пара скобок усиливает фокус примерно на 10%.
Пример:
👉 ((дятел летит)) над снежными горами — здесь не заданы коэффициенты важности.
…предположим, что ИИ никак не хочет добавлять снег на горы, при этом остальная часть изображения вас устраивает. В этом случае, мы используем круглые скобки в запросе так:
👉 дятел летит над (заснеженными горами)
…так мы увеличиваем фокус на 10% для фразы 'заснеженными горами'
👉 дятел (летит) над горами (((заснеженными горами)))
…в этом примере мы четко даем понять ИИ, что орел должен лететь именно над горами покрытыми снегом, при этом коэффициент важности для 'летит' увеличен на 10%, а для 'заснеженными горами' — на 30%.
Вопрос правильного составления промтов для Stable Diffusion достаточно обширен и его сложно уложить в одну статью, однако есть отличное видео на YouTube, где это объясняется очень подробно. Рекомендую к просмотру…
Руководство по составлению промтов для Stable Diffusion XL
В отличие от SD 1.5, SDXL лучше адаптирована к пониманию прямой речи, что позволяет писать промты для нейросети Stable Diffusion более естественным образом, похожим на общение с живым человеком. В большинстве случаев SDXL самостоятельно и корректно определяет коэффициенты важности без необходимости использования круглых или других скобок.
Пример генерации в SDXL с использованием промта без весовых коэффициентов 'Модная женщина уверенно стоит в оживленной городской обстановке. На ней платье до колен с цветочным принтом и подходящая широкополая шляпа. Ее волнистые волосы до плеч изящно ниспадают на плечи. Ее глаза очаровательного оттенка изумрудно-зеленого очаровывают всех, кто встречается с ней взглядом. Фотография, сделанная в винтажном полароидном стиле, имеет теплое, мягкое освещение, подчеркивающее ее сияющий цвет лица. На заднем плане шумный городской пейзаж с шумными улицами и красочными граффити создает оживленную атмосферу. Женщина уверенно держит холщовую сумку, наполненную художественными принадлежностями, намекая на ее творческий и авантюрный дух'
Эта информация должна стать хорошим стартом для изучения работы с нейросетью Stable Diffusion. Более детальные вопросы я планирую рассмотреть в последующих статьях, поэтому не забудьте подписаться на мой канал.
Лучшая нейросеть - Stable Diffusion Web Ui (Avtomatic1111) / Forge / Control net Photomaker / Краткий обзор расширений
В этом видео я расскажу о самой лучшей нейросети на сегодняшний день - Stable Diffusion WebUI Forge, аналог Avtomatic1111.
✨ Что вы узнаете:
- Процесс установки и откуда скачать Stable Diffusion WebUI Forge
- Об интерфейсе и основных настройках Forge скачать, как установить,
- О новых расширениях встроенных расширениях
- О новой модели для и Control net - Photomaker Желаю приятного просмотра)
🔥 Сборка уже обновлена включает в себя:
✅ дополнительные расширения: adetailer, clip-interrogator, sd-webui-ar-plus, sd-webui-prompt-all-in-one, sd-webui-tinycards, stylez, a-detailer
✅ популярные негативные инверсии, подборку моих стилей (около 200 шт.),
✅ дополнительные апскейлеры foolhardy-Remacri, NMKD-Faces, AnimeSharp, и др., VAE - 840000, 560000, sdxl, anime2 и пр. )
Там же все ссылки на все модели для Control net, модель photomaker а так же все остальные модели для Control net и многое другое
Триггерные слова для Photomaker - a photo of photomaker
Все модели, lora, lycoris, текстовые инверсии и пр. можно найти тут - civitai.com
✏️ Пример пути к вашим моделям в файле webui-user.bat:
--ckpt-dir "C:\Forge\webui\models\Stable-diffusion"
--embeddings-dir "C:\Forge\webui\embeddings"
--lora-dir "C:\Forge\webui\models\Lora"
--vae-dir "C:\Forge\webui\models\VAE"
--hypernetwork-dir "C:\Forge\webui\models\hypernetworks"
✏️ В Фокусе заходим в файл config.txt и исправляем путь по примеру -
"path_checkpoints": "C:\\Forge\\webui\\models\\Stable-diffusion",
Вышло обновление Automatic 1111 до версии 1.8.0, что нового и как обновиться?
Всем привет, вчера обновился Automatic 1111 - самый популярный интерфейс для генерации изображений с помощью нейросетей Stable Diffusion. Посмотрим что нового!
Внизу будет полный чейнджлог который я постарался аккуратно перевести, но сперва я расскажу вам о самых заметных и приятных нововведениях, их не много, но они действительно крутые!
Мягкий инпеинтинг и поддержка моделей инпеинтинга для SDXL
Soft инпеинтинг с дополнительным размытием краев позволяет добиться невероятного качества изменения. Переходы теперь идеальные между оригиналом и инпеинтингом. Особенно если использовать модель для инпеинтинга SDXL, поддержка которых теперь доступна из коробки, просто скачайте модель как обычно. Взгляните на результаты, почти как ControlNet Inpainting в Fooocus.
Чтобы все работало хорошо надо поставить на максимум Mask blur, Masked content ставьте Original если хотите изменить то что уже нарисовано, например глаза или волосы, или Fill, если хотите добавить то, чего нет, например одеть очки или шляпу. Может понадобится поиграться с ползунком Denoising strength, в зависимости о задачи хорошо себя показывают значения от 0.5 до 1.
Структура папок при выборе моделей и лор
Поменялся интерфейс в меню экстрасетей (модели, лоры, эмбединги), теперь навигация представлена деревом каталогов и это наконец-то стало удобно.
Поддержка апскейлеров архитектуры DAT
Добавлена нативная поддержка апскейлеров формата DAT, попробуйте скачать 4xLSDIRDAT в папку stable-diffusion-webui\models\DAT, не страшно если её нет, можете создать, она появится при попытке активировать DAT апскейлер на вкладке Extras.
Кнопка быстрого Hires. fix
В txt2img теперь есть кнопка, которая позволяет сделать Hires. fix на уже готовой картинке, при этом сразу начинается апскейл экономя время.
Полный список изменений Automatic1111 версии 1.8.0
Основные особенности
Обновление PyTorch до версии 2.1.2: улучшает общую производительность и добавляет новые функции.
Мягкая заливка (Soft Inpainting): позволяет более естественно заполнять области на изображении.
Поддержка FP8: использует меньшие объемы памяти при тех же вычислительных возможностях.
Поддержка модели SDXL-Inpaint: предназначена для инпеинтинга областей на изображениях, созданных с помощью Stable Diffusion SDXL.
Использование Spandrel: предлагает улучшенное качество результатов масштабирования и восстановления лиц.
Автоматическая совместимость с предыдущими версиями: гарантирует корректную работу при загрузке infotext из старых изображений.
Zero terminal SNR noise schedule option: предоставляет пользователям больший контроль над процессом генерации.
Кнопка [✨] для исправления высокого разрешения: упрощает процесс улучшения качества выбранного изображения в галерее c помощью Hi-Res. Fix. .
Отдельный репозиторий ресурсов: снижает зависимость от внешних сервисов и повышает безопасность.
Официальная поддержка сэмплера LCM: расширяет возможности выбора алгоритмов генерации.
Поддержка моделей апскейлеров DAT: позволяет увеличить детализацию изображений.
Деревовидное представление экстра сетей: упрощает навигацию и управление экстросетями.
Поддержка NPU (нейронных процессоров): ускоряет генерацию изображений на соответствующем оборудовании.
Поддержка комментариев к промптам: облегчает документирование и понимание процесса создания изображений.
Незначительные изменения
Вставка строк WIDTHxHEIGHT: теперь можно вставить строки с указанием ширины и высоты изображения в соответствующие поля.
Живой предпросмотр на весь экран: добавлена опция для просмотра результатов генерации во весь экран.
Сочетания клавиш для управления: добавлены сочетания клавиш для запуска генерации, пропуска и прерывания.
Поддержка TCMALLOC: улучшена поддержка TCMALLOC на разных платформах для более эффективного использования памяти.
Предупреждение о не найденном Lora: теперь появляется предупреждение, если модель Lora не найдена.
Добавление отрицательных подсказок к Lora: появилась возможность добавлять отрицательные подсказки к моделям Lora в дополнительных сетях для более тонкой настройки генерации.
Разные сиды в сетке xyz_grid: теперь можно устанавливать разные значения случайного числа (seed) для каждой оси в сетке xyz_grid.
Преобразование VAE в bfloat16: добавлена опция для преобразования VAE в формат bfloat16, что позволяет экономить память без существенного влияния на качество.
Улучшенная поддержка IPEX: улучшена поддержка библиотеки IPEX для ускорения вычислений на графических процессорах Intel.
Прерывание генерации: появилась возможность прервать генерацию после завершения текущей итерации, а не ждать ее полного окончания.
Управление полноэкранным предпросмотром: добавлено плавное появление/исчезновение элементов управления полноэкранным предпросмотром для более удобного взаимодействия.
Более точный контроль заморозки настроек: теперь можно более точно выбирать, какие настройки будут заморожены и не будут меняться при изменении других параметров.
Увеличение лимитов для апскейлеров: увеличены лимиты для апскейлеров, что позволяет работать с большими разрешениями.
Регулировка размера кисти горячими клавишами: появилась возможность регулировать размер кисти с помощью горячих клавиш.
Информация о модели: добавлена информация о модели в файл журнала CSV при сохранении изображений.
Изменение размера столбцов: теперь можно менять размер большего количества столбцов в интерфейсе.
Отключение наложения исходного изображения при инпеинтинге: добавлена опция не накладывать исходное изображение при инпеинтинге областей, позволяя увидеть результат инпеинтинга без наложения оригинала.
Поддержка DDIM: добавлена опция Pad conds v0 для поддержки совместимости с алгоритмом генерации DDIM, как это было до версии 1.6.0.
Плейсхолдер "Прерывание...": добавлен плейсхолдер "Прерывание..." для информирования пользователя о процессе остановки генерации.
Кнопка обновления списка расширений: добавлена кнопка для обновления списка установленных расширений.
Отключение пост-нормализации: добавлена опция для отключения нормализации изображения после расчета усиления, (disable normalize embeddings after calculating emphasis).
Подсчет токенов: теперь при подсчете токенов учитываются включенные стили.
Конфигурация кнопки [📂]: добавлена возможность настройки кнопки [📂] для управления отображением изображений в галерее.
Вывод изображений с LyCORIS BOFT: добавлена поддержка вывода изображений с использованием сетей LyCORIS BOFT.
Поддержка изменения размера столбцов на сенсорных устройствах: добавлена поддержка изменения ширины столбцов для удобства работы на планшетах.
Расширения и API
Удалены пакеты: больше не требуются пакеты basicsr, gfpgan, realesrgan, а также их зависимости: absl-py, addict, beautifulsoup4, future, gdown, grpcio, importlib-metadata, lmdb, lpips, Markdown, platformdirs, PySocks, soupsieve, tb-nightly, tensorboard-data-server, tomli, Werkzeug, yapf, zipp, soupsieve.
Идентификаторы задач для API: добавлена поддержка идентификаторов задач для API, что позволяет разработчикам отслеживать выполнение задач.
Поддержка override_settings для API infotext: добавлена возможность переопределять настройки API infotext.
Переименование модуля: модуль generation_parameters_copypaste переименован в infotext_utils.
Исправлен сбой: исправлен сбой, вызванный исключением Script init.
Обновление numpy: библиотека numpy обновлена до версии 1.26.2.
Утилита для проверки модели: добавлена утилита для проверки типа данных и устройства модели.
Общий метод forward для lora: реализован общий метод forward для всех методов встроенного расширения lora.
Выполнение model_loaded_callback: callback model_loaded_callback теперь выполняется после перемещения модели на целевое устройство.
self в CFGDenoiserParams: добавлен параметр self для CFGDenoiserParams, что повышает стабильность работы denoiser.
TLS в режиме API: разрешен TLS в режиме API only (--nowebui).
Новый callback: добавлен новый callback postprocess_image_after_composite.
Обновление API modules/api/api.py: добавлена эндпоинт API для обновления списка эмбедингов.
Функция set_named_arg: добавлена функция set_named_arg, позволяющая разработчикам устанавливать значения аргументов по имени.
Callback before_token_counter: добавлен callback before_token_counter, который используется для комментариев к подсказкам.
ResizeHandleRow: добавлена возможность переопределять параметр масштаба столбца ResizeHandleRow.
Производительность
Улучшение производительности: значительно улучшена производительность для каталогов экстрасетей с большим количеством файлов.
Сокращение повторного индексирования: сокращено ненужное повторное индексирование каталога экстрасетей .
Оптимизация вызовов isfile/exists: исключены ненужные вызовы isfile/exists.
Исправления ошибок
Исправлены множественные ошибки, связанные с поддержкой нескольких файлов стилей.
Исправлены ошибки, связанные с использованием Lora.
Восстановлена утерянная настройка (связанная с коммитом e294e46).
Исправлена ошибка капсинга BLIP в Extras.
Теперь информация infotext включается в сохраняемое исходное изображение для img2img.
Исправлена обработка ситуации, когда axis_type в сетке xyz_grid имеет значение None.
Добавлена функциональность IPv6 (когда аргумент Webui не передается).
Исправлены проблемы с потокобезопасностью API для txt2img и img2img.
Исправлена обработка случаев, когда selectable script_index имеет значение None.
Исправлена ошибка загрузки файла config.json.
Исправлено преобразование infotext из строкового типа в float.
Устранена проблема с настройкой GRADIO_ANALYTICS_ENABLED.
Исправлена конфигурация ведения логов.
Исправлена обработка исключения CondFunc при разрешении атрибутов.
Исправлены сбои при больших батчах.
Исправлено использование неправильной модели из-за алиаса.
Добавлен символ # в список недопустимых символов в названиях файлов.
Исправлена проверка зависимостей для рассширений.
Исправлен сброс индексов вкладок после перезапуска интерфейса.
Исправлено вложенное ручное преобразование типов.
Сохраняется выбор апскйлера после перезапуска.
Исправлена фильтрация пустых значений в сетке XYZ, когда axis имеет целочисленный или десятичный тип (например, seed оси int).
Исправлено регулярное выражение CLIP Interrogator topN.
Исправлена ошибка типа данных в слое MHA/изменен механизм проверки типа данных для ручного преобразования.
Обработана ошибка загрузки файла style.csv.
Исправлена ошибка при редактировании карточек экстрасетей.
Исправлена работа метаданных экстрасетей при первом создании файла .json с метаданными.
Функция util.walk_files теперь нечувствительна к регистру расширений.
Запрещено применение настроек, если страница расширений не загружена.
Вызвана правильная функция для подсчета токенов в img2img.
Исправлены ошибки исчезновения поиска/перезагрузки при использовании других расширений ExtraNetworks.
Изящная обработка исключения чтения mtime из кэша.
Прерывание по клавише Escape срабатывает только при видимой кнопке прерывания.
Опция отключения подсчета токенов подсказок действительно отключает подсчет, а не просто скрывает результаты.
Исправлено двойное масштабирования при инпейнте.
Исправлено использование переведенного контента для сопоставления категорий.
Исправлена работа параметра split_threshold при разделении больших изображений.
Исправлена обработка изменения размера для мобильных устройств.
Другие изменения
Добавлен идентификатор для "extra_options". Заменено числовое поле на слайдер.
Изменено сравнение state dict на ref compare.
Обновлена библиотека torch-rocm до версий 5.6/5.7.
Путь к выходным файлам теперь основан на пути к данным.
Изменён порядок модулей препроцессинга в вкладке "Extras".
Удалён код cleanup_models.
Теперь файл конфигурации интерфейса перезаписывается только при наличии изменений.
Исправлена проблема с линтером из коммита 501993e.
Обновлен файл README.md.
Исправлена работа кнопки высокого разрешения и теперь фиксирует сид.
Улучшено ведение логов, включая резервный логгер.
Информация о генерации теперь читается из infotexts, а не из json.
Улучшен метод get_crop_region.
Обновлена версия библиотеки safetensors до 0.4.2.
Добавлены всплывающие подсказки для create_submit_box.
Реализовано подсветка строк таблицы при наведении курсора в вкладке расширения.
Всегда добавляется временная метка к отображаемому изображению.
Добавлена настройка core.filemode=false, чтобы не отслеживать изменения прав доступа к файлам.
Нормализованы пути в аргументах командной строки.
В строке прогресса теперь используется оригинальное название приложения.
Метод register_tmp_file теперь используется также для mtime.
Ознакомиться с оригиналом и прочитать список всех изменения можно на этой странице.
Как обновиться?
Добавьте аргумент запуска git pull в ваш webui-user.bat, для этого просто откройте файл в блокноте, если не хотите обновляться при каждом запуске (рекомендую оставить), можете после обновления убрать его из файла.
Если у вас портативная версия, то возможно в ней есть update.bat, тогда активируйте его для обновления.
В случае если обновление происходит с ошибками может помочь удаление папки venv, после перезапуска автоматик сам перекачает окружение.
Новинка Stable Cascade! Сравниваем с DALL·E 3, Midjourney 6, SDXL. А1111, Portable и онлайн версии
Привет, друзья! В этом видео я рассказываю о Stable Cascade - последней разработке от создателей Stable Diffusion. Эта технология умеет генерировать текст без ошибок, не "портит" руки на изображениях и работает на компьютерах с 12-16 ГБ видеопамяти.
Мы познакомимся с новинкой, запустим её онлайн, попробуем портативную версию и добавим Stable Cascade в Automatic 1111. В конце покажу, как можно улучшить результаты с помощью A1111 не отходя от кассы.
А чтобы было еще интереснее мы будем сравнивать результаты с DALL·E 3 на ChatGPT Plus, Midjourney 6 через телеграм-бот и SDXL на ArtGeneration.me. Смотрите на результаты вместе со мной и делайте выводы! Приятного просмотра.
Ссылки из видео:
Мои ссылки:
Друг познается в чате
«Чат на чат» — новое развлекательное шоу RUTUBE. В нем два известных гостя соревнуются, у кого смешнее друзья. Звезды создают групповые чаты с близкими людьми и в каждом раунде присылают им забавные челленджи и задания. Команда, которая окажется креативнее, побеждает.
Реклама ООО «РУФОРМ», ИНН: 7714886605
InstantID — генерация с вашим лицом. Полное руководство Huggingface, Colab, Portable, Automatic 1111
Привет, друзья! В этом видео я расскажу вам о революционном инструменте InstantID, который позволяет создавать невероятные изображения с использованием вашего лица!🌟 Будь то аниме аватар или художественное изображение, InstantID делает сходство поразительным. 🎭 Вы узнаете, как работает эта технология, как ей пользоваться на Huggingface, запустить в Colab, и если у вас есть видеокарта с 12+ ГБ видеопамяти, я покажу вам портативную версию и установку в Automatic 1111! 🎨
Ссылки из видео:
Мои ссылки: