29

Установка и гайд по Stable Diffusion для ленивых

Как многие знают, вышла открытая версия нейросети, Stable Diffusion, которая создает изображения по запросам. В связи с этим, я решил поделиться с сообществом некоторыми наработками, которые выяснил во время работы и как все же использовать данную нейросеть без регистрации, смс и вырванных волос.


Начну с инструкции, выложенной коллегой на русском. Там же, в комментариях, я и нашел все выложенное здесь

: Инструкция по установке и использованию нейросети Stable-Diffusion на собственном железе


Это вариант не для ленивых. А теперь, собственно, для таких как я:

https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_... - блокнот от гугла колаб. Ограничения на время использование графических ресурсов. Плюсы - большое количество настроек, масштабирование и увеличение резкости по желанию, по умолчанию без цензуры. Её также можно будет включить. Минусы - вас в любой момент могут отключить и не сказать когда можно будет подключиться вновь. Также требуется предоставить доступ на гуглдиск.


https://stability.ai/blog/stable-diffusion-public-release - локальная установка для лентяев. Скачать, распаковать, наслаждаться. Требуется не менее 8ми гигабайт видеопамяти и CUDA ядра.


https://huggingface.co/spaces/stabilityai/stable-diffusion - попробовать онлайн c цензурой.


http://beta.dreamstudio.ai/ - регистрация и ограничение на количество картинок. Сойдет для пробы благодаря гибким возможностям настройки, которые не всякий компьютер потянет. Также присутствует цензура - непотребные картинки просто будут замылены.


Разберемся в основных настройках.


Steps - количество "шагов" нейросети, или проходов. Больше - не значит лучше, мне хватает и 50-ти. Разницы же между 100 и 200-500 практически нет.

V Scale - Как я понимаю, это точность выполнения запроса. Я использую 7-10. При 7 получается наиболее реалистичное изображение, при 10 более пластиковое, нереалистичное, зато выхолощенное от основных недостатков.


Seed - шаблон. В нейросети триллионы шаблонов и по умолчанию включается рандом. Шаблон можно выбрать отдельно и редактировать его сколько влезет с помощью запросов, но о них позже.


Разрешение картинки (размер) - на моей RTX 3070 больше чем 576x576 не получается. Размеры должны делиться на два. То есть можно использовать 512, но 513 уже не получиться. С помощью размеров можно создавать вертикальные или панорамные картинки. К слову, блокнот от гугла позволяет использовать разрешение 1600x1024, больше я не пробовал, тем более что картинки еще дополнительно скалируются в нём.

Output - папка для скидывания картинок. При каждом запуске сбрасывается на внутреннюю папку программы.


Гайд по созданию.


Вначале мы пишем "тело" картинки. Её шаблон. Например: "Cyberpunk 2077 city". После этого к нему, через запятую, можно добавить модификаторы. Например "beautiful" - универсальный тег или "realistic". Кроме того, можно уточнить что именно будет в кадре. Например "skyscraper" или "battle". В итоге получиться "Cyberpunk 2077 city, in front skyscraper, battle, realistic". Чем ближе запрос к началу, тем он более приоритетен. Ну и конечно, в версиях без цензуры можно творить разврат, но это довольно непросто, так как часто получаются фотографии, которые дадут фору Гигеру. В его стиле, к слову, также можно создать изображение, как и в стиле любого художника. Достаточно добавить "in style ***", где звёздочки - фамилия художника. Чем он известнее, тем четче результат.  Также, если вы создаете картинку на основе реально существующего популярного человека, то результат будет более приятным глазу и четким. Если же не хочется конкретного человека, то можно добавить черты их слияния через "fusion". Например "with face Ana de Armas fusion Gal Gadot. В таком случае создаётся слияние лиц и  некоторых черт тела с основным заданным шаблоном, или же оно само становится основным шаблоном.


P.S. Зачастую, картинки, в поиске подходящего шаблона, приходиться брутфорсить. Для этого отлично подходят автокликеры с таймером нажатия. То есть выставляете время чуть больше, чем создается картинка, наводите курсор на Render  и идете пить чай. Или спать. (У меня автокликер требует запуска от имени администратора). Возможно можно ещё как-то иначе автоматизировать процесс, но мне лень с этим разбираться. Можете добавить в комментариях, Если у вас что-то получилось с этим  сделать.


https://freemouseclicker.com/ - автокликер


В гугл коллабе есть пункт "run_forever" - будет создавать картинки бесконечно, пока вас временно (или постоянно, если обнаглеете), не лишат прав на доступ к графическим ресурсам.


Изображение можно улучшить другими нейросетями. Для увеличения разрешения или тем же Remini.


В конце добавлю свои удачные примеры:

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества