Установка и гайд по Stable Diffusion для ленивых
Как многие знают, вышла открытая версия нейросети, Stable Diffusion, которая создает изображения по запросам. В связи с этим, я решил поделиться с сообществом некоторыми наработками, которые выяснил во время работы и как все же использовать данную нейросеть без регистрации, смс и вырванных волос.
Начну с инструкции, выложенной коллегой на русском. Там же, в комментариях, я и нашел все выложенное здесь
: Инструкция по установке и использованию нейросети Stable-Diffusion на собственном железе
Это вариант не для ленивых. А теперь, собственно, для таких как я:
https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_... - блокнот от гугла колаб. Ограничения на время использование графических ресурсов. Плюсы - большое количество настроек, масштабирование и увеличение резкости по желанию, по умолчанию без цензуры. Её также можно будет включить. Минусы - вас в любой момент могут отключить и не сказать когда можно будет подключиться вновь. Также требуется предоставить доступ на гуглдиск.
https://stability.ai/blog/stable-diffusion-public-release - локальная установка для лентяев. Скачать, распаковать, наслаждаться. Требуется не менее 8ми гигабайт видеопамяти и CUDA ядра.
https://huggingface.co/spaces/stabilityai/stable-diffusion - попробовать онлайн c цензурой.
http://beta.dreamstudio.ai/ - регистрация и ограничение на количество картинок. Сойдет для пробы благодаря гибким возможностям настройки, которые не всякий компьютер потянет. Также присутствует цензура - непотребные картинки просто будут замылены.
Разберемся в основных настройках.
Steps - количество "шагов" нейросети, или проходов. Больше - не значит лучше, мне хватает и 50-ти. Разницы же между 100 и 200-500 практически нет.
V Scale - Как я понимаю, это точность выполнения запроса. Я использую 7-10. При 7 получается наиболее реалистичное изображение, при 10 более пластиковое, нереалистичное, зато выхолощенное от основных недостатков.
Seed - шаблон. В нейросети триллионы шаблонов и по умолчанию включается рандом. Шаблон можно выбрать отдельно и редактировать его сколько влезет с помощью запросов, но о них позже.
Разрешение картинки (размер) - на моей RTX 3070 больше чем 576x576 не получается. Размеры должны делиться на два. То есть можно использовать 512, но 513 уже не получиться. С помощью размеров можно создавать вертикальные или панорамные картинки. К слову, блокнот от гугла позволяет использовать разрешение 1600x1024, больше я не пробовал, тем более что картинки еще дополнительно скалируются в нём.
Output - папка для скидывания картинок. При каждом запуске сбрасывается на внутреннюю папку программы.
Гайд по созданию.
Вначале мы пишем "тело" картинки. Её шаблон. Например: "Cyberpunk 2077 city". После этого к нему, через запятую, можно добавить модификаторы. Например "beautiful" - универсальный тег или "realistic". Кроме того, можно уточнить что именно будет в кадре. Например "skyscraper" или "battle". В итоге получиться "Cyberpunk 2077 city, in front skyscraper, battle, realistic". Чем ближе запрос к началу, тем он более приоритетен. Ну и конечно, в версиях без цензуры можно творить разврат, но это довольно непросто, так как часто получаются фотографии, которые дадут фору Гигеру. В его стиле, к слову, также можно создать изображение, как и в стиле любого художника. Достаточно добавить "in style ***", где звёздочки - фамилия художника. Чем он известнее, тем четче результат. Также, если вы создаете картинку на основе реально существующего популярного человека, то результат будет более приятным глазу и четким. Если же не хочется конкретного человека, то можно добавить черты их слияния через "fusion". Например "with face Ana de Armas fusion Gal Gadot. В таком случае создаётся слияние лиц и некоторых черт тела с основным заданным шаблоном, или же оно само становится основным шаблоном.
P.S. Зачастую, картинки, в поиске подходящего шаблона, приходиться брутфорсить. Для этого отлично подходят автокликеры с таймером нажатия. То есть выставляете время чуть больше, чем создается картинка, наводите курсор на Render и идете пить чай. Или спать. (У меня автокликер требует запуска от имени администратора). Возможно можно ещё как-то иначе автоматизировать процесс, но мне лень с этим разбираться. Можете добавить в комментариях, Если у вас что-то получилось с этим сделать.
https://freemouseclicker.com/ - автокликер
В гугл коллабе есть пункт "run_forever" - будет создавать картинки бесконечно, пока вас временно (или постоянно, если обнаглеете), не лишат прав на доступ к графическим ресурсам.
Изображение можно улучшить другими нейросетями. Для увеличения разрешения или тем же Remini.
В конце добавлю свои удачные примеры:










