Привет! В этом видео расскажу, как установить и настроить Forge - оптимизированный аналог Automatic1111 от создателя Fooocus и ControlNet. Научимся генерировать картинки на прозрачном фоне, вырезать фон у готовых изображений и создавать маски для инпейнтинга. Полезно для всех любителей ИИ-арта! Приятного просмотра!
Делает все, что может модель PonyXL, но "почти" фотореалистично!
Если вы знакомы с моделями Pony, то они очень специфичны в своих подсказках и фокусировке на предмете. Я сделал эту модель, чтобы она работала так же, но была ближе к фотореалистичной. В ней используются те же подсказки и LoRA, что и в других моделях PonyXL.
Источник - @neurosklad 🤖 - все, что нужно, для твоей нейронки
🔥Это новая нейронка InstantMesh. Работает очень просто: загружаете исходное изображение, затем сервис удалит фон и вы получите объёмную модельку объекта, которую можно отдалить, приблизить и покрутить. Попробуйте демо на Huggingface
Как бы выглядели артисты «Кривого зеркала» в мире «Чёрного зеркала». Не за каждым кадром стоит конкретный эпизод, но многие серии, я думаю, вы узнаете.
При создании, использовалась классная штука в MidJourney, помимо обычных приемов: Выделяем на генерации лицо с помощью Vary (Region) и в промпте вставляем ссылку на фотографию человека через —cref
В данном материале я поделюсь своими наработками о том, как писать промты для нейросети Dall-E 3, а также расскажу о возможности осуществлять этот процесс без вложений. Мой опыт с искусственным интеллектом Dall-E 3 от компании OpenAI начался в конце 2023 года, после того как я уже имел опыт работы с такими системами, как Stable Diffusion и Midjourney. С самых первых попыток использования Dalle я заметил, что формулировать запросы оказывается удивительно легко.
Изначально я вводил базовые промты и был впечатлен способностью искусственного интеллекта дополнять эти запросы и создавать целостные изображения, учитывая стиль, освещение и контекст.
Пример такого запроса:
демонесса, облаченная в плащ из огня, окутанная мрачным туманом из лепестков черной розы, в динамичной позе
Я считаю, что главное преимущество использования Dall-E 3 по сравнению с другими генеративными ИИ заключается в легкости формирования запросов.
Вам не потребуется заморачиваться с подбором сложных параметров и использованием скобок, как это бывает в Stable Diffusion, поскольку Dall-E отзывается на обычный человеческий язык.
При проведении испытаний я предложил искусственному интеллекту дополнить мою исходную задачу, и был поражен, когда Dall-E 3 выдала уникальные предложения для создания сцен с участием указанных мною персонажей. Это оказалось крайне полезным, поскольку я не всегда обладал четким видением того, что хотел создать — для творческих процессов это настоящий прорыв.
Я также экспериментировал с сочетанием разнообразных элементов, например, создавая химер (смешение различных сущностей и форм). Получаемые результаты всегда были уникальны и иногда на грани сюрреализма. Вот как можно задать исходные данные для создания химеры:
микс из обезьяны и черепахи посреди каменных джунглей
И вот знаменитая комбинация бульдога с носорогом =)
Далли также способен добавлять тест на изображения. Для этого в запросе следует указать на английском описание объекта, который должен быть изображен, например:
девушка держит знак с надписью 'HELLO WORLD!'
Хотя иногда текст содержал ошибки, несколько попыток обычно приводили к ожидаемому исходу.
Я также тестировал возможности нейросети в создании изображений в стиле Леонардо да Винчи и других знаменитых художников.
Результаты оказались впечатляющими - искусственный интеллект идеально воссоздал их стили. Представьте себе пирамиды Хеопса под жарким солнцем Египта, выполненные в манере Леонардо да Винчи.
И самое захватывающее - это способность задавать любые невообразимые запросы, искусственный интеллект почти всегда способен воплотить любые фантазии в жизнь, так что не бойтесь экспериментировать, создавать и изумляться =)
В начале статьи я обещал предложить бесплатный способ использования нейросети Dalle 3
Каждый день вы можете получать бесплатные очки, которые можно использовать в Dalle для создания генераций, выбрав в нижнем меню опцию 'Dalle-3' и затем нажимая на 'Multi-Image'.
Вот и всё, что вам нужно знать.
Но есть еще один существенный вопрос...
Как составлять негативный промтп для Dalle 3
Негативный запрос описывает то, что вы не хотели бы видеть на картинке.
Приведем простой пример: вы желаете изобразить девушку в платье, но вам не нужно, чтобы платье было красного цвета.
В Stable Diffusion для этого пришлось бы указать 'red' в настройках негативного промта отдельно, но в Далли такой функции нет, поэтому вам нужно просто указать предпочтительный цвет платья.
По этому же принципу важно точно формулировать свои желания, а не то, чего вы хотите избежать.
Ключевое правило — избегайте отрицательных формулировок, например, 'не рисуй красное платье', так как это не принесет ожидаемого результата.
Вот такие прикольные открытки можно сделать в Midjourney, причем с текстом. Английский текст без проблем генерируется в самой Midjourney V6, а вот с русским придется немного подшаманить - и то, совсем немного. Я расскажу, как генерировать открытки с английским текстом в одной только Midjourney без редактирования в сторонних сервисах, а так же, как сгенерировать открытки с русским текстом, приложив минимум навыков и усилий. Поехали.
С чего начать
Я люблю начинать с вдохновения, когда его нет, я его черпаю либо в Google картинках, либо в Pinterest - там результаты чаще интереснее. В данном случае, я просто зашла на сайт и ввела "8 марта открытки" - ничего сложного.
Затем я отобрала изображения, которые мне понравились, и скачала их себе на компьютер.
Теперь осталось сгенерировать похожие изображения. Так как с фантазией, как с рулеткой - повезет/не повезет, я иногда предпочитаю, чтоб нейросети за меня описывали, что находится на изображении. Можно в самой Midjourney через команду /describe отправить изображения, и бот даст 4 описания того, что на картинке:
Можно сгенерировать все 4 изображения сразу, а можно перевести промпт, например в DeepL и немного его откорректировать.
Как альтернативу, я люблю использовать сервис Replicate - от выдает меньше "отсебятины", хорошо работает с фото - часто ссылается на стоковых фотографов, так что запишите себе в копилочку полезных сервисов:
Осталось только скопировать получившиеся промпты, вставить в Midjourney и получить изображения. Кстати, можно еще подключить --sref. (этим тонкостям обучаю)Понравившиеся апскейлить через кнопки U. Не исключено, что изображения будут с непонятным текстом, как у меня, особенно, если на открытке - исходнике был текст:
1/3
Нам этот текст нужно поправить. Есть 2 варианта - в самой Midjourney - если текст будет английскийили в Canva, если нужен текст на русском языке. Давайте их рассмотрим по порядку.
1. Текст в Midjourney на английском языке
Нажимаем кнопку Vary (Region) под изображением и выделяем область с текстом на непонятном языке и исправляем промпт, удаляем все до "--v6.0" и пишем желаемый текст, не забыв взять его в кавычки: text "Women's Day!" или text "8 March"
Вот, что получилось:
1/2
2. Текст на русском языке с минимальными усилиями
Если мы решили пойти другим путем, и написать текст на русском языке, нам необходимо удалить непонятный текст на изображении. Для этого я использую сервис Clipdrop- там инструмент Сleanup, либо сервисCleanup.pictures - они как раз нужны для удаления нежелательных объектов. Ничего сложного - загружаю изображение, выделяю нежелательный текст и нажимаю кнопку «Clean»:
Получаю чистенькие изображения без текста:
1/2
Вообще от текста ни следа не осталось
Теперь мне нужно нанести на эти изображения текст, и я делаю это с помощью Canva - это простой редактор. Добавляю текст, там есть и рукописные шрифты. Для вашего удобства я приложу скрины, чтобы увидели названия шрифтов, которые применила я, и сразу могли найти названия:
1/2
Вот так легко можно создавать открытки в Midjourney на русском и английском языках. Если вы хотите по-настоящему крутые иллюстрации, то А если вы хотите по-настоящему крутые иллюстрации, то Midjourney то, что вам нужно - самая понятная и настраиваемая нейросеть, которая создает шедевры. Хотите быстро и качественно научиться генерировать в лучшей нейросети для генерации изображений? Вступайте в Закрытый клуб Midjourney и начните обучаться с единомышленниками по адекватной цене.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Прочитав много гайдов по Stable Diffusion, я понял, что каждый мне чем-то не нравится, так что я решил сделать свой, с блекджеком и расширениями. В этом гайде я хочу быстро пробежаться по основным моментам генерации, которые ты будешь использовать больше всего. Поехали.
Маленькое авторское отступление. Да, я буду показывать все на примере фансервисных девушек. NSFW - двигатель прогресса!
Также хочу предостеречь. Вас полностью устроит только одна из сотни ваших генераций, хорошая картинка получится далеко не с первого раза, так что желаю удачи и усидчивости.
И последнее - этот гайд скорее всего уже устарел на момент выпуска, потому что все достаточно быстро развивается. Курите Reddit в поисках новых решений и технологий.
Установка
Нужно скачать python и установить (обязательно прожми Add to PATH)
С помощью блокнота зайди в файлик webui-user.bat и в строке set commandline_ARGS= допиши --no-half-vae --opt-channelslast --opt-sdp-no-mem-attention --api --update-check.
???
Profit!
Запуск производится с файлика webui-user.bat
SD работает на видеокарте. Лучший вариант - Nvidia, начиная с 1000 серии.
Если нужно заходить в Stable Diffusion не с хост-ПК, а например, на ноутбуке в теплой кровати, то открой файлик webui-user.bat в блокноте и в строке set commandline_ARGS= после знака равно напиши --listen.
Подготовка к работе
Для работы SD нужны модели. Их ищи на Civitaiили Hugging Face. Модели нужно класть в models\Stable-diffusion. Популярные и хорошие модели:
Во вкладке Avaliable уже есть куча расширений, которые можно установить
Во вкладке install from URL можно ставить расширения из github. Просто вставь ссылку, и нажимай Install. Главное, после установки любого расширения нужно нажать Reload UI в Installed!
Парочка тех, которые тебе очень помогут:
ADetailer. Улучшает лица и руки. Лица получше, руки похуже.
ControlNet и Posex. Это расширения для редактирования позы персонажа. Их можно найти во вкладке Avaliable. Как по мне, работает только для простых поз, но скорее всего я дебил. Это обширная тема, поэтому лучше посмотреть вот этот видос.
Dynamic Promts. Прикольное расширение. Оно добавляет свои рандомные промты в твои. Можно получить необычные результаты. Combinatorial generation немного меняет сцену, Magic Promt меняет ее сильнее, а I’m feeling lucky добавляет элементы хаоса.
Наконец-то можно писать промт
Ну почти. Сначала пройдемся по настройкам:
Sampling method — отвечает за первоначальную кашу, из которой будет диффузироваться изображение. DPM++ 2M Karras делает более контрастные и резкие изображения, Euler a делает более "теплые" и как будто "маслом". С остальными — экспериментируй.
Sampling Steps — количество шагов генерации. Чем выше значение — тем больше деталей будет в изображении. Среднее число — от 23 до 40.
Width и Height — ширина и высота. Не рекомендуется больше 1000, иначе вместо одного персонажа будет два, или вообще в одной картинке будет две.
Batch count и Batch size — количество изображений за одно "нажатие" Generate. В одном Batch count содержится один Batch size. Batch size — до 8 картинок, в Batch count — до 100 Batch size.
CFG Scale — степень соответствия промту. Чем больше значение, тем ближе будет соответствовать результат к промту. Но не стоит переусердствовать. Если выставить слишком большое значение, то нейросеть как бы "передержит" каждый промт, и изображение получится очень "шумным". Обычно больше 7 не ставят, а чаще даже уменьшают. Но если какая-то мелкая деталь не проявлятся, и конструкция (promt: число) не срабатывает, стоит повысить именно это значение (Уважаемый господин в комментариях оставил картинку и объяснил более умно. Вообще стоит прочитать комментарии, там много интересного)
Seed — рандомное число. Если хотите много похожих изображений, жмите на зеленую кнопочку и Seed "застынет".
Собственно, все относительно просто. Теперь пиши, что хочешь и оно генерирует. Пара фактов:
Если какому-то промту нужно добавить силы, или наоборот, то пишите (promt:цифра). Больше 1 — промт сильнеет, меньше 1, промт слабеет. Пример — (side view:1.5).
Можно комбинировать промты. Сначала пример: [blonde | (short pink hair:1.2)]. Оно работает вот так: на первом шагу семплирования картинка будет генерироваться с промтом blonde, на втором шагу — short pink hair, и так по очереди. Особенно хорошо это работает с волосами, делая их более реалистичными. Результат этого промта:
Если сделать картинку с только промтом short pink hair:
Если сделать картинку комбинацией [blonde | (short pink hair:1.2)]
Используй негативные промты! Они нужны, чтобы нейросеть вещи, которые ты опишешь в Negative Promt — не делала, очевидно. Вот шаблон:
Также есть такая прикольная штука, как Textual Inversion — это файлики, в которых собраны какие-либо промты. Их нужно кидать в \embeddings. Вот такой файлик для плохих рук. Ищи их во вкладке Textual Inversion и кидай в Negative Promts.
Усредненная структура промта:
Тема (фото, рисунок, портрет)
Объект (кто или что во главе картинки)
Стиль (аниме, реализм, мультфильм)
Стиль2 (автор, режиссер, модель фотоаппарата (canon eos, polaroid))
Разрешение (hdr, high resolution, 4k, 8k)
Цветовая гамма (главенствующий цвет композиции)
Освещение (moonshine, sunny, soft lightning)
Угол камеры и поза (вот ультимативный гайд по этой теме. Пользуюсь им постоянно)
Кстати, после генерации все картинки попадают в \outputs\txt2img-images
Стили
Скачай файлик со стилями и кидай его в корень папки с SD. Они очень помогут в стилизации картинки. Находится под вкладкой Generate:
Да, их можно комбинировать.
Немного про Dynamic Promts
Устал придумывать промт? Хочется красивые картиночки по какой-нибудь теме? Не беда, ведь можно зарандомить заранее подготовленные промты!
На Civitai это фильтр Wildcards. Вот самая популярная подборка оттуда. Качай архив и все текстовые файлы кидай в \extensions\sd-dynamic-prompts\wildcards
В SD заходи во вкладку Wildcards Manager, и там тебя будет ждать куча "тем", которые ты можешь добавить к своему промту.
В свой промт нужно вписывать название, как в Wildcards file, например: __background_horror_place__
LoRa
Лора — это маленькие обученные модели, которые накладываются на основную модель, тем самым внося свои изменения в результат.
Покажу на примере Зельды. Кладем это в \models\Lora.
Лежат они во вкладке Loras. Не забудь нажать Refresh. Нажимай на лору, и она появится в положительном промте. На Civitai, там где лора была скачана, указан список триггер-слов, от которых Лора начинает работать. Использовать те, которые хочется получить.
Там же в описании авторы обычно указывают, какую силу стоит давать Лоре. В нашем случае — 0.7-0.8
Собственно, я пишу в промт, что хочу девочку на фоне страшного города, добавляю к промту лору Зельды, добавляю промты, указанные в описании этой лоры, и получаю вот это:
1girl, <lora:zelda_1:0.9> aazelda, short hair, crown braid, hairclip, pointy ears, brown cape, blue shirt, puffy sleeves, long sleeves, fingerless gloves, black gloves, black pants, tight pants, (Desolate fog-shrouded alley:1.3), (side view)
Красота? Конечно красота, ведь это сама принцесса Зельда!
Inpaint
Ты сделал вайфу, все круто, но какая-то деталь не дает тебе покоя? Вкладка IMG-TO-IMG тебе поможет! В этой вкладке есть подвкладки, и нас интересует Inpaint.
На этой картинке с Зельдой мне не нравятся какие-то крюки на левых домах.
Нужно выделить часть изображения, которую нужно менять и нажать Generate. Желательно выделять с небольшим запасом.
Для усиления эффекта лучше написать новый промт. Например убрать все ненужное, и дописать нужное.
В настройках в принципе можно ничего не трогать, кроме Denoising strength. В этом стоит поэкспериментировать, и посидев, запомнишь, какие значения для чего нужны. Очень грубо говоря: выше 0.75 ставить не стоит, менее 0.25 - практически ничего не меняется. Для этой картинки я оставил дефолтный 0.75.
Если нужно поменять еще что-то, снова, но уже под этой получившейся картинкой - нажимаем на Палитру и уже меняем новую картинку (нажми на ластик для удаления текущего выделения, и не забудь поменять промт под новые условия!)
Апскейл
Как только картинка получилась, стоит и подтянуть разрешение. Нажимай под картинкой на угольник и ты попадешь во вкладку Extras. Хорошие стандартные апскейлеры - R-ESRGAN 4x+ (для реалистичных изображений) и R-ESRGAN 4x+ Anime6B (для аниме). Но лучший для меня - Swin2SR_RealworldSR. Его нужно установить. Качай вот отсюда и кидай в \models\SwinIR. Он не мылит изображение, как R-ESRGAN. Все картинки после апскейла попадают в \outputs\extras-images
Вот апскейленое в 2 раза нашей Зельды
Вот и все
Это основные моменты, которые помогут тебе делать неплохие картиночки.
Это первая версия гайда. В производстве находится ультимативная версия, которая порвет весь ру-сегмент (наверное)
Ideogram 1.0 от бывших разработчиков из Google идеально понимает текстовые запросы и выдаёт качественные картинки без ошибок, главное ввести грамотно промт.
Ideogram 1.0 прекрасно подойдёт для создания логотипов, рекламы.. или создание крутых аватарок на Пикабу со своим же логином, просто перейдите на сайт, пройдите авторизацию через Google, введите промт.. например:
Аватарка с 3d надписью alllhimic, неоновые эффекты, много элементов, космос.
И ждите результата генераций, если результат не нравится, пробуйте другой промт со своими критериями, может вам нравится космос и вы хотите другие эффекты.. пропишите в промте.
После авторизации, вы получаете бесплатный лимит: 100 изображений/день (25 промтов/день), думаю такого лимита вам вполне хватит, чтобы сделать себе крутую аватарку, а если нет - тогда ждите обновление лимита на следующий день или используйте другой Google-аккаунт.
Мне очень интересно будет посмотреть на ваши результаты, присылайте в комментариях, также пишите свой промт - это поможет многим найти нужный промт для своей аватарки.
Я тестировал нейросеть и пытался сделать аватарку для своего чата в Telegram и смотрите, что из этого вышло, вариантов много.. как плохих, так и хороших, но я не серьезно подошел к генерации и писал очень примитивные промты, но если детально расписать промт, то результат генерации будет невероятным и он вам обязательно понравится: