Нейросети и искусственный интеллект
7 постов
7 постов
Метод, позволяющий заменить лицо в видео с помощью нейросети, известной как создание deepfake, включает в себя пошаговое описание и примеры видео, где я успешно заменил лица с использованием онлайн-инструмента на базе искусственного интеллекта через бота в Telegram.
Ключевые методики для замены лица в видео с применением искусственного интеллекта:
установка специализированного ПО с ИИ на персональный компьютер (требуется видеокарта nVidia 3060, 4090 или аналогичная)
запросы к экспертам (не рассматриваем данный вариант)
использование онлайн-сервисов, включая ботов в Telegram и на других платформах
В данном руководстве я сосредоточусь на наиболее доступном методе, который не требует регистрации, предоставления личных данных и покупки дорогих компонентов для компьютера. Исследовав различные методы замены лиц в видео с помощью ИИ, я отдал предпочтение использованию ботов в Telegram, поскольку этот способ оказался более экономичным и эффективным. Я обнаружил всего два таких бота, однако в одном из них обнаружились проблемы с частыми мельканиями лица (видимо, из-за недоработанного программного обеспечения).
Я не настаиваю на использовании исключительно этого способа, вы всегда можете найти альтернативные сервисы. Однако я поделюсь своим опытом работы со вторым ботом в Telegram, который показал себя безукоризненно.
Вот фотография, на основе которой было создано видео с использованием технологии замены лица.
Здесь представлен результат моих усилий – видео, где я заменил оригинальное лицо с помощью указанной фотографии.
По моему мнению, результат получился весьма убедительным – удалось отлично заменить лицо в видео при помощи искусственного интеллекта. В данном случае, лицо Локи было заменено на лицо, взятое с фотографии, и он был первым персонажем, появившимся на экране. Если в видео присутствуют другие персонажи, их лица останутся без изменений, что мне и требовалось.
Перейдите по данной ссылке в Telegram-бот
Нажмите кнопку 'Старт' / 'Start' для активации (стандартный процесс для работы с ботами в Telegram)
В нижнем меню выберите раздел 'YesVideo'
Активируйте режим 'AniPhoto' для анимации изображений
Отправьте боту изображение с лицом, которое вы хотите использовать в создании Дипфейк видео
Подождите немного, и ваша фотография появится в меню — здесь выберите опцию 'DeepFace Video'
Загрузите видео, в котором хотите заменить лицо, взятое из отправленной фотографии. Важно, чтобы в кадре был человек с четкими чертами лица
Подтвердите начало процесса создания видео с подменённым лицом
Дождитесь завершения процесса, который может занять от 1 до 3 минут в зависимости от длительности оригинального видео
Никакой регистрации не требовалось. Алгоритм искусственного интеллекта для подмены лиц в видеозаписях показывает наилучшие результаты, когда лица на фото и в видео хоть сколько-нибудь схожи по таким параметрам как оттенок кожи, цвет волос, контуры лица и так далее. Выбирая более подходящие изображения для этой цели, можно значительно увеличить эффективность процесса.
Мой личный опыт использования технологии дипфейк видео показывает, что стоимость обработки одного видео составляет всего около 20-30 рублей, при этом не возникает необходимости в установке сложного ПО или приобретении дорогостоящего оборудования для создания дипфейк видео на основе ИИ.
Не используйте для загрузки в бота изображения плохого качества.
Лицо человека на фото должно быть снято крупным планом, и в кадре должны помещаться как лицо, так и верхняя часть головы.
Размер файла исходного видео не должен превышать 20 мегабайт.
В видео должен быть только один человек, чье лицо подлежит замене.
В случае наличия нескольких лиц, подмена будет произведена только для одного из них.
Желательно, чтобы в ходе видео человек не совершал резких движений головой, иначе могут возникнуть кадры, на которых лицо будет наложено некорректно. Оптимальным выбором будут видеоролики, где человек смотрит прямо в камеру.
Благодарю всех за внимание, и если вам интересны подобные технологии, буду рад вашей подписке и лайкам.
В этой статье мы поговорим о том, как увеличить фотографии и любые картинки с использованием нейросети через сервисы в интернете, которые не требуют регистрации. В процессе мы также повысим качество исходного изображения. Upscale (или увеличение с повышением качества изображения) можно осуществить абсолютно бесплатно, но давайте обо всем по порядку.
Обычно при увеличении изображений или фото с применением ИИ заключается в том, что многие платформы просто масштабируют изображения, добавляя отсутствующие пиксели. Однако гораздо интереснее те сервисы, которые не просто добавляют пиксели, а действительно дорабатывают картинки + детали + додумывают мелкие элементы.
Представим ситуацию, когда необходимо сохранить первоначальный вид объекта, одновременно увеличив его размер и добавив дополнительные элементы. Это может быть актуально когда нужно работать с изображениями низкого качества или если возникает необходимости обогатить их деталями для улучшения "визуала".
В начале я изучил возможности нейросетей, таких как Stable Diffusion. Да, они предлагают нужные функции, но работа с ними требует немалых усилий по настройке, установке дополнительных плагинов и т.д.
Далее обнаружил, что гораздо проще решить эти задачи с помощью онлайн-сервисов, хотя их и не так много, если не учитывать те, которые выдают неудовлетворительные результаты. Я же поделюсь с вами подходом, который лично меня устраивает по качеству.
Предложенный метод пригоден как для обработки фотографий, так и для рисунков.
Для утроения размера изображения при сохранении его исходного вида и улучшения детализации делаем следующее:
Открываем этого бота в Telegram (отдельная регистрация не требуется)
в меню выбираем Stable Diffusion
затем переходим в настройки и выбираем из списка модель 'Reliberate' (она предназначена для работы с реализмом)
устанавливаем 'DenS' на уровне 0.1 (степень изменения оригинала)
отправляем боту исходное изображение
в появившемся меню выбираем 'Детализация + Upscale X3'
В процессе апскейла активируется алгоритм, позволяющий с помощью нейросети повысить качество фотографии без необходимости делать доп. настройки.
В результате получаем то же изображение, но увеличенное в три раза, при этом все мелкие элементы выглядят значительно четче. Этот метод идеально подходит для работы с реализмом, а также с артами и аниме — примеры изображений я приложил в начале статьи.
Я бы посоветовал не ограничиваться только этим примером, а экспериментировать с разными настройками, выбирать другие модели (их достаточно много), менять значение 'DenS' и так далее.
Еще хочу упомянуть о возможности использования этого инструмента абсолютно бесплатно — доступны ежедневные баллы, которые можно получить "for free", так что обязательно изучите этот момент.
Краткое руководство по применению нейросети Chat GPT для рерайта текста, обходя таким образом системы проверки на уникальность (антиплагиат). Мы опробуем веб-сервисы в мессенджере Telegram для переформулирования вашего текста. Здесь я остановлюсь на бесплатном методе – он идеально подходит как для новичков в области копирайтинга, так и для профессионалов, студентов и всех, кто стремится извлечь выгоду из передовых технологий искусственного интеллекта.
Нейросеть Chat GPT делает рерайт текста
Вероятно, вы уже в курсе, что за последние несколько лет технологии искусственного интеллекта, особенно ChatGPT, значительно прогрессировали в области создания и обработки текстов. Если ранее написание статей было трудоемким процессом, требующим много времени и усилий для создания текста с нуля, то теперь вы можете делать рерайт любых текстов на любом языке без опасений, что они будут слишком сильно похожи на оригинал. Я призываю вас делать рерайт чужих статей, то свои собственные труды вполне можно зарерайтить с целью размещения на разных сайтах.
Перейдем к делу. Я хочу поделиться с вами тем, как можно бесплатно переписывать статьи при помощи нейросети Chat GPT через бота в Telegram, который я лично использую для этих целей. Этот подход позволяет мне создавать контент очень быстро. Вы вольны выбирать любого бота или сервис с аналогичными возможностями, однако не во всех мне понравилось качество работы.
К тому же, нейросеть Chat GPT окажется полезной для копирайтеров в плане корректировки ошибок в текстах.
В мессенджере Telegram запустите этого бота
В нижнем меню выберите кнопку 'ChatGPT'
Далее нажмите кнопку Роль и в появившемся списке выберите 'Рерайтер'
Отправьте боту оригинальный текст статьи, который искусственный интеллект должен обработать
Роль 'Рерайтер' настроена таким образом, чтобы не только изменять текст, но и делать его достаточно уникальным, что поможет избежать антиплагиата. Основная идея и язык исходного текста будут полностью сохранены, но формулировки и последовательность изложения будут изменены. Это значительно упростит процесс создания уникального контента. Весь процесс займет всего 1 - 2 минуты в зависимости от длины оригинального текста.
Все очень просто — в предложенном мной боте вам будут ежедневно начисляться баллы, которые можно использовать для бесплатного рерайта текстов.
Не забудьте проверить текст, полученный от нейросети; возможно, вы захотите внести некоторые корректировки перед публикацией.
В будущем все, что нас окружает, будет функционировать на основе нейросетей, а сейчас мы можем использовать базовые возможности этих технологий.
В данном материале я расскажу как писать промты для Chat GPT и сделаю небольшое исследование, уделю внимание правильной подготовке промтов и приведу в пример методы и хитрости для работы с этим инструментом. Этот текст будет полезен для авторов контента, студентов, а также для всех, кто использует тексты в рамках работы с нейросетью ChatGPT.
Перейдем без предисловий к ключевым моментам написания запросов в ChatGPT.
Используйте ChatGPT как инструмент для выявления и коррекции ошибок в своих текстах
Это поможет улучшить качество ваших статей и документов. Вне зависимости от уровня ваших знаний в той или иной области, ошибки могут случиться у каждого, и искусственный интеллект может стать надежным помощником в их обнаружении и исправлении.
Пример: исправь все ошибки в статье, которую я представлю далее. Напиши свои аргументы и перечисли их в виде отдельных пунктов. [[текст вашей статьи]]
Для того чтобы извлечь максимум от работы с нейросетью, критически важно формулировать запросы в ChatGPT с ясной целью
Когда вы формулируете задание для ChatGPT, акцентируйте внимание на желаемом результате, вместо того чтобы указывать то, чего делать не следует.
Пример неоптимального запроса: переведи это выражение на английский язык: [[текст]]. Избегай использования заглавных букв и слов, которые короче шести букв.
Пример оптимального запроса: переведи этот текст на английский язык: [[ваш текст]]. Используй только строчные буквы и слова, состоящие из шести и более символов.
Используйте Chat GPT для выделения основных тезисов из представленного вами текста или статьи
Такой подход может быть полезен, когда нужно быстро получить сжатое изложение ключевых аспектов.
Пример запроса: твоя задача — изложить в форме тезисов основные идеи текста статьи, которую я сейчас предоставлю. Стремись к максимальной точности и детализации в своих разъяснениях. Ты должен пояснить каждый тезис и дополнить его исчерпывающей информацией, если это необходимо. Текст статьи: [[текст вашей статьи]]
Используйте роли для решения конкретных узконаправленных задач через Chat GPT
К сожалению, в базовой версии ChatGPT такая функциональность отсутствует, но ее можно найти в некоторых сторонних приложениях и ботах. В качестве примера рассмотрим этого бота в Телеграме, где разработчики сделали использование Chat Gpt более удобным, введя предустановленные роли для выполнения различных задач.
Для этого перейдите в меню бота в Телеграме, выберите вкладку 'ChatGPT', затем кликните на значок 'Роль'. Вы увидите перечень ролей, предназначенных для выполнения специфических задач. Выберите нужную роль в соответствии с вашей задачей, активируйте ее и следуйте появившимся инструкциям.
К примеру, если вам нужно переформулировать текст (сделать рерайт), выберите роль 'Рерайтер'. После активации отправьте боту текст, и он перепишет его, сохраняя ключевые идеи, но изменяя формулировки.
Вот ряд ролей, доступных для выбора: генератор идей, специалист по соцсетям, эксперт по рекламе, специалист по продажам, маркетолог, специалист по сетевому маркетингу, эксперт по отработке возражений, создатель контента, юридический советник, текстовый рефразер, SEO-аналитик, SEO-копирайтер, копирайтер для YouTube, инстаграм-блогер, психологический консультант, фитнес-тренер, гид, преподаватель иностранных языков, разработчик на Python, разработчик на PHP+JS, редактор текстов.
Требуйте от Chat GPT только проверенную информацию
Для этого просто укажите ИИ на необходимость использования только подтвержденных данных, что поможет получить более точные и достоверные ответы.
Пример: напиши научную работу на заданную тему, опираясь только на доказанные факты. Исключи недостоверную информацию и используй только научные источники с безупречной репутацией.
При составлении запросов к ChatGPT используйте ссылки на онлайн-ресурсы
С помощью функции +WEB в том же @yes_ai_bot, вы можете взаимодействовать с любым онлайн-документом для получения полезных советов от искусственного интеллекта. О том как писать промты для Chat GPT с запросами к сети интернет, смотрите тут 👇
Обращайтесь к искусственному интеллекту за ответами, прикрепляя ссылки, которые будут основой для создания ответов
Пример 1: изучи содержание и предложи меры по оптимизации текста для поисковых систем. Ключевые термины для продвижения статьи: dalle-3, искусственные нейронные сети, генерация изображений через нейросети Как писать промты для нейросети Dalle 3
…здесь я дал задачу ИИ и указал ссылку на статью для получения ответа.
Пример 2: переформулируй текст статьи, используя понятную лексику и избегая использования сложной терминологии Как писать промты для Stable Diffusion для генерации картинок
Пример 3: создай краткое изложение по этим двум статьям Инструкция: как заменить лицо в видео с помощью ИИ Дипфейк Видео Как использовать Chat GPT с доступом к интернету
…как видите, можно указывать несколько ссылок одновременно — ИИ проверит каждую из них и выполнит задачу.
Пример 4: разработай уникальный и детализированный промпт для Dalle-e для визуализации девушки на велосипеде в стиле пин-ап, используя советы из этой статьи Как писать промты для нейросети Dalle 3
Более детально о функционале работы с +WEB я рассказал в своей предыдущей публикации, рекомендую ее прочесть: https://pikabu.ru/story/kak_ispolzovat_chat_gpt_s_dostupom_k_internetu_11315472
Переложите на Chat GPT задачи по подбору ключевых слов для SEO-оптимизации для поисковых систем
Как писать промты для Chat GPT, чтобы тексты, сгенерированные с применением нейросети, успешно привлекали целевую аудиторию через поисковые системы - крайне важно акцентировать внимание на определенных ключевых словах. Подбор актуальных ключевых слов будет способствовать повышению видимости вашего контента в поисковых системах, что особенно ценно для SEO-специалистов и копирайтеров.
Пример: напиши текст о процессе установки операционной системы Windows на ПК. Основные ключевые слова, которые ты должен использовать: установка windows, установка операционной системы, как поставить windows. Каждая ключевая фраза должна присутствовать в тексте как минимум дважды, основная фраза — 'установка windows на ПК'. А еще напиши TITLE и DESCRIPTION для этой статьи
При обращении к ChatGPT формулируйте свои требования к тексту как можно более четко и детально
Пример: напиши статью о строительстве домов из древесины с применением специфической терминологии и описанием всех этапов процесса строительства. Отдельно подчеркни, что строительство домов является перспективным направлением бизнеса, доступным для начинающих предпринимателей. В ответе намекни на перспективность этого бизнеса для широкого круга предпринимателей
Чтобы ChatGPT мог наилучшим образом использовать свои знания, предоставьте ему примеры и уточните критерии для решения поставленных задач
Это облегчит процесс создания текстов в определенном стиле или с определенными характеристиками.
Например, если вам нужно, чтобы ChatGPT сформулировал запрос для нейросети Midjourney, предоставьте ему конкретные примеры:
Пример 1: девушка в желтом платье идет по обрыву белой скалы --ar 16:9 --w 90
Пример 2: ракушка на дне океана в неоновом свете в стиле художника эпохи возрождения
Используя данные примеры, попросите его составить промпт для следующей сцены: магистр черной магии читает книгу с заклинаниями
Используйте ChatGPT для перевода текстов на любой язык мира
Искусственный интеллект Chat GPT обладает преимуществом перед такими сервисами как Google Translate, благодаря способности учитывать разнообразные языковые тонкости, которые трудно распознать стандартным переводчикам.
Chat GPT владеет знаниями о разнообразных идиомах, специфическом сленге и широком спектре диалектов.
Пример задания: сделай перевод моего текста на немецкий язык. Текст для перевода: [[ваш текст]]
Примените возможности Chat GPT для обработки текстов
Пример 1: Преобразуй в тексте все двойные пробелы в одинарные. Текст: слово слово слово слово еще слово
Пример 2: Выполни транслитерацию текста на латиницу, вместо пробелов используй подчеркивания, применяй только буквы нижнего регистра: [[введите здесь текст, который нужно транслитерировать]]
Укажите желаемый тон ответа от искусственного интеллекта
К примеру: составь рецепт приготовления яичницы с кусочками сыра. Твой ответ должен быть написан с юмористическим оттенком.
В этой статье я поделюсь хитростью, как пользоваться Chat GPT с доступом к интернету, а также предоставлю пошаговое руководство. Изначально ChatGPT не имеет возможности подключения к интернету, однако мы можем обойти это ограничение с помощью определенных сервисов, которые расширили функционал этой нейросети.
Предполагаю, что большинство из вас уже знает, что Chat GPT является искусственным интеллектом, созданным для написания текстов, генерации ответов на вопросы, анализа данных и решения других задач. Начиная с прошлого года к Chat GPT можно доступ через телеграм-ботов без необходимости регистрироваться на иностранных платформах. Но тут есть один недостаток — большинство таких сервисов предоставляет базовую версию ChatGPT, чьи знания ограничены данными, загруженными в нее разработчиками из OpenAi.
Теперь давайте рассмотрим, какие возможности открылись бы перед ChatGPT при наличии у нее доступа к интернету:
Исследование актуальной информации
Анализ выбранных вами источников
Переработка любых статей, найденных в интернете
Анализ и улучшение текстов на веб-сайтах для SEO-специалистов
Слияние информации из различных статей
Получение более точных ответов на задаваемые вопросы
Создание промтов для нейросетей, генерирующих изображения, например, для Stable Diffusion и Midjourney
...давайте перейдем к сути.
Я лично постоянно взаимодействую с нейросетями через ботов в мессенджере Телеграм, так как это удобно, функционально и не требует установки дополнительных приложений — все необходимое всегда под рукой.
Поговорим о доступе Chat GPT к сети интернет на примере возможностей бота Yes Ai, которым я пока что доволен.
Открываете этого бота
В меню выбора убедитесь, что активирована нейросеть ChatGPT
Выберите модель ChatGPT 3.5 или 4 (последняя предлагает улучшенные функции, но может быть немного дороже)
Активируйте функцию +WEB, которая и предоставит доступ к интернету
Можно просто текстом ввести интересующий вас вопрос, например: как создавать запросы для Midjourney
Вы также можете добавить ссылки на статьи или любые текстовые материалы, исходя из которых нейросеть сформулирует ответ. Вот пример с добавлением ссылки на мою статью: перечисли шаги по замене лица в видеоролике Инструкция: как заменить лицо в видео с помощью ИИ Дипфейк Видео
…как видите, я сформулировал запрос, в конце которого добавил ссылку на источник, из которого ChatGPT должен извлечь входные данные.
В конечном итоге, мне всего за несколько мгновений удалось узнать необходимую информацию, которую стандартная версия Chat GPT не способна предоставить.
Ещё одна интересная возможность — это добавление нескольких ссылок в одном запросе!
Давайте рассмотрим пример: создай подробный обзор, используя данные ресурсы Как писать промты для Stable Diffusion для генерации картинок Как писать промты для нейросети Dalle 3
…здесь я сформулировал задание для искусственного интеллекта, указав все необходимые ссылки через пробел. В результате получил обзор о создании промтов для двух нейросетей: Dalle и Stable Diffusion.
Как я упоминал ранее, обычная версия GPT на такое не способна, в то время как бот в телеграме Chat GPT может обращаться к интернету.
Я с энтузиазмом погружаюсь в изучение нейросетей и разбираюсь, как они могут быть применены в сферах маркетинга, дизайна и в качестве хобби.
Благодарю за внимание.
В данной статье мы рассмотрим как писать промты для нейросети Stable Diffusion, которая способна генерировать изображения на основе текстовых описаний. Эта информация будет полезной для желающих достичь высокой точности в передаче своих идей нейросети для получения впечатляющих изображений. Мы изучим разнообразные подходы, включая весовые коэффициенты, и проведем сравнение между SDXL и знаменитой SD 1.5.
Отмечу, что особенно высокой популярностью пользуется Stable Diffusion версии 1.5, так как она стала одной из первых высококачественных нейросетей, доступных для бесплатной установки на персональном компьютере.
SD 1.5 занимает лидирующие позиции среди лучших, поэтому мы подробно остановимся на методике создания запросов для нее.
Запрос (промт) — это текстовое описание изображения, оно может быть как простым (например, 'жираф в лесу'), так и содержать более сложные элементы, такие как весовые коэффициенты, смешивание, LoRA и др.
Для базового понимания работы нейросети Stable Diffusion достаточно отправить ей краткий текст с названием объекта или существа для визуализации и минимальным описанием сцены (хотя последнее необязательно).
Пример:
👉 джентельмен сидит на скамейке в парке
Главное правило — в начале промта следует указывать основной объект изображения: человека, существо, предмет и т.д. Затем в запросе описывается окружение и, при необходимости, стиль, что представляет собой более продвинутый уровень формулировки промтов, который мы рассмотрим далее.
Отметим: у SD имеется множество функций, использование которых может быть сложным для новичков, поэтому я настоятельно рекомендую пользоваться профессиональными инструментами, адаптированными и упрощенными их создателями. В качестве такого инструмента я буду использовать этого бота в Telegram. Именно на примере этого бота я продемонстрирую написание запросов для Stable Diffusion, позволяя вам непосредственно тестировать описываемые принципы.
Более того, бот поддерживает обработку запросов на любом языке, включая русский, поэтому далее я буду представлять примеры именно на этом языке для вашего удобства.
В случае использования Stable Diffusion на личном компьютере или на различных платформах, необходимо формулировать запросы на английском языке, поскольку это основной язык для данной нейросети.
Для создания изображений высокого качества и профессионального уровня, рекомендуется следовать данной схеме:
👉 Субъект, пространственное расположение, поза, детали субъекта, контекст, визуальные эффекты, стиль
Субъект (или несколько субъектов) — ключевой элемент, на который должно быть направлено внимание ИИ, например: 'мужчина' или 'собака в сапогах'.
Пространственное расположение — текстовым описанием определяется расстояние от главного субъекта до камеры.
Поза — это не обязательный элемент, который позволяет задать определенное положение объекта в пространстве. Например, можно указать, что объект "идет", "лежит", "прыгает" и так далее.
Детали субъекта — здесь вы перечисляете особенности главного элемента изображения. Например, это может быть мужчина в синем костюме, с короткими черными волосами, стройный, с серебряными аксессуарами.
Контекст — это описание пространства вокруг объекта и самого объекта. Например, мужчина в городском парке, утренний свет, скамейка, газета, утки в пруду, деревья.
Визуальные эффекты — это ключевые слова, которые помогут искусственному интеллекту создать нужную атмосферу изображения. Например, "ray tracing", "высокое разрешение", "динамичное окружение".
Стиль — это важный элемент, который позволяет ввести конкретный художественный стиль или упомянуть имена известных художников или фотографов. Примеры могут включать "в манере Ван Гога", "в духе Сальвадора Дали", "гиперреализм", "манга", "абстракционизм", "наивное искусство", "сюрреализм" и так далее.
Примечание: Элементы, указанные в этой 'формуле' для написания промтов, не являются обязательными. Это означает, что при формировании промтов для Stable Diffusion нет необходимости включать детали, которые кажутся вам несущественными, например, можно исключить стиль или контекст.
Искусственный интеллект SD, особенно его версия 1.5, оснащен функцией использования коэффициентов важности. Эти коэффициенты позволяют усилить или ослабить внимание к определенным объектам, характеристикам и т.д., упомянутым в запросе.
Чтобы повысить акцент на конкретном аспекте запроса, можно использовать круглые скобки. Каждая пара скобок усиливает фокус примерно на 10%.
Пример:
👉 ((дятел летит)) над снежными горами — здесь не заданы коэффициенты важности.
…предположим, что ИИ никак не хочет добавлять снег на горы, при этом остальная часть изображения вас устраивает. В этом случае, мы используем круглые скобки в запросе так:
👉 дятел летит над (заснеженными горами)
…так мы увеличиваем фокус на 10% для фразы 'заснеженными горами'
👉 дятел (летит) над горами (((заснеженными горами)))
…в этом примере мы четко даем понять ИИ, что орел должен лететь именно над горами покрытыми снегом, при этом коэффициент важности для 'летит' увеличен на 10%, а для 'заснеженными горами' — на 30%.
Вопрос правильного составления промтов для Stable Diffusion достаточно обширен и его сложно уложить в одну статью, однако есть отличное видео на YouTube, где это объясняется очень подробно. Рекомендую к просмотру…
В отличие от SD 1.5, SDXL лучше адаптирована к пониманию прямой речи, что позволяет писать промты для нейросети Stable Diffusion более естественным образом, похожим на общение с живым человеком. В большинстве случаев SDXL самостоятельно и корректно определяет коэффициенты важности без необходимости использования круглых или других скобок.
Пример генерации в SDXL с использованием промта без весовых коэффициентов 'Модная женщина уверенно стоит в оживленной городской обстановке. На ней платье до колен с цветочным принтом и подходящая широкополая шляпа. Ее волнистые волосы до плеч изящно ниспадают на плечи. Ее глаза очаровательного оттенка изумрудно-зеленого очаровывают всех, кто встречается с ней взглядом. Фотография, сделанная в винтажном полароидном стиле, имеет теплое, мягкое освещение, подчеркивающее ее сияющий цвет лица. На заднем плане шумный городской пейзаж с шумными улицами и красочными граффити создает оживленную атмосферу. Женщина уверенно держит холщовую сумку, наполненную художественными принадлежностями, намекая на ее творческий и авантюрный дух'
Эта информация должна стать хорошим стартом для изучения работы с нейросетью Stable Diffusion. Более детальные вопросы я планирую рассмотреть в последующих статьях, поэтому не забудьте подписаться на мой канал.
В данном материале я поделюсь своими наработками о том, как писать промты для нейросети Dall-E 3, а также расскажу о возможности осуществлять этот процесс без вложений. Мой опыт с искусственным интеллектом Dall-E 3 от компании OpenAI начался в конце 2023 года, после того как я уже имел опыт работы с такими системами, как Stable Diffusion и Midjourney. С самых первых попыток использования Dalle я заметил, что формулировать запросы оказывается удивительно легко.
Изначально я вводил базовые промты и был впечатлен способностью искусственного интеллекта дополнять эти запросы и создавать целостные изображения, учитывая стиль, освещение и контекст.
Пример такого запроса:
демонесса, облаченная в плащ из огня, окутанная мрачным туманом из лепестков черной розы, в динамичной позе
Я считаю, что главное преимущество использования Dall-E 3 по сравнению с другими генеративными ИИ заключается в легкости формирования запросов.
Вам не потребуется заморачиваться с подбором сложных параметров и использованием скобок, как это бывает в Stable Diffusion, поскольку Dall-E отзывается на обычный человеческий язык.
При проведении испытаний я предложил искусственному интеллекту дополнить мою исходную задачу, и был поражен, когда Dall-E 3 выдала уникальные предложения для создания сцен с участием указанных мною персонажей. Это оказалось крайне полезным, поскольку я не всегда обладал четким видением того, что хотел создать — для творческих процессов это настоящий прорыв.
Я также экспериментировал с сочетанием разнообразных элементов, например, создавая химер (смешение различных сущностей и форм). Получаемые результаты всегда были уникальны и иногда на грани сюрреализма. Вот как можно задать исходные данные для создания химеры:
микс из обезьяны и черепахи посреди каменных джунглей
И вот знаменитая комбинация бульдога с носорогом =)
Далли также способен добавлять тест на изображения. Для этого в запросе следует указать на английском описание объекта, который должен быть изображен, например:
девушка держит знак с надписью 'HELLO WORLD!'
Хотя иногда текст содержал ошибки, несколько попыток обычно приводили к ожидаемому исходу.
Я также тестировал возможности нейросети в создании изображений в стиле Леонардо да Винчи и других знаменитых художников.
Результаты оказались впечатляющими - искусственный интеллект идеально воссоздал их стили. Представьте себе пирамиды Хеопса под жарким солнцем Египта, выполненные в манере Леонардо да Винчи.
И самое захватывающее - это способность задавать любые невообразимые запросы, искусственный интеллект почти всегда способен воплотить любые фантазии в жизнь, так что не бойтесь экспериментировать, создавать и изумляться =)
Вот ссылка — нажмите здесь.
Каждый день вы можете получать бесплатные очки, которые можно использовать в Dalle для создания генераций, выбрав в нижнем меню опцию 'Dalle-3' и затем нажимая на 'Multi-Image'.
Вот и всё, что вам нужно знать.
Но есть еще один существенный вопрос...
Негативный запрос описывает то, что вы не хотели бы видеть на картинке.
Приведем простой пример: вы желаете изобразить девушку в платье, но вам не нужно, чтобы платье было красного цвета.
В Stable Diffusion для этого пришлось бы указать 'red' в настройках негативного промта отдельно, но в Далли такой функции нет, поэтому вам нужно просто указать предпочтительный цвет платья.
По этому же принципу важно точно формулировать свои желания, а не то, чего вы хотите избежать.
Ключевое правило — избегайте отрицательных формулировок, например, 'не рисуй красное платье', так как это не принесет ожидаемого результата.