А разве ai может генерить обнаженку?
вот такой случай произошел сегодня на просторах паутины. как говорится - смотреть до конца
вот такой случай произошел сегодня на просторах паутины. как говорится - смотреть до конца
За последнюю неделю по сети прокатилась целая волна постов про InstantID, позволяющего без обучения и файн-тюнинга создавать изображения с загруженным вами лицом человека. Но самая главная проблема заключалась в том, что при локальном запуске, официальная версия требовала 24 гигабайта видеопамяти для своей работы. Мне же удалось поумерить аппетиты до 12-14 гигабайт, а также ускорить вывод в несколько раз.
Видеообзор на мою модификацию вы можете посмотреть в видео выше, про саму же технологию уже был обзор тут: InstantID: Создание персонализированных изображений по одному фото. И лучший бесплатный генератор нейро-аватарок на сегодняшний день
В этом посте же я расскажу про отличия и особенности модификации. Ссылка на загрузку будет в конце данного поста.
Интерфейс программы переведен на русский язык, чтобы повысить комфорт работы для людей, которые недавно начали работать с нейросетями. Расширенные же настройки остались на английском, т.к. многие термины для опытных пользователей привычнее видеть именно в таком формате.
Сборка является портативной - она не требует установки каких либо доп программ, пакетов либоо чего-то еще. Вам надо всего лишь распаковать архив и запустить один из bat файлов. Единственное при первом запуске она скачает модель. Это было сделано для того чтобы не раздувать размер архива до 20+ Гб.
Обычная генерация и генерация с улучшением лица
Кроме оптимизации памяти, я добавил RestoreFormer++ для улучшения лица, а также возможность увеличивать размер изображения на выходе до x4. В будущих обновлениях планирую добавить выбор модели для апскейла.
Базовая версия требовала 30 шагов для создания изображения. Благодаря технологии LCM и SDXL Turbo, я снизил количество шагов до 4 по умолчанию. Такое значение ускоряет вывод в несколько раз, при этом выдавая вполне нормальное качество.
Благодаря всему этому, работа через процессор стала возможной. К примеру генерация на Ryzen R9 5900X заняла около 2-х минут с использованием 20-24 гигабайт оперативной памяти. Увы, из за того что CPU не поддерживает по умолчанию FP16 и работает в режиме FP32 потребление памяти больше, чем на GPU. Возможно в будущем получится оптимизировать работу с использованием bfloat16, тогда потребление оперативки будет намного меньше.
Если вы владелец RTX 3090, 4090 или какой-то подобной карты, вы можете отключить оптмизацию работы с памятью и ускорить вывод. Для этого, сразу после запуска откройте расширенные настройки и отключите Enable TinyVAE и Enable Attention Slicing
Также вы можете заменить модель по умолчанию. Пока что поддерживаются только модели с HuggingFace. Для этого отредактируйте bat файл для запуска и измените строку с:
python gradio_demo\app_lcm.py
на
python gradio_demo\app_lcm.py --pretrained_model_name_or_path hg_username/model_name
где --pretrained_model_name_or_path это аргумент для указания модели, а hg_username/model_name это указание на модель. После измненеия модель загрузится с HuggingFace и в последующем уже будет работать локально.
Нормальную поддержку выбора кастомных моделей с Civitai добавлю позже.
Скачать архив с портативной версией можно тут. Или же через Яндекс Диск
Если у вас ошибки при распаковке - обновите WinRAR.
Важно чтобы в пути до папки со сборкой не было кириллических названий, путь должен быть на английском, иначе возможны серьёзные ошибки.
Будущие обновления будут публиковаться в моем Телеграм канале. Там же вы можете найти и другие сборки различных нейронок.
Если же у вас возникнут проблемы, то вы можете спросить как и решить в нашем чате
У нейросети Fal появилась новая фича — Photo Booth, которая превратит вас в любую знаменитость. Частота кадров 30 fps, результат пока далек от идеала, но потестить бесплатно можно уже прямо сейчас с вебки.
Похоже теперь любого человека можно заставить говорить все, что угодно. Проект VideoReTalking, представленный на конференции SIGGRAPH Asia 2022, предлагает систему для редактирования видео с говорящими головами в реальном времени на основе входного аудио.
VideoReTalking позволяет создавать видео высокого качества с синхронизацией движения губ даже при изменении эмоций, то есть так, чтобы человек на нём говорил заданный текст с учетом синхронизации движения губ и эмоций, соответствующих звучанию. Технология использует сложные алгоритмы машинного обучения и обработки изображений для достижения реалистичного результата без необходимости ручного вмешательства пользователя.
Процесс включает в себя три этапа: генерация видео лица с каноническим выражением, синхронизация движения губ с аудио и улучшение фотореалистичности лица. Все этапы выполняются автоматически без вмешательства пользователя с использованием обучаемых подходов
Достаточно загрузить речь нужного человека и на выходе получить видео, где он говорит ваш текст.
Хоть синтезированный голос отличается, все равно открываются новые возможности для редактирования видеоконтента, но также поднимает вопросы этики и правомерности использования подобных технологий... Что думаете? 😬
Код на GitHub.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой тг НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса
"Меня забанили в Midjourney за создание реалистичных изображений политиков, изменяющих своим женам. Я сгенерировал их для серии работ под названием “Искусственный интеллект как революционный способ шантажа"
Нейрохудожник Джастин Браун был заблокирован модераторами платформы Midjourney после того, как он создал фальшивые фотографии политиков, изображающих измену своим супругам. По словам самого художника, эти работы были частью серии под названием "Искусственный интеллект как революционный способ шантажа". Он выразил опасение, что искусственный интеллект может стать опасным оружием в руках злоумышленников.
Хотя намерения художника казались благими, модераторы Midjourney приняли решение заблокировать его аккаунт, возможно, в связи с предстоящими выборами президента США в 2024 году. Подобные фейковые изображения могут оказывать влияние на голосование, если люди будут ими верить.
Среди политиков, изображенных на этих фотографиях, есть Джо Байден, Дональд Трамп, Берни Сандерс, Барак Обама, бывший губернатор Нью-Джерси Крис Кристи и губернатор Флориды Рон ДеСантис. Некоторые из них намерены участвовать в предстоящих выборах.
Хотя эти фальшивые изображения не выглядят слишком реалистичными, они все равно обладают определенной убедительностью. Кроме того, модераторы платформы Midjourney забанили художника только после того, как он опубликовал свои работы в социальных сетях. Это означает, что другие люди всё еще могут создавать подобный контент, если делают это без публичного доступа.
Джастин Браун отметил, что его аккаунт был заблокирован модераторами Midjourney сразу после того, как его работы стали популярными на Reddit. Он ранее получал предупреждения из-за непристойных изображений, но никогда не был забанен. Модераторы не объяснили причину блокировки, однако она является очевидной.
Пользователи платформы разделились по мнению насчет этих фейковых фотографий. Некоторые считают, что никто не поверит подобным обманам, в то время как другие напомнили о множестве наивных пользователей, не разбирающихся в технологиях. Если таким людям показать эти фальшивые изображения, они могут легко принять их за реальные фотографии.
Сам художник признал, что никогда не задумывался о своих изображениях как о реальных. Однако он осведомлен о том, что некоторые из его работ уже были опубликованы другими людьми без контекста его творчества. Поэтому ему не удивительно, если найдутся люди, которые поверят в их подлинность.
Обзор бота нейросети Midjourney в телеграме.
ВАУ! БУМ! УФФ! Произошли какие-то наикрутейший изменения!
Продолжаю делиться впечатлениями. Обещала новый пост чуть ли на следующий день, но дела..дела..
То, что хотела сказать тогда - отодвигаю. Ведь:
Появилась возможность не только генерировать картинки по запросу, но и отправлять свои фотографии. Просто отправляешь боту свою картинку, а в ответ получаешь модернизированную фотку в любом стиле.
Работа на !!пятой!!, самой продвинутой, версии нейросети. Действительно, разница значительная. Качество супер, стало меньше "багов" с пальцами, головными уборами и прочим. И генерации становится все сложнее отличить от реальных фото.
Произошли изменения и в лимитах. Если раньше при входе давали 20 картинок и стоял лимит в 5 бесплатных ежедневных генераций, то сейчас новичкам дается 20 картинок до конца суток и каждый день - лимит на одну бесплатную генерацию. Что получается 365 бесплатных генерации за год. При условии, что Midjourney вообще закрыл бесплатный доступ, я считаю это шикарной новостью и решением! И продолжаю генерить в ботике всякую всячину)
Подписка на 20 картинок все еще стоит 100 рублей. Считаю, достойно для обычного пользователя. Тем более с наличием такого функционала:
- бесплатные генерации (мало, но все же),
- разделение картинок,
- улучшение качества картинок (см.прошлый пост)
- пятая версия
Теперь о грусти-печали:
- Конкурсы совсем пропали (админы обленились выбирать генерации, видимо). Но, надеюсь, вернут. Так как теперь это знатная плюшка - картинки в подарок.
- Тут всплывает и вторая грусть: конечно, я расстроилась, что теперь не 5, а 1 генерация в день. Но бабушка учила радоваться мелочам. Вот и радуюсь. Бесплатных генераций нигде, кроме здесь - нет. Так что, буду радоваться малому.
Несмотря ни на что, мне нравится бот. Удобно, что в телеге (ведь сейчас все туда переехало).
И еще немного про обещания команды: вроде все исполняют. Но пока новых анонсов не было) Да и я уже сама не знаю, что можно обновить - добавить)
Ну и в заключении я снова обещаю вернуться с обзорами вскоре!
PS. А на прикрепленной генерации - я=)) В стиле nicoletta ceccoli))