Привет, Пикабу. Ох уж, сколько лет я тут ничего не выкладывал. Пришло время исправляться. Да не абы что, а то, что я сделал собственную версию персонажей из GTA San Andreas в реальной жизни.
Теперь многобукав: Наверняка кто-то из вас видел пост на Reddite с персонажами от AaronGNP. Где он с помощью Stable Diffusion сделал реалистичных персонажей из игры.
Сделано круто, но не было других персонажей. К тому же в своей версии я хотел добиться больших соответствий, что не всегда идеально у меня получалось.
Ведь полагаю, многие из вас хотели бы видеть, скажем, в фильме идентичного по внешности актёра или графику, как в играх, комиксах и так далее.
Я из подобных рассуждений и захотел сделать свои версию. Мне было это интересно, может и вам понравиться, что я сделал.
На чём стряпал
Я использовал Stable Diffusion. Она бесплатна, огромное сообщество и больше тонких настроек в отличие от Midjourney. Рендерил всё на RTX 4090/Ryzen 9 7900X
Процесс создания
Сделать качественное изображение очень похожее на графику не так просто. Но я для себя придумал классный методом ре-рендеринга. Нигде в интернете не нашёл, чтобы так делали, я сам просто экспериментировал с настройками.
Проблема в том, что если значения сразу ставить Denoising Strength высоким, изображение становится качественным. Но сильно меняет исходное изображение. Что и бывало у AaronGNP и других ребят. Ну и конечно же правильно написанный promt тоже играет роль, ведь CJ мог бы легко превратиться в женщину.
Значение порядка 0.5-0.55
При низком оставляет всё почти так же, но и качество изображения, если оно не качественное и не фотореалистичное делается плохим. Больше похоже на улучшенные текстуры. Так не пойдёт. Надо широкую на широкую делать однозначно.
Поэтому я подошёл к гибридному методу, в котором улучшенное использовал на себе же и так до необходимого результата. При необходимости, я корректировал promt, и менял разные модели, чтобы сделать лучше результат.
Но такой метод не всегда работает правильно и классно. Но в основном показывает себя довольно хорошо.
В итоге собрал это в видео. Планирую дальше выпускать подобные ролики, при этом не ограничиваясь только играми.
Сразу обозначу, что это пост о моем опыте, а не инструкция от профессионала. мне нужен был простенький статейный блог для внутренней работы. И эта цель достигнута )
Я уже примерно год задумывалась о том, что мне для работы нужно какое-то единое хранилище для моих материалов, которые я использую в своей работе с клиентами (я психолог). Потому что между консультациями я очень часто присылаю им кучу ссылок на разные сайты со статьями, видео и заметками на темы, которые актуальны в рамках нашей работы с запросом. И особенно неудобно было с тестами. Они их проходят на сторонних сайтах, потом забывают сделать скрины результатов и так далее.
Я раньше уже обращалась в студии и к фрилансерам с этим запросом, но мне там такое ТЗ выкатывали подготовки к будущему сео / разработке / текстам и прочему что я в загрузке консультаций, тренингов и семейной жизни эту идею забросила на дальнюю полку. потому что все слишком усложнилось. А хотелось сильно проще )
А сейчас для меня пришло идеальное время. идет 2 месяц декрета, я уже нормально высыпаюсь, быт налажен и есть возможность занять себя делом в "фоновом режиме". Я попробовала использовать время прогулок с сыночком для "наговаривания" статьи на диктофон и получилось вполне сносно ) править такой текст намного легче, чем писать с нуля. И я решилась на попытку реализовать свою идею с блогом )
Буду рада, если мой опыт кого-то вдохновит на создание собственного сайта, если есть такая мысль и потребность. Это оказалось сильно проще, чем я предполагала.
ВАЖНО: понятное дело, что это просто сайт. он не оптимизирован, не предназначен для рекламы, я наверняка накосячила с сео настройками и все потеряно-пропало с выдачей. в этом контексте я без ожиданий. для моих целей он уже худо-бедно сгодится и я довольна ) так что делюсь:
1. С чего я начала:
Первым делом, как сформировала итоговое представление что хочу, обратилась ко всем знакомым кто разбирается в теме сайтов. Все дали совет делать на вордпрессе, так как это лучший движок для блогов - статейников. дополнительно загуглила и рекомендация подтвердилась. вопрос решен )
2. Сразу загуглила "Как сделать сайт на вордпресс":
Изучила пару страниц выдачи, ютуб и остановилась на этом видео:
оно не самое "свежее" (как я сейчас понимаю), но я прошла по шагам и у меня все получилось.
3. В процессе настройки сайта купила домен:
Я загуглила "какой домен выбрать для личного сайта" и все рекомендуют +- одно и тоже:
для России лучше .ru
в нейминге использовать фамилию
идеально, если будет отражать смысл сайта. у меня это блог.
то есть идеальная формула для домена с моим запросом: Фамилия+blog+.ru
4. После того как установила движок - выбрала "тему дизайна" блога:
Изучила выдачу ютуба и наткнулась на канал "финты вордпресс" с плеером "обзор тем вордпресса". вот ссылка на него - https://www.youtube.com/@wpruse
Там 16 максимально подробных обзоров, выбрала самую подходящую и купила. не стала усложнять.
В обзоре рассказывают как ее купить, установить и обзорно показывают все настройки, так что проблем не возникло. его обзоры не рассчитаны на совсем новичков, но он все же произнес фразу про то что в комплекте идет демо-контент и что при желании им можно воспользоваться.
Так что я воспользовалась этой возможностью и установила демо-контект по простой инструкции от разработчиков темы и получила готовый сайт. (по этому пункту меня, вроде как, наругали что я испортила себе сео будущее. но если это и так, то я не жалею. так как без этого шаблона я тему сама бы не настроила :D )
Потом по обзору настроек темы от wpruse я уже видела как они реально работают на моем сайте и сделала худо-бедно как мне нужно )
Логотипа у меня нет фирменного, поэтому я просто взяла из шаблона и в приложении на телефоне заменила на свои слова по смыслу. Цвета тоже не трогала.
Главная страница сайта. Так как в блоках не заданы настройки какие именно записи выводить, то по шаблону выводятся самые свежие записи. А их у меня сейчас всего 4. Поэтому сейчас в блоках одно и тоже. нижнего меню также нет пока, поэтому блок пустой
5. Сейчас я на этом этапе - сделать базу статей в рамках первой рубрики:
Я хочу сделать постов 25-30 и когда уже будет небольшая база, то начну заниматься остальными настройками темы - внешний вид записей, блоки навигации, фотографии, тонкие настройки рубрик, их описания и прочее - прочее. Сейчас это бессмысленно.
Кстати, оформление статей - отдельная тема. Думаю что когда закончу плановое заполнение первой рубрики, то снова пройдусь по всем статьям и внесу корректировки - в текст, оформление и структуру. Все приходит с опытом же. + клиенты задают новые вопросы и есть потребность менять / добавлять новые блоки.
6. Что планирую в будущем:
нужно закончить базовую настройку сайта. но это все в процессе сделаю. Как обычно бывает - пока изучала как сделать сайт обнаружила множество вопросов, о которых даже не задумывалась и будет очень интересно этим заняться ) К примеру - как писать длинные статьи, правила "читаемости" длинных статей, как сделать форму подписки на новые статьи, как сделать форму "задать вопрос" или "предложить тему", каким образом и на какой сервис выкладывать записи моих бесплатных вебинаров по темам недели, как оповещать об этом, как делать тайминг на видео и прочее-прочее. как сделать чтобы какой-то контент был в открытом доступе, а какой-то только для клиентов. раньше не задумывалась об этом, а сейчас реально нужно для удобства )
Итог:
Уже в данном виде опыт считаю успешным ) сумма затрат на все 4,5 тыс рублей. если тему не покупать, то обошлось бы рублей 800-900. По времени базовая настройка движка 2 дня (из которых сутки защиту соединения предоставлял сервис). время настройки темы не беру, процесс бесконечный, особенно с нулевым опытом как у меня. если есть опыт, то минимально запуститься за несколько часов, наверно, можно.
И в конце хочу обратиться к моим подписчикам (так как увидите этот пост, скорее всего, только вы :D): если вам зайдет эта тема, то напишите коммент и я по мере развития блога буду писать мини-отчеты о моем опыте. об успехах и неудачах. а если не зайдет, то думаю основную мысль мне удалось донести - если вам нужен сайт-визитка, лендос для услуги, блог для статей - то вы справитесь 100% очень легко и просто!
не откладывайте. просто сделайте! потому что если получилось у меня с нулевым опытом, то и у вас получится 100%
Давайте погрузимся в мир коротких видеороликов и узнаем, как загрузить, создать, скачать и отключить Shorts.
1. Как загрузить Shorts:
- Откройте приложение YouTube на своем мобильном устройстве. - Нажмите на значок "+" в нижней части экрана. - Выберите опцию "Создать видео в формате Shorts". - Затем вы можете либо снять новое видео, либо выбрать готовое из вашей галереи. - После выбора видео вы сможете добавить фильтры, музыку и другие эффекты. - Нажмите на кнопку "Далее" и добавьте заголовок, описание и хэштеги для вашего Shorts. - Наконец, нажмите на кнопку "Опубликовать" и ваш Shorts будет загружен на YouTube.
Изображение из переводчика
2. Как переводится "Shorts":
- "Shorts" - это английское слово, которое можно перевести на русский язык как "короткие видео" или "короткометражки". Это формат видео, который позволяет создавать и просматривать короткие, занимательные ролики на YouTube.
3. Как сделать Shorts:
- Создание Shorts - это простой процесс, который можно выполнить прямо в приложении YouTube на мобильном устройстве. Следуйте инструкциям, описанным в первом пункте, чтобы создать свой собственный короткий видеоролик.
4. Как скачать ролик себе на компьютер, уже опубликованный в Shorts:
- К сожалению, на данный момент YouTube не предоставляет прямой способ скачивания Shorts на компьютер. Shorts предназначены для просмотра и создания на мобильных устройствах. Однако, вы можете воспользоваться сторонними программами или онлайн-сервисами для загрузки видео с YouTube на компьютер.
Например, программы для записи видео с экрана, такие как: - OBS Studio - Camtasia - Bandicam - Snagit - ShareX
Блок shorts в youtobe
5. Как отключить Shorts в YouTube и возможно ли это сделать:
- На данный момент YouTube не предоставляет возможности отключить Shorts. Функция Shorts является частью платформы и доступна для всех пользователей. Если вы не хотите видеть Shorts в своей ленте, вы можете просто прокрутить их или использовать фильтры поиска, чтобы исключить короткие видео из результатов.
- Максимум есть решение в браузере, но и то только если просматривать с компьютера: - откройте ютуб
Кликаем правой кнопкой рядом с блоком shorts
- нажмите правой кнопкой на экран (рядом с блоком shorts, который хотите удалить) - нажмите "посмотреть код"
Кликаем кнопку выделения
- кнопку "выделение", как на рисунке
- левой кнопкой между обложками shorts (будет выделено синим) - нажмите на клавиатуре кнопку "delite" (удалить).
- после чего останется только закрыть окошко внизу с кодом
Единственное - что этот блок снова появится после перезагрузки страницы или после перехода. По этому этого решения хватит не надолго.
Пару недель назад я захотел сделать кавер с одним определённым голосом на какую-нибудь популярную песню. tl;dr всё получилось и ниже вы узнаете, как повторить такой результат:
Быстрое гугление выдаёт несколько онлайновых сервисов, в которых либо можно выбрать из списка уже обученных моделей, либо это дорого, долго и вне моего контроля над генерацией.
платно
Если допустить немного пердолинга, то есть инструмент для локальной установки с простым веб-интерфейсом и кнопкой "Generate".
Но для полноценной работы ему требуются обученные голосовые модели в формате RVC (об этом ниже), функционала обучения в нём нет.
Ещё немного поисков выдают вариации такого колаба.
Для обучения нужно оплатить подписку Colab Pro, иначе процесс будет прибит сервером с ошибкой "недопустимая инструкция для бесплатного аккаунта".
Этого уже достаточно для создания каверов со своими голосовыми моделями. Первые каверы я делал именно так. Если хотите улучшить качество генерации или оптимизировать сам процесс, то переходите к следующему пункту.
Как это работает
Realistic Voice Cloning (реалистичное копирование голоса) или RVC работает по вполне понимаемому алгоритму.
При обучении:
дорожка с голосом, который нужно скопировать, нарезается на короткие отрезки
эти отрезки сортируются по высоте тона, тембру и эмоциям или настроению (используется нейросетевой инструмент оценки эмоциональности)
результат собирается в базу данных и индексируется
При копировании голоса:
заменяемая звуковая дорожка тоже нарезается на короткие отрезки
эти куски анализируются и подбирается наиболее подходящий аналог из базы данных (модели) обученного голоса
подобранному кусочку меняется высота тона, скорость воспроизведения и, если точного аналога не найдено, накладывается "акцент" для создания похожего звука
результат сшивается в цельную звуковую дорожку
Конечно "под капотом" всё устроено значительно сложнее, но принцип понятен.
Если умеете пользоваться гитом и командной строкой, то можете сразу перейти к пункту про обучение модели. Ниже будет подробная инструкция по установке.
Требования к железу:
компьютер с Windows или Linux
дискретная видеокарта с 8 ГБ памяти или больше (поддерживаются NVIDIA, AMD и Intel)
И распаковываем в любую папку. В моём случае C:\ffmpeg и файл ffmpeg.exe находится по адресу C:\ffmpeg\bin\ffmpeg.exe
Почти готово, нужно только добавить путь к ffmpeg в переменную path.
Нажимаем Win и начинаем вводить "изменение переменных среды":
выбираем этот пункт
В системных переменных выбираем Path и нажимаем "Изменить..."
Создаём новую переменную с путём до файла ffmpeg.exe
Опять открываем командную строку и проверяем правильность установки:
ffmpeg
Непосредственно установка
Создайте на диске папку, где будет размещаться софт для обучения модели. У меня это C:\AIcovers (обойдитесь без пробелов в именах папок, это упростит работу в будущем).
Откройте командную строку и перейдите в только что созданную папку.
cd C:\AIcovers
Клонируем этот репозиторий в папку train командой:
Осталось скачать предобученные модели для обработки звука. В основном репозитории нет скрипта для автоматического скачивания этих файлов, поэтому я набросал нечто корявое, но рабочее и отправил PR в основной репозиторий. После мержа курсивный текст будет неактуален.
Скачайте и сохраните у себя файл download_models.py в папке train/tools, куда мы клонировали репозиторий. Затем выполните команду:
И у нас автоматически должно открыться окно браузера с интерфейсом
Если видите это — поздравляю, вы всё сделали правильно. Читайте дальше, чтобы понять, как этим пользоваться.
Обучаем голосовую модель
В интерфейсе переходим на вкладку "Обучение модели":
Нужно подготовить данные для обучения модели.
Задайте название для модели голоса в соответствующем поле.
Создайте на диске папку и положите в неё один или несколько файлов с записью голоса. Это должны быть аудиофайлы почти в любом формате. Точно поддерживаются wav, mp3 и m4a.
Голос должен быть максимально очищен от шумов и фоновой музыки. Не должно быть посторонних звуков, которые человек не может издавать ртом.
Для редактирования звука можно воспользоваться бесплатным редактором Audacity.
Введите адрес к папке с аудиозаписями в это поле:
Если в пути к этой папке есть пробелы, то добавьте кавычки.
Нажмите кнопку "Обработать данные" и дождитесь сообщения "end preprocess" в поле справа от кнопки.
Следующая операция выполняется немного дольше. Сперва выберите алгоритм обработки данных (извлечения черт):
Лучшее качество дают rmvpe и rmvpe_gpu. Они по-разному нагружают видеокарту и центральный процессор. Я так и не понял, какой лучше, поэтому выбираю второй.
Нажмите кнопку "Извлечь черты" и дождитесь сообщения "all-feature-done" в поле справа от кнопки.
• 20-30 для исходника низкого качества с высоким уровнем шума, большее число не улучшит качества обучения
• ~200 для датасета высокого качества, с низким уровнем фонового шума и достаточной продолжительностью (10 минут и более)
Этот параметр влияет на использование видеопамяти:
Рекомендаций по оптимальному значению не дам, подбирайте экспериментально для каждого датасета, чтобы расход видеопамяти не вылезал за общий её объём, иначе будет использована системная ОЗУ (та самая DDR на материнской плате) и вместо ускорения обучения вы получите замедление.
использовано 3.9 ГБ более медленной системной памяти
Нажимайте кнопку "Обучить модель" и ждите окончания процесса. Как и в предыдущих этапах в правом поле будет отображаться результат. В консоли можете следить за ходом процесса.
Дожидаемся окончания обучения и нажимаем кнопку "Обучить индекс черт" и ждём ещё немного.
Заходим в папку с нажим скриптом и по пути assets\weights находим файл *имя-модели*.pth (в моём случае my-voice.pth) и копируем его в отдельную папку.
Теперь по пути logs\*имя-модели* (в моём случае logs\my-voice) находим файл с именем формата added_IVFxxx_Flat_nprobe_1_*имя-модели*_v2.index (у меня это added_IVF2050_Flat_nprobe_1_my-voice_v2.index) и копируем его в папку к файлу .pth из предыдущего пункта.
Запакуйте оба файла в архив zip с любым именем. Можно использовать встроенный инструмент Windows из контекстного меню Отправить > Сжатая zip-папка.
Поздравляю, этот архив и есть нужная голосовая модель в формате RVC.
В этом места закончился лимит на картинки. Все иллюстрации можете посмотреть в статье на телеграфе.
Замена голоса в треках
Предыдущий инструмент, который мы использовали для тренировки модели, вполне подходит для генерации новых треков, но удобство использования у него на очень низком уровне. Обещаю внести свой вклад в исправление этого недостатка. А пока установим намного более дружелюбный инструмент.
В консоли после запуска будет ссылка, по которой открывается веб-интерфейс.
Для задания другого сетевого порта добавьте параметр --listen-port *номер порта*, а для доступности интерфейса с других компьютеров в локальной сети добавьте параметр --listen.
Для доступности из интернета можно добавить параметр --share.
Использование
Откроем интерфейс и перейдём на вкладку "Upload model", чтобы добавить обученную на предыдущем этапе модель голоса.
Выберите файл для загрузки, задайте имя модели в поле "Model name" и нажмите кнопку "Upload model".
Если всё правильно, то в поле "Output message" вы увидите сообщение "model successfully uploaded!".
Теперь переходите на вкладку "Generate" и нажимайте кнопку "Refresh models". В списке "Voice models" появится загруженная вами модель. Выберите её.
В поле "Song input" можно либо вставить ссылку на ролик на YouTube, либо загрузить файл, выбрать вариант "Upload file instead". Рекомендую начать эксперименты с песни Джонни Кэша, у неё хорошо отделяется вокал и достаточно разборчивый голос для замены.
Нажимайте кнопку "Generate" и ждите результата. Подбирайте параметры, пока не получится что-то хорошее. Делитесь получившимися шедеврами.
Если будут вопросы, то можете задать их мне в телеграме.
Подписывайтесь на канал, ставьте лайки, жмите на колокольчик и всё такое. Всех люблю и обнимаю.
На релизе (в начале 2023) GRID Legends VR (standalone версия для шлема Quest 2) выглядел очень убого, а управлялся только стиками на VR контроллере. Смотреть в это пиксельное месиво было совсем не интересно, управление же на стики лично меня слегка укачивало (слишком уж рваным оно было). Теперь же - все отлично! :)
Итак, меняем несколько настроек в меню игры, чтобы "сделать хорошо":
- Video: выставить resolution на 125% (вместо 75% по умолчанию)
- Video: выставить refresh rate на 60hz (вместо 72hz по умолчанию)
- Controls: для обоих Left & Right Controller выбрать "Load Device Preset" и после выбрать " ... motion control" пункт меню. Таким образом включится рулёжка жестами-движениями контроллера.
И всё! Игра буквально преображается, и вместо убогого пиксельного крошева выглядит как вполне вменяемая гонка. Да, до сих пор визуал довольно простенький, но он хотя-бы уже не режет глаз.
Управление же motion контроллерами вместо стиков - это буквально открытие 2023 года лично для меня: ввод получается очень точный (даже на хорошем геймпаде такой точности добиться очень сложно), рука отдыхает на коленях-подлокотнике (т.е. её не нужно держать перед собой так, чтобы рука затекла уже через 10 минут игры), а вторая рука становится, по сути, свободной.
Я бы с удовольствием играл так во все VR игры с машинами: левой рукой рулишь-газуешь-тормозишь, правой рукой целишься-стреляешь. Более того, я бы даже в ПК игры играл с рулежкой на motion controller; точнее этого ввода, на мой взгляд, может быть только полноценный руль.
Друзья, всем привет, из этого видео вы узнаете как добавить стилизованный скрытый текст и как делать классные оптические иллюзии на ваших генерациях, это очень просто, понадобится только ControlNet.
TL;DR Что тут вообще происходит, это обзор на дополнительные файлы улучшающие качество создаваемых изображений в Automatic 1111, это оболочка для нейронной сети генерирующей изображения - Stable Diffusion.
Видеохостинг YouTube открыл доступ к разработанному им мобильному редактору видео, который назвали YouTube Create. Пока что редактор находится в статусе бета-версии и доступен в восьми странах только для Android.
Однако, как оказалось, ничто не мешает скачать приложение в виде пакета APK с соответствующих ресурсов и установить его — никаких региональных блокировок приложение не имеет. Версия Android должна быть не ниже 8.0. Поэтому вот первые впечатления от пользования им.
Описание на APKMirror сообщает, что приложение поддерживает 73 языка. Среди них есть и русский. При первом входе в приложение требуется указать свою учетную запись Google.
Стартовая страница предельно проста. После нажатия на плюс вы переходите к каталогу видеозаписей и фотографий на вашем устройстве.
Я для примера возьму фотографии из одного поста, опубликованного на другом ресурсе. После импорта изображений вы переходите в интерфейс редактирования видеоролика.
По умолчанию продолжительность каждого статичного кадра составляет 5 секунд, но её, конечно, можно регулировать. На каждый кадр можно накладывать различные эффекты, поворачивать его, заменять, а также изменять последовательность кадров.
Что можно добавить:
Оверлей
Текст
Стикеры
Музыку
Закадровый голос
Каждый эффект можно предварительно просмотреть перед тем, как использовать: например, увидеть, как будет выглядеть наложенный анимированный текст. Все добавляемые элементы можно перемещать в произвольные точки кадра простым перетаскиванием, а также изменять их размер.
Отличительной особенностью приложения я бы назвал большую библиотеку музыки для использования в роликах. Каталог разбит по жанрам, на мой субъективный вкус, все композиции можно слушать без отвращения.
Вся музыка лицензирована, так что проблем в отношении монетизации быть не должно. Также можно добавлять звуковые эффекты и любые произвольные звуковые файлы из библиотеки вашего устройства.
Звуковых дорожек можно добавить несколько: это удобно, если вы, как я, подготовили отдельно закадровую озвучку и хотите использовать ее вместе с музыкой. Громкость и звуковые эффекты каждой дорожки регулируются индивидуально.
При выборе пункта «Закадровая речь» появляется возможность записать звук непосредственно в приложении.
При нажатии на стилизованный символ бесконечности между кадрами можно выбрать вариант анимации перехода, в том числе для первого и последнего кадра.
По окончании редактирования ролик экспортируется в разрешении 720р или 1080р.
Его можно тут же опубликовать на YouTube (примечание: если у вас несколько учетных записей (и, соответственно, каналов), будет предложено опубликовать на канале той учетной записи, под которой вы авторизованы в приложении YouTube). Также ролик, разумеется, сохраняется в памяти вашего устройства.
Резюме
Плюсы:
Локализация
Понятный интерфейс
Обширная библиотека элементов для оформления роликов
Нативная возможность публикации на YouTube
Минусы:
Нет веб-версии, как у CapCut от ByteDance, владельцев TikTok (штатный веб-редактор YouTube заменяет её лишь частично). С другой стороны, нужна ли она?
«Чат на чат» — новое развлекательное шоу RUTUBE. В нем два известных гостя соревнуются, у кого смешнее друзья. Звезды создают групповые чаты с близкими людьми и в каждом раунде присылают им забавные челленджи и задания. Команда, которая окажется креативнее, побеждает.