Нейросеть для анимирования губ ваших фотографий
Приветсвую вас, читатели! Сегодня я расскажу о такой нейросети, как SadTalker.
Небольшое предисловие. Это моя первая статья на пикабу, так что обратная связь приветствуется.
Установка данной нейросети на Google Colab:
Переходим на Colab и видим блокнот. Подключаемся к нему и обязательно выбираем видеокарту Т4 во так: наверху есть вкладка "Среда выполнения", нажмите на неё. После этого нажмите на "Сменить среду выполнения" и выбираете "T4 GPU"
Теперь запускаете первый код блок, если вам выдало вот это, то продолжаем работу:
Tesla T4, 15360 MiB, 15101 MiB
Запускаем теперь код блок ниже и ждём пока не напишет это под ним:
Готово!
Запускаем третий код блок, он скачает нам модели для нашей нейросети. Если всё успешно, то выдаст следующее сообщение:
Готово!
Теперь этап загрузки картинки.
В левой части вашего экрана есть эмодзи папки, нажимаете на него и видите папку SadTalker. Заходите в папку examples, а в ней в папку source_image. Нажимаете на эту папку правой кнопкой мыши и загружаете файл, пока синий кружочек не перестанет крутиться. Если ваш файл на русском языке, переименуйте его на английский.
Работа с загрузкой аудио.
Всё то же самое как в прошлом разделе, только папка driven_audio. В этот раз копируем путь к нашему аудио. Нажимаем на него ПКМ и копируете к нему путь. Теперь вставляете этот путь после --driven_audio в вашем кодблоке. Если что, это был предпоследний код блок.
Ну и выводим наш результат.
Просто нажимаете на последний кодблок и он выдаст вам ваше видео, которые вы можете скачать.
Спасибо что прочитали! Буду рад обратной связи.