Сообщество - Видеомонтаж

Видеомонтаж

990 постов 5 637 подписчиков

Популярные теги в сообществе:

48

Resemble Enhance - нейросеть для улучшения голоса и очистки от шума

Resemble Enhance - нейросеть для улучшения голоса и очистки от шума Искусственный интеллект, Нейронные сети, Звук, Видеомонтаж, Монтаж, Гайд, Обработка звука, Инновации, Программа, Технологии, Цифровые технологии, Голос, Создание музыки, Видео, Длиннопост

Resemble Enhance - это инструмент на основе ИИ для улучшения качества речи путем шумоподавления и усиления.

Он состоит из двух модулей: шумоподавителя, который отделяет речь от шумного аудио, и улучшателя, который повышает качество звука, устраняя искажения и расширяя полосу пропускания.

Модели обучены на высококачественных речевых данных с частотой дискретизации 44.1 кГц.

Проще говоря, это портативный улучшатель записей голоса, который может пригодиться буквально всем, кто работает с медиа/контентом/звуком.

Это очень хорошая альтернатива плагина GOYO, который на данный момент недоступен. Более того, вам не нужна DAW или другая сторонняя программа, чтобы запустить Resemble, как в случае с GOYO.

Модель пока что подходит только для английской речи. Чтобы развернуть локально, необходима видеокарта NVIDIA минимум с 4 Gb видеопамяти.

По классике, начнем с интерфейса и далее взглянем на возможности более наглядно.

На самом деле, мы постарались и перевели интерфейс на русский язык и он стал уж совсем интуитивно понятным, но все же пробежимся в общих чертах.

Resemble Enhance - нейросеть для улучшения голоса и очистки от шума Искусственный интеллект, Нейронные сети, Звук, Видеомонтаж, Монтаж, Гайд, Обработка звука, Инновации, Программа, Технологии, Цифровые технологии, Голос, Создание музыки, Видео, Длиннопост
  1. Выбор Сэмплера ОДУ для CFM

    Если вы уже сталкивались ранее с нейросетями, то знаете, что сэмплер, если просто - метод обработки шума. По стандарту стоит Midpoint и я также советую вам не менять его.

  2. Количество вычислений для CFM

То же самое, что и количество шагов. По стандарту 64.

Параметры 3, 4 и 5 показались мне не сильно важными.

В целом, настройки уже выставлены так, чтобы хорошо обработать бОльшую часть записей.

Шумоподавление перед усилением

Последняя галочка важная. Если в записи очень громкий внешний шум, то перед улучшением весь шум необходимо подавить, чтобы оно работало более корректно.

Resemble Enhance - нейросеть для улучшения голоса и очистки от шума Искусственный интеллект, Нейронные сети, Звук, Видеомонтаж, Монтаж, Гайд, Обработка звука, Инновации, Программа, Технологии, Цифровые технологии, Голос, Создание музыки, Видео, Длиннопост

Так же в Resemble Enhance есть возможность записать голос сразу, ускорять запись при прослушивании и возможность вырезать выбранный фрагмент.

Так как я не особо в курсе, где можно взять уже готовые плохие записи голоса, кроме как тех самых туториалов 10-летней давности, то предлагаю взять пару примеров из моих роликов и искусственно испортить исходник: добавим шум ветра, моря, можно чуть исказить с помощью эквалайзера.

Ну и все записи я заранее перевел на английский язык с помощью сервиса HeyGen.

Я добавил в запись своего голоса шум толпы. Представим, что мне пришлось записывать подкаст в ресторане.

Resemble очень хорошо очистил шум с этой задачей он справляется прекрасно, но улучшатор голоса иногда работает не совсем стабильно. В прочем, возможно это из-за искусственного перевода.

Давайте попробуем взять неискуственный, оригинальный кусок на настоящем английском из популярного мультика. К нему я дополнительно чуть-чуть примиксовал шум озера, посмотрим, как нейросеть справится с задачей.

Замечу, здесь улучшатор сработал много лучше.

Вот как это смотрится на видео:

Теперь давайте попробуем взять что-то всем знакомое, от чего становится тепло на душе: протестируем нашу нейросеть на старых мемах.

Я уверен, все слышали про мем Очень очень affordable... Довольно старый мем, местами проскакивает посторонний шум толпы, попробуем её исправить.

Ради эксперимента я не стал переводить его и очень удивился результату, просто взгляните

Следующий уж точно не менее известный мем - салатик и борщ с капусткой, но не красной. Уже его я перевёл, в целом на записи и так достаточно шума и его уж точно больше, чем на прошлой.

Здесь опять же чуть хуже работает улучшатор голоса. Я уверен, что это связано с тем, что перевод искусственный, а модель обучалась на настоящих голосах.

Ну и давайте повысим сложность - легендарный мем Очень плохая музыка с просто ужасным исходником. Громкая музыка, а в оригинале еще и стерео панорама не понятно куда едет. Про микрофон промолчу, записано это чудо 15 лет назад, чему удивляться.

На удивление, даже тут нейросеть прекрасно очистила шум, правда запись все равно осталась низкой по качеству. Улучшатор, конечно, совсем не в кассу - речь превратилась в один из монологов Уинстона Черчилля.

Далее мне стало интересно, и я взял еще одно видео, на нем очень сильное эхо, которое я еще и усилил.

Шумодав подчистил хвосты от эхо, но само оно не пропало, что было очевидно. А вот улучшатору, судя по всему, пришлось переписывать голос по новой.

На возможности нейросети взглянули со всевозможных сторон, теперь расскажу, как установить это действительно полезное чудо техники.

Чтобы установить Resemble Enhance, достаточно скачать нашу портативную версию с установкой в один клик.

Перед установкой отключите антивирус, он ругается на самораспаковывающийся архив. Если переживаете, то скачивайте 7z-архив, который нужно просто разархивировать в любое удобное место.

Надеюсь, статья была полезной, подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!

Показать полностью 2 8
3

Этим летом сделал мини-фильм - "Ужасы нейросетей" (AI)


Когда в мире наступает ночь - появляются они. Существа из тени ведут свою жизнь.
Ссылки
https://www.youtube.com/watch?v=1G5sbFioQZQ

https://vk.com/wall-53212510_6564

Мини-фильм был снят с помощью нейросетей (AI генерация). Работа создана AnderVe, всего было обработано около 50 роликов. В анимации показаны чужие, зомби, драконы, духи. Распространяется по сети свободно и без ограничений, 2024 год.

5
Вопрос из ленты «Эксперты»

Вопросы по видеомонтажу

Я решила заняться видеомонтажом, но в платную школу идти не хочу, очень дорого и очень много плохих отзывов, не хочу чтобы деньги оказались выброшены на ветер. Есть много бесплатных курсов, но в процессе стали появляться вопросы , на которые я пока не нашла ответы. Например, я бы хотела работать и в Вегасе, и в Премьере, но с использованием After Effects, а также Plural Eye. Вегас у меня версии 21.0, Премьер - 2024 года, After Effects 2019 , Plural Eye пока не скачивала. Как мне их синхронизировать между собой? Какого года они все должны быть, чтобы всё работало корректно? Какие версии лучше установить? Если кто-то знает, подскажите, пожалуйста.

2

Вопрос знатокам

Всем привет! Подскажите, пожалуйста, как или с помощью чего в Да Винчи можно сделать поэтапное анимированное появление предмета в кадре ( пример: сначала появляется одна стена, потом плавно вторая, третья.. окна, двери и в итоге - целый дом.) заранее благодарю!

1

Решил этим летом делать мини-фильм

Решил этим летом делать мини-фильм Видеомонтаж, Генерация, Звук, Монтаж, Компьютерная графика, Мат

С учётом развития в этом году нейронок всяких и других генераторов (в том числе музыки) решил не проебать это лето. И вот доделываю концепты. Нужно ещё будет вставить музыку и готово. Ну как готово, ещё нужно поработать видео и "сшить".

Одна из сложностей - видео нейронки генерируют по 3-4-5 секунд. Чтоб побольше было этого времени приходится больше кредитов тратить. В итоге за неделю можно сделать 1-2 минуты. Сами концепты довольно простые (в плане генерации картинки, а потом видеоряда и анимации). Если нужно видео хотя бы на 5 минут, то каждые сутки проработки приходится считать эти самые секунды. И вот постепенно они превращаются в минуты видео.

Решил посчитать сколько нейронок использую - получилось 14. Этот момент тоже вызывает сложности, сначала ты бросаешься к генераторам картинок, потом видео, потом их меняешь. Через час забываешь какой из них использовал и на каком ещё есть кредиты для генерации.

Показать полностью 1
6
Вопрос из ленты «Эксперты»

Стендап

Здравствуйте, уважаемые пикабушники!

Я к вам за советом. Пост будет без рейтинга. Дело в том что у меня есть хобби, я занимаюсь стендапом. Уже около четырёх лет и есть ощущение что я в этом неплох. За все время у меня скопился час материала которые я хочу заснять и выложить в соц сети, потому что не могу по другому.

Давайте сейчас оставим творческую часть и вопросы смешно/несмешно. Но я хотел попросить у вас совет по поводу технической части.

Я беспокоюсь за финальное качество видео. На какую аппаратуру нужно? Сколько камер оптимально? Что нужно чтобы хорошо записать звук? Проходить в небольшом баре. Нужно ли дополнительное освещение для качественной съёмки? Какой бюджет закладывать?

Я живу в провинциальном городе с населением в 600к человек. То есть тут возможностей и людей меньше чем в столицах.

Буду благодарен любой информации, которая способна помочь.

LivePortrait v2: Мощный DeepFake для Анимации Фото и Видео | Обзор Русской Портативной Версии

Альтернативный плеер ВК:

Привет! В этом видео я расскажу вам о новом революционном инструменте для создания DeepFake"ов - Live Portrait! 🎭

Вы узнаете, как пользоваться основными функциями программы, включая анимацию фотографий, создание видео и использование Retargeting. Я покажу, как работать с портативной версией, которая легко запускается даже на компьютерах с 8 ГБ видеопамяти! 🎨

Ссылки из видео:

🔗 Скачать Live Portrait

🎓 Клуб по нейросети Fooocus

Мои ссылки:

🚀 Подпишись на Бусти там записи стримов, эксклюзив и ролики выходят раньше

📢 Подпишись на основной телеграм, чтобы ничего не пропустить

🎨 Наша онлайн нейросеть для создания изображений

📱 Подпишись сразу на все мои нейро-каналы в телеграм

Показать полностью 1
Отличная работа, все прочитано!