Видеомонтаж

990 постов • 5 637 подписчиков

Resemble Enhance - нейросеть для улучшения голоса и очистки от шума⁠⁠

Resemble Enhance - это инструмент на основе ИИ для улучшения качества речи путем шумоподавления и усиления.

Он состоит из двух модулей: шумоподавителя, который отделяет речь от шумного аудио, и улучшателя, который повышает качество звука, устраняя искажения и расширяя полосу пропускания.

Модели обучены на высококачественных речевых данных с частотой дискретизации 44.1 кГц.

Проще говоря, это портативный улучшатель записей голоса, который может пригодиться буквально всем, кто работает с медиа/контентом/звуком.

Это очень хорошая альтернатива плагина GOYO, который на данный момент недоступен. Более того, вам не нужна DAW или другая сторонняя программа, чтобы запустить Resemble, как в случае с GOYO.

Модель пока что подходит только для английской речи. Чтобы развернуть локально, необходима видеокарта NVIDIA минимум с 4 Gb видеопамяти.

По классике, начнем с интерфейса и далее взглянем на возможности более наглядно.

На самом деле, мы постарались и перевели интерфейс на русский язык и он стал уж совсем интуитивно понятным, но все же пробежимся в общих чертах.

Выбор Сэмплера ОДУ для CFM
Если вы уже сталкивались ранее с нейросетями, то знаете, что сэмплер, если просто - метод обработки шума. По стандарту стоит Midpoint и я также советую вам не менять его.
Количество вычислений для CFM

То же самое, что и количество шагов. По стандарту 64.

Параметры 3, 4 и 5 показались мне не сильно важными.

В целом, настройки уже выставлены так, чтобы хорошо обработать бОльшую часть записей.

Шумоподавление перед усилением

Последняя галочка важная. Если в записи очень громкий внешний шум, то перед улучшением весь шум необходимо подавить, чтобы оно работало более корректно.

Так же в Resemble Enhance есть возможность записать голос сразу, ускорять запись при прослушивании и возможность вырезать выбранный фрагмент.

Так как я не особо в курсе, где можно взять уже готовые плохие записи голоса, кроме как тех самых туториалов 10-летней давности, то предлагаю взять пару примеров из моих роликов и искусственно испортить исходник: добавим шум ветра, моря, можно чуть исказить с помощью эквалайзера.

Ну и все записи я заранее перевел на английский язык с помощью сервиса HeyGen.

Я добавил в запись своего голоса шум толпы. Представим, что мне пришлось записывать подкаст в ресторане.

Resemble очень хорошо очистил шум с этой задачей он справляется прекрасно, но улучшатор голоса иногда работает не совсем стабильно. В прочем, возможно это из-за искусственного перевода.

Давайте попробуем взять неискуственный, оригинальный кусок на настоящем английском из популярного мультика. К нему я дополнительно чуть-чуть примиксовал шум озера, посмотрим, как нейросеть справится с задачей.

Замечу, здесь улучшатор сработал много лучше.

Вот как это смотрится на видео:

Теперь давайте попробуем взять что-то всем знакомое, от чего становится тепло на душе: протестируем нашу нейросеть на старых мемах.

Я уверен, все слышали про мем Очень очень affordable... Довольно старый мем, местами проскакивает посторонний шум толпы, попробуем её исправить.

Ради эксперимента я не стал переводить его и очень удивился результату, просто взгляните

Следующий уж точно не менее известный мем - салатик и борщ с капусткой, но не красной. Уже его я перевёл, в целом на записи и так достаточно шума и его уж точно больше, чем на прошлой.

Здесь опять же чуть хуже работает улучшатор голоса. Я уверен, что это связано с тем, что перевод искусственный, а модель обучалась на настоящих голосах.

Ну и давайте повысим сложность - легендарный мем Очень плохая музыка с просто ужасным исходником. Громкая музыка, а в оригинале еще и стерео панорама не понятно куда едет. Про микрофон промолчу, записано это чудо 15 лет назад, чему удивляться.

На удивление, даже тут нейросеть прекрасно очистила шум, правда запись все равно осталась низкой по качеству. Улучшатор, конечно, совсем не в кассу - речь превратилась в один из монологов Уинстона Черчилля.

Далее мне стало интересно, и я взял еще одно видео, на нем очень сильное эхо, которое я еще и усилил.

Шумодав подчистил хвосты от эхо, но само оно не пропало, что было очевидно. А вот улучшатору, судя по всему, пришлось переписывать голос по новой.

На возможности нейросети взглянули со всевозможных сторон, теперь расскажу, как установить это действительно полезное чудо техники.

Чтобы установить Resemble Enhance, достаточно скачать нашу портативную версию с установкой в один клик.

Перед установкой отключите антивирус, он ругается на самораспаковывающийся архив. Если переживаете, то скачивайте 7z-архив, который нужно просто разархивировать в любое удобное место.

Надеюсь, статья была полезной, подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!

Показать полностью 2 8

user6675218

1 год назад

Видеомонтаж

Этим летом сделал мини-фильм - "Ужасы нейросетей" (AI)⁠⁠

Когда в мире наступает ночь - появляются они. Существа из тени ведут свою жизнь.
Ссылки
https://www.youtube.com/watch?v=1G5sbFioQZQ

https://vk.com/wall-53212510_6564

Мини-фильм был снят с помощью нейросетей (AI генерация). Работа создана AnderVe, всего было обработано около 50 роликов. В анимации показаны чужие, зомби, драконы, духи. Распространяется по сети свободно и без ограничений, 2024 год.

[моё] Видеомонтаж Онлайн Короткометражка YouTube Видео

Вопрос из ленты «Эксперты»

user9502856

1 год назад

Видеомонтаж

Вопросы по видеомонтажу⁠⁠

Я решила заняться видеомонтажом, но в платную школу идти не хочу, очень дорого и очень много плохих отзывов, не хочу чтобы деньги оказались выброшены на ветер. Есть много бесплатных курсов, но в процессе стали появляться вопросы , на которые я пока не нашла ответы. Например, я бы хотела работать и в Вегасе, и в Премьере, но с использованием After Effects, а также Plural Eye. Вегас у меня версии 21.0, Премьер - 2024 года, After Effects 2019 , Plural Eye пока не скачивала. Как мне их синхронизировать между собой? Какого года они все должны быть, чтобы всё работало корректно? Какие версии лучше установить? Если кто-то знает, подскажите, пожалуйста.

Вопрос Спроси Пикабу Текст Видеомонтаж

Elle.Ray

1 год назад

Видеомонтаж

Вопрос знатокам⁠⁠

Всем привет! Подскажите, пожалуйста, как или с помощью чего в Да Винчи можно сделать поэтапное анимированное появление предмета в кадре ( пример: сначала появляется одна стена, потом плавно вторая, третья.. окна, двери и в итоге - целый дом.) заранее благодарю!

[моё] Видео Видеомонтаж Монтаж Компьютерная графика Текст

user6675218

1 год назад

Видеомонтаж

Решил этим летом делать мини-фильм⁠⁠

С учётом развития в этом году нейронок всяких и других генераторов (в том числе музыки) решил не проебать это лето. И вот доделываю концепты. Нужно ещё будет вставить музыку и готово. Ну как готово, ещё нужно поработать видео и "сшить".

Одна из сложностей - видео нейронки генерируют по 3-4-5 секунд. Чтоб побольше было этого времени приходится больше кредитов тратить. В итоге за неделю можно сделать 1-2 минуты. Сами концепты довольно простые (в плане генерации картинки, а потом видеоряда и анимации). Если нужно видео хотя бы на 5 минут, то каждые сутки проработки приходится считать эти самые секунды. И вот постепенно они превращаются в минуты видео.

Решил посчитать сколько нейронок использую - получилось 14. Этот момент тоже вызывает сложности, сначала ты бросаешься к генераторам картинок, потом видео, потом их меняешь. Через час забываешь какой из них использовал и на каком ещё есть кредиты для генерации.

Показать полностью 1

[моё] Видеомонтаж Генерация Звук Монтаж Компьютерная графика Мат

Вопрос из ленты «Эксперты»

Аноним

1 год назад

Видеомонтаж

Стендап⁠⁠

Здравствуйте, уважаемые пикабушники!

Я к вам за советом. Пост будет без рейтинга. Дело в том что у меня есть хобби, я занимаюсь стендапом. Уже около четырёх лет и есть ощущение что я в этом неплох. За все время у меня скопился час материала которые я хочу заснять и выложить в соц сети, потому что не могу по другому.

Давайте сейчас оставим творческую часть и вопросы смешно/несмешно. Но я хотел попросить у вас совет по поводу технической части.

Я беспокоюсь за финальное качество видео. На какую аппаратуру нужно? Сколько камер оптимально? Что нужно чтобы хорошо записать звук? Проходить в небольшом баре. Нужно ли дополнительное освещение для качественной съёмки? Какой бюджет закладывать?

Я живу в провинциальном городе с населением в 600к человек. То есть тут возможностей и людей меньше чем в столицах.

Буду благодарен любой информации, которая способна помочь.

[моё] Вопрос Спроси Пикабу Рекомендации Текст

Nerual.Dreming

1 год назад

Видеомонтаж

LivePortrait v2: Мощный DeepFake для Анимации Фото и Видео | Обзор Русской Портативной Версии⁠⁠

Альтернативный плеер ВК:

Привет! В этом видео я расскажу вам о новом революционном инструменте для создания DeepFake"ов - Live Portrait! 🎭

Вы узнаете, как пользоваться основными функциями программы, включая анимацию фотографий, создание видео и использование Retargeting. Я покажу, как работать с портативной версией, которая легко запускается даже на компьютерах с 8 ГБ видеопамяти! 🎨

Ссылки из видео:

🔗 Скачать Live Portrait

🎓 Клуб по нейросети Fooocus

Мои ссылки:

🚀 Подпишись на Бусти там записи стримов, эксклюзив и ролики выходят раньше

📢 Подпишись на основной телеграм, чтобы ничего не пропустить

🎨 Наша онлайн нейросеть для создания изображений

📱 Подпишись сразу на все мои нейро-каналы в телеграм

Показать полностью 1