Нейросеть для расшифровки видео и аудио в текст или субтитры
Whisper - это мультиязычная нейросеть, позволяющая распознавать речь в видео или аудиофайле и расшифровывать их в текст, а также в режиме реального времени переводить речь в текст за счет аудиозахвата.
Кому будет полезна:
- Людям, кому нужны субтитры для видеоконтента (Ютуберы, телевиденье)
- Наборщикам текста
- Работающим со стенограммами
и многим другим.
Мы с вами будем разбирать версию на C++, которую очень легко использовать и которая не требует установки кучи зависимостей.
Интерфейс выглядит довольно просто.
Нам надо выбрать язык нашего источника. Если хотите сразу же перевести текст на английский - выберите Translate.
В Transcribe File вы выбираете файл, из которого будем извлекать текст.
Output format: формат, в котором сохраним текст. Есть как обычный текстовый файл, так и различные стандарты субтитров.
Ну и в поле ниже выбираете, куда сохранится текст.
После всех настроек нажимаем Transcribe и обработка начнется. За процессом можно следить, нажав Debug Console, выглядит это как-то так:
Нажав Audio Capture мы переходим в режим захвата звука с микрофона.
Установка:
1) Качаем архив WhisperDesktop.zip с Github и распаковываем.
2) С Huggingface качаем модель. Чем больше модель весит, тем более точно будет работать расшифровка, но и больше использоваться видеопамяти. Рекомендую попробовать модели ggml-medium.bin и ggml-large.bin
3) Закидываем нашу модель в папку, с WhisperDesktop.exe и запускаем его.
Вот в принципе и всё. Больше различных статей по полезным и интересным нейросетям, а также мои сборки можно найти у меня в телеграм канале.
Скайлар Низ(Skylar Neese) Исчезновение
События о которых пойдет речь в фильме, произошли в США в штате Западная Вирджиния ,в городке Стар-сити.
Скайлар Низ обычный подросток своего времени. Ей 16 лет. Живет в провинциальном "звездном" городке - Стар сити. Учится в старшей школе, в свободное время работает в закусочной, гуляет с друзьями и одноклассниками, не забывая фотографировать свою жизнь и делится ею в социальных сетях.
Но 6 июля 2012 года отец девочки Дэвид Нис , чувствует неладное. Комната девочки пуста, вещи на месте а открытое окно навевает только тревожные мысли.
P.S Попрошу потратить(у кого есть время) 30 минут своей жизни на просмотр данного видеоряда. Я попытался правильно подать материал, осуждая убийц и отдавая дань уважения убиенной и её родителям. Сделано для ознакомления, а у кого есть дети, возможно для предостережения. Года полтора назад я посмотрел видео на Youtube канале : Agatha Christie :"Дело Скайлар Низ или жестокое предательство ".И решил написать на Пикабу статью : Жуткая история предательства. Если друг оказался вдруг... (там другой аккаунт, я забыл пароль).Ну, а недавно вспомнил об этой истории и задумал смонтировать фильм. Зацепило почему-то "отбитость" этих двух особ и отсутствие эмпатии.
Кого раздражает мой голос можете сразу выключить. ВНИМАНИЕ! ВНИМАНИЕ! На первой минуте скример. Решил сделать в мрачной ,пугающей атмосфере под музыку композитора Якиро Ямаоки, который делал музыку для игры Silent Hill(сам не проходил, так побегал, но помню приятель на PS1 играл ).Хотелось бы услышать конструктивную критику и комментарии что хорошо ,что плохо, что улучшить, а не по типу "Чувак ,это не твое" или "учи азбуку" или "Все поняяяятнооо".
Приёмы монтажа
Источник
Сможете найти на картинке цифру среди букв?
Справились? Тогда попробуйте пройти нашу новую игру на внимательность. Приз — награда в профиль на Пикабу: https://pikabu.ru/link/-oD8sjtmAi
Звук. Камера. Мотор
Всех доброго времени! Я снимаю ролики для YouTube. Хотел спросить совета людей которые снимают или снимали видео. Какие программы вы использовали для улучшения микрофона? Обрабатывали в видеоредакторах или использовали сторонний софт для микрофона?
Большое спасибо за ваше время и ответы. Всем хорошего дня или вечера!