Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Войти
Войти
Забыли пароль?
Создать аккаунт
Создавая аккаунт, я соглашаюсь с правилами использования сайта и даю согласие на обработку персональных данных.
Восстановление пароля
Восстановление пароля
Получить код в Telegram
или продолжите с
Google VK
Создать сообщество

Топ прошлой недели

  • Kuchka70 Kuchka70 84 поста
  • Wildwildworld Wildwildworld 69 постов
  • VerhovniyMemolog VerhovniyMemolog 84 поста
Посмотреть весь топ
Вакансии

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Новости Пикабу Помощь Кодекс Пикабу Реклама О компании
Верификации Награды Контакты О проекте Зал славы
Промокоды Скидки Вакансии Курсы
Блоги Купоны Aliexpress Купоны Мвидео Купоны Hoff
Android iOS
Мобильная версия

Голосовой набор текста

Теги
Рейтинг
Автор
Сообщество
Тип постов
любые текстовые картинка видео [мое] NSFW
Период времени
за все время неделя месяц интервал
13 постов сначала свежее
59
neurogenerated
neurogenerated
3 месяца назад
Искусственный интеллект

Нейросеть для расшифровки видео и аудио в текст или субтитры⁠⁠

Whisper - это мультиязычная нейросеть, позволяющая распознавать речь в видео или аудиофайле и расшифровывать их в текст, а также в режиме реального времени переводить речь в текст за счет аудиозахвата.

Кому будет полезна:

- Людям, кому нужны субтитры для видеоконтента (Ютуберы, телевиденье)

- Наборщикам текста

- Работающим со стенограммами

и многим другим.

Мы с вами будем разбирать версию на C++, которую очень легко использовать и которая не требует установки кучи зависимостей.

Нейросеть для расшифровки видео и аудио в текст или субтитры Нейронные сети, Видеомонтаж, Голосовой набор текста, Расшифровка, Монтаж, Субтитры, Звук, Длиннопост

Интерфейс выглядит довольно просто.
Нам надо выбрать язык нашего источника. Если хотите сразу же перевести текст на английский - выберите Translate.

В Transcribe File вы выбираете файл, из которого будем извлекать текст.
Output format: формат, в котором сохраним текст. Есть как обычный текстовый файл, так и различные стандарты субтитров.

Ну и в поле ниже выбираете, куда сохранится текст.

После всех настроек нажимаем Transcribe и обработка начнется. За процессом можно следить, нажав Debug Console, выглядит это как-то так:

Нейросеть для расшифровки видео и аудио в текст или субтитры Нейронные сети, Видеомонтаж, Голосовой набор текста, Расшифровка, Монтаж, Субтитры, Звук, Длиннопост



Нажав Audio Capture мы переходим в режим захвата звука с микрофона.

Нейросеть для расшифровки видео и аудио в текст или субтитры Нейронные сети, Видеомонтаж, Голосовой набор текста, Расшифровка, Монтаж, Субтитры, Звук, Длиннопост

Установка:

1) Качаем архив WhisperDesktop.zip с Github и распаковываем.

2) С Huggingface качаем модель. Чем больше модель весит, тем более точно будет работать расшифровка, но и больше использоваться видеопамяти. Рекомендую попробовать модели ggml-medium.bin и ggml-large.bin

3) Закидываем нашу модель в папку, с WhisperDesktop.exe и запускаем его.

Вот в принципе и всё. Больше различных статей по полезным и интересным нейросетям, а также мои сборки можно найти у меня в телеграм канале.

Показать полностью 3
Нейронные сети Видеомонтаж Голосовой набор текста Расшифровка Монтаж Субтитры Звук Длиннопост
9
Поддержать
Эмоции
23
Mitochondrion
Mitochondrion
2 года назад

Когда хотел сэкономить время, используя голосовой набор⁠⁠

Когда хотел сэкономить время, используя голосовой набор
[моё] Голосовой набор текста Бег Марафон Голеностоп
7
Эмоции
3
zerrowall
2 года назад

Ввод текста голосом⁠⁠

Изучаю языки, понадобилось сделать упражнение на понимание на слух. Слушал, слушал, толком ничего не понял. Решил помочь себе и записать аудиоупражнение сперва в текстовый подстрочник. Попробовал сперва Word dictation из Office 365, но ему не понравился мой интернет, не знаю уж почему. Затем взял Google Docs и прямо на телефоне всё отлично записалось.
Далее в видео смотрим пример...
На самом деле, можно точно также вводить в любую другую программу на телефоне, например, эту вот концовку текста я ввел с помощью предустановленного Notes.
Извиняюсь за вертикальное видео, по другому с телефона запись экрана делать не очень удобно...

[моё] Голосовой набор текста Изучение языка Английский язык Немецкий язык Google docs Видео
1
Эмоции
64
kovaligor
kovaligor
2 года назад
Маркетинговер

Если вы потеряли слух⁠⁠

Прочитал пост ГЛУХАЯ

Вот что хочется сказать. Не стоит отчаиваться. Сегодняшние технологии спешат на помощь. Конечно, не всегда можно вернуть слух, но можно продолжать общаться с миром.

Решение простое. Берём самый недорогой Android смартфон. Открываем любой текстовый документ, на клавиатуре включаем ввод текста голосом. И в режиме реального времени читаем то, что говорит ваш собеседник.

Точность распознавания очень высокая. Будут конечно ошибки, но не критичные для понимания контекста. А отвечать можно будет уже голосом.

Если вы потеряли слух Совет, Глухота, Голосовой набор текста, Технологии, Длиннопост
Показать полностью 1
Совет Глухота Голосовой набор текста Технологии Длиннопост
12
Эмоции
18
DELETED
2 года назад

Богатый внутренний мир пользователя Apple⁠⁠

Уберите детей и беременных женщин от монитора!


Начал использовать, наконец, голосовой набор. У меня Андроид. Приятель говорит, а у него некоторые слова на Айфоне плохо распознаются. И действительно...


"Вы никогда не узнаете это слово, если не посмотрите видео по ссылке..."


(ВНИМАНИЕ! Видео содержит бранные слова в виде текста! Слушать вполне прилично)

Надо ли говорить, что Айфон не мой, и слово "подз..упный" я в жизни не употребляю. Даже сомневаюсь, что я его слышал до этого.


Но, видимо, в жизни пользователя Apple, как его представляет Тим Кук, такое слово должно быть.

Богатый внутренний мир пользователя Apple iPhone, Голосовой набор текста, Apple, Нецензурщина, Видео
Показать полностью 1
[моё] iPhone Голосовой набор текста Apple Нецензурщина Видео
13
Эмоции
7
ESych
ESych
3 года назад

Немного про голосовые сообщения⁠⁠

К сожалению такое иногда попадается.
А недавно чуть не оказался автором подобного "чуда". Ехал в машине и надо было срочно отписаться. И вспомнил тут про одну крайне удобную фишку Андроида. Точнее клавиатуры гбоард.

Немного про голосовые сообщения Голосовые сообщения, Голосовой набор текста, Android

Во-первых эта фишка требует качественной дикции. Особенно по-английски.
Во-вторых, знаки препинания она не ставит сама и их приходится диктовать.
Но как иногда удобно пользоваться - не поймёшь пока не попробуешь.
зы: переписка за рулем зло, даже голосовым набором, смотреть таки надо на дорогу.

Голосовые сообщения Голосовой набор текста Android
5
17
gaponov83
4 года назад

Чат с пассажиром⁠⁠

Пришел заказ с пометкой детского кресла. На фото переписка. Понимая что текст вводится голосовым набором,не ожидал увидеть среди пассажиров лиц славянской наружности. Ан нет! Русские. Просто что то пошло не так. Но повеселило

Чат с пассажиром Яндекс Такси, Голосовой набор текста, Детское автокресло
Показать полностью 1
[моё] Яндекс Такси Голосовой набор текста Детское автокресло
4
7
Selm
Selm
4 года назад

Да не пиши ты⁠⁠

Минусы голосового ввода текста

Coub Голосовой блокнот Голосовое управление Голосовой набор текста Speech Блокнот Речь Мат
2
Посты не найдены
12Далее
О Пикабу
О проекте
Контакты
Реклама
Сообщить об ошибке
Отзывы и предложения
Новости Пикабу
RSS
Информация
Помощь
Кодекс Пикабу
Награды
Верификации
Бан-лист
Конфиденциальность
Правила соцсети
Наши проекты
Блоги
Вакансии
Промокоды
Скидки
Курсы
Зал славы
Mobile
Android
iOS
Партнёры
Fornex.com
Промокоды Aliexpress
Промокоды Мвидео
Промокоды в Пятёрочке
Промокоды Hoff
Промокоды в Ленте Онлайн
Промокоды МТС
Промокоды Сбермаркет
Промокоды Яндекс Маркет