Поиск программы для распознавания голоса

Пару лет как стал записывать рассказы прабабушки жены на телефон. Ей уже 92 года - не успею записать, потом разве что вспоминать придётся - а много ли вспомнишь? Очень жалею, что в своё время не записывал рассказы мамы и отца про войну, про оккупацию - боюсь, что уже половину рассказов не вспомню. Нет, наверное вспомню, но много подробностей будет уже потеряно.

Так вот, у меня вопрос. Я знаю, что есть программы для распознавания голоса, есть и онлайн. Меня не забанили в гугле, я их находил, но хотелось бы получить реальные отзывы, какие хорошие, какие не очень. Наверняка кто-нибудь на пикабу занимался распознаванием.

Просто если печатать на слух -то получается очень долго и муторно.

118
Автор поста оценил этот комментарий

Запишите лучше прям на видео. А потом будете уже думать как перевести звук в текст

Но гораздо приятнее потом не только читать/слушать, но и видеть родственника, которого уж нет.

раскрыть ветку (1)
44
Автор поста оценил этот комментарий

Вот бы так просто было. Она ж от любого фотоаппарата шарахается, а тут видео снимать: "Ой, я старая и страшная" Женщина и в 90 лет женщиной остаётся. А диктофон-то я могу втихушку включить - сидим, болтаем, заодно и записываю.

показать ответы
26
Автор поста оценил этот комментарий

Распознавание нейросетью (а нынче других реально рабочих вариантов и нет) очень сильно зависит от разницы обучающего множества и целевой записи.

Если бабушка, например, начнёт перечислять топонимы Карелии, - ошибок распознавания будет много.

Ну и пожилая речь тоже не способствует качеству.

Silero, Voice ЦРТ, Яндекс SpeechKit - всё коммерческое, если на потоке.


А так, да, понимаю желание.

Я практически ничего не знаю про деда. Не успел. Большой архив фото, начиная с военных лет и до 80х, утрачен. На тех, что остались, только деда с бабушкой и могу идентифицировать.

Да и с отцом, пока он был в адекватном состоянии, не наговорились, тоже многие  моменты неясны.

Хотя, чудом спас из ликвидируемых гаражей киноплёнку, снятую любительской камерой, где он молодой и красивый на Домбае...


Храните голос. Это какая-то ниточка, что-ли, связывающая живых с прошлым...

раскрыть ветку (1)
9
Автор поста оценил этот комментарий

да, собственно, для этого и записываю. Чтобы память осталась.

Я понимаю, что вычитка всё равно понадобится. Но проще, когда хотя бы часть текста не нужно будет набивать. Попробую названные вами программы.

Автор поста оценил этот комментарий
а диктофоном пользоваться никак, а потом под диктовку перепечатывать?
раскрыть ветку (1)
11
Автор поста оценил этот комментарий

если Вы не заметили, то я в посте написал, что печатать на слух - очень долго и муторно. Ну и во-вторых, почему нельзя пользоваться распознавателями текста, если такие существуют?

показать ответы
16
Автор поста оценил этот комментарий
Согласен. Хорошая машинистка печатает слепым 10-пальцевым методом со скоростью речи. Встроенная в голову живая нейронка у неё сильно лучше по сравнению программными аналогами. Обычно это не сильно дорого.
Записи живого голоса будет приятно самому слушать и вспоминать бабушку, если уж речь о любимой бабуле.
раскрыть ветку (1)
4
Автор поста оценил этот комментарий

Ну так записи я не собираюсь выкидывать, а перевести хотел бы сам. Мне спешить некуда.

Пока, во всяком случае )))

показать ответы
10
Автор поста оценил этот комментарий
Есть такая приложуха, называется «Голосовой блокнот». Программа перевода аудио в текст. Там не сложно разобраться, она простая. Лежит и на App Stor, и в ГуглПлее. За работу с длинными записями надо разово заплатить небольшую денежку и пользоваться можно безлимитно.
Есть нюанс. При любой такой работе если дикция говорящего неразборчивая, то потом придётся долго править полученный текст.
раскрыть ветку (1)
7
Автор поста оценил этот комментарий

спасибо, попробую

72
Автор поста оценил этот комментарий
Чёткая дикция, высокое качество записи, простая речь - если этого нет, все программы speech-to-text превращаются в тыкву.
раскрыть ветку (1)
8
Автор поста оценил этот комментарий

Понимаете, я пробовал. Получилось довольно неплохо, но не сообразил сохранить ссылку на сайт. Сайт какой-то иностранный и длительность бесплатного перевода ауди в текст - 5 мин.

показать ответы
Автор поста оценил этот комментарий
У вас Гугл опять забанили?
раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Поздравляю! Вы опять не дочитали пост до конца!

5
Автор поста оценил этот комментарий

Недавно увидел, что Ворд (с 2020 версии, кажется) делает это просто шикарно! Сам не пользовался, потому у меня 2016, а танцы с бубном про переустановке мне не улыбаются.


Поэтому использовал бота в телеге @VoiceMsgBot. Просто пересылаешь голосовое, а он в текст переводит (кстати, вроде такая функция есть у телеграм премиум, но это не точно).

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

да, у меня тоже 2016, бота гляну, спасибо

3
Автор поста оценил этот комментарий

Dragon dictation от Nuance в своё время был очень неплох, но как там сейчас дела обстоят — надо выяснять

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

гляну

2
DELETED
Автор поста оценил этот комментарий

Не уверен что есть смысл этим заморачиваться. Записывайте на диктофон и всё. А потом, когда появится у вас время, хоть вручную переводите аудио в текст, хоть с программами.

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

ну так я и записываю, просто хотелось бы и в текст перевести. Время позволяет, но вручную очень муторно.

показать ответы
11
Автор поста оценил этот комментарий
Заливаешь видео со звуком на Ютуб, а там есть автоматические субтитры которые можно скопировать
раскрыть ветку (1)
4
Автор поста оценил этот комментарий

оригинально )))

6
Автор поста оценил этот комментарий
мне очень не понятно за что ты минусы лепишь? за то что тебе единственный адекватный вариант разжевали? ну не работают программы распознавания речи с невнятной речью. Ты как хочешь, чтобы суперпрограмма все распозновала? такого нет пока. Зато у тебя есть бабушка и диктофон, остальное твое желание напечатать текст, и твое нежелание возиться с диктофонными записями.
раскрыть ветку (1)
5
Автор поста оценил этот комментарий

речь вполне внятная, просто хотел узнать, кто какими программами или онлайн-сервисами пользуется - наверняка такие имеются. Что тут сложного-то?

1
Автор поста оценил этот комментарий

@zuberst, если есть смартфон не вижу проблем, наберёте черновой вариант голосом, потом быстренько подправить где что-то набралось не корректно. Два верхних варианта ввода ваши.

Иллюстрация к комментарию
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

спасибо!

показать ответы
3
Автор поста оценил этот комментарий
А потом, через несколько десятков лет можно сказать своим внукам: «Вот вы, молодёжь, ленивые задницы! Я, в вашем возрасте, не ленился и записал для вас историю ваших предков. Всё сам! ))))
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

да до внуков-то ещё дожить надо )))

11
Автор поста оценил этот комментарий
Автор, нормальный вариант от Салюта - ищи в телеге @smartspeech_sber_bot

Также у салюта есть полная версия - в т.ч. с синтезом и разметкой https://developers.sber.ru/portal/products/smartspeech

Имхо - тренировали нейросеть на айтишных разговорах, так что вылезают ошибки по распознаванию разных терминов. Но вариант рабочий и довольно удобный. В телеге есть ограничения по форматам файлов (aac раньше не ел) и размер файла был до 20мб. Но это не проблема нынче.
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

спасибо!

3
Автор поста оценил этот комментарий

Yandex SpeechKit гуглите... придется немножко почитать + денежку, вероятно, заплатить, но на сегодняшний день это лучшая русскоязычная распознавалка.


P.S. Еще можно на какую-нибудь биржу рабов типа wmmail слить, они там страницу текста под диктовку готовы за доллар набирать.
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

спасибо, мне самому интересно распознаванием заниматься. Тем более там есть вещи, которые просто без контекста сложно понять - я же могу добавить.

Автор поста оценил этот комментарий

Сейчас диктовка это же встоенное в любую систему или телефон функция? Зачем отдельное приложение? У меня не винда, но я уверен что и там все это есть.

Иллюстрация к комментарию
Предпросмотр
YouTube0:20
раскрыть ветку (1)
Автор поста оценил этот комментарий

я не настолько хорошо знаю смартфон, поэтому и спрашиваю. Да и проще мне по старинке, на компьютере.

показать ответы
2
Автор поста оценил этот комментарий
А в чем проблема видео записывать? Для распознавания голоса необходима четкая дикция, а тут просто записал на видео и все. И потомкам можно будет не только текстовые записи показывать, но и видео.
раскрыть ветку (1)
Автор поста оценил этот комментарий

сложно её уговорить, если только скрытую камеру

показать ответы
1
Автор поста оценил этот комментарий
Вот две приложухи: "голосовой блокнот" и "фоновый диктофон"
У блокнота неплохо получается распознавать голос в текст. Периодически баловался записью мыслей за рулём. Вторая - просто очень хорошо пишет звук даже в режиме блокировки (нужно настраивать, убрать ограничение активности иначе через 15 минут система зарубит диктофон). Запишите, а потом попробуйте прогнать через голосовой блокнот или просто транскрибируйте руками - все равно текст придётся потом править.
Иллюстрация к комментарию
Иллюстрация к комментарию
раскрыть ветку (1)
Автор поста оценил этот комментарий

фоновым диктофоном как раз и пользуюсь, а голосовой блокнот попробую - уже многие посоветовали, спасибо!

3
Автор поста оценил этот комментарий

Зачем программа? Перевод голос- текст прекрасно выполняется в самом Андроиде штатным средствами. Например этот текст набран именно таким способом.

Иллюстрация к комментарию
раскрыть ветку (1)
Автор поста оценил этот комментарий

интересно, не знал. Попробую. Я со смартфонами на Вы пока.

Автор поста оценил этот комментарий

спасибо, посмотрю

2
Автор поста оценил этот комментарий
Ок. А программы которая наоборот преобразует текст в голос? Есть такая?
раскрыть ветку (1)
Автор поста оценил этот комментарий

в том же олридере, если не ошибаюсь, есть такая фишка - чтение текста. Вполне нормально.