В силу жизненных обстоятельств стал очень плохо слышать собеседника при разговоре по телефону.
Если с проблемой записи звонка (чтоб тебе провалиться, google, со своими политиками конфиденциальности) кое-как разобрался, (спасибо китайским производителям смартфонов), то внезапно вылезла проблема, когда даже записанный разговор понимается с трудом.
Вспомнив, что на дворе 2024 гг. начал искать в свободном доступе какие-нибудь способы перевода в текстовый формат записей разговоров. Были найдены и протестированы следующие варианты.
Transcriptor - есть на гугл.плей. есть ознакомительный режим и платная версия.
+Достаточно простой и понятный интерфейс;
+Возможность загружать аудиофайл;
+Вполне качественная расшифровка речи и разбивка ее по собеседникам.
-ограничения бесплатной версии в 70 минут , а как приобрести платную, находясь в РФ не очень понятно. (Хотя, по идее, можно создать новый аккаунт и получить новые бесплатные минуты);
-после расхода определенного количества бесплатных минут урезается время транскрипции. У меня, в итоге, стало показывать только 50-60 первых секунд разговора. А при остатке 45 бесплатных минут программа начала писать про сбой и предлагает воспользоваться сайтом;
-цена. Все же дороговато за месячную подписку, к тому же минуты "сгорают". Нет тарифного плана типа "лайт".;
Сервис VEED. Онлайн сервис создания субтитров к видео.
+Качественная расшифровка речи. Лучше чем Транскриптор распознает слова, разбивка по собеседникам;
+Есть бесплатные минуты после регистрации;
- сложный интерфейс сайта, заточен под создание субтитров для видео, отдельно перевода аудио в текст - не нашел;
- цена. Еще более дорогое удовольствие чем транскриптор. Хотя надо понимать, что сервис заточен под блогеров и прочих, любящих пилить видосики на ютуб;
Как оказалось, всеми любимая Телега тоже имеет подобный функционал.
При подписке Телеграм-премиум есть возможность по кнопке переводить аудиосообщение в текст.
+ демократичная цена за подписку, к тому же дающая дополнительные "плюшки";
+ Достаточно качественная расшифровка.
- нет разбивки по собеседникам, текст идет сплошным потоком.
- не принимает аудиофайл, приходится запускать файл в плеере и одновременно запускать запись голосового сообщения. К тому же нужен "собеседник" или делать запись в избранное.
- файлы более 4мб отказывается принимать, сообщает что не удалось распознать речь.
Минусы, аналогичные Телеграм-премиуму.
-хуже, чем встроенный транскриптор от телеграм-премиум распознает речь;
- нет разбивки по собеседникам, текст идет сплошным потоком;
- не принимает аудио файл записи звонка.
Телеграмм-бот от Сбера smartspeech_sber_bot
+Качественная расшифровка, лучше распознает текст чем voix и телеграм-премиум.
+Возможность загрузить файл записи звонка целиком.
- нет разбивки по собеседникам, текст идет сплошным потоком.
Были испробованы и какие-то другие сервисы, но либо неадекватно дорогие, либо сложные для использования.
Выводов не будет. Пост написан с целью помочь таким же как и я.
П.с. Сбер порадовал в этот раз.