Программы для локального озвучивания текстов (TTS)⁠⁠

Следующие программы, о которых я сейчас расскажу, полностью бесплатные.

Вот вам приятнее послушать, например, какую-нибудь статью, а не читать её. Или вы просто хотите озвучить для каких-нибудь других целей свой текст. Обычно все онлайн-сайты для озвучивания текстов имеют ограничения по количеству символов, которые доступны в бесплатной версии, но у следующих программ такой проблемы нет.

TTS (Text-to-Speech) — это технология синтеза речи, которая преобразует печатный текст в звучащую устную речь. Проще говоря, TTS позволяет компьютеру или устройству «прочитать» любой текст вслух, имитируя человеческий голос.

Первой программой, которую мы рассмотрим, будет "Балаболка" (https://www.cross-plus-a.com/ru/balabolka.html).

Когда вы запустите "Балаболку", вас встретит интуитивно понятный интерфейс:

Вы печатаете/вставляете текст и нажимаете зелёную кнопку "Плей". Вроде бы всё, НО программа использует только установленные у вас на компьютере модели голосов, а их качество, мягко говоря, говно (и ваши уши явно не этого ждут).

Для того чтобы это исправить, можно скачать из интернета сторонние голоса, например эти:

https://rhvoice.ru/languages/

Только очень важно вам проверять на вирусы модели, которые вы устанавливаете, так как все эти модели устанавливаются как exe. Вот только не надо верить во все эти сказки про таблетки или что-то ещё. Антивирус создан, чтобы искать вирусы, и если он их находит, то не надо игнорировать это.

Ну вот вы установили другие голосовые модели, но всё равно качество хоть стало лучше, но всё ещё не супер.

Вот теперь мы переходим к следующей программе Demagog (https://aloys.narod.ru/sof/1/demagog.htm#18).

Через неё можно озвучивать используя установленные голосовые модели, но нас больше всего интересует Silero.

Silero это высококачественные TTS голоса.

Скачивает эту версию программы:

Супер. Теперь осталось понять как использовать эти голоса Silero.

Запускаем программу и выбираем любой раздел для написания текста. Пишем текст.

После того как написали текст, нажимаем на символ интеграла (выполнить скрипт):

Далее выбираем "Из файла":

Затем выбираем "Silero":

Ну а теперь выбираем "Text to Speech":

Вот мы стоим сейчас перед выбором голосов, который разбит на разделы:

Вы выберите нужный вам язык и голос, но что же это за "Словари"? Всё очень просто. Чтобы текст был озвучен хорошо, его нужно подготовить к прочтению. Каждый словарь изменит текст, соответствуя своему названию. Лучше всего использовать словарь с цифрами. Так как модели голосов (как бы это ни было смешно) не могут прочитать именно цифры, если они как символ, ну там 1, 2, 3 и так далее. Поэтому цифры прописывают словами: "1" → "один" и так далее.

Далее в последний раз нажимаем на "Ок" и ждём, пока программа всё озвучит и выдаст сообщение об окончании:

Теперь идём в папку "temp", куда по умолчанию программа сохраняет все результаты:

Всё! Теперь у вас есть две программы для озвучивания текстов.

Вы смотрите срез комментариев. Показать все

Shadowworm

или загнать текст в читалку яндексе с ИИ

раскрыть ветку (3)

Ну прямо-таки "огромный выбор" у Яндекс читалки: изменить скорость прочтения и всего два голоса на выбор. Сохранить результат озвучивания нельзя. Спасибо, но не надо.

раскрыть ветку (2)

сохранить результат не проблема

было бы желание

начитка на порядок качественнее

(с интонациями а не по словам и правильными ударениями)

чем все эти устаревшие движки со словарями

(которых ещё и нет в комплекте надо отдельно ставить и искать)

Но из минусов нужен доступ в сеть . офлайн не работает

раскрыть ветку (1)

(с интонациями а не по словам и правильными ударениями)
чем все эти устаревшие движки со словарями

Вы сейчас издеваетесь? Они все работают абсолютно одинаково. Что у Яндекса, что у любой другой компании. Это нихрена не устаревшие технологии. Интонации что там, что тут одни и те же. Всё зависит только от модели голоса. В Яндекс-читалке, которую вы тут вспомнили, только два голоса, и один из них это уже надоевший голос Алисы, а второй это голос какого-то Зиновия Юрьева.

сохранить результат не проблема было бы желание

Мазохизмом запахло. Вместо того чтобы нажать одну кнопку для сохранения аудио, вы будете должны включить диктофон и записать аудио, и вот ладно минуту так записывать, но час и больше?

У Demagog Silero куча моделей уже внутри программы. Вы, похоже, вообще не читали мой пост или быстро его пролистали. Также я добавил в этом посте ссылку на сайт с бесплатными TTS-моделями на разных языках. И почему вы вообще вынесли как минус возможность безграничного добавления голосов из всего интернета?

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества