Попробовал клонировать свой голос — вот что получилось

Недавно я захотел сделать аудиокнигу своим же голосом. То есть не стандартный синтез речи, а именно клон, который звучит как я.

Сначала было весело: русские слова без ударений звучали странно. Например, замок (Строение) и замок (Закрыть) — без правильного ударения нейросеть часто выбирает не то значение :S

Чтобы разобраться, я решил сравнить несколько популярных сервисов:

  • Оригинал (мой реальный голос)

  • Apihost.ru — умеет ставить ударения в тексте, звучит ближе к живой речи

  • ElevenLabs.io — очень качественный движок, но ударений для русского нет

  • Speechify.com — в основном англоязычный сервис, клонирование только в премиум-версии

🔊 Примеры (слушайте сами):

Попробовал клонировать свой голос — вот что получилось Нейросети, Звук