Попробовал клонировать свой голос — вот что получилось
Недавно я захотел сделать аудиокнигу своим же голосом. То есть не стандартный синтез речи, а именно клон, который звучит как я.
Сначала было весело: русские слова без ударений звучали странно. Например, замок (Строение) и замок (Закрыть) — без правильного ударения нейросеть часто выбирает не то значение :S
Чтобы разобраться, я решил сравнить несколько популярных сервисов:
Оригинал (мой реальный голос)
Apihost.ru — умеет ставить ударения в тексте, звучит ближе к живой речи
ElevenLabs.io — очень качественный движок, но ударений для русского нет
Speechify.com — в основном англоязычный сервис, клонирование только в премиум-версии