Клонирование голоса⁠⁠

Еще одна нейросеть для генерации и клонирования голоса Qwen3-TTS. В отличии от других она позволяет генерировать голос по промпту, в котором можно описать возраст, тембр и другие характеристики голоса. Для клонирования голоса достаточно всего 3 секунд референсного аудио.

Локальную версию можно скачать по ссылке - https://github.com/shaitanzx/qwen3_tts/releases/download/Qwen3_TTS/qwen3_tts.7z

Для запуска достаточно распаковать и запустить run.bat

Если вы обладатель GPU NVidia 50xx, то перед первым запуском запустите install_for_nv50xx.bat для скачивания и установки необходимых модулей.

Также доступна работа через GoogleColab по ссылке https://colab.research.google.com/github/shaitanzx/qwen3_tts/blob/main/qwen3_colab.ipynb

Примеры промтов для генерации голосов можно посмотреть в описании репозитория https://github.com/shaitanzx/qwen3_tts

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества