Клонирование голоса
Еще одна нейросеть для генерации и клонирования голоса Qwen3-TTS. В отличии от других она позволяет генерировать голос по промпту, в котором можно описать возраст, тембр и другие характеристики голоса. Для клонирования голоса достаточно всего 3 секунд референсного аудио.
Локальную версию можно скачать по ссылке - https://github.com/shaitanzx/qwen3_tts/releases/download/Qwen3_TTS/qwen3_tts.7z
Для запуска достаточно распаковать и запустить run.bat
Если вы обладатель GPU NVidia 50xx, то перед первым запуском запустите install_for_nv50xx.bat для скачивания и установки необходимых модулей.
Также доступна работа через GoogleColab по ссылке https://colab.research.google.com/github/shaitanzx/qwen3_tts/blob/main/qwen3_colab.ipynb
Примеры промтов для генерации голосов можно посмотреть в описании репозитория https://github.com/shaitanzx/qwen3_tts
