Sovits svc превращает низкий тон в высокий
Всем здравствуйте. Уже как пол года страдаю от данной проблемы. Дело в том, что нейросеть почему-то превращает при инференции низкий голос в писклявый. Настройки всегда стояли дефолтные. Ещё пробовал несколько энкодеров: хьюберт и сейчас обучаю whisper-ppg-large. Думал, что дело могло быть в энкодере, но нет. Нейронка всё равно пищать начинает. Перерыл много сраниц в Интернете, в том числе и github, но не нашёл ничего дельного. Даже сомневаюсь сейчас в том, что у кого-то ещё, кроме меня, есть такая же проблема, но решил сначала здесь спросить, т.к. почитал на этом формуе статьи про нейронки и понял, что здесь есть достаточно умных людей с опытом использования подобных нейросетей. Репозиторий sovits использую классический, оригинальный: svc-develop-team/so-vits-svc -b 4.1-Stable.
Видео, где наглядно понятна проблема: