Помянем перца!
Похоже что это был не ИИ!
ыЫ)
Похоже что это был не ИИ!
ыЫ)
Слили разговор Иосифа Пригожина(тот который с музыкой связан, жена у которого Валерия) с Фархатом Ахмедовым обсуждали насколько все в стране наворовано и насколько все пропало, а так же куда девать свои честно заработанные хаты и яхты в швейцариях лондонах и тд, т.к санкции в натуре это очень неприятно, Иосиф на все это в свою очередь сказал, что все это нейросети, дал интервью фонтанке где сказал, что во первых мол че я там в личном разговоре говорил это вообще не важно, а во вторых я вот прям такого разговора не помню, с Ахмедовым да базарю, но вот такой базар не помню
Вроде , уже признал подлинность части разговора. Хотя, нейросетями там и правда можно хоть Медведева с Мишустиным сделать.
настолько ли хорошо? Опыт подсказывает что сделать естественную речь дальше пары фраз всё ещё нельзя, особенно с контекстной интонацией и правильным дыханием
Ага, если кто-то подскажет нейросеть, где можно сделать такой качественный и натуральный диалог с любыми голосами, то тысячи инди разработчиков скажут спасибо, да м крупные студии сэкономят знатно
Именно - это ж бездонная бочка денег, подобная нейросеть будет стоить миллиарды ибо позволит оные же сэкономить на озвучке
Я не про нейросеть, моделирующую речь с нуля, но редукторы голоса же есть. Ещё десять лет назад навигаторы болтали голосом Жирика, со всеми интонациями и придыханиями, прекрасно имитируя оригинал.
Но если там , скорее всего, это больше была заслуга пародиста, то например видосы Сарказмошной прекрасно выпускают пение голосом оригинала с изменёнными словами, и они вряд ли на пародистах выезжают, наверняка балуются редукторами.
Конкретно сабж, скорее всего, правда, а если нет, то мог бы ею спокойно быть. Но подделать подобный диалог думаю можно, если задаться целью.
Ещё десять лет назад навигаторы -//- прекрасно имитируя оригинал.
Вы же в курсе что это не было "имитацией", а был живой актёр порезанный на аудиофрагменты).
Синтез речи тогда был (да и сейчас) очень далёк от реальности - просто из-за того что "нейросеть" как вещь имеет проблему "китайской комнаты" - и многие дефекты речи которые для нас понятны и логичны (окончание дыхания раньше окончания фразы, различные гортанные и ротовые побочные отзвуки, интонация, характерная конкретному человеку в виду разной степени прокачанности речи итд) - для нейросети набор непонятных битов и байтов которая она мешает по "весам" и выплёвывает результат - т.е. вероятность что из этой бетономешалки выйдет идеальный файл не то чтоб прям велика.
Но подделать подобный диалог думаю можно, если задаться целью.
Можно, но чертовски сложно ввиду того что нужно найти актёров "по-старинке", собрать непубличные данные о том как человек разговаривает "без камер" и при этом не скатиться в карикатуру, при этом имея данные о внутренней кухне достаточные для сбора убедительного аудиоряда аж на 32 минуты. Задача всё-таки титаническая, на реализацию могут потребоваться человеко-годы.