«Голосовой Photoshop»

Обратил внимание на данный пост http://pikabu.ru/story/adobe_sozdala_photoshop_dlya_zvuka_46...

который практически прошел мимо большинства из нас.

Сложно себе представить какие могут быть последствия, от применения данной технологии в соц. инженерии.

Более подробно: https://xakep.ru/2016/11/07/adobe-project-voco/

Баяны

256K постов14.4K подписчиков

Добавить пост

Правила сообщества

Сообщество для постов, которые ранее были на Пикабу.

Вы смотрите срез комментариев. Показать все
20
Автор поста оценил этот комментарий

Печально, конечно, но там явно используется движок TTS, который совсем не универсальный и очень плохо поддаётся, например, обрусячиванию. Т.е. я вижу презентацию так: взяли дефолтный голос из толкового TTS, составили из него оригинальное предложение и игрались с ним, это давно не фантастика. Но голоса у всех разные, разные интонации, разные произношения, поэтому до мошенничества таким способом ещё далеко.

раскрыть ветку (8)
5
Автор поста оценил этот комментарий

нейросеть можно научить определять в речи паузы, слова паразиты, акценты, употребление сложных предложений или причастных/деепричастных оборотов.
Он сначала с помощью вводного предложения дал системе модель. На этом этапе определялось больше, как он говорит, нежели что.

На втором этапе уже были новые значения (новые слова), которые подставлялись в уже известную модель.

раскрыть ветку (3)
2
Автор поста оценил этот комментарий

а я краем уха услышал что в систему предварительно скормили 20 минут речи

Автор поста оценил этот комментарий

Обучить - да, но не так скоро :)

1
Автор поста оценил этот комментарий

нейросеть можно чему угодно обучить

это допущение на уровне "а вот ежели тут колдануть.."

DELETED
Автор поста оценил этот комментарий

то есть контора уровня адоб будет нам выдавать подделку? Сильно сомневаюсь. Иначе на кой хрен выделять такому продукту время на презентации?)

раскрыть ветку (3)
Автор поста оценил этот комментарий

Это не подделка, это именно презентация возможностей, а для презентации обычно всё выверяют до мелочей, ибо сбои чреваты (вспоминаем Microsoft Windows). Ну и никто не заявлял, что это оригинальный, только что записанный текст, поэтому отмазаться всегда можно.

раскрыть ветку (2)
DELETED
Автор поста оценил этот комментарий

Тогда не понимаю. Вы пишете, что в презентации используется голосовой движок, то есть записи никогда не было, а просто сгенерировали им пару фраз, и потом прросто несколько слов меняют. В то время как данный продукт позиционируется как редактор живой записи, то есть "записали -> загнали в прогу -> изменили текст -> изменилось аудио".

Ну и никто не заявлял, что это оригинальный, только что записанный текст, поэтому отмазаться всегда можно.

Так это и есть как раз наёбка зрителей, так как по сути говорят со сцены одно, а делают другое. В чём я сомневаюсь, так как считаю, что компания не будет выкатывать презентацию на настолько сырой продукт и обманывать нас ради этого.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Может запись была, может нет, я не знаю. Точно видно, что используется TTS, а универсальный TTS нет, и это главный препон этой технологии.


В чём я сомневаюсь, так как считаю, что компания не будет выкатывать презентацию на настолько сырой продукт и обманывать нас ради этого.

Я вас удивлю, но сырец на презентации - это обычное дело. Маркетинговое наебалово - хлеб сегодняшних презентаций. Допиливать это будут ещё несколько лет, причём я гарантирую (можете записать где-нибудь), что когда продукт выйдет на рынок, и тем или иным способом попадёт к вам в руки, вы будете удивлены насколько паршиво работает эта программа.

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку