Печально, конечно, но там явно используется движок TTS, который совсем не универсальный и очень плохо поддаётся, например, обрусячиванию. Т.е. я вижу презентацию так: взяли дефолтный голос из толкового TTS, составили из него оригинальное предложение и игрались с ним, это давно не фантастика. Но голоса у всех разные, разные интонации, разные произношения, поэтому до мошенничества таким способом ещё далеко.

раскрыть ветку (8)

Danila1995

7 лет назад

нейросеть можно научить определять в речи паузы, слова паразиты, акценты, употребление сложных предложений или причастных/деепричастных оборотов.
Он сначала с помощью вводного предложения дал системе модель. На этом этапе определялось больше, как он говорит, нежели что.

На втором этапе уже были новые значения (новые слова), которые подставлялись в уже известную модель.

раскрыть ветку (3)

pjotar

7 лет назад

а я краем уха услышал что в систему предварительно скормили 20 минут речи

YujiTFD

7 лет назад

Обучить - да, но не так скоро :)

Nidere2

7 лет назад

нейросеть можно чему угодно обучить

это допущение на уровне "а вот ежели тут колдануть.."

DELETED

7 лет назад

то есть контора уровня адоб будет нам выдавать подделку? Сильно сомневаюсь. Иначе на кой хрен выделять такому продукту время на презентации?)

раскрыть ветку (3)

YujiTFD

7 лет назад

Это не подделка, это именно презентация возможностей, а для презентации обычно всё выверяют до мелочей, ибо сбои чреваты (вспоминаем Microsoft Windows). Ну и никто не заявлял, что это оригинальный, только что записанный текст, поэтому отмазаться всегда можно.

раскрыть ветку (2)

DELETED

7 лет назад

Тогда не понимаю. Вы пишете, что в презентации используется голосовой движок, то есть записи никогда не было, а просто сгенерировали им пару фраз, и потом прросто несколько слов меняют. В то время как данный продукт позиционируется как редактор живой записи, то есть "записали -> загнали в прогу -> изменили текст -> изменилось аудио".

Ну и никто не заявлял, что это оригинальный, только что записанный текст, поэтому отмазаться всегда можно.

Так это и есть как раз наёбка зрителей, так как по сути говорят со сцены одно, а делают другое. В чём я сомневаюсь, так как считаю, что компания не будет выкатывать презентацию на настолько сырой продукт и обманывать нас ради этого.

раскрыть ветку (1)

YujiTFD

7 лет назад

Может запись была, может нет, я не знаю. Точно видно, что используется TTS, а универсальный TTS нет, и это главный препон этой технологии.

В чём я сомневаюсь, так как считаю, что компания не будет выкатывать презентацию на настолько сырой продукт и обманывать нас ради этого.

Я вас удивлю, но сырец на презентации - это обычное дело. Маркетинговое наебалово - хлеб сегодняшних презентаций. Допиливать это будут ещё несколько лет, причём я гарантирую (можете записать где-нибудь), что когда продукт выйдет на рынок, и тем или иным способом попадёт к вам в руки, вы будете удивлены насколько паршиво работает эта программа.

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку