ИИ научился создавать видео с одного кадра. Старые картины теперь можно сделать живыми⁠⁠

Технология из Гарри Поттера дошла до наших дней. Теперь для создания полноценного видео человека достаточно одной его картинки или фотографии. Исследователи машинного обучения из «Сколково» и центра Samsung AI из Москвы опубликовали свою работу о создании такой системы, вместе с целым рядом видео знаменитостей и предметов искусства, получивших новую жизнь.

Текст научной работы можно почитать тут. Там всё довольно интересно, с массой формул, но смысл прост: их система руководствуется «ориентирами», достопримечательностями лица, вроде носа, двух глаз, двух бровей, линии подбородка. Так она мгновенно улавливает, что человек собой представляет. И потом может переносить всё остальное (цвет, текстуру лица, усы, щетину и прочее) на любое другое видео человека. Адаптируя старое лицо к новым ситуациям.

Разумеется, это пока работает только на портретах. Модели нужен только один человек, с лицом, повернутым к нам, чтобы у него было хотя бы видно оба глаза. Тогда система может делать с ним что угодно, передавать ему любую мимику. Достаточно дать ей подходящее видео (с другим человеком с головой примерно в том же положении).
Ранее ИИ уже научился делать дипфейки, и интернет-пользователи знатно поиздевались над знаменитостями, вставляя их лица в порно и делая мемы с Николасом Кейджем. Но для этого им приходилось тренировать алгоритмы мегабайтами (а лучше – гигабайтами) данных, находить как можно больше изображений и видео с лицами знаменитостей, чтобы выдать более-менее пристойный результат. Сам создатель Deepfakes говорил, что на компиляцию одного короткого ролика у него уходит 8-12 часов. Новая система генерирует результат моментально, а на входе ей достаточно одной картинки.
С предыдущей системой мы никогда бы не смогли посмотреть на живую Мону Лизу, у нас есть только один её ракурс. Теперь, с алгоритмами, работающими по ориентирам, это становится возможным. Идеала не достичь, но уже что-то близко.

В работе московских исследователей также используется генеративно-состязательная сеть. Две модели алгоритма сражаются друг с другом. Каждая пытается обмануть оппонента, и доказать ему, что то видео, которое она создает – настоящее. Так достигается определенный уровень реализма: картинка человеческого лица не выпускается «в свет», если модель-критик не уверена в её подлинности более чем на 90%. Как говорят авторы в своей работе, в изображениях регулируются десятки миллионов параметров, но за счет такой системы, работа кипит очень быстро.

Если картинок несколько, результат улучшается. Опять же, проще всего получается работать со знаменитостями, которые уже сняты со всех возможных ракурсов. Для достижения «идеального реализма» нужны 32 снимка. В этом случае сгенерированные ИИ фото в невысоком разрешении будут неотличимы от настоящих фото человека. Нетренированные люди на этом этапе уже не способны выявить фейк – возможно, шансы остаются у экспертов или у близких родственников «подопытного» со всех этих изображений.
Если фото или картинка только одна, итог пока не всегда самый лучший. Увидеть артефакты на видео, когда голова находится в движении, можно без особых проблем. Сами исследователи говорят, что их самое слабое место – взгляд. Модель, основанная на ориентирах лица, пока не всегда понимает, как и куда человек должен смотреть.

Источник

Samsung Машинное обучение Искусственный интеллект Видео Оживление Habr Pochtoycom Сколтех Гифка Длиннопост

233

Искусственный интеллект

2.5K постов9.8K подписчиков

Добавить пост

Правила сообщества

Здесь вы можете свободно создавать посты по теме Искусственного интеллекта. Добро пожаловать :)

Разрешено:

- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.

Запрещено:

I) Невостребованный контент

I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

II) Нетематический контент

II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

II.3) Создавать контент, входящий в противоречие с правилами Пикабу.

III) Непотребный контент

III.1) Эротика, порнография (даже с NSFW).

III.2) Жесть.

За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

208

DELETED

5 лет назад

вы хотели сказать, "магия из Гарри Поттера"?

раскрыть ветку (1)

pecimfetr

5 лет назад

ну, магию, в принципе, тоже можно назвать технологией :)

показать ответы

NOTaSpetsKor

5 лет назад

Слямзил выражение, и даже не указал откуда оно:

Три закона Кларка были сформулированы известным английским писателем-фантастом и футурологом Артуром Кларком:Когда уважаемый, но пожилой учёный утверждает, что что-то возможно, то он почти наверняка прав. Когда он утверждает, что что-то невозможно, — он, весьма вероятно, ошибается.Единственный способ обнаружения пределов возможного состоит в том, чтобы отважиться сделать шаг в невозможное.Любая достаточно развитая технология неотличима от магии. https://ru.wikipedia.org/wiki/%D0%A2%D1%80%D0%B8_%D0%B7%D0%B...

раскрыть ветку (1)

pecimfetr

5 лет назад

Не думал про законы Кларка в тот момент, не слямзил :)
Но, да, мой комментарий достаточно сильно напоминает его выражение, соглашусь.

показать ответы

frock

5 лет назад

Я поверю в ИИ когда контекстная реклама будет предугадывать мои запросы. ))
Сразу ИИм сдамся .))

раскрыть ветку (1)

pecimfetr

5 лет назад

в ИИ верить еще рано :)
пока что это лишь маркетинговое название машинного обучения, но зато звучит-то как.. красиво.

показать ответы

ArrivaSama

5 лет назад

А что именно тут нового, подскажите, пожалуйста? Просто я свои картинки оживляла еще год назад при помощи приложульки talking face на телефоне

раскрыть ветку (1)

pecimfetr

5 лет назад

Так совсем же разная штучка: сравните свою гифку и гифку из поста. Результат другой.

rAeNyDka

5 лет назад

А есть тут кто из Сколково? Это правда, что вы там науки прикладные куете?

раскрыть ветку (1)

pecimfetr

5 лет назад

существует негосударственный университет в Сколково, занимается различными исследованиями. Очень много туда ребятишек на магистерские программы поступает из различных топовых университетов РФ типа Физтеха.

https://ru.wikipedia.org/wiki/Сколковский_институт_науки_и_т... почитайте, достаточно интересно

нет, я не из Сколково, но достаточно интересует вся эта тема)

показать ответы

Alanjon

5 лет назад

Кто эта женщина на первой картинке?? У всех в хатах весела

раскрыть ветку (1)

pecimfetr

5 лет назад

https://ru.wikipedia.org/wiki/Неизвестная_(картина)

показать ответы

NOTaSpetsKor

5 лет назад

хах. а чего просто не запостить его обычным путем? если видео годное - получит плюсы.

раскрыть ветку (1)

pecimfetr

5 лет назад

ну, он постил. Только через настройки своего аккаунта на Youtube запретил смотреть видео на сторонних площадках, провоцируя к переходу на свой канал, из-за чего первый бан сначала и словил :)

показать ответы

Parkad

5 лет назад

Ну собственно так и есть. На движения и мимику одного человека накладывают лицо другого.

раскрыть ветку (1)

pecimfetr

5 лет назад

о, привет, динозаврик

показать ответы

va.dudnikov

5 лет назад

Я тоже не знал, что такое законы Кларка, но всё-таки выражение про магию знал.

раскрыть ветку (1)

pecimfetr

5 лет назад

знать-то знал, да мой коммент был отсылкой к этой части текста:

Технология из Гарри Поттера дошла до наших дней. Теперь для создания полноценного видео человека достаточно одной его картинки или фотографии.

показать ответы

NOTaSpetsKor

5 лет назад

че хоть он писал то, что даж модератор снизошел

раскрыть ветку (1)

pecimfetr

5 лет назад

Флуд, рекламил свои видео на YouTube

показать ответы

NeAdminPikabu

5 лет назад

Почему должно смущать? Он будет говорить, что дрочил на гей-порно с начальником.

раскрыть ветку (1)

pecimfetr

5 лет назад

о, привет
неожиданное твое появление!

показать ответы

FoxWithoutAName

5 лет назад

Был пацан и нет пацана.

раскрыть ветку (1)

pecimfetr

5 лет назад

пацан к успеху шел, канал на ютубе продвигал, не получилось..

temirlancomcom01

5 лет назад

Комментарий удален. Причина: флуд, повторяющийся или мешающий обсуждению комментарий

раскрыть ветку (1)

pecimfetr

5 лет назад

@moderator, ааа спамеры отакуе

показать ответы

OverLord243

5 лет назад

ну вот не надо, иногда в России реально делают вещи впереди планеты всей. Например бесконтактная оплата везде. Банкинг и онлайн банкинг у нас очень хорош, сейчас даже в ларьке у Ашота можно за шаурму карточкой расплатиться. В Америке например до сих пор кэш юзают для мелких покупок, а карточку или квитки используют только при покупке больших вещей вроде техники или машины.
В метро вон распознавание лиц людей уже вроде года 2 работает если не больше. Даже в Китае эту технологию кажется позже нас запустили.

раскрыть ветку (1)

pecimfetr

5 лет назад

не обращайте внимания на провокацию)