ИИ научился создавать видео с одного кадра. Старые картины теперь можно сделать живыми

ИИ научился создавать видео с одного кадра. Старые картины теперь можно сделать живыми Samsung, Машинное обучение, Искусственный интеллект, Видео, Оживление, Habr, Pochtoycom, Сколтех, Гифка, Длиннопост

Технология из Гарри Поттера дошла до наших дней. Теперь для создания полноценного видео человека достаточно одной его картинки или фотографии. Исследователи машинного обучения из «Сколково» и центра Samsung AI из Москвы опубликовали свою работу о создании такой системы, вместе с целым рядом видео знаменитостей и предметов искусства, получивших новую жизнь.

ИИ научился создавать видео с одного кадра. Старые картины теперь можно сделать живыми Samsung, Машинное обучение, Искусственный интеллект, Видео, Оживление, Habr, Pochtoycom, Сколтех, Гифка, Длиннопост

Текст научной работы можно почитать тут. Там всё довольно интересно, с массой формул, но смысл прост: их система руководствуется «ориентирами», достопримечательностями лица, вроде носа, двух глаз, двух бровей, линии подбородка. Так она мгновенно улавливает, что человек собой представляет. И потом может переносить всё остальное (цвет, текстуру лица, усы, щетину и прочее) на любое другое видео человека. Адаптируя старое лицо к новым ситуациям.

ИИ научился создавать видео с одного кадра. Старые картины теперь можно сделать живыми Samsung, Машинное обучение, Искусственный интеллект, Видео, Оживление, Habr, Pochtoycom, Сколтех, Гифка, Длиннопост

Разумеется, это пока работает только на портретах. Модели нужен только один человек, с лицом, повернутым к нам, чтобы у него было хотя бы видно оба глаза. Тогда система может делать с ним что угодно, передавать ему любую мимику. Достаточно дать ей подходящее видео (с другим человеком с головой примерно в том же положении).
Ранее ИИ уже научился делать дипфейки, и интернет-пользователи знатно поиздевались над знаменитостями, вставляя их лица в порно и делая мемы с Николасом Кейджем. Но для этого им приходилось тренировать алгоритмы мегабайтами (а лучше – гигабайтами) данных, находить как можно больше изображений и видео с лицами знаменитостей, чтобы выдать более-менее пристойный результат. Сам создатель Deepfakes говорил, что на компиляцию одного короткого ролика у него уходит 8-12 часов. Новая система генерирует результат моментально, а на входе ей достаточно одной картинки.
С предыдущей системой мы никогда бы не смогли посмотреть на живую Мону Лизу, у нас есть только один её ракурс. Теперь, с алгоритмами, работающими по ориентирам, это становится возможным. Идеала не достичь, но уже что-то близко.

ИИ научился создавать видео с одного кадра. Старые картины теперь можно сделать живыми Samsung, Машинное обучение, Искусственный интеллект, Видео, Оживление, Habr, Pochtoycom, Сколтех, Гифка, Длиннопост

В работе московских исследователей также используется генеративно-состязательная сеть. Две модели алгоритма сражаются друг с другом. Каждая пытается обмануть оппонента, и доказать ему, что то видео, которое она создает – настоящее. Так достигается определенный уровень реализма: картинка человеческого лица не выпускается «в свет», если модель-критик не уверена в её подлинности более чем на 90%. Как говорят авторы в своей работе, в изображениях регулируются десятки миллионов параметров, но за счет такой системы, работа кипит очень быстро.

ИИ научился создавать видео с одного кадра. Старые картины теперь можно сделать живыми Samsung, Машинное обучение, Искусственный интеллект, Видео, Оживление, Habr, Pochtoycom, Сколтех, Гифка, Длиннопост

Если картинок несколько, результат улучшается. Опять же, проще всего получается работать со знаменитостями, которые уже сняты со всех возможных ракурсов. Для достижения «идеального реализма» нужны 32 снимка. В этом случае сгенерированные ИИ фото в невысоком разрешении будут неотличимы от настоящих фото человека. Нетренированные люди на этом этапе уже не способны выявить фейк – возможно, шансы остаются у экспертов или у близких родственников «подопытного» со всех этих изображений.
Если фото или картинка только одна, итог пока не всегда самый лучший. Увидеть артефакты на видео, когда голова находится в движении, можно без особых проблем. Сами исследователи говорят, что их самое слабое место – взгляд. Модель, основанная на ориентирах лица, пока не всегда понимает, как и куда человек должен смотреть.


Источник

Искусственный интеллект

2.5K постов9.8K подписчиков

Добавить пост

Правила сообщества

Здесь вы можете свободно создавать посты по теме Искусственного интеллекта. Добро пожаловать :)


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

208
DELETED
Автор поста оценил этот комментарий

вы хотели сказать, "магия из Гарри Поттера"?

раскрыть ветку (1)
85
Автор поста оценил этот комментарий

ну, магию, в принципе, тоже можно назвать технологией :)

показать ответы
62
Автор поста оценил этот комментарий

Слямзил выражение, и даже не указал откуда оно:

Три закона Кларка были сформулированы известным английским писателем-фантастом и футурологом Артуром Кларком:Когда уважаемый, но пожилой учёный утверждает, что что-то возможно, то он почти наверняка прав. Когда он утверждает, что что-то невозможно, — он, весьма вероятно, ошибается.Единственный способ обнаружения пределов возможного состоит в том, чтобы отважиться сделать шаг в невозможное.Любая достаточно развитая технология неотличима от магии. https://ru.wikipedia.org/wiki/%D0%A2%D1%80%D0%B8_%D0%B7%D0%B...

раскрыть ветку (1)
26
Автор поста оценил этот комментарий

Не думал про законы Кларка в тот момент, не слямзил :)
Но, да, мой комментарий достаточно сильно напоминает его выражение, соглашусь.

показать ответы
14
Автор поста оценил этот комментарий
Я поверю в ИИ когда контекстная реклама будет предугадывать мои запросы. ))
Сразу ИИм сдамся .))
раскрыть ветку (1)
17
Автор поста оценил этот комментарий

в ИИ верить еще рано :)
пока что это лишь маркетинговое название машинного обучения, но зато звучит-то как.. красиво.

показать ответы
10
Автор поста оценил этот комментарий

А что именно тут нового, подскажите, пожалуйста? Просто я свои картинки оживляла еще год назад при помощи приложульки talking face на телефоне

Предпросмотр
раскрыть ветку (1)
11
Автор поста оценил этот комментарий

Так совсем же разная штучка: сравните свою гифку и гифку из поста. Результат другой.

Автор поста оценил этот комментарий

А есть тут кто из Сколково? Это правда, что вы там науки прикладные куете?

раскрыть ветку (1)
5
Автор поста оценил этот комментарий

существует негосударственный университет в Сколково, занимается различными исследованиями. Очень много туда ребятишек на магистерские программы поступает из различных топовых университетов РФ типа Физтеха.

https://ru.wikipedia.org/wiki/Сколковский_институт_науки_и_т... почитайте, достаточно интересно

нет, я не из Сколково, но достаточно интересует вся эта тема)

показать ответы
2
Автор поста оценил этот комментарий
Кто эта женщина на первой картинке?? У всех в хатах весела
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

хах. а чего просто не запостить его обычным путем? если видео годное - получит плюсы.

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

ну, он постил. Только через настройки своего аккаунта на Youtube запретил смотреть видео на сторонних площадках, провоцируя к переходу на свой канал, из-за чего первый бан сначала и словил :)

показать ответы
5
Автор поста оценил этот комментарий

Ну собственно так и есть. На движения и мимику одного человека накладывают лицо другого.

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

о, привет, динозаврик

показать ответы
3
Автор поста оценил этот комментарий

Я тоже не знал, что такое законы Кларка, но всё-таки выражение про магию знал.

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

знать-то знал, да мой коммент был отсылкой к этой части текста:

Технология из Гарри Поттера дошла до наших дней. Теперь для создания полноценного видео человека достаточно одной его картинки или фотографии.

:)

показать ответы
Автор поста оценил этот комментарий

че хоть он писал то, что даж модератор снизошел

раскрыть ветку (1)
Автор поста оценил этот комментарий

Флуд, рекламил свои видео на YouTube

показать ответы
Автор поста оценил этот комментарий

Почему должно смущать? Он будет говорить, что дрочил на гей-порно с начальником.

раскрыть ветку (1)
Автор поста оценил этот комментарий

о, привет
неожиданное твое появление!

показать ответы
Автор поста оценил этот комментарий

Был пацан и нет пацана.

раскрыть ветку (1)
Автор поста оценил этот комментарий

пацан к успеху шел, канал на ютубе продвигал, не получилось..

Автор поста оценил этот комментарий
Комментарий удален. Причина: флуд, повторяющийся или мешающий обсуждению комментарий
раскрыть ветку (1)
Автор поста оценил этот комментарий

@moderator, ааа спамеры отакуе

показать ответы
4
Автор поста оценил этот комментарий

ну вот не надо, иногда в России реально делают вещи впереди планеты всей. Например бесконтактная оплата везде. Банкинг и онлайн банкинг у нас очень хорош, сейчас даже в ларьке у Ашота можно за шаурму карточкой расплатиться. В Америке например до сих пор кэш юзают для мелких покупок, а карточку или квитки используют только при покупке больших вещей вроде техники или машины.
В метро вон распознавание лиц людей уже вроде года 2 работает если не больше. Даже в Китае эту технологию кажется позже нас запустили.

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

не обращайте внимания на провокацию)