427

Нейронные сети научились удалять людей с видео

Пару лет назад довольно активно обсуждалась тема deep fake. Технологии, позволяющей заменять лица одних людей на видео другими. Но в том время технология была сырая, даже невооружённым взглядом можно было заметить неестественность изображения. Плавающие контуры лица, искажения пропорций, неестественная мимика и многое другое. Некоторым людям доводилось сделать довольно реалистичные deep fake на небольших отрезках видео, но в какой то момент всё равно вылезала неестественность.

Нейронные сети научились удалять людей с видео Искусственный интеллект, Технологии, Наука, Машинное обучение, Нейронные сети, Deep learning, Deepfake, Видео, Длиннопост

Никаких резких скачков в этой области долгое время не было, поэтому разговоры понемногу сошли на нет. Но данное направление никто не забрасывал и различные группы исследователей и инженеров продолжали работу в этом направлении. И вот в этом году группа исследователей из Оксфорда, Института Вейцмана и Google Research представили систему ансамбля нейронных сетей, способных определять на видео не просто контуры отдельных объектов, но и последствия любых контактов этих объектов с окружающим миром. Поднятую пыль, тени, задетые объекты, даже поднятую рябь на воде. И этот ансамбль нейросетей способен не только всё это определять, но и удалять с видео. Ниже прикрепляю оригинальное видео, представленное авторами разработки.

Поскольку оригинальное видео полностью на английском и в нём описываются лишь базовые особенности работы нейросетей, я также записал видео на русском. В нём я подробнее и простым языком постарался разобрать как саму разработку, так и те принципы, по которым работают нейросети, входящие в ансамбль.

При этом стоит заметить, что данная нейросеть работает абсолютно автономно. И обрабатывать различные видео она способна в "промышленных" масштабах. Есть у неё конечно и ряд ограничений, так что не стоит бояться, что уже завтра можно будет удалить кого угодно с любого видео.

С другой стороны, от появления сетей, которые могли очень криво заменять лица людей, до появления систем, способных практически бесследно удалить любой движущийся объект с видео прошло всего пару лет. И кто знает, чему научатся сети ещё лет через 5-10.

Наука | Научпоп

9.1K постов82.4K подписчиков

Правила сообщества

Основные условия публикации

- Посты должны иметь отношение к науке, актуальным открытиям или жизни научного сообщества и содержать ссылки на авторитетный источник.

- Посты должны по возможности избегать кликбейта и броских фраз, вводящих в заблуждение.

- Научные статьи должны сопровождаться описанием исследования, доступным на популярном уровне. Слишком профессиональный материал может быть отклонён.

- Видеоматериалы должны иметь описание.

- Названия должны отражать суть исследования.

- Если пост содержит материал, оригинал которого написан или снят на иностранном языке, русская версия должна содержать все основные положения.


- Посты-ответы также должны самостоятельно (без привязки к оригинальному посту) удовлетворять всем вышеперечисленным условиям.

Не принимаются к публикации

- Точные или урезанные копии журнальных и газетных статей. Посты о последних достижениях науки должны содержать ваш разъясняющий комментарий или представлять обзоры нескольких статей.

- Юмористические посты, представляющие также точные и урезанные копии из популярных источников, цитаты сборников. Научный юмор приветствуется, но должен публиковаться большими порциями, а не набивать рейтинг единичными цитатами огромного сборника.

- Посты с вопросами околонаучного, но базового уровня, просьбы о помощи в решении задач и проведении исследований отправляются в общую ленту. По возможности модерация сообщества даст свой ответ.


Наказывается баном

- Оскорбления, выраженные лично пользователю или категории пользователей.

- Попытки использовать сообщество для рекламы.

- Фальсификация фактов.

- Многократные попытки публикации материалов, не удовлетворяющих правилам.

- Троллинг, флейм.

- Нарушение правил сайта в целом.


Окончательное решение по соответствию поста или комментария правилам принимается модерацией сообщества. Просьбы о разбане и жалобы на модерацию принимает администратор сообщества. Жалобы на администратора принимает @SupportComunity и общество Пикабу.

0
Автор поста оценил этот комментарий
Ну да, да. То-то Майкрософт с Гуглом утвердили премию на сервис распознающий deepface
раскрыть ветку (1)
7
Автор поста оценил этот комментарий

Это классическая война щита и меча. Будут появляться более совершенные алгоритмы подмены, а для них будут пытаться разработать более совершенные алгоритмы нахождения подмены.

К примеру, вот обзорная статья этого года по текущему состоянию этого вопроса - https://www.scirp.org/journal/paperinformation.aspx?paperid=...

21
Автор поста оценил этот комментарий
Пока всегда можно определить редактировалась ли видеозапись нейросеткой по характерным артефактам и искажённым распределением контрастов по масштабам. Да и нейросетки способные найти редактору так-же разрабатываются. Конечно можно представить, что нейросеть когда нить научится генерировать полностью правдоподобное изображерие, но это выглядит маловероятным.
раскрыть ветку (1)
7
Автор поста оценил этот комментарий

Кстати да, сетки умеющие распознавать работу других сетей уже есть) В ближайшие недели постараюсь до них добраться и тоже одну из последних работ разобрать)

показать ответы
14
Автор поста оценил этот комментарий

Я не эксперт в нейросетях и блокчейне, но мне пришла такая идея:

1. При записи видео вместе с файлом сохраняется хэш-сумма от этого файла.


2. Сразу по сохранению файла (по факту съемки) создается хэш-сумма этого файла с метаданными (но можно и без них, если нам нужна только доказанная временная метка)


3. Хэш этого файла отправляется в общедоступный и надежный блокчейн сразу после съемки видео. Можно даже те же криптовалюты использовать, если они позволяют добавлять данные к транзакциям.


Таким образом мы получаем доказательство что конкретный видео-файл был сделан не позже записи в блокчейне, проверяемое кем угодно, при предъявлении оригинального видео-файла.
При этом нельзя будет произвести никакие манипуляции с файлом (нельзя перекодировать, вырезать часть или изменить что-либо) - тогда хэш-сумма тоже изменится, а она уже записана в блокчейне, изменить её никто не может, только если весь блокчейн поменять (что невозможно, если мы говорим о блокчейнах, на которых работают криптовалюты).

Этого может быть недостаточно, ведь так можно сделать и фейк, подтвердив только его дату создания.


Но, во-первых, для спонтанных преступлений этот способ отлично сработает (скажем по такому принципу могут работать камеры видеонаблюдения).


Во-вторых, если мы говорим о проблеме подмены оригинального видео с генерацией нового хэша - наш хэш, удостоверяющий оригинальное видео будет первым, что защищает его от изменений.

В-третьих, даже для фиксации преступлений (например в кейсе слежки) это может быть тоже эффективно.
Скажем в кейсе когда пытаются кого-то подставить с помощью видео фейка. Допустим злоумышленники способны сделать идеальный видео-фейк, который не отличить от настоящего. Но при этом подделать временную метку, получаемую из отправки хэша видео в цепочку блокчейна - не получится.
В итоге злоумышленники будут иметь на руках видео с временной меткой, но при этом без возможности внести в него корректировки. И в большинстве кейсов такое фейковое видео можно будет вывести на чистую воду - сопоставив детали.
Например жертва в этот же момент может снимать свое видео, так же подтверждаемое хэш-суммой в блокчейне. Тут уже будет "слово против слова".

Не говоря уже о том, что пока-что не реально генерировать фейк-видео в режиме реального времени (без постобработки там много артефактов видимых невооруженным глазом, и маленькое разрешение) - скорее всего до выхода квантовых компьютеров в широкий обиход - будет и не реально. Если мы говорим о видео в качестве 4k и выше.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

В целом идея неплохая, но предположение о том, что не получится генерировать фейк в режиме реального времени без видимых артефактов несколько неверное) Собственно, приведённая в посте сеть работает в режиме реального времени. Очень много ресурсов потребуется для обучения нейросети, но после обучения большинство нейросетей это максимально простые модели построенные на сумматорах. И работают они очень быстро, особенно на видеокартах.