5459

Найден способ уверенно распознавать дипфейки?

Современные нейросети умеют создавать настолько правдоподобные изображения, что их порой сложно отличить от реальных фотографий. Такие изображения, называемые дипфейками, могут быть любопытными и забавными, но лишь до тех пор, пока все понимают, что это подделка. Когда же кто-то пытается выдавать дипфейки за чистую монету, они становятся большой проблемой.

С их помощью можно нанести ущерб репутации, повлиять на общественное мнение и даже сфабриковать подложные доказательства для суда. Поэтому, как только появились нейросети, умеющие производить дипфейки, сразу началась разработка алгоритмов, которые были бы способны их распознавать.


Задача осложняется тем, что для создания дипфейков обычно используются генеративно-состязательные нейросети (Generative Adversarial Networks, GAN). Их работа изначально основана на противостоянии двух нейронных сетей, одна из которых генерирует картинки, а другая старается определить, настоящие они или нет. Обе эти сети обучены на больших массивах реальных фотографий. Если изображение выглядит неправдоподобно, вторая нейросеть заставляет первую изменять его до тех пор, пока оно не перестанет идентифицироваться как подделка.


Получается, что дипфейки изначально создаются такими, что существующие системы распознавания не могут уверенно отличить их от реальных фотографий. На сайте thispersondoesnotexist.com вы сами можете оценить, насколько правдоподобно выглядят сгенерированные нейросетью несуществующие люди.


Алгоритмы по распознаванию дипфейков обычно используют свёрточные нейронные сети, которые умеют выделять характерные признаки. Эти нейросети обучают на самих изображениях в явном виде, что требует много времени и ресурсов. Однако коллектив исследователей из Института информационной безопасности им. Хорста Гёрца при Рурском университете в Бохуме предложил более простое и изящное решение этой проблемы. Учёные решили подвергнуть изображения частотному анализу, использовав давно известный метод дискретного косинусного преобразования. Он применяется, например, в алгоритме сжатия JPEG. Изображение в этом случае рассматривается как результат наложения гармонических колебаний различной частоты, взятых с разными коэффициентами. Примерно так:

Эти коэффициенты можно визуализировать в виде прямоугольной тепловой карты, верхний левый угол которой соответствует низкочастотным областям исходного изображения, а нижний правый — высокочастотным. Реальные фотографии в основном состоят из низкочастотных колебаний.

Реальная фотография и её спектрограмма


Если же явные всплески наблюдаются в высокочастотной области, это может свидетельствовать о том, что изображение — подделка. А если они ещё и формируют регулярную структуру — тут как говорится, и к гадалке не ходи.

Дипфейк и его спектрограмма


Чтобы проверить эффективность предложенного подхода, учёные составили тестовую выборку из 10 000 изображений, куда вошли сгенерированные нейросетью StyleGAN портреты несуществующих людей и реальные фотографии из набора Flickr-Faces-HQ (FFHQ). Всё это можно найти на сайте whichfaceisreal.com. Успех был абсолютным: алгоритм распознал все дипфейки до единого!


Более того — выяснилось, что он с большой долей вероятности позволяет определить, с помощью какой именно нейросети было сгенерировано изображение. Дело в том, что каждая из них имеет свой «отпечаток» в частотном диапазоне.

Спектрограммы реальных фотографий из набора Stanford Dogs (слева) и изображений, сгенерированных нейросетями различных архитектур, которые были обучены на этом наборе (четыре справа). Усреднённые значения для 10 000 изображений


Откуда же берутся эти всплески в высокочастотных областях? Оказывается, что они неразрывно связаны с самим принципом действия генеративно-состязательных нейросетей. В основе их работы лежит процесс так называемого апсемплинга, то есть отображения данных из пространства низкой размерности в пространство высокой размерности. Например, сеть StyleGAN, создавшая все дипфейки с людьми из этого поста, формирует в пространстве данных изображение размером 1024 × 1024 пикселя (более миллиона значений) на основе вектора из скрытого пространства, имеющего размерность всего-навсего 100. Если же попытаться обойтись без апсемплинга, то объём вычислений, необходимых для генерации дипфейков, вырастет до астрономических величин.


В данной статье учёные подробно рассмотрели лишь один набор данных и одну архитектуру нейросети. Однако они утверждают, что предложенный метод универсален и будет работать не только для всех существующих сетей типа GAN, но и для тех, что появятся в будущем. Так ли это, станет ясно уже довольно скоро.


Источник


P. S. Это очередная новость с семинара «Актуальная наука» в Политехническом музее. Я буду стараться публиковать их каждую неделю.

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

Вы смотрите срез комментариев. Показать все
491
DELETED
Автор поста оценил этот комментарий
Если появился способ отличать нейросеть от реальности, значит можно научить нейросети избегать этих отличий, разве нет?
раскрыть ветку (144)
393
Автор поста оценил этот комментарий

Естественно. Надо всего лишь добавить описанный в статье анализ в набор критериев "настоящести" при генерации дипфейка.

Просто ещё один виток "гонки вооружений".

раскрыть ветку (85)
24
Автор поста оценил этот комментарий

Как говорил мой дед:

"На хитрую жопу есть хуй с винтом,

на хуй с винтом есть жопа с лабиринтом."

раскрыть ветку (5)
6
Автор поста оценил этот комментарий

И древние греки именно так говорили. Они были людьми практическими и широкой души, это мы из оригинального эпоса хорошо знаем.

А потом уже в Эпоху Просвещения им приписали скучный благозвучный афоризм про вечную борьбу щита и меча. :)

5
Автор поста оценил этот комментарий

Как говорил мой дед;

"Я твой дед!"

2
Автор поста оценил этот комментарий

А на жопу с лабиринтом найдётся свой Минотавр?

раскрыть ветку (1)
4
Автор поста оценил этот комментарий
Акзактли., вы поняли правило)
1
Автор поста оценил этот комментарий
А на каждую жопу с лабиринтом найдется хуй с путеводителем!
167
Справедливость
Автор поста оценил этот комментарий

только нет гарантии что для генерации изображения которое проходит этот критерий не понадобится увеличение ресурсов на порядок, или на несколько порядков, а соотвественно и стоимости. И собственно это уже будет неплохим решением проблемы.

раскрыть ветку (74)
44
Автор поста оценил этот комментарий

Чтобы полностью нивелировать вскрытую особенность (уязвимость) конкретной нейросети (в статье предметно говорится о спектральных маркерах, их частном случае обнаружения внутри обозначенного списка нейросетей), понадобится пару десятков строчек кода на постобработке. Всё.

(Ну, и ещё пару, а может и десяток, фреймворков дополнительных в проект нейросети, но это уже детали).

раскрыть ветку (41)
78
Справедливость
Автор поста оценил этот комментарий

Так после такой постобработки может оказаться что изображение уже будет визуально не похоже на реальное. И возможно придётся менять именно подход к генерации изображений. Посмотрим.

раскрыть ветку (40)
25
Автор поста оценил этот комментарий

Вы заблуждаетесь. Конкретно в посте речь идёт об изменениях, которые не заметны человеческому взгляду. Если речь идёт только о коррекции обозначенной уязвимости, то всё мной описанное в предыдущем комментарии -- верно. Если же авторы аналитической разработки "случайно забыли" упомянуть ещё какие-то важные подробности, то вот тогда и "посмотрим". В любом случае такие публикации хоть и полезны для развития общего кругозора, но конкретно в данном случае авторы оказали обществу медвежью услугу. Маркеры уязвимостей дипфейк-нейросетей не должны публиковаться в открытом доступе под страхом тюрьмы. Кто считает иначе, жду ваши аргументы. Но сначала хорошенько подумайте, что лично вы будете делать, если дипфейк применят против вас, и готовы ли вы смириться с возможными последствиями.

раскрыть ветку (35)
72
Автор поста оценил этот комментарий

Маркеры уязвимостей дипфейк-нейросетей не должны публиковаться в открытом доступе под страхом тюрьмы. Кто считает иначе, жду ваши аргументы

Только в реальной жизни для этого термин есть из раздела ИТ безопасности...не помню как его...короче ограничение доступа к такой информации не является её защитой.
Так как очевидно не выполняет свою функцию.
Представим ситуацию, на суде приносят фотку и говорят что она фейк/реальная. На вопрос как эксперт это определил - говорят что это закрытая информация, но вы нам верьте точно точно...какая вера такому эксперту который не может обосновать свое заключение? Ни какого.
Дальше, сокрытие информации не выполняет функцию защиты вот почему, очевидно что фейк имеет место и важность здесь и сейчас, ну то есть через неделю-год говорить что эт был фейк уже поздновато будет. Следовательно достаточно купить уязвимость нулевого дня к нейросети и утопить какого нибудь политика в говне, ведь мы же верим просто коробке а коробка говорит что эт все правда. Да коробку пофиксят через неделю но....
Так что это очередная ебанистика в духе советских секретностей, помню как пилот бывший рассказывал что летали по гугл мап ибо карты с такой точностью требовали спец допуска.

раскрыть ветку (13)
20
Автор поста оценил этот комментарий

Security through obscurity это называется. Так то вы правы.

5
Автор поста оценил этот комментарий

А вы знаете, как суды обычно работают с закрытой для общества информацией, ну, например, корпоративными тайнами? Суд в любом случае посвящается в детали под тем же условием неразглашения. Звучит не очень в нашей стране, но в остальных по крайней мере работает неплохо. И это совершенно точно лучше полной публичной информированности.

И да, утопить в говне - одно, посадить за решетку на основании пары фоток человека с расчлененным трупом - другое, они очень даже могут иметь важность и через неделю, и через сколько там срок за такие преступления.

раскрыть ветку (6)
18
Автор поста оценил этот комментарий
Алгоритм формирования доказательства должен раскрываться. Подписки хуиски, это не защитит, куча людей левых помимо судьи и прокурора и одно их слово и к хуям поломают вашу защиту.
Если вы и в зале суда запретите рассказывать о схеме то это просто коррупционная дыра где эксперт будет вершителем судеб не подотчетным никому.

Ну и по итогу эта схема сгниет ибо будет тайной и следовательно ни какой конкуренции ни какой критики и ни каких белых хакеров что ломают ее на выставках.
раскрыть ветку (4)
Автор поста оценил этот комментарий
В суде все озвучивается всегда прямо - стороны имеют права знать все материалы дела. Просто при закрытом процессе сторонам запрещено за пределами заседания об этом распространяться. И то, если речь идёт о секретной информации. Не все материалы дела представляют из себя такую информацию.
ещё комментарии
Автор поста оценил этот комментарий

Закрытое заседание. Вот и всё. Это не равно тому, что всё происходящее внутри должно быть достоянием общественности. Если вам кажется, что так есть способ воспользоваться коррупцией - вам не кажется. Впрочем, скажу, видимо, одну неочевидную вещь - любую систему возможно использовать недобросовестно. Вопрос только с какой стороны это возможно сделать и кому. Любой суд это всегда коррупционная дыра, судья всегда вершитель судеб, который подотчетный у нас в стране исключительно формально, не понимаю в чем суть вашего аргумента.

Сгнивание схем не всегда плохая идея. Или вам кажется, что физики, раскрывшие информацию о ядерном синтезе военным (не важно с чьей стороны) с точки зрения общей пользы обществу сделали благое дело?

Люди уже могли бы начать делать выводы о том, к чему ведет гонка вооружений, когда все делятся всем. Но, видимо, не делают.

1
Автор поста оценил этот комментарий
Вдобавок любое решение обжалуется минимум два раза, а иногда и четыре и все суды апелляционной, кассационных и надзорной инстанций имеют полный доступ к этой информации.
ещё комментарии
9
Справедливость
Автор поста оценил этот комментарий

Серьезно? Тут как раз показана концептуальная проблема текущих подходов генерации. Когда все изображение генерируется из небольшого вектора начальных данных, а потом шлифуется. По сути научились выявлять паттерны указывающие на то что был применён именно этот подход. Чтобы обмануть выявление, нужно или менять подход или усложнять начальные данные (что требует увеличение вычислительных ресурсов)

раскрыть ветку (8)
Автор поста оценил этот комментарий

Я повторю, теперь о том что области генерации оставляют спектральный паттерн известно всем заинтересованным. Внимание! Речь идёт о СПЕКТРАЛЬНЫХ МАРКЕРАХ, для ЧЕЛОВЕЧЕСКОГО взгляда ОНИ НЕРАЗЛИЧИМЫ! Если бы они были различимы для человеческого взгляда, вы бы их сразу на фото видели. Теперь же просто "синтетику" паттернов потрут отдельным алгоритмом смешивания и последующей коррекции энтропии проблемных участков.

раскрыть ветку (7)
7
Автор поста оценил этот комментарий
Зачем подтирать если можно просто напечатать фотографию на которой никакие спектрограммы нее видны
Автор поста оценил этот комментарий
Теперь же просто

Не просто. Как в самом посте написано. Либо использовать кратно большие мощности, либо делать принципиально новый алгоритм. И то и то КРАЙНЕ сложно выполнимо. Так что 99.99% людей мира не могут сейчас сделать дипфейк и не спалится. Для любого обывателя этого вполне достаточно. В конце концов мы же не про фсб/цру говорим...


P.S. Это уязвимость метода. Её принципиально не поправить "заплаткой".

раскрыть ветку (5)
0
Автор поста оценил этот комментарий
Эмм низкочастотная фильтрация полученного изображения?
0
Автор поста оценил этот комментарий
Печать+фото разве не решают эту проблему?
раскрыть ветку (3)
2
Автор поста оценил этот комментарий
Нет. Стеганографическая цифровая подпись, внедрённая в картинку, не видна глазом, но отлично распознаётся с отсканированной распечатки. Чтобы её подавить тупо "в лоб", надо очень серьёзно "зарезать" качество картинки — либо надо знать алгоритм её внедрения, чтобы целенаправленно искать внесённые подписью искажения и уничтожать их.

Тут аналогично. Либо серьёзно давить качество, либо ковырять алгоритм, чтобы научиться целенаправленно уничтожать маркеры, распознаваемые алгоритмом.
Автор поста оценил этот комментарий
А потом отсканировать. И вуаля - чистая картинка.
раскрыть ветку (1)
3
Автор поста оценил этот комментарий
Маркеры уязвимостей дипфейк-нейросетей не должны публиковаться в открытом доступе под страхом тюрьмы.

Но почему?

раскрыть ветку (6)
4
Автор поста оценил этот комментарий
Потому что если никто не знает, что ключ под ковриком — дверь открыть никто не сможет!
Типичная узколобая логика вояк и спецслужб. Вместо надёжного алгоритма, который безопасен потому, что в нём нет дыр — секретный алгоритм, который "безопасен" потому, что вроде бы пока никто не знает, где в нём дыры.
раскрыть ветку (5)
0
Автор поста оценил этот комментарий

При чём тут вояки и спецслужбы, не понимаю.

Речь ведь идёт об обнародовании способа однозначной идентификации поддельных картинок.

Тот человек по неизвестной мне причине считает, что давать людям возможность распознать фальшивку нельзя.

раскрыть ветку (4)
2
Автор поста оценил этот комментарий
Вояки и спецслужбы при том, что это у них понимание защиты такое: вместо использования безопасных публичных алгоритмов, в которых безопасность обеспечена отсутствием уязвимостей, они полагают нужным и достаточным просто засекретить алгоритм, чтоб снизить вероятность нахождения уязвимостей.

Вот и этот человек так же: он считает, что вместо публикации уязвимости, что приведет к её устранению, нужно просто запретить публикацию, чтоб о уязвимости никто не узнал — тогда и устранять её не понадобится.
раскрыть ветку (3)
0
Автор поста оценил этот комментарий
Вояки и спецслужбы при том, что это у них понимание защиты такое: вместо использования безопасных публичных алгоритмов, в которых безопасность обеспечена отсутствием уязвимостей

Речь не о военных разработках, а о поделках частных энтузиастов.

И речь не о безопасности продукта, а о выявлении фальшивок, изготовленных с применением такового продукта.

Вот и этот человек так же: он считает, что вместо публикации уязвимости, что приведет к её устранению

В устранении этой т.н. "уязвимости" заинтересованы лишь те, кто имеет желание предотвратить распознавание фальшивок.

Соответственно, если уязвимость опубликовать, то выявление фальшивок упрощается.

раскрыть ветку (2)
1
Автор поста оценил этот комментарий

Мой аргумент: " Разогнать гонку дипфейков и контрмер к ним до такого уровня, что создание не отличимых фейков станет невозможным без суперкомпьютеров за десятки миллионов $"

раскрыть ветку (2)
Автор поста оценил этот комментарий
Что за блядские манеры - дать идею куда вбухать бабла , которое не твое, с наименьшим профитом? Вот нахуя? Что проблем мало? Пенсии охунные, люди добрые?
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

@moderator, провокация.

1
Автор поста оценил этот комментарий
По моему в самой статье ясно дали понять откуда ноги растут
"В основе их работы лежит процесс так называемого апсемплинга, то есть отображения данных из пространства низкой размерности в пространство высокой размерности. Например, сеть StyleGAN, создавшая все дипфейки с людьми из этого поста, формирует в пространстве данных изображение размером 1024 × 1024 пикселя (более миллиона значений) на основе вектора из скрытого пространства, имеющего размерность всего-навсего 100. Если же попытаться обойтись без апсемплинга, то объём вычислений, необходимых для генерации дипфейков, вырастет до астрономических величин. "
Так что никакой парой строчек кода это не плфиксить, это нужны мощные компы.
1
Автор поста оценил этот комментарий

Если дипфейк применят ко мне, значит кому-то это выгодно. Я сделаю соответствующие выводы, расскажу кому смогу про дипфейк, "подстелю" где нужно "соломки", и... вздохну свободнее!
Есть два мира: в одном, если ты на видео творишь какую-то дичь или просто что-то предосудительное в некоторых кругах, то либо кто-то отвалил огромные бабки за фальсификацию (что, согласитесь, не всегда правдоподобно), либо на видео действительно ты и репутации жопа.
Во втором мире, если ты оказался героем компромата, то всегда можно сказать (и продемонстрировать), что за три копейки можно соорудить такой дипфейк, а я -- не я и жопа не моя!

В этом плане мир не сильно изменится. Недавно то же самое происходило с записью голоса, а до того с фотографией, которую куда проще ретушировать, чем видео... Когда-нибудь и ДНК тест перестанет быть таким уж надёжным.

Так вот, если кто-то применил против меня дипфейк, значит это стало достаточно дешево (ведь кому я, нахрен, нужен). Хорошо, что это произошло не в переходный период, пока большинство верит видеороликам, но многие уже "умеют в дипфейк". Переходный период пройдёт, не так уж он и долог, а мы будем жить в новом мире. Мы каждый день живём немножко в новом мире. Без паники.

А ещё помните как в мультике? "Если все в клетках, то мне-то она зачем?" Люди смогут творить больше дичи, ведь надёжно доказать, что это не дипфейк уже не так просто. Люди станут проще относиться к наготе, поскольку сделать правдоподобный ролик про любого человека не проблема, даже от оригинала хрен отличишь.
Негативный аспект тоже есть: камеры наблюдения и без того были весьма бесполезными в идентификации, а теперь им совсем доверия не будет. Регистраторы на автомобилях будет проще оспаривать, что добавит мороки законопослушиным гражданам.

2
Автор поста оценил этот комментарий
Тут нейросети даже фотошоп вычисляют, а вы хотите, чтобы видеозаписи были неотличимы от реальности (хотя там достаточно в 99 процентах просто присмотреться)
0
Автор поста оценил этот комментарий
Посмотрите как работают отрисовщики документов для фрода. Накладывается шум если по простому. И отличить невозможно. Ну или сфоткать с экрана айпада
Автор поста оценил этот комментарий

Достаточно пройтись ФНЧ по такому изображению, чтобы стереть маркеры. ФНЧ применительно к изображениям - это размытие. Только слабое, почти не заметное глазу.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий
Не, нифига. Слабое размытие эффекта не даст. Маркеры пропадут только после того, как изображение будет фактически уничтожено.
6
Автор поста оценил этот комментарий

По сути.

Имеется самообучающийся алгоритм.

Ему была дана куча фото реальных людей с указанием что "вот такие картинки — правильные".

Чтобы победить описываемый в статье анализ, надо к каждому фото приложить спектрограмму и расширить обучение указанием "вот такие картинки с вот такими спектрограммами — правильные". Обучение усложнится чисто количественно за счёт потребности в анализе не только фото, но и его спектрограммы, а так же за счёт потребности в просчёте спектрограмм для генерируемых "картинок-кандидатов". Оба эти фактора усложнения не выглядят принципиально усложняющими процесс.

раскрыть ветку (4)
2
Автор поста оценил этот комментарий

Вы как сова из анекдота - стратег.

Чтобы решить описываемую проблему, надо от уровня "вот есть магия, и она делает магию с кривульками, надо с магией поговорить, показать ей кривульки и строго-настрого запретить их делать, и все станет красиво" дойти до реального понимания длинных слов в посте.

раскрыть ветку (2)
1
Автор поста оценил этот комментарий
уровня "вот есть магия

Балда, это называется идея и общая архтектура.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Я ж говорю - стратег)

Попробую и я в идеи: от каждого по возможностям, каждому по потребностям!

А вы там на местах уже зашлифуете шероховатости..

DELETED
Автор поста оценил этот комментарий
Алилуйя! Глас разума! А то вдруг "радикально усложнит", "потребуется рост мощностей", "гигантский объем кода"... Просто одно новое условие, причем в конце списка предыдущих, и все.
0
Автор поста оценил этот комментарий
об этом в статье и написано
0
Автор поста оценил этот комментарий
Так где ваши квантовые компуктеры?
Автор поста оценил этот комментарий

Тут уже вопрос можно решить простой пост-обработкой изображения для убирания данных "артефактов", много ресурсов не потребуется.

раскрыть ветку (7)
1
Автор поста оценил этот комментарий

Если бы науку двигали комментаторы на Пикабу, мы бы уже, наверное, давно Марс колонизировали) Всё просто же!

раскрыть ветку (6)
0
Автор поста оценил этот комментарий

Банальный фильтр для растрового изображения. Тоже самое, что в большинстве редакторов изображений можно сделать вручную, тут будет с десяток строк кода на питоне том же. Чтобы обойти детектор для начала хватит. Умнее что уже дальнейшее развитие и игра с фильтрами.


PS: Кстати человеком визуально большинство изображений StyleGAN легко распознать - там артефакты около волос видны. Во всяком случае на https://www.whichfaceisreal.com/ по артефактам на переходе лица и фона я на 100% угадываю.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий
Код, дайте код!!!
0
Автор поста оценил этот комментарий
Уже назад бы землю пикабуцнули с Марса!
0
Автор поста оценил этот комментарий

Ебать ты умный. А в голову не приходит, что комментатор на пикабу может быть и учёный, и инженер, и программист? Я вот двигаю искусство и геймдев,например.

раскрыть ветку (2)
Автор поста оценил этот комментарий

Чувак, ты такой классный! Но пирожков у меня на полке нет.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Сам тащусь с себя. Сочувствую твоей ситуации с пирожками, держись там.

ещё комментарии
Автор поста оценил этот комментарий
Есть гарантия- один санный раз вложится в обучение сети это не будет стоить увелечение стоимости обработки для клиента( написать алгоритм обучения 1000-10000 долларов, чем дороже тем меньше средств на само обучение)
30
Автор поста оценил этот комментарий

Или просто фотографировать сгенерированную фотографию.

раскрыть ветку (2)
8
Автор поста оценил этот комментарий
И отсканировать распечатанное фото, которое получилось при фотографировании)
4
Автор поста оценил этот комментарий
Потрясающий ход.jpg
1
Автор поста оценил этот комментарий
Ну не совсем, то что описано в статье это не посредственно эффект самой генерации , но не чего не мешает исправить эти погрешности на пост обработке , думаю даже без нейросетей можно будет обойтись.
21
Автор поста оценил этот комментарий
Да вы и сами можете отличить зачастую
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
раскрыть ветку (11)
28
Автор поста оценил этот комментарий

Там еще есть нейросеть, генерирующая котов, которая по факту генерирует мемы. И нейросеть, генерирующая лошадей, а по факту монстров для фэнтзийных РПГ. Наслаждайтесь:

Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
раскрыть ветку (2)
11
Автор поста оценил этот комментарий

Как перестать рыдать от смеха?

6
Автор поста оценил этот комментарий
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
Иллюстрация к комментарию
18
Автор поста оценил этот комментарий

Жизненно, когда друзья залезают в кадр

Иллюстрация к комментарию
раскрыть ветку (1)
0
Автор поста оценил этот комментарий
Да ваще, жесть)))
10
Автор поста оценил этот комментарий
Иллюстрация к комментарию
8
Автор поста оценил этот комментарий

Я такое нарандомил

Иллюстрация к комментарию
4
Автор поста оценил этот комментарий
Иллюстрация к комментарию
раскрыть ветку (1)
7
Автор поста оценил этот комментарий

Да, алло, не могу сейчас говорить

3
Автор поста оценил этот комментарий

Я теперь не усну. Ппц восстание машин, людям растягивают лица

3
Автор поста оценил этот комментарий
Иллюстрация к комментарию
44
Автор поста оценил этот комментарий

Вы до конца не дочитали? Там же написано:

Откуда же берутся эти всплески в высокочастотных областях? Оказывается, что они неразрывно связаны с самим принципом действия генеративно-состязательных нейросетей.
...
Если же попытаться обойтись без апсемплинга, то объём вычислений, необходимых для генерации дипфейков, вырастет до астрономических величин.

Единственный вариант, не требующий увеличения вычислительных мощностей, который вижу я - изобрести нейросеть, формирующую изображение на кардинально иных принципах, но это считай всю работу сначала начинать.

раскрыть ветку (28)
27
Автор поста оценил этот комментарий

Зачем сначала? Проще обрабатывать изображение с высокочастотными всплесками другой нейросетью, которая уберет эти всплески.

раскрыть ветку (19)
40
Автор поста оценил этот комментарий

Вот потому мы и возвращаемся к началу. Уберёт всплески, да. И заставит человека на самой картинке выглядеть, как жертва десяти поколений инцеста)
Вы не забывайте, что эта тепловая карта не существует сама по себе, она неразрывно связана с конкретными деталями изображения. Меняете одно — неизбежно меняете и другое, причём довольно непредсказуемым образом.

раскрыть ветку (10)
16
Автор поста оценил этот комментарий

Частотный анализ проводится на основе содержания каждого пикселя в изображении, а не на изображённом объекте. Его можо обмануть обычным фильтром.

Таким образом, человек на картинке не может "выглядеть как жертва десяти поколений инцеста", по скольку само лицо в пост-обработке менять нет необходимости. Достаточно подровнять значение определенных пикселей. Полученное изображение будет лишь слегка размыто.


Вполне вероятно что неиросеть для постаобработки тоже не нужна. Учитывая что генерирующие неиросети оставляют опознаваемый "отпечаток", можно и более класическими методами найти фильтр который приведёт спектрограмму в нужную нам форму.


(Оригинальную публикацию не читал, эксперимент не повторял и выше написаное есть лишь моё интуитивное понимание вопроса. Если я не прав - прошу, поправьте.)

раскрыть ветку (8)
14
Автор поста оценил этот комментарий

Интуитивное понимание далеко не всегда бывает правильным, и это не тот случай) Вы в чём-то даже противоречите сами себе. «Частотный анализ проводится на основе содержания каждого пикселя» — верно. Но далее вы пишете «Достаточно подровнять значение определенных пикселей». Этих «определённых» пикселей будет почти столько, сколько всего пикселей в изображении. Именно потому, что, как вы сказали, каждый из них влияет на спектрограмму. Да, можно применить к ДКП «обычный» фильтр, который сделает ровно обратное преобразование и приведёт спектрограмму к некому образцовому виду. Но мы не можем предугадать, как это повлияет на само изображение. Скорее всего — катастрофически.
Многие здесь говорят, что нужно «просто» дообучить нейросеть дополнительно минимизировать ещё и разброс на спектрограмме. Но, если верить выводам из статьи, это ни разу не просто. При использовании архитектуры GAN мы столкнёмся с так называемой «трудной проблемой обучения», при которой нейросети нужно будет одновременно максимизировать два взаимоисключающих критерия — но она просто в в силу своей архитектуры не сможет улучшать один так, чтобы при этом не ухудшать другой. Обучение просто не сойдётся.

раскрыть ветку (7)
4
Автор поста оценил этот комментарий
Обучение просто не сойдётся.

Мы же знаем что решение существует (реальные фотографии), значит в принципе минимум для этой задачи оптимизации тоже существует. Нужно лишь найти способ быстро к нему приходить нигде не застревая по-дороге. Понятное дело, что там скорее всего ухабы и кочки, но никто не отменял методы поиска решений для таких особых случаев.

раскрыть ветку (3)
4
Автор поста оценил этот комментарий

Мы же знаем что решение существует (реальные фотографии), значит в принципе минимум для этой задачи оптимизации тоже существует. Нужно лишь найти способ быстро к нему приходить нигде не застревая по-дороге.
Мы уже знаем что для любых шифров существует ключ (иначе бы никто не смог расшифровать данные). Нужно лишь найти способ быстро его вычислять, не имея доступа к исходному тексту сообщения (С)


Ага, всё именно так.

раскрыть ветку (2)
Автор поста оценил этот комментарий

Аналогии плохие. Шифры это задача дискретная. А нейросети это задача на оптимизацию гладкой функции.

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Суть одна и та же - всё упирается в вычислительные мощности.

1
Автор поста оценил этот комментарий

"Учитывая что генерирующие неиросети оставляют опознаваемый отпечаток, можно и более класическими методами найти фильтр который приведёт спектрограмму в нужную нам форму."


Вот тут, ребята используя подобную технику снилили точность алгоритма до околонулевого значения, имея доступ к класификатору, и до 22% без доступа к класификатору.


Carlini, N. and Farid, H. Evading deepfake-image detectors with white-and black-box attacks. In IEEE Conference on Computer Vision and Pattern Recognition (CVPR) Workshops, 2020.


Картинки слева определяются классификатором как сгенерированные, справа - как настоящие.

Иллюстрация к комментарию
1
Автор поста оценил этот комментарий

Если я правильно понял идею, то если натравить программу конкретно на устранение этих паттернов, то она банально зашакалит ее, при этом нельзя будет предсказать как именно и какую часть фотографии? Я так думаю, подобные участки скорее всего будут находиться в месте где были высокие частоты и будут довольно специфическими. А если есть что-то явно указывающее на изменение, то и выявить дипфейк труда не составит, просто нужно будет найти подходящий инструмент

раскрыть ветку (1)
0
Автор поста оценил этот комментарий
Это всё не более, чем предположения, нужно пробовать )))
2
Автор поста оценил этот комментарий

10 поколений... Вы таки хотите поговорить за Габсбургов?

15
Автор поста оценил этот комментарий
Проще обрабатывать изображение с высокочастотными всплесками другой нейросетью, которая уберет эти всплески.

И при этом покоцает изображение непредсказуемым образом.

Это же преобразование, т.е. эти всплески - часть изображения. Убираешь всплески - меняется изображение. Грубо говоря, разница в звучании между mp3 в 128 кбит и 320 кбит появляется именно из-за того что в первом убрали такие "всплески", только у другого преобразования.

раскрыть ветку (7)
4
DELETED
Автор поста оценил этот комментарий

почему нельзя "сгладить" всплески?

Генерируем изображение в 4 раза больше и сжимаем? Или еще какое-то случайное, сглаживающее преобразование.

(не знаю получится ли и вообще хз..)


Только не повторяйтесь, что это "покоцает" изображение...может да...но инстаграмму нужно 200 итерраций,чтобы стало заметно.

раскрыть ветку (6)
11
Автор поста оценил этот комментарий

Нет) Вы допускаете ошибку в самом начале ваших рассуждений. «Генерируем изображение в 4 раза больше» — и ровно этим порождаем новые артефакты, заметные на спектрограмме! Посмотрите статью, там на странице 5 показано, что даже такие банальные методы апскейлинга, как nearest neighbor и bilinear, формируют ярковыраженные следы. Так что на самом деле тем преобразованием, которым вы хотите сгладить спектрограмму, вы, наоборот, сделаете её ещё более «колючей». Просто здесь нужно не путать методы, которые могут визуально сгладить результирующую картинку, и методы, которые могут сгладить спектрограмму. Как я вижу по комментариям, очень многие не видят разницы.

раскрыть ветку (4)
1
Автор поста оценил этот комментарий

Я так понимаю что он имел в виду базовое изображение, без апскейлинга :)

раскрыть ветку (2)
0
DELETED
Автор поста оценил этот комментарий

Не, имел ввиду как раз после апскелинга.

Некоторые алгоритмы сжатия "размазывают" информацию содержащуюся в одном пикселе по соседним, и казалось что это позволит "сгладить" всплески.


мои рассуждения происходили от стеганографии и методов ее детекта,  может эти задачи совсем разные;)


Anyway, спасибо за пояснения.

Ничего не понятно, но очень интересно(с).

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Так стеганография таким же методом и детектится.

0
Автор поста оценил этот комментарий
Сейчас идёт тенденция на улучшение качества снятой картинки за счёт нейронных сетей, лет через 10, почти не будет новых фотографий без такой обработки.
1
Автор поста оценил этот комментарий
Генерируем изображение в 4 раза больше и сжимаем?

Так там вся проблема в том что нейросеть генерирует основу изображения 100х100 и интерполирует. Если бы она генерировала хотя бы в оригинальном размере, то этих всплесков и так бы не было.

0
Автор поста оценил этот комментарий
А что если просто сделать снимок этого изображения?
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Думаю будет зависеть от качества снимка. Т.к. причина лежит именно в самом изображении, то чем выше качество снимка - тем больше проявится аномалия, а чем оно ниже - тем меньше в нём смысла.

0
Автор поста оценил этот комментарий

Возникновение высокочастотных всплесков в развёртке спектра картинки связано с размерами областей ретушировки ,необходимостью подбора точных тоновых характеристик.Мне кажется,что ретушировать по-другому невозможно.

DELETED
Автор поста оценил этот комментарий

Учитывая что старый смартфон тебе может лицо поменять в реалтайме, то эти астраномические величины без цифр могут быть: "вместо вашего потейтописи, вам понадобиться карта 3070"

раскрыть ветку (4)
11
Автор поста оценил этот комментарий

Авторы этого исследования использовали рабочую станцию на базе Intel XeonGold 6230 со 192 ГБ памяти и четырьмя Nvidia Quadro RTX 5000. Так что они с некоторым скепсисом смотрят на ваши утверждения про 3070)

раскрыть ветку (1)
1
Пупупу...
Автор поста оценил этот комментарий

Хеех, у них в одной видяхе оперативки как у меня на домашнем "игровом" компе. Который стоит как четверть от этой видяхи...

2
Автор поста оценил этот комментарий

степени\факториалы проходили? чрезвычайно быстро растущая функция о чем нибудь говорит?

2
Автор поста оценил этот комментарий
Не надо сравнивать привязку к лицу статичных картиночек и полноценную замену одного лица на другое на реалистично-правдоподобном уровне
3
Автор поста оценил этот комментарий
Если же попытаться обойтись без апсемплинга, то объём вычислений, необходимых для генерации дипфейков, вырастет до астрономических величин.

(с) пост

Так просто не выйдет.

5
Автор поста оценил этот комментарий

Можно не только конвертировать высокочастотные колебания в низкие, но и накладывать оригинальные шумы физической матрицы.
И да, это пара строк плюс небольшая база шумов.

раскрыть ветку (1)
3
Автор поста оценил этот комментарий
К слову да, так и не понял, что мешает наложить шум на конечный результат, а не менять алгоритм.
4
Автор поста оценил этот комментарий

Думаю да. Это как соревнование снаряда и брони, в ходе развития технологий то одно то другое будет выходить вперёд.

4
Автор поста оценил этот комментарий
Тут 3 пути. Либо суперкомпьютеры или объединение домашних компьютеров в огромную сеть (что увеличивает стоимость картинки и соответственно целесообразность ее применения ради рядового пользователя).
Вариант 2 развитие мощностей домашних пк. Вот тут все сложно. Нужен прорыв, а к нему совершенно нет предпосылок. Предпосылки наоборот к тому что мы скоро упрётся в потолок вычислительных мощностей.
Вариант 3 строить генерацию дипфейков на других принципах. Это на первый взгляд не понятно как делать.
Описанный след это как ваше днк. Попробуйте поменять определённый ген на другой более красивый. На вашей тушке это отразится очень заметно.
раскрыть ветку (3)
0
Автор поста оценил этот комментарий

Предпосылки наоборот к тому что мы скоро упрётся в потолок вычислительных мощностей.
Предпосылки к тому, что это просто не требуется.

Сравните разницу производительности p3 - p4 - c2d и между поколениями i7. В последнее время она вообще минимальная.

раскрыть ветку (2)
4
Автор поста оценил этот комментарий

Всмысле не требуется? Вот уж чего чего, а вычислительные мощности требуются ВСЕГДА.

Не зря на заре компьютеров говорили что 128 кбит хватит на все задачи что вы можете себе представить. А сейчас у меня в часах мощности больше..

1
Автор поста оценил этот комментарий
Эм... вам уже ниже ответили. Это не потому, что не требуется это потому что делать производительность выше все труднее и труднее.
1
Автор поста оценил этот комментарий

Полагаю что сгенерировать изображение, спектрограмма которой была бы как у реального фото намного сложнее чем вычислить файл размером 1 гб исходя из его хеша. Думаю что сейчас чтобы исправить вот эти вот вспышки на спектрограммах, не хватит мощности всех супер-компьютеров планеты и тысячи лет их работы.


Специалисты по криптографии могут подсказать прав ли я?

раскрыть ветку (3)
1
Автор поста оценил этот комментарий
Я не специалист по криптографии, но для генерации изображения можно либо подкорректировать функцию ошибки дискриминатора, чтобы он учитывал различия в спектограммах, либо же на изображения просто накладывать фильтр. Все это делается в несколько строчек кода и не приводит к астрономическим вычислениям.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Вы только что подорвали бизнес дипфейков картинок, в аудио анализе это применяется много лет.

0
Автор поста оценил этот комментарий

Можно только переретушировать(изменить весь объект ) .

1
Автор поста оценил этот комментарий

Соединить их вместе и получится генеративно-состязательная нейросеть

0
Автор поста оценил этот комментарий

Именно. Пост стоило назвать, найдена новая способ тренировать нейросеть так, чтобы её даже другие программы не отличали.

0
DELETED
Автор поста оценил этот комментарий
Классическое противостояние на новый лад 🤔
Автор поста оценил этот комментарий
Сказано же, что время генерации вырастет до астрономических величин
Через тернии к ГОСТу
Автор поста оценил этот комментарий

Именно. В данном случае надо просто дождаться более мощных машин, которые смогут отрисовывать такие изображения в один заход махом, а не кусочками.

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества