5459

Найден способ уверенно распознавать дипфейки?⁠⁠

Современные нейросети умеют создавать настолько правдоподобные изображения, что их порой сложно отличить от реальных фотографий. Такие изображения, называемые дипфейками, могут быть любопытными и забавными, но лишь до тех пор, пока все понимают, что это подделка. Когда же кто-то пытается выдавать дипфейки за чистую монету, они становятся большой проблемой.

С их помощью можно нанести ущерб репутации, повлиять на общественное мнение и даже сфабриковать подложные доказательства для суда. Поэтому, как только появились нейросети, умеющие производить дипфейки, сразу началась разработка алгоритмов, которые были бы способны их распознавать.

Задача осложняется тем, что для создания дипфейков обычно используются генеративно-состязательные нейросети (Generative Adversarial Networks, GAN). Их работа изначально основана на противостоянии двух нейронных сетей, одна из которых генерирует картинки, а другая старается определить, настоящие они или нет. Обе эти сети обучены на больших массивах реальных фотографий. Если изображение выглядит неправдоподобно, вторая нейросеть заставляет первую изменять его до тех пор, пока оно не перестанет идентифицироваться как подделка.

Получается, что дипфейки изначально создаются такими, что существующие системы распознавания не могут уверенно отличить их от реальных фотографий. На сайте thispersondoesnotexist.com вы сами можете оценить, насколько правдоподобно выглядят сгенерированные нейросетью несуществующие люди.

Алгоритмы по распознаванию дипфейков обычно используют свёрточные нейронные сети, которые умеют выделять характерные признаки. Эти нейросети обучают на самих изображениях в явном виде, что требует много времени и ресурсов. Однако коллектив исследователей из Института информационной безопасности им. Хорста Гёрца при Рурском университете в Бохуме предложил более простое и изящное решение этой проблемы. Учёные решили подвергнуть изображения частотному анализу, использовав давно известный метод дискретного косинусного преобразования. Он применяется, например, в алгоритме сжатия JPEG. Изображение в этом случае рассматривается как результат наложения гармонических колебаний различной частоты, взятых с разными коэффициентами. Примерно так:

Эти коэффициенты можно визуализировать в виде прямоугольной тепловой карты, верхний левый угол которой соответствует низкочастотным областям исходного изображения, а нижний правый — высокочастотным. Реальные фотографии в основном состоят из низкочастотных колебаний.

Реальная фотография и её спектрограмма

Если же явные всплески наблюдаются в высокочастотной области, это может свидетельствовать о том, что изображение — подделка. А если они ещё и формируют регулярную структуру — тут как говорится, и к гадалке не ходи.

Дипфейк и его спектрограмма

Чтобы проверить эффективность предложенного подхода, учёные составили тестовую выборку из 10 000 изображений, куда вошли сгенерированные нейросетью StyleGAN портреты несуществующих людей и реальные фотографии из набора Flickr-Faces-HQ (FFHQ). Всё это можно найти на сайте whichfaceisreal.com. Успех был абсолютным: алгоритм распознал все дипфейки до единого!

Более того — выяснилось, что он с большой долей вероятности позволяет определить, с помощью какой именно нейросети было сгенерировано изображение. Дело в том, что каждая из них имеет свой «отпечаток» в частотном диапазоне.

Спектрограммы реальных фотографий из набора Stanford Dogs (слева) и изображений, сгенерированных нейросетями различных архитектур, которые были обучены на этом наборе (четыре справа). Усреднённые значения для 10 000 изображений

Откуда же берутся эти всплески в высокочастотных областях? Оказывается, что они неразрывно связаны с самим принципом действия генеративно-состязательных нейросетей. В основе их работы лежит процесс так называемого апсемплинга, то есть отображения данных из пространства низкой размерности в пространство высокой размерности. Например, сеть StyleGAN, создавшая все дипфейки с людьми из этого поста, формирует в пространстве данных изображение размером 1024 × 1024 пикселя (более миллиона значений) на основе вектора из скрытого пространства, имеющего размерность всего-навсего 100. Если же попытаться обойтись без апсемплинга, то объём вычислений, необходимых для генерации дипфейков, вырастет до астрономических величин.

В данной статье учёные подробно рассмотрели лишь один набор данных и одну архитектуру нейросети. Однако они утверждают, что предложенный метод универсален и будет работать не только для всех существующих сетей типа GAN, но и для тех, что появятся в будущем. Так ли это, станет ясно уже довольно скоро.

Источник

P. S. Это очередная новость с семинара «Актуальная наука» в Политехническом музее. Я буду стараться публиковать их каждую неделю.

411

Искусственный интеллект

5.7K поста11.9K подписчика

Добавить пост

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.

Разрешено:

- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.

Запрещено:

I) Невостребованный контент

I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.

II) Нетематический контент

II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

II.3) Создавать контент, входящий в противоречие с правилами Пикабу.

III) Непотребный контент

III.1) Эротика, порнография (даже с NSFW).

III.2) Жесть.

За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

Вы смотрите срез комментариев. Показать все

491

DELETED

5 лет назад

Если появился способ отличать нейросеть от реальности, значит можно научить нейросети избегать этих отличий, разве нет?

раскрыть ветку (144)

393

dobry.bobr

5 лет назад

Естественно. Надо всего лишь добавить описанный в статье анализ в набор критериев "настоящести" при генерации дипфейка.

Просто ещё один виток "гонки вооружений".

раскрыть ветку (85)

mangolodron

5 лет назад

Как говорил мой дед:

"На хитрую жопу есть хуй с винтом,

на хуй с винтом есть жопа с лабиринтом."

раскрыть ветку (5)

dobry.bobr

5 лет назад

И древние греки именно так говорили. Они были людьми практическими и широкой души, это мы из оригинального эпоса хорошо знаем.

А потом уже в Эпоху Просвещения им приписали скучный благозвучный афоризм про вечную борьбу щита и меча. :)

Khoba28

5 лет назад

Как говорил мой дед;

"Я твой дед!"

MisterMD

5 лет назад

А на жопу с лабиринтом найдётся свой Минотавр?

раскрыть ветку (1)

mangolodron

5 лет назад

Акзактли., вы поняли правило)

Snid

5 лет назад

А на каждую жопу с лабиринтом найдется хуй с путеводителем!

167

darkdogs

Справедливость 5 лет назад

только нет гарантии что для генерации изображения которое проходит этот критерий не понадобится увеличение ресурсов на порядок, или на несколько порядков, а соотвественно и стоимости. И собственно это уже будет неплохим решением проблемы.

раскрыть ветку (74)

KOCTiK.XBOCTiK

5 лет назад

Чтобы полностью нивелировать вскрытую особенность (уязвимость) конкретной нейросети (в статье предметно говорится о спектральных маркерах, их частном случае обнаружения внутри обозначенного списка нейросетей), понадобится пару десятков строчек кода на постобработке. Всё.

(Ну, и ещё пару, а может и десяток, фреймворков дополнительных в проект нейросети, но это уже детали).

раскрыть ветку (41)

darkdogs

Справедливость 5 лет назад

Так после такой постобработки может оказаться что изображение уже будет визуально не похоже на реальное. И возможно придётся менять именно подход к генерации изображений. Посмотрим.

раскрыть ветку (40)

KOCTiK.XBOCTiK

5 лет назад

Вы заблуждаетесь. Конкретно в посте речь идёт об изменениях, которые не заметны человеческому взгляду. Если речь идёт только о коррекции обозначенной уязвимости, то всё мной описанное в предыдущем комментарии -- верно. Если же авторы аналитической разработки "случайно забыли" упомянуть ещё какие-то важные подробности, то вот тогда и "посмотрим". В любом случае такие публикации хоть и полезны для развития общего кругозора, но конкретно в данном случае авторы оказали обществу медвежью услугу. Маркеры уязвимостей дипфейк-нейросетей не должны публиковаться в открытом доступе под страхом тюрьмы. Кто считает иначе, жду ваши аргументы. Но сначала хорошенько подумайте, что лично вы будете делать, если дипфейк применят против вас, и готовы ли вы смириться с возможными последствиями.

раскрыть ветку (35)

NWhisper

5 лет назад

Маркеры уязвимостей дипфейк-нейросетей не должны публиковаться в открытом доступе под страхом тюрьмы. Кто считает иначе, жду ваши аргументы

Только в реальной жизни для этого термин есть из раздела ИТ безопасности...не помню как его...короче ограничение доступа к такой информации не является её защитой.
Так как очевидно не выполняет свою функцию.
Представим ситуацию, на суде приносят фотку и говорят что она фейк/реальная. На вопрос как эксперт это определил - говорят что это закрытая информация, но вы нам верьте точно точно...какая вера такому эксперту который не может обосновать свое заключение? Ни какого.
Дальше, сокрытие информации не выполняет функцию защиты вот почему, очевидно что фейк имеет место и важность здесь и сейчас, ну то есть через неделю-год говорить что эт был фейк уже поздновато будет. Следовательно достаточно купить уязвимость нулевого дня к нейросети и утопить какого нибудь политика в говне, ведь мы же верим просто коробке а коробка говорит что эт все правда. Да коробку пофиксят через неделю но....
Так что это очередная ебанистика в духе советских секретностей, помню как пилот бывший рассказывал что летали по гугл мап ибо карты с такой точностью требовали спец допуска.

раскрыть ветку (13)

Tarindair

5 лет назад

Security through obscurity это называется. Так то вы правы.

PussInBoots501

5 лет назад

А вы знаете, как суды обычно работают с закрытой для общества информацией, ну, например, корпоративными тайнами? Суд в любом случае посвящается в детали под тем же условием неразглашения. Звучит не очень в нашей стране, но в остальных по крайней мере работает неплохо. И это совершенно точно лучше полной публичной информированности.

И да, утопить в говне - одно, посадить за решетку на основании пары фоток человека с расчлененным трупом - другое, они очень даже могут иметь важность и через неделю, и через сколько там срок за такие преступления.

раскрыть ветку (6)

NWhisper

5 лет назад

Алгоритм формирования доказательства должен раскрываться. Подписки хуиски, это не защитит, куча людей левых помимо судьи и прокурора и одно их слово и к хуям поломают вашу защиту.
Если вы и в зале суда запретите рассказывать о схеме то это просто коррупционная дыра где эксперт будет вершителем судеб не подотчетным никому.

Ну и по итогу эта схема сгниет ибо будет тайной и следовательно ни какой конкуренции ни какой критики и ни каких белых хакеров что ломают ее на выставках.

раскрыть ветку (4)

VanDerVaalc

5 лет назад

В суде все озвучивается всегда прямо - стороны имеют права знать все материалы дела. Просто при закрытом процессе сторонам запрещено за пределами заседания об этом распространяться. И то, если речь идёт о секретной информации. Не все материалы дела представляют из себя такую информацию.

ещё комментарии

PussInBoots501

5 лет назад

Закрытое заседание. Вот и всё. Это не равно тому, что всё происходящее внутри должно быть достоянием общественности. Если вам кажется, что так есть способ воспользоваться коррупцией - вам не кажется. Впрочем, скажу, видимо, одну неочевидную вещь - любую систему возможно использовать недобросовестно. Вопрос только с какой стороны это возможно сделать и кому. Любой суд это всегда коррупционная дыра, судья всегда вершитель судеб, который подотчетный у нас в стране исключительно формально, не понимаю в чем суть вашего аргумента.

Сгнивание схем не всегда плохая идея. Или вам кажется, что физики, раскрывшие информацию о ядерном синтезе военным (не важно с чьей стороны) с точки зрения общей пользы обществу сделали благое дело?

Люди уже могли бы начать делать выводы о том, к чему ведет гонка вооружений, когда все делятся всем. Но, видимо, не делают.

VanDerVaalc

5 лет назад

Вдобавок любое решение обжалуется минимум два раза, а иногда и четыре и все суды апелляционной, кассационных и надзорной инстанций имеют полный доступ к этой информации.

KOCTiK.XBOCTiK

5 лет назад

Господи, это настолько плохо, что даже хорошо. Как можно вообще сюда приплести покупку уязвимости нулевого дня в даркнете? Речь прямо о противоположном. Речь о том, чтобы не раскрывать широкой общественности (то есть тем людям, кто никак не может применить это на практике) все подробности исследования. Речь не идёт о "покупке" этой уязвимости. Я понимаю к чему вы это сказали. Дескать злоумышленники смогут купить эти закрытые данные у учёных, и сделать "идеальный дипфейк", и далее по тексту. Но это всё в огороде бузина, а в Киеве дядька. В реальности теперь обозначенные в посте дипфейк-нейросети просто исправят уязвимость. А исправляется она, как я уже писал, в десяток строчек кода.

Начали вы вроде как за здравие, подняли вопрос сертификации экспертов (которые вообще-то не раскрывают подробностей своей деятельности как например в экспертном заключении об анализе днк на соответствие образцу вам никто подробно не рассказывает о секвенировании), но закончили речь за упокой. Печаль-беда.

раскрыть ветку (4)

DELETED

5 лет назад

При шифровании: алгоритм должен оставаться стойким даже в случае компрометации (утечки алгоритма открытый доступ).

В общем - если даже со знанием алгоритма(нейронки) нельзя взломать дипфейк - тогда дипфейк хороший.

Алгоритмы шифрования потому и развиваются: код открыт... и никто никому ничего не запрещает исследовать и публиковать.

А компании по инф безопасности и так разбогатеюь на алгоритмах детекта.

Но это приведет только к тому, что богатые смогут детектить...а у кого денег нет - не смогут детектить...или смогут но хуже.

NWhisper

5 лет назад

Речь о том что во первых купить можно всех. Во вторых доверия эксперту который не раскрывает основу длыэя выводов нет. Следовательно в том же суде присяжных ему надо будет показать картинки и сказать что на них и что обозначает а потом иди следи чтоб десяток присяжных нигде ничего не слил даже в разговоре устном.

раскрыть ветку (1)

VanDerVaalc

5 лет назад

В РФ присяжные судят только при согласии подсудимого. Поэтому они не судят почти никогда. А если процесс связан с гостайной, то все участники процесса получают допуск к гостайне. Включая присяжных, по идее, но я ещё ни разу о таких процессах не слышал.

NikAlexGen

5 лет назад

Десяток строчек кода, давай, мешок с костями

ещё комментарии

darkdogs

Справедливость 5 лет назад

Серьезно? Тут как раз показана концептуальная проблема текущих подходов генерации. Когда все изображение генерируется из небольшого вектора начальных данных, а потом шлифуется. По сути научились выявлять паттерны указывающие на то что был применён именно этот подход. Чтобы обмануть выявление, нужно или менять подход или усложнять начальные данные (что требует увеличение вычислительных ресурсов)

раскрыть ветку (8)

KOCTiK.XBOCTiK

5 лет назад

Я повторю, теперь о том что области генерации оставляют спектральный паттерн известно всем заинтересованным. Внимание! Речь идёт о СПЕКТРАЛЬНЫХ МАРКЕРАХ, для ЧЕЛОВЕЧЕСКОГО взгляда ОНИ НЕРАЗЛИЧИМЫ! Если бы они были различимы для человеческого взгляда, вы бы их сразу на фото видели. Теперь же просто "синтетику" паттернов потрут отдельным алгоритмом смешивания и последующей коррекции энтропии проблемных участков.

раскрыть ветку (7)

Jsrr

5 лет назад

Зачем подтирать если можно просто напечатать фотографию на которой никакие спектрограммы нее видны

TYZzzz

5 лет назад

Теперь же просто

Не просто. Как в самом посте написано. Либо использовать кратно большие мощности, либо делать принципиально новый алгоритм. И то и то КРАЙНЕ сложно выполнимо. Так что 99.99% людей мира не могут сейчас сделать дипфейк и не спалится. Для любого обывателя этого вполне достаточно. В конце концов мы же не про фсб/цру говорим...

P.S. Это уязвимость метода. Её принципиально не поправить "заплаткой".

раскрыть ветку (5)

goofinator

5 лет назад

Эмм низкочастотная фильтрация полученного изображения?

VanDerVaalc

5 лет назад

Печать+фото разве не решают эту проблему?

раскрыть ветку (3)

DarknessPaladin

5 лет назад

Нет. Стеганографическая цифровая подпись, внедрённая в картинку, не видна глазом, но отлично распознаётся с отсканированной распечатки. Чтобы её подавить тупо "в лоб", надо очень серьёзно "зарезать" качество картинки — либо надо знать алгоритм её внедрения, чтобы целенаправленно искать внесённые подписью искажения и уничтожать их.

Тут аналогично. Либо серьёзно давить качество, либо ковырять алгоритм, чтобы научиться целенаправленно уничтожать маркеры, распознаваемые алгоритмом.

Serathil

5 лет назад

А потом отсканировать. И вуаля - чистая картинка.

раскрыть ветку (1)

GrafOrloff

5 лет назад

Маркеры уязвимостей дипфейк-нейросетей не должны публиковаться в открытом доступе под страхом тюрьмы.

Но почему?

раскрыть ветку (6)

DarknessPaladin

5 лет назад

Потому что если никто не знает, что ключ под ковриком — дверь открыть никто не сможет!
Типичная узколобая логика вояк и спецслужб. Вместо надёжного алгоритма, который безопасен потому, что в нём нет дыр — секретный алгоритм, который "безопасен" потому, что вроде бы пока никто не знает, где в нём дыры.

раскрыть ветку (5)

GrafOrloff

5 лет назад

При чём тут вояки и спецслужбы, не понимаю.

Речь ведь идёт об обнародовании способа однозначной идентификации поддельных картинок.

Тот человек по неизвестной мне причине считает, что давать людям возможность распознать фальшивку нельзя.

раскрыть ветку (4)

DarknessPaladin

5 лет назад

Вояки и спецслужбы при том, что это у них понимание защиты такое: вместо использования безопасных публичных алгоритмов, в которых безопасность обеспечена отсутствием уязвимостей, они полагают нужным и достаточным просто засекретить алгоритм, чтоб снизить вероятность нахождения уязвимостей.

Вот и этот человек так же: он считает, что вместо публикации уязвимости, что приведет к её устранению, нужно просто запретить публикацию, чтоб о уязвимости никто не узнал — тогда и устранять её не понадобится.

раскрыть ветку (3)

GrafOrloff

5 лет назад

Вояки и спецслужбы при том, что это у них понимание защиты такое: вместо использования безопасных публичных алгоритмов, в которых безопасность обеспечена отсутствием уязвимостей

Речь не о военных разработках, а о поделках частных энтузиастов.

И речь не о безопасности продукта, а о выявлении фальшивок, изготовленных с применением такового продукта.

Вот и этот человек так же: он считает, что вместо публикации уязвимости, что приведет к её устранению

В устранении этой т.н. "уязвимости" заинтересованы лишь те, кто имеет желание предотвратить распознавание фальшивок.

Соответственно, если уязвимость опубликовать, то выявление фальшивок упрощается.

раскрыть ветку (2)

777sigma

5 лет назад

Мой аргумент: " Разогнать гонку дипфейков и контрмер к ним до такого уровня, что создание не отличимых фейков станет невозможным без суперкомпьютеров за десятки миллионов $"

раскрыть ветку (2)

NikAlexGen

5 лет назад

Что за блядские манеры - дать идею куда вбухать бабла , которое не твое, с наименьшим профитом? Вот нахуя? Что проблем мало? Пенсии охунные, люди добрые?

раскрыть ветку (1)

777sigma

5 лет назад

@moderator, провокация.

DerrickMed

5 лет назад

По моему в самой статье ясно дали понять откуда ноги растут
"В основе их работы лежит процесс так называемого апсемплинга, то есть отображения данных из пространства низкой размерности в пространство высокой размерности. Например, сеть StyleGAN, создавшая все дипфейки с людьми из этого поста, формирует в пространстве данных изображение размером 1024 × 1024 пикселя (более миллиона значений) на основе вектора из скрытого пространства, имеющего размерность всего-навсего 100. Если же попытаться обойтись без апсемплинга, то объём вычислений, необходимых для генерации дипфейков, вырастет до астрономических величин. "
Так что никакой парой строчек кода это не плфиксить, это нужны мощные компы.

trapwalker

5 лет назад

Если дипфейк применят ко мне, значит кому-то это выгодно. Я сделаю соответствующие выводы, расскажу кому смогу про дипфейк, "подстелю" где нужно "соломки", и... вздохну свободнее!
Есть два мира: в одном, если ты на видео творишь какую-то дичь или просто что-то предосудительное в некоторых кругах, то либо кто-то отвалил огромные бабки за фальсификацию (что, согласитесь, не всегда правдоподобно), либо на видео действительно ты и репутации жопа.
Во втором мире, если ты оказался героем компромата, то всегда можно сказать (и продемонстрировать), что за три копейки можно соорудить такой дипфейк, а я -- не я и жопа не моя!

В этом плане мир не сильно изменится. Недавно то же самое происходило с записью голоса, а до того с фотографией, которую куда проще ретушировать, чем видео... Когда-нибудь и ДНК тест перестанет быть таким уж надёжным.

Так вот, если кто-то применил против меня дипфейк, значит это стало достаточно дешево (ведь кому я, нахрен, нужен). Хорошо, что это произошло не в переходный период, пока большинство верит видеороликам, но многие уже "умеют в дипфейк". Переходный период пройдёт, не так уж он и долог, а мы будем жить в новом мире. Мы каждый день живём немножко в новом мире. Без паники.

А ещё помните как в мультике? "Если все в клетках, то мне-то она зачем?" Люди смогут творить больше дичи, ведь надёжно доказать, что это не дипфейк уже не так просто. Люди станут проще относиться к наготе, поскольку сделать правдоподобный ролик про любого человека не проблема, даже от оригинала хрен отличишь.
Негативный аспект тоже есть: камеры наблюдения и без того были весьма бесполезными в идентификации, а теперь им совсем доверия не будет. Регистраторы на автомобилях будет проще оспаривать, что добавит мороки законопослушиным гражданам.

Riffrider

5 лет назад

Тут нейросети даже фотошоп вычисляют, а вы хотите, чтобы видеозаписи были неотличимы от реальности (хотя там достаточно в 99 процентах просто присмотреться)

fellingsbro

5 лет назад

Посмотрите как работают отрисовщики документов для фрода. Накладывается шум если по простому. И отличить невозможно. Ну или сфоткать с экрана айпада

bloodymc

5 лет назад

Достаточно пройтись ФНЧ по такому изображению, чтобы стереть маркеры. ФНЧ применительно к изображениям - это размытие. Только слабое, почти не заметное глазу.

раскрыть ветку (1)

DarknessPaladin

5 лет назад

Не, нифига. Слабое размытие эффекта не даст. Маркеры пропадут только после того, как изображение будет фактически уничтожено.

dobry.bobr

5 лет назад

По сути.

Имеется самообучающийся алгоритм.

Ему была дана куча фото реальных людей с указанием что "вот такие картинки — правильные".

Чтобы победить описываемый в статье анализ, надо к каждому фото приложить спектрограмму и расширить обучение указанием "вот такие картинки с вот такими спектрограммами — правильные". Обучение усложнится чисто количественно за счёт потребности в анализе не только фото, но и его спектрограммы, а так же за счёт потребности в просчёте спектрограмм для генерируемых "картинок-кандидатов". Оба эти фактора усложнения не выглядят принципиально усложняющими процесс.

раскрыть ветку (4)

bl00m

5 лет назад

Вы как сова из анекдота - стратег.

Чтобы решить описываемую проблему, надо от уровня "вот есть магия, и она делает магию с кривульками, надо с магией поговорить, показать ей кривульки и строго-настрого запретить их делать, и все станет красиво" дойти до реального понимания длинных слов в посте.

раскрыть ветку (2)

dobry.bobr

5 лет назад

уровня "вот есть магия

Балда, это называется идея и общая архтектура.

раскрыть ветку (1)

bl00m

5 лет назад

Я ж говорю - стратег)

Попробую и я в идеи: от каждого по возможностям, каждому по потребностям!

А вы там на местах уже зашлифуете шероховатости..

DELETED

5 лет назад

Алилуйя! Глас разума! А то вдруг "радикально усложнит", "потребуется рост мощностей", "гигантский объем кода"... Просто одно новое условие, причем в конце списка предыдущих, и все.

Silencehardik

5 лет назад

об этом в статье и написано

BLAHAJ

5 лет назад

Так где ваши квантовые компуктеры?

nstorm

5 лет назад

Тут уже вопрос можно решить простой пост-обработкой изображения для убирания данных "артефактов", много ресурсов не потребуется.

раскрыть ветку (7)

BootSect

5 лет назад

Если бы науку двигали комментаторы на Пикабу, мы бы уже, наверное, давно Марс колонизировали) Всё просто же!

раскрыть ветку (6)

nstorm

5 лет назад

Банальный фильтр для растрового изображения. Тоже самое, что в большинстве редакторов изображений можно сделать вручную, тут будет с десяток строк кода на питоне том же. Чтобы обойти детектор для начала хватит. Умнее что уже дальнейшее развитие и игра с фильтрами.

PS: Кстати человеком визуально большинство изображений StyleGAN легко распознать - там артефакты около волос видны. Во всяком случае на https://www.whichfaceisreal.com/ по артефактам на переходе лица и фона я на 100% угадываю.

раскрыть ветку (1)

NikAlexGen

5 лет назад

Код, дайте код!!!

NikAlexGen

5 лет назад

Уже назад бы землю пикабуцнули с Марса!

MudroeMurlo

5 лет назад

Ебать ты умный. А в голову не приходит, что комментатор на пикабу может быть и учёный, и инженер, и программист? Я вот двигаю искусство и геймдев,например.

раскрыть ветку (2)

BootSect

5 лет назад

Чувак, ты такой классный! Но пирожков у меня на полке нет.

раскрыть ветку (1)

MudroeMurlo

5 лет назад

Сам тащусь с себя. Сочувствую твоей ситуации с пирожками, держись там.

MudroeMurlo

5 лет назад

нет гарантии что то что ты сказал не полная чушь. А я гарантирую что это чушь

раскрыть ветку (15)

Dominic.Decocco

5 лет назад

Что ты несешь?

раскрыть ветку (14)

MudroeMurlo

5 лет назад

а, странно не в ту ветку написал. Я про это:

только нет гарантии что для генерации изображения которое проходит этот критерий не понадобится увеличение ресурсов на порядок, или на несколько порядков, а соотвественно и стоимости. И собственно это уже будет неплохим решением проблемы.

какое нахер "увеличение ресурсов на порядок или на несколько порядков". Речь идёт об артефактах, неких метриках, по которым можно определить, что поток сгенерирован нейронное сетью ( а точнее конкретной имплементацией). Как только об этих метриках стало известно их можно устранить очень легко на уровне генерации самого потока. Тут даже не надо переучивать нейронку. Но даже если и надо будет переучивать это будут не порядки увелечения ресурсов, а те же самые ресурсы просто с некоторыми другими параметрами. Чувак просто в лужу пёрнул, даже примерно не понимая о чем говорит.

раскрыть ветку (13)

NikAlexGen

5 лет назад

Просвети, о светоч мудрости!

Dominic.Decocco

5 лет назад

"Как только об этих метриках стало известно их можно устранить очень легко на уровне генерации самого потока"

Пруф на это можно?

Потому как ниже пишут, что архитектура ГАНов не факт что позволит такое сделать. И их слова что-то поубедительнее выглядят

раскрыть ветку (10)

MudroeMurlo

5 лет назад

Да нет тут пруфов. Тут статья уровня кликбейта для обывателей. Изначально задача ставилась "получить картинку, которая выглядит на глаз как фотография". Поэтому если её изучать всяким спектральными анализами, будут видны артефакты работы алгоритма. Как только задача расширится до того, чтобы "получить картинку, которая выглядит на глаз и для спектрального анализа как фотография" будет сразу фейл этих алгоритмов детекции. Грубо говоря надо добавить при обучении еще один параметр для исходных фотографий - "спектральная карта картинки". Это если всё совсем правильно делать. А скорее всего просто при рендеринге выходной картинки фиксится без переучивания сети, применением фильтров в областях которые дают "всплески в высокочастотных областях"

раскрыть ветку (7)

bl00m

5 лет назад

Точит МудроеМурло на токарном станке цилиндры втемную. Но люди не дураки, спектральный анализ узнал в цилиндре цилиндр.

Раскрыт заговор.

Но Мурло не зря мудрое. "Гавно вопрос!" - воскликнуло оно, - "Будем на токарном станке точить кубы!"

Это к тому, что инструмент зачастую определяет результат.

раскрыть ветку (6)

MudroeMurlo

5 лет назад

Во-первых ты прав, используя осторожно наречие "зачастую". Которое даже не говорит на сколько часто. Во-вторых ты пошёл по скользкой дорожке метафор и аналогий, чтобы аргументировать свою скудную мысль. Как результат ты даже не в лужу пернул, как чувак, который написал про "увеличение ресурсов на порядки по причине что нет гарантии", а сразу жиденько обосрался. Вместо своей попытки язвить, рекомендую по фактам идти и использовать рациональное мышление, вместо аналогий. Может тогда получится разговаривать по существу с тобой. Тут инструмент под задачу создаёт человек, если кратко, дурачок.

раскрыть ветку (5)

bl00m

5 лет назад

Ты груб и глуп. Нет желания с тобой общаться.

"Мудрое" можешь смело убирать.

раскрыть ветку (4)

MudroeMurlo

5 лет назад

Комментарий удален. Причина: оскорбления, грубое общение и провокации

раскрыть ветку (3)

Moderator1337

TH1RT3EN 5 лет назад

Здравствуйте.

Прошу Вас в дальнейшем воздержаться от подобного рода высказываний в сторону пользователей ресурса. Предупреждение Вам с занесением в профиль, та как у Вас ранее не было никаких нарушений и предупреждений. Теперь к Вашему аккаунту будет повышенное внимание при обработке призывов.

раскрыть ветку (1)

MudroeMurlo

5 лет назад

да без проблем, просто бесят тупорылые существа =)

bl00m

5 лет назад

@moderator, тут #4.3 по идее. Спасибо.

DELETED

5 лет назад

Не будут устраняться артефакты. Это невозможно. Просто из миллиардов фото будут ещё отсеиваться и фото с артефактами. Все.

раскрыть ветку (1)

nrk45136

5 лет назад

Я тебе даже больше скажу - по разнице "карт" артефактов и среднестатистической картинки будет выполняться обратное преобразование, результатом которого и будут те незаметные для глаза особенности изображения. Вычесть их - и всё. Это на много порядков дешевле модификации нейросети.

TYZzzz

5 лет назад

Как я понял, на текущий момент сети работают с кусочком изображения.

Пусть например 100х100. Всё изображение 300х300. Так вот. Тут говориться что метод имеет не линейную зависимость сложности обсчёта от размера. И что бы сгенирировать современную картинку 1080р "одним куском" нужны просто дикие мощности. Да, можно компенсировать это временем, но даже так. Предположим 1 фейк за 5 лет работы домашнего компа - это не то что будет делать обыватель. Да и смысла такие видео иметь будут куда как меньше. Проще уж актёров нанять и загримировать..

ещё комментарии

pizdobolovich

5 лет назад

Есть гарантия- один санный раз вложится в обучение сети это не будет стоить увелечение стоимости обработки для клиента( написать алгоритм обучения 1000-10000 долларов, чем дороже тем меньше средств на само обучение)

orcabomber

5 лет назад

Или просто фотографировать сгенерированную фотографию.

раскрыть ветку (2)

SuperTurbopes

5 лет назад

И отсканировать распечатанное фото, которое получилось при фотографировании)

Phill4Perm

5 лет назад

Потрясающий ход.jpg

0xFFFFFF

5 лет назад

Ну не совсем, то что описано в статье это не посредственно эффект самой генерации , но не чего не мешает исправить эти погрешности на пост обработке , думаю даже без нейросетей можно будет обойтись.

dimoshan

5 лет назад

Да вы и сами можете отличить зачастую

раскрыть ветку (11)

Rattory

5 лет назад

Там еще есть нейросеть, генерирующая котов, которая по факту генерирует мемы. И нейросеть, генерирующая лошадей, а по факту монстров для фэнтзийных РПГ. Наслаждайтесь:

раскрыть ветку (2)

Gurvin

5 лет назад

Как перестать рыдать от смеха?

MaXaXaM

5 лет назад

zmeeeb

5 лет назад

Жизненно, когда друзья залезают в кадр

раскрыть ветку (1)

dimoshan

5 лет назад

Да ваще, жесть)))

Soliance

5 лет назад

Puirf

5 лет назад

Я такое нарандомил

forsag1n

5 лет назад

раскрыть ветку (1)

LeTraceurSnork

5 лет назад

Да, алло, не могу сейчас говорить

Gurvin

5 лет назад

Я теперь не усну. Ппц восстание машин, людям растягивают лица

tatboy

5 лет назад

plMex

5 лет назад

Вы до конца не дочитали? Там же написано:

Откуда же берутся эти всплески в высокочастотных областях? Оказывается, что они неразрывно связаны с самим принципом действия генеративно-состязательных нейросетей.

...

Если же попытаться обойтись без апсемплинга, то объём вычислений, необходимых для генерации дипфейков, вырастет до астрономических величин.

Единственный вариант, не требующий увеличения вычислительных мощностей, который вижу я - изобрести нейросеть, формирующую изображение на кардинально иных принципах, но это считай всю работу сначала начинать.

раскрыть ветку (28)

flowwolf

5 лет назад

Зачем сначала? Проще обрабатывать изображение с высокочастотными всплесками другой нейросетью, которая уберет эти всплески.

раскрыть ветку (19)

BootSect

5 лет назад

Вот потому мы и возвращаемся к началу. Уберёт всплески, да. И заставит человека на самой картинке выглядеть, как жертва десяти поколений инцеста)
Вы не забывайте, что эта тепловая карта не существует сама по себе, она неразрывно связана с конкретными деталями изображения. Меняете одно — неизбежно меняете и другое, причём довольно непредсказуемым образом.

раскрыть ветку (10)

Bart131095

5 лет назад

Частотный анализ проводится на основе содержания каждого пикселя в изображении, а не на изображённом объекте. Его можо обмануть обычным фильтром.

Таким образом, человек на картинке не может "выглядеть как жертва десяти поколений инцеста", по скольку само лицо в пост-обработке менять нет необходимости. Достаточно подровнять значение определенных пикселей. Полученное изображение будет лишь слегка размыто.

Вполне вероятно что неиросеть для постаобработки тоже не нужна. Учитывая что генерирующие неиросети оставляют опознаваемый "отпечаток", можно и более класическими методами найти фильтр который приведёт спектрограмму в нужную нам форму.

(Оригинальную публикацию не читал, эксперимент не повторял и выше написаное есть лишь моё интуитивное понимание вопроса. Если я не прав - прошу, поправьте.)

раскрыть ветку (8)

BootSect

5 лет назад

Интуитивное понимание далеко не всегда бывает правильным, и это не тот случай) Вы в чём-то даже противоречите сами себе. «Частотный анализ проводится на основе содержания каждого пикселя» — верно. Но далее вы пишете «Достаточно подровнять значение определенных пикселей». Этих «определённых» пикселей будет почти столько, сколько всего пикселей в изображении. Именно потому, что, как вы сказали, каждый из них влияет на спектрограмму. Да, можно применить к ДКП «обычный» фильтр, который сделает ровно обратное преобразование и приведёт спектрограмму к некому образцовому виду. Но мы не можем предугадать, как это повлияет на само изображение. Скорее всего — катастрофически.
Многие здесь говорят, что нужно «просто» дообучить нейросеть дополнительно минимизировать ещё и разброс на спектрограмме. Но, если верить выводам из статьи, это ни разу не просто. При использовании архитектуры GAN мы столкнёмся с так называемой «трудной проблемой обучения», при которой нейросети нужно будет одновременно максимизировать два взаимоисключающих критерия — но она просто в в силу своей архитектуры не сможет улучшать один так, чтобы при этом не ухудшать другой. Обучение просто не сойдётся.

раскрыть ветку (7)

us9000

5 лет назад

Обучение просто не сойдётся.

Мы же знаем что решение существует (реальные фотографии), значит в принципе минимум для этой задачи оптимизации тоже существует. Нужно лишь найти способ быстро к нему приходить нигде не застревая по-дороге. Понятное дело, что там скорее всего ухабы и кочки, но никто не отменял методы поиска решений для таких особых случаев.

раскрыть ветку (3)

plMex

5 лет назад

Мы же знаем что решение существует (реальные фотографии), значит в принципе минимум для этой задачи оптимизации тоже существует. Нужно лишь найти способ быстро к нему приходить нигде не застревая по-дороге.

Мы уже знаем что для любых шифров существует ключ (иначе бы никто не смог расшифровать данные). Нужно лишь найти способ быстро его вычислять, не имея доступа к исходному тексту сообщения (С)

Ага, всё именно так.

раскрыть ветку (2)

us9000

5 лет назад

Аналогии плохие. Шифры это задача дискретная. А нейросети это задача на оптимизацию гладкой функции.

раскрыть ветку (1)

plMex

5 лет назад

Суть одна и та же - всё упирается в вычислительные мощности.

Bart131095

5 лет назад

"Учитывая что генерирующие неиросети оставляют опознаваемый отпечаток, можно и более класическими методами найти фильтр который приведёт спектрограмму в нужную нам форму."

Вот тут, ребята используя подобную технику снилили точность алгоритма до околонулевого значения, имея доступ к класификатору, и до 22% без доступа к класификатору.

Carlini, N. and Farid, H. Evading deepfake-image detectors with white-and black-box attacks. In IEEE Conference on Computer Vision and Pattern Recognition (CVPR) Workshops, 2020.

Картинки слева определяются классификатором как сгенерированные, справа - как настоящие.

Vizmar

5 лет назад

Если я правильно понял идею, то если натравить программу конкретно на устранение этих паттернов, то она банально зашакалит ее, при этом нельзя будет предсказать как именно и какую часть фотографии? Я так думаю, подобные участки скорее всего будут находиться в месте где были высокие частоты и будут довольно специфическими. А если есть что-то явно указывающее на изменение, то и выявить дипфейк труда не составит, просто нужно будет найти подходящий инструмент

раскрыть ветку (1)

D1mitry

5 лет назад

Это всё не более, чем предположения, нужно пробовать )))

Gurvin

5 лет назад

10 поколений... Вы таки хотите поговорить за Габсбургов?

plMex

5 лет назад

Проще обрабатывать изображение с высокочастотными всплесками другой нейросетью, которая уберет эти всплески.

И при этом покоцает изображение непредсказуемым образом.

Это же преобразование, т.е. эти всплески - часть изображения. Убираешь всплески - меняется изображение. Грубо говоря, разница в звучании между mp3 в 128 кбит и 320 кбит появляется именно из-за того что в первом убрали такие "всплески", только у другого преобразования.

раскрыть ветку (7)

DELETED

5 лет назад

почему нельзя "сгладить" всплески?

Генерируем изображение в 4 раза больше и сжимаем? Или еще какое-то случайное, сглаживающее преобразование.

(не знаю получится ли и вообще хз..)

Только не повторяйтесь, что это "покоцает" изображение...может да...но инстаграмму нужно 200 итерраций,чтобы стало заметно.

раскрыть ветку (6)

BootSect

5 лет назад

Нет) Вы допускаете ошибку в самом начале ваших рассуждений. «Генерируем изображение в 4 раза больше» — и ровно этим порождаем новые артефакты, заметные на спектрограмме! Посмотрите статью, там на странице 5 показано, что даже такие банальные методы апскейлинга, как nearest neighbor и bilinear, формируют ярковыраженные следы. Так что на самом деле тем преобразованием, которым вы хотите сгладить спектрограмму, вы, наоборот, сделаете её ещё более «колючей». Просто здесь нужно не путать методы, которые могут визуально сгладить результирующую картинку, и методы, которые могут сгладить спектрограмму. Как я вижу по комментариям, очень многие не видят разницы.

раскрыть ветку (4)

plMex

5 лет назад

Я так понимаю что он имел в виду базовое изображение, без апскейлинга :)

раскрыть ветку (2)

DELETED

5 лет назад

Не, имел ввиду как раз после апскелинга.

Некоторые алгоритмы сжатия "размазывают" информацию содержащуюся в одном пикселе по соседним, и казалось что это позволит "сгладить" всплески.

мои рассуждения происходили от стеганографии и методов ее детекта, может эти задачи совсем разные;)

Anyway, спасибо за пояснения.

Ничего не понятно, но очень интересно(с).

раскрыть ветку (1)

plMex

5 лет назад

Так стеганография таким же методом и детектится.

D1mitry

5 лет назад

Сейчас идёт тенденция на улучшение качества снятой картинки за счёт нейронных сетей, лет через 10, почти не будет новых фотографий без такой обработки.

plMex

5 лет назад

Генерируем изображение в 4 раза больше и сжимаем?

Так там вся проблема в том что нейросеть генерирует основу изображения 100х100 и интерполирует. Если бы она генерировала хотя бы в оригинальном размере, то этих всплесков и так бы не было.

3a4em86

5 лет назад

А что если просто сделать снимок этого изображения?

раскрыть ветку (1)

plMex

5 лет назад

Думаю будет зависеть от качества снимка. Т.к. причина лежит именно в самом изображении, то чем выше качество снимка - тем больше проявится аномалия, а чем оно ниже - тем меньше в нём смысла.

ZATOOMUCH

5 лет назад

Возникновение высокочастотных всплесков в развёртке спектра картинки связано с размерами областей ретушировки ,необходимостью подбора точных тоновых характеристик.Мне кажется,что ретушировать по-другому невозможно.

DELETED

5 лет назад

Учитывая что старый смартфон тебе может лицо поменять в реалтайме, то эти астраномические величины без цифр могут быть: "вместо вашего потейтописи, вам понадобиться карта 3070"

раскрыть ветку (4)

BootSect

5 лет назад

Авторы этого исследования использовали рабочую станцию на базе Intel XeonGold 6230 со 192 ГБ памяти и четырьмя Nvidia Quadro RTX 5000. Так что они с некоторым скепсисом смотрят на ваши утверждения про 3070)

раскрыть ветку (1)

KamOK

Пупупу... 5 лет назад

Хеех, у них в одной видяхе оперативки как у меня на домашнем "игровом" компе. Который стоит как четверть от этой видяхи...

rexarizma

5 лет назад

степени\факториалы проходили? чрезвычайно быстро растущая функция о чем нибудь говорит?

Riddlenigma

5 лет назад

Не надо сравнивать привязку к лицу статичных картиночек и полноценную замену одного лица на другое на реалистично-правдоподобном уровне

sacredsalmon

5 лет назад

Если же попытаться обойтись без апсемплинга, то объём вычислений, необходимых для генерации дипфейков, вырастет до астрономических величин.

(с) пост

Так просто не выйдет.

AUF77

5 лет назад

Можно не только конвертировать высокочастотные колебания в низкие, но и накладывать оригинальные шумы физической матрицы.
И да, это пара строк плюс небольшая база шумов.

раскрыть ветку (1)

absurdlogik

5 лет назад

К слову да, так и не понял, что мешает наложить шум на конечный результат, а не менять алгоритм.

rickardo

5 лет назад

Думаю да. Это как соревнование снаряда и брони, в ходе развития технологий то одно то другое будет выходить вперёд.

mr.igrok

5 лет назад

Тут 3 пути. Либо суперкомпьютеры или объединение домашних компьютеров в огромную сеть (что увеличивает стоимость картинки и соответственно целесообразность ее применения ради рядового пользователя).
Вариант 2 развитие мощностей домашних пк. Вот тут все сложно. Нужен прорыв, а к нему совершенно нет предпосылок. Предпосылки наоборот к тому что мы скоро упрётся в потолок вычислительных мощностей.
Вариант 3 строить генерацию дипфейков на других принципах. Это на первый взгляд не понятно как делать.
Описанный след это как ваше днк. Попробуйте поменять определённый ген на другой более красивый. На вашей тушке это отразится очень заметно.

раскрыть ветку (3)

plMex

5 лет назад

Предпосылки наоборот к тому что мы скоро упрётся в потолок вычислительных мощностей.

Предпосылки к тому, что это просто не требуется.

Сравните разницу производительности p3 - p4 - c2d и между поколениями i7. В последнее время она вообще минимальная.

раскрыть ветку (2)

TYZzzz

5 лет назад

Всмысле не требуется? Вот уж чего чего, а вычислительные мощности требуются ВСЕГДА.

Не зря на заре компьютеров говорили что 128 кбит хватит на все задачи что вы можете себе представить. А сейчас у меня в часах мощности больше..

mr.igrok

5 лет назад

Эм... вам уже ниже ответили. Это не потому, что не требуется это потому что делать производительность выше все труднее и труднее.

Alexnvkz

5 лет назад

Полагаю что сгенерировать изображение, спектрограмма которой была бы как у реального фото намного сложнее чем вычислить файл размером 1 гб исходя из его хеша. Думаю что сейчас чтобы исправить вот эти вот вспышки на спектрограммах, не хватит мощности всех супер-компьютеров планеты и тысячи лет их работы.

Специалисты по криптографии могут подсказать прав ли я?

раскрыть ветку (3)

megatka

5 лет назад

Я не специалист по криптографии, но для генерации изображения можно либо подкорректировать функцию ошибки дискриминатора, чтобы он учитывал различия в спектограммах, либо же на изображения просто накладывать фильтр. Все это делается в несколько строчек кода и не приводит к астрономическим вычислениям.

раскрыть ветку (1)

ZATOOMUCH

5 лет назад

Вы только что подорвали бизнес дипфейков картинок, в аудио анализе это применяется много лет.

ZATOOMUCH

5 лет назад

Можно только переретушировать(изменить весь объект ) .

IceBoxSpaceToo

5 лет назад

Соединить их вместе и получится генеративно-состязательная нейросеть

us9000

5 лет назад

Именно. Пост стоило назвать, найдена новая способ тренировать нейросеть так, чтобы её даже другие программы не отличали.

DELETED

5 лет назад

Классическое противостояние на новый лад 🤔

BasBasoff

5 лет назад

Сказано же, что время генерации вырастет до астрономических величин

Engineer52

Через тернии к ГОСТу 5 лет назад

Именно. В данном случае надо просто дождаться более мощных машин, которые смогут отрисовывать такие изображения в один заход махом, а не кусочками.

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку

Правила сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества