Парадоксальный подход C2PA разработки, или как змея съела свой хвост
Почему маркировка не решает проблему дипфейков? Почему информация созданная нейросеть. это не главная проблема? Если оно не работает, зачем тогда оно существует?...
Нужно ли помечать все что связано с ИИ? На первый взгляд - да.
Идея проста: зная, что контент (будь то изображение, видео или текст) создан искусственным интеллектом, пользователь якобы сможет легче отличить реальность от вымысла. Однако действительность оказывается куда более многогранной.
В декабре 2024 года аналитический центр Center for Data Innovation опубликовал доклад «Why AI-Generated Content Labeling Mandates Fall Short», в котором авторы предлагают взглянуть на проблему с другой стороны.
Главный тезис:
Проблема интернета заключается не в отсутствии маркировки AI-контента. Проблема заключается в отсутствии доверия к происхождению цифрового контента вообще.
Это важный тезис, потому что он меняет саму постановку вопроса.
Вместо: «Как найти контент, созданный ИИ?»
Авторы предлагают спрашивать:
«Как понять происхождение любого цифрового контента?»
Главная ошибка во всей этой суматохе с ИИ-контентом - путанница двух паралллельно идущих понятий:
Достоверность контента и Происхождение контента
Чуть более понятно покажем на примерах
О достоверности контента:
Человек пишет полностью ложную статью, никакой ИИ не использовался. Контент создан человеком,но информация полностью ложна ( привет желтой прессе)
О происхождении контента
Нейросеть помогает подготовить аналитический отчёт на основе проверенных данных. Контент создан с помощью ИИ, но информация может быть абсолютно корректной.
Делаем довольно логичный вывод: Способ создания контента не определяет его достоверность. Именно поэтому авторы считают опасным формирование ложного разделения:
«контент человека = хороший»
«контент ИИ = подозрительный»
А чего там с дезинформацией и с дипфейками? Увы, маркировки не решают их проблему.
Ложная информация существовала задолго до появления нейросетей и причины распространения такого контента намного глубже:
1.эмоциональная реакция людей;
2.распространение непроверённых материалов;
3.алгоритмы социальных сетей;
4.человеческие когнитивные искажения.
К нашему(как простых обывателей интернета) сожалению маркировка AI- контента не устраняет ни одну из этих причин. Более того, пользователь может продолжать распространять ложную информацию даже тогда, когда знает, что она создана нейросетью.
С дипфейками такая же ситуация. Это особенно актуально в политике.
Представим дипфейк политика. Даже если на видео присутствует маркировка: «Создано ИИ» цель злоумышленника всё равно может быть достигнута.
Почему?
Потому что задача дипфейка часто заключается не в том, чтобы убедить всех.
Достаточно:
1.вызвать сомнения;
2.создать информационный шум;
3.испортить репутацию;
4.сформировать эмоциональную реакцию.
Маркировка сама по себе не останавливает эти процессы.
Так почему же после всего этого, нас снова возвращают к тейку о том, что разработка C2PA не просто очередной слив денег. Самая важная часть доклада 24-го года касается именно будущего цифрового доверия. Авторы доклада предлагают отказаться от идеи:
«искать плохой контент»
и перейти к идее:
«подтверждать происхождение контента».
Здесь появляется C2PA. Фактически C2PA предлагает новый подход. Не спрашивать:
«Это создано ИИ?»
А спрашивать:
«Откуда появился этот файл?»
Если пользователь может проверить: автора, дату создания, историю изменений, программное обеспечение, источник публикации, то уровень доверия к цифровой информации существенно возрастает. Или нет?