Стример участвовал в случайных конкурсах с помощью нейросетей. В итоге ему досталась PS5
Теперь приз обещан тому, кто выиграет в его собственном конкурсе. Чтобы сделать это, вам придется отличить творчество нейросети от настоящего.
В этой статье я попытаюсь разобрать опубликованное видео и проанализировать его содержимое для выявления ИИ. Начнем с краткого содержания:
Автор и его команда c канала Zonom попытались повторить «достижение» жителя США по имени Джейсон Аллен, о котором ранее сообщалось в новостях. Тому удалось одержать победу в крупном творческом конкурсе с помощью генерации средствами «Midjourney». По словам американца, он потратил на подборку идеального варианта большое количество времени, а также сам придумал идею и сформулировал запрос, поэтому считает присужденное ему первое место заслуженным. Сторонники противоположных мнений назвали его мошенником и заявили, что творения нейросети не должны соревноваться с картинами настоящих художников.
С того момента прошло немало времени, и нейросети уже прогремели на весь мир. Но повлияла ли общеизвестная скандальность новых средств ИИ на возможность побеждать в конкурсах? Герой видео решил это проверить.
Первый конкурс состоялся в рамках ежегодного состязания художников «Мифы рождества», организованного площадкой преподавателей рисования «FUNGI». Авторы социального эксперимента применили две разных нейросети для генерации изображений, но ни одна из них не выдала цельного качественного результата, поэтому им пришлось «склеить» удачные фрагменты.
Несмотря на вполне убедительный «рисунок», приз достался другому участнику. В итоговом разборе работы принял участие и сам директор цифровой школы рисования, но даже ему не удалось распознать фальшивку.
Организаторы второго конкурса «Монстродевочки» от студии разработки игр «Cavemen programmerz» заранее предупредили участников о недопустимости попыток нейросетевого подлога, однако это не остановило авторов эксперимента.
Общественность довольно быстро выявила фальшивые картины и все закончилось закономерным скандалом, повеселившим публику.
Третий конкурс проходил в сети магазинов «Шишка». От участников требовалась креативная фотография с символикой организатора, при этом допускалось использование средств фотомонтажа.
И хотя генерации героев видео полюбились жюри и легко прошли во второй тур, по итогу они не смогли занять первое место… По крайней мере, так было поначалу. В последний момент призовой пьедестал неожиданно претерпел изменения. Выяснилось, что главный финалист совершил так называемую «накрутку» голосов, доказательства этому были найдены самими организаторами. Состоялся пересмотр и повторное объявление победителей. На сей раз Zonom и его помощники очутились на первой строчке рейтинга. Это означало, что им достается главный приз – Playstation 5. После церемонии вручения желанный подарок был запечатлен на камеру.
На этой ноте видео плавно переходит в научно-философскую плоскость и начинает пестреть умозаключениями на тему будущего человечества, которое будет вынуждено мириться с возможностями ИИ. Но давайте пропустим пространные рассуждения и перейдем к делу: ответим на брошенный автором вызов и попробуем вычислить нейросетевой контент в опубликованном им видеоблоге. К тому же, создатель оставил для зрителей подсказку, и мы не имеем права ею пренебречь.
Музыкальный контент.
Исходя из шпаргалки, оставленной в описании, в видео могут звучать от нуля до пяти композиций, созданных не человеческими усилиями. Вариант «Все музыкальное сопровождение написано компьютером» мы не рассматриваем, потому что уже при первом просмотре встречаются некоторые узнаваемые музыкальные темы из стандартной фонотеки контентмейкеров. Возможен ли вариант «Все музыкальное сопровождение написано людьми»? Сомневаюсь, ведь это было бы скучно. Зачем устраивать эксперимент, если в наличии нет ни одного сгенерированного компьютером трека?
Идем по порядку: от легкого к сложному. Первым делом заглядываем в описание и смотрим credits, а также в инструментарии самого youtube находим распознанные треки. Таким образом мы уже отсеяли около половины всех композиций и узнали их название. Следующий шаг – задействовать SHAZAM. Но чтобы этот способ сработал, придется отсеять голос комментатора, который перекрывает музыкальное сопровождение, с помощью пресловутого vocal remover. Последний этап: дать послушать все оставшиеся под вопросом композиции человеку, занимающемуся музыкой по своему призванию. Тут самое интересное! Он сразу же уловил нейросетевые нотки в мелодии, которая играет во фрагменте с загадками для стримеров.
Последующие мелодии тоже вызвали подозрения, причем все они идут подряд в количестве трех. Неужели это и есть то самое – правильное число? Что ж, возможно, где-то на протяжении всего хронометража спрятаны еще две композиции, – но, если это так, они ничем не отличаются от живой музыки.
Визуальный контент.
На 35-ой и 36-ой минутах видео автор дает нам задание найти одну настоящую фотографию, спрятанную среди десяти искусственных. Давайте проанализируем каждую из них.
В цветочной лавке присутствуют предметы странной формы и непонятного назначения, а форма и размер полок сильно разнятся. Я не флорист, но сомневаюсь, что настоящий инвентарь выглядит так. На футболке-поло самого продавца присутствуют лишние дырки для пуговиц, фартук вызывает подозрения, а ручка окна на заднем плане резко прерывается и не имеет логичного крепления к раме. Вердикт: фальшивка.
Казалось бы, перед нами типичный сварщик. Но присмотритесь к искаженному фону. Впрочем, это не самое главное. В руках рабочего бумажный стаканчик для кофе. Вы когда-нибудь видели фастфуд-тару с керамическими ручками? Вот и я не видел. И это еще не все. Его роба не соответствует профессии, а к электродному держаку не присоединены провода. Вердикт: подделка.
Истинное происхождение черно-белой «фотографии» с девушкой за ветриной выдает неразборчивый генеративный текст на ценнике блюда, а также странный «шрам» на носу и подозрительные колтуны в волосах. Вердикт: фикция.
Улыбающийся парень выглядит достаточно правдоподобно, но есть небольшая проблема с зубами, а щетина больше похожа на трещины. Вердикт: больше склоняюсь к нейросети, но однозначного ответа дать не могу.
Псевдофотографию с волной я сразу смог нагуглить, и как оказалось, она имеет под собой целую историю, связанную с очередным конкурсом. Похоже, автор оставил для нас отсылку. Эта работа некогда тоже заняла первое место среди настоящих фотографий, однако после победы участник чистосердечно признался в использовании AI и решил вернуть присужденные ему призовые.
Ягоды в ладонях выглядит весьма убедительно. На этой фотографии я не смог обнаружить однозначных признаков присутствия «цифровой руки». Мы сможем нащупать нить истины только методом исключения, поэтому не задерживаемся и переходим к следующим вариантам. Вердикт: пока остается под вопросом.
Девушка-диджей выдает себя странным техническим устройством наушников, неживым взглядом и прочими подозрительными фрагментами. Вердикт: пожалуй, нейросеть.
Чернокожая братия имеет едва заметные проблемы с баскетбольным мячом и козырьком кепки, но самым явным признаком нейросети является неудачно сгенерированное лицо на заднем плане. Вердикт: ненастоящая фотография.
Сперва я подумал, что ангельское изваяние – это и есть та самая живая фотография, которую мы ищем. Но интуиция меня подвела. Сосчитайте пальцы на ноге. Их шесть. Вердикт: обман.
Толпа в метро смотрится очень неплохо, но чем дольше всматриваешься в изображение, тем больше возникает вопросов. Вагоны «сращиваются» со стенами, а некоторые люди будто стоят на каких-то возвышениях, ну а пара лиц и вовсе искажены. Вердикт: ну, вы сами поняли.
Забавно, что друг за другом нам были продемонстрированы лишь 10 изображений, однако на общем плане в конце фрагмента видеоряда затесалась еще одна потенциальная фотография с веснушчатой девушкой. Это простая уловка, чтобы сбить зрителя с толку. Почти нет сомнений, что это тоже нейросетевая генерация.
Итак, после всех наблюдений мы делаем вывод: правильным вариантом является горсть черешни. Пусть я и метался между двумя вариантами, все же ягоды мне импонируют больше.
Информационный контент.
Наконец-то мы добрались вплавь до знакомой мне территории. Будучи рыбой в воде, воспитанной информационными акулами в океане слов, осмелюсь заявить настолько твердо и четко, что мне позавидовал бы сам Борис Николаевич Ельцин: текст сценария к обсуждаемому видео однозначно не мог быть написан сугубо компьютером. Эпитеты, метафоры, абстракции, живая и стройная подача, сложные речевые обороты – все в наличии. Такое искусственному интеллекту не под силу… пока. Невозможно доподлинно определить, могла ли быть основа и структура повествования предложена нейросетью, а впоследствии отредактирована, или же компьютер вовсе не притрагивался к рассказу о приключениях автора. Придется выбирать из двух вариантов – словно подкинуть монетку. Пятьдесят на пятьдесят. И право подбросить эту монетку я оставляю вам.