Grok генерирует NWSF без соответствующих запросов
Новый скандал с ИИ-инструментом Илона Маска
Искусственный интеллект Grok от компании xAI снова оказался в центре скандала. После недавнего инцидента, когда система называла себя "МехаГитлером" во время антисемитского сбоя, появились новые проблемы с неподобающим контентом.
Проблема с генерацией изображений знаменитостей
Журналист издания The Verge обнаружил серьезную проблему в новой видео-функции Grok Imagine. При первом же использовании система сгенерировала неприемлемые изображения Тейлор Свифт без соответствующего запроса.
Детали инцидента
Джесс Уэзербед из The Verge тестировала функцию, запросив изображение "Тейлор Свифт празднует на Coachella с парнями". Выбрав режим "spicy" (острый) из четырех доступных вариантов, она получила:
Более 30 изображений певицы в откровенной одежде
Видеоролики продолжительностью 15 секунд с неподобающим содержанием
Контент, нарушающий правила платформы X
Важно отметить: журналист не использовала никаких специальных методов обхода ограничений и не делала явных запросов на создание подобного контента.
Контекст и предыдущие проблемы
Эта ситуация особенно проблематична на фоне прошлогоднего скандала, когда платформу X наводнили дипфейки с участием Тейлор Свифт. Тогда компания заявила о "нулевой терпимости" к подобному контенту и активно удаляла нарушения.
Позиция X по безопасности
Команда X Safety ранее заявляла:
"Размещение изображений без согласия строго запрещено на X. Мы активно удаляем весь выявленный контент и принимаем соответствующие меры против ответственных аккаунтов."
Технические особенности проблемы
Что работает правильно:
Прямые запросы на неподобающий контент блокируются
Система отказывается изменять внешность знаменитостей определенными способами
Режим "spicy" корректно работает с изображениями детей, отказываясь создавать неподобающий контент
Где возникают сбои:
Косвенные запросы в режиме "spicy" могут привести к нежелательным результатам
Система "по умолчанию" генерирует неподобающий контент в нескольких случаях
Сложность разграничения между допустимым "острым" контентом для взрослых и недопустимым материалом
Правовые последствия
С введением в действие закона Take It Down Act в следующем году, платформы будут обязаны оперативно удалять изображения интимного характера, созданные без согласия, включая сгенерированные ИИ. xAI может столкнуться с юридическими последствиями, если проблемы Grok не будут устранены.
Реакция компании
Пока что X не прокомментировала отчет The Verge. Илон Маск продолжает активно продвигать Grok Imagine, призывая пользователей делиться своими "творениями" в социальных сетях.
P.S. Веду канал "ИИ съел мой код", где я делюсь новостями, практическими кейсами использования ИИ в разработке, промптами и инструментами.