Что происходит с законодательством вокруг ИИ?
Далеко не всем авторам контента нравится, что ИИ тренируют на их трудах: книгах, фильмах и видео, кадрах из игр. Ведь обученный таким образом ИИ сам начинает создавать контент, в чем-то копируя стиль исходников. Но с другой стороны — а сильно ли такое обучение отличается от того, как учатся люди? Вряд ли какому-то писателю придет в голову запрещать читать его книжки в детском садике потому, что дети вырастут и один из них станет автором даже лучше и успешнее.
В США есть закон о добросовестном использовании, который допускает ограниченное использование чужих произведений без лицензии, если оно преследует общественно полезные цели. Обучение — именно такой случай. Поэтому, когда авторы произведений начали подавать в суд на разработчиков ИИ-моделей, адвокаты последних стали строить свою защиту на законе о добросовестном использовании. И добились успехов.
Недавно суд в США вынес промежуточное решение по коллективному иску писателей Андреа Бартц, Чарльза Грейбера и Кёрка Уоллеса Джонсона, которые обвиняли Anthropic в незаконном использовании их книг для обучения Claude AI. Судья Уильям Алсап признал, что обучение попадает под закон о добросовестном использовании, однако назначил на декабрь 2025 года еще одно слушание, на котором определит штраф Anthropic за незаконное хранение книг множества авторов — грубо говоря, за пиратство. Датасеты языковых моделей огромны и при их создании разработчики “срезали углы”, нередко скачивая книги прямо из нелегальных библиотек. В случае с Anthropic количество таких текстов оценивается в 7 миллионов, что, даже при минимальной сумме в 150 долларов за текст, грозит гигантским штрафом. Тут вопросов нет, воровать не стоило.
Следом за Anthropic аналогичное решение суд вынес и в отношении Meta* (признанна в РФ экстремистской организацией) иск к которой подали 13 авторов книг. Истцы пытались убедить суд, что ИИ ставит под угрозу рынок их книг, но судья не поддержал этот аргумент.
История еще не окончена — у истцов есть как минимум две апелляции. Кроме того, суд высказался только относительно книг, а есть ведь и другие дела. NY Times обвиняет OpenAI и Microsoft в обучении моделей на новостных статьях издания, а Disney судится с Midjourney за использование своего контента в обучении визуальных моделей. И судья по делу Meta* сразу сказал, что каждую сферу стоит рассматривать отдельно: например, обучение на новостях действительно может создать конкуренцию новостным СМИ (на самом деле, уже создает) — и будет запрещено.
Но вот что подумалось. Любой судебный процесс с апелляциями — это даже не месяцы, а годы. И возможно юридическое регулирование станет одной из первых областей, которые просто не успеют за прогрессом в области ИИ — грубо говоря, когда суд вынесет окончательное решение, искусственный интеллект будет встроен в наши жизни настолько глубоко, что откатить уже ничего не получится.
P.S. Поддержать меня вы можете подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Искусственный интеллект
4.3K постов11.1K подписчиков
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан