Meta* обучала ИИ Llama 3 на пиратских книгах
Утечка внутренних данных Meta показала, что компания использовала пиратскую библиотеку Library Genesis (LibGen) для обучения своей новой модели искусственного интеллекта Llama 3.
LibGen — крупнейший в мире теневой архив научных и художественных книг, доступ к которому заблокирован во многих странах из-за нарушений авторских прав. Однако, несмотря на юридические риски, в Meta решили использовать его данные, поскольку альтернативные легальные источники оказались слишком дорогими и ограниченными.
Во внутренней переписке обсуждались меры предосторожности: удаление метаданных, указывающих на пиратское происхождение файлов, и маскировка использования LibGen. Это означает, что Meta осознавала возможные последствия, но все равно пошла на этот шаг.
Теперь писатели и издатели требуют объяснений: их книги были использованы для обучения Llama 3 без согласия и компенсации. В ответ Meta ссылается на принцип fair use, который до сих пор остается серой зоной в судебной практике.
Шел 2025 год: Марк Цукерберг подался в пираты. Капитан Марк Цукерберг.
*Корпорация Meta признана экстремистской и запрещена в РФ