Компанія Meta свідомо використовувала піратські матеріали для навчання своїх моделей штучного інтелекту Llama – з благословення керівника компанії Марка Цукерберга – згідно з судовим процесом про порушення авторських прав, що триває проти компанії. Як повідомляє TechCrunch, позивачі у справі Kadrey v. Meta подали до суду документи, в яких йдеться про використання компанією набору даних LibGen для навчання ШІ.
LibGen зазвичай описують як “тіньову бібліотеку”, яка надає доступ до файлообмінника до академічних і загальнодоступних книг, журналів, зображень та інших матеріалів. Адвокат позивачів, серед яких письменниці Сара Сільверман і Та-Нехісі Коутс, звинуватив Цукерберга в тому, що він схвалив використання LibGen для навчання, незважаючи на занепокоєння керівників і співробітників компанії, які описали її як “набір даних, про які вони знають, що вони є піратськими”.
Компанія видалила інформацію про авторські права з матеріалів LibGen, йдеться у скарзі, перед тим, як передати їх Llama. У документі, поданому до суду, Meta, очевидно, визнала, що “видалила всі абзаци про авторське право з початку і кінця” статей наукових журналів. Один з інженерів компанії навіть створив скрипт для автоматичного видалення інформації про авторське право. Адвокат стверджував, що Meta зробила це, щоб приховати свою діяльність з порушення авторських прав від громадськості. Крім того, адвокат згадав, що Meta визнала, що торрентувала матеріали LibGen, хоча її інженери не хотіли ділитися ними “з корпоративного ноутбука [Meta]”.
У 2023 році Сільверман разом з іншими авторами подав до суду на Meta і OpenAI за порушення авторських прав. Вони звинуватили компанії у використанні піратських матеріалів з тіньових бібліотек для навчання своїх моделей ШІ. Суд раніше відхилив деякі з їхніх вимог, але позивачі заявили, що їхня змінена скарга підтримує їхні звинувачення і враховує попередні причини відхилення позову судом.










