Стали известны миллионы украденных книг, на которых Meta* обучала свой ИИ

Стали известны миллионы украденных книг, на которых Meta* обучала свой ИИ Meta*, известная своими соцсетями, в центре скандала: она использовала миллионы пиратских книг для обучения своего искусственного интеллекта (ИИ). Теперь список этих книг стал доступен для всех благодаря СМИ.

Стали известны миллионы украденных книг, на которых Meta* обучала свой ИИ

Meta*, известная своими соцсетями, в центре скандала: она использовала миллионы пиратских книг для обучения своего искусственного интеллекта (ИИ). Теперь список этих книг стал доступен для всех благодаря СМИ.

Речь идёт о теневой библиотеке под названием LibGen (сокращение от Library Genesis). Это огромный архив, где хранятся около 7,5 миллиона книг и 81 миллион научных статей — всё это выложено в интернете без разрешения авторов. Meta* взяла эти материалы, чтобы научить свой ИИ Llama* понимать и генерировать тексты. Среди книг есть произведения известных писателей, таких как Стивен Кинг, а также научные работы.

The Atlantic выпустил инструмент, который позволяет искать по базе LibGen. Это не значит, что вы можете скачать книги, — инструмент показывает только, какие произведения попали в архив. За два года журналисты изучили данные и выяснили, что многие авторы даже не знали, что их работы используют для обучения ИИ.

*принадлежит Meta, которая признана в РФ экстремистской и запрещена