Reddit обмежує доступ до Wayback Machine Інтернет-архіву

0
425 views
Reddit обмежує доступ до Wayback Machine Інтернет-архіву

Wayback Machine від Internet Archive стала останньою жертвою жорстких заходів Reddit щодо доступу до даних. Компанія почала вводити нові обмеження на доступ до архівного сайту, що значно обмежить можливості Wayback Machine щодо збереження інформації з Reddit.

З цією зміною Wayback Machine, проект, що реалізується некомерційною організацією Internet Archive, зможе сканувати лише головну сторінку Reddit. Він більше не матиме доступу до коментарів, сторінок субреддитів, деталей публікацій, профілів та інших даних.

Цей крок є останнім кроком Reddit у його прагненні обмежити можливість компаній, що займаються штучним інтелектом, використовувати його дані для навчання великих мовних моделей без сплати ліцензійних зборів. Це також значно відрізняється від позиції, яку компанія займала минулого року, коли вона чітко заявила, що не буде обмежувати «добросовісних учасників», включаючи Internet Archive. Незрозуміло, що саме змінилося з того часу. Reddit, схоже, вважає, що компанії, що займаються штучним інтелектом, обходять його правила, збираючи дані за допомогою Wayback Machine. Ми звернулися до Інтернет-архіву за коментарем.

Ліцензування даних стало важливим напрямком бізнесу для Reddit. Компанія уклала багатомільйонні угоди з OpenAI та Google, які дозволяють їм використовувати публікації Reddit для навчання своїх моделей штучного інтелекту. Водночас Reddit займає все більш жорстку позицію щодо компаній, які намагаються використовувати його дані без таких домовленостей. Раніше цього року компанія подала позов проти Anthropic, звинувачуючи її в тому, що вона роками без дозволу збирала дані з Reddit.