Група письменників подала розширений колективний позов проти NVIDIA, звинувативши компанію у свідомому використанні піратських книг для навчання мовних моделей. Про це повідомляє TorrentFreak.
Оновлену скаргу подали до Окружного суду Північного округу Каліфорнії. Позивачі заявляють, що під час збору доказів їм стали відомі внутрішні листи та документи NVIDIA, які, на їхню думку, свідчать про погодження використання піратських матеріалів на рівні керівництва. Автори пов’язують це рішення з конкуренцією у сфері штучного інтелекту.
«У першій версії позову, поданій на початку 2024 року, письменники заявили, що компанія навчала свої моделі на датасеті Books3 з піратськими книгами. У відповідь NVIDIA наполягала, що таке використання підпадає під принцип fair use, а тексти слугують лише для статистичного аналізу», — пише TorrentFreak.
У новій редакції позову перелік звинувачень суттєво розширили. Зокрема, стверджується, що представник NVIDIA звертався до піратської бібліотеки Anna's Archive з проханням надати доступ до її колекцій для навчання мовних моделей. За словами позивачів, бібліотека попередила компанію про незаконний статус матеріалів і поцікавилася, чи має вона дозвіл на їх використання.
Попри це, як зазначається у позові, приблизно за тиждень керівництво NVIDIA схвалило продовження співпраці. Anna’s Archive, за твердженням авторів, запропонувала доступ до близько 500 терабайтів даних, що включали мільйони книг, частина з яких зазвичай доступна лише через Internet Archive. У матеріалах справи не уточнюється, чи платила NVIDIA за цей доступ.
Крім того, у позові йдеться про можливе використання матеріалів з інших піратських ресурсів, зокрема LibGen, Sci-Hub та Z-Library. Автори також стверджують, що NVIDIA поширювала інструменти, які дозволяли корпоративним клієнтам автоматично завантажувати датасет The Pile, до складу якого входить Books3.
Серед позивачів — письменники Абді Наземіан, Браян Кін, Стюарт О’Нан, Андре Дюбюс III та Сьюзен Орлеан. Вони вимагають відшкодування збитків і припускають, що до справи можуть приєднатися й інші автори
Раніше ми повідомляли, що Anna’s Archive створив відкритий архів Spotify обсягом майже 300 ТБ.
Підписуйтеся на ProIT у Telegram, щоб не пропустити жодної публікації!