Сара Сильверман подает в суд на OpenAI, Meta за то, что они являются «плагиаторами промышленной силы»

Comedian и писательница Сара Сильверман.Увеличить / Актриса и писательница Сара Сильверман. Джейсон Кемпин / Персонал | Getty Images Северная Америка

В пятницу юридическая фирма Джозеф Савери подала федеральные коллективные иски США от имени Сары Сильверман и других авторов против OpenAI и Meta, обвинив компании в незаконном использовании материалов, защищенных авторским правом, для обучения языковых моделей ИИ, таких как ChatGPT и LLaMA.

Другие представленные авторы включают Кристофера Голдена и Ричарда Кадри, а более ранний коллективный иск, поданный той же фирмой 28 июня, касался авторов Пола Тремблея и Моны Авад. В каждом иске утверждается о нарушении Закона об авторском праве в цифровую эпоху, недобросовестной конкуренции и халатности.

Юридическая фирма Джозеф Савери не первый раз принимает судебные иски против генеративного искусственного интеллекта. В ноябре 2022 года та же компания подала иск против GitHub Copilot за предполагаемое нарушение авторских прав. В январе 2023 года та же юридическая группа повторила эту формулу, подав коллективный иск против Stability AI, Midjourney и DeviantArt из-за генераторов изображений AI. По словам адвоката Мэтью Баттерика, иск GitHub в настоящее время находится на рассмотрении. Процедурные маневры в испытании Stable Diffusion все еще продолжаются, и на данный момент нет ясного результата.

В пресс-релизе, опубликованном в прошлом месяце, юридическая фирма охарактеризовала ChatGPT и LLaMA как «промышленных плагиаторов, нарушающих права авторов книг». Авторы и редакторы связывались с юридической фирмой с марта 2023 года, написали адвокаты Джозеф Савери и Баттерик, потому что авторы «обеспокоены» «сверхъестественной способностью этих инструментов ИИ генерировать текст, аналогичный тому, который содержится в текстовых записях, защищенных авторским правом, включая тысячи книг."

Последние иски против Сильвермана, Голдена и Кадри были поданы в Окружной суд США в Сан-Франциско. Авторы требовали суда присяжных в каждом случае и добивались постоянного судебного запрета, который мог бы заставить Meta и OpenAI вносить изменения в свои инструменты искусственного интеллекта.

Мета отклонила запрос Арса на комментарий. OpenAI не сразу ответила на запрос Ars о комментариях.

Представитель юридической фирмы Савери отправил Арсу заявление, в котором говорится: "Если такое предполагаемое поведение будет продолжаться, эти модели в конечном итоге заменят авторов, чьи украденные работы приводят в действие эти продукты ИИ, с которыми они конкурируют. Этот новый костюм представляет собой более широкая борьба за сохранение прав собственности всех художников и других авторов."

Обвиняется в использовании «заведомо незаконных» наборов данных

Ни Meta, ни OpenAI не раскрывают полностью содержимое наборов данных, используемых для обучения LLaMA и ChatGPT. Но адвокаты авторов, которые подают в суд, говорят, что они определили вероятные источники данных из подсказок в заявлениях и документах, опубликованных компаниями или связанными с ними исследователями. Авторы обвинили OpenAI и Meta в использовании обучающих наборов данных, содержащих материалы, защищенные авторским правом, которые распространялись без согласия авторов или издателей, включая загрузку произведений с некоторых из самых известных пиратских сайтов электронных книг.

В иске OpenAI авторы утверждали, что, основываясь на разоблачениях OpenAI, ChatGPT, по-видимому, был обучен 294 000 книг, предположительно загруженных с «пресловутых веб-сайтов «теневых библиотек», таких как Library Genesis (также известная как LibGen), Z-Library (также известная как LibGen). Bok), Sci-Hub и Bibliotik». Мета сообщила, что LLaMA обучался на части набора данных под названием ThePile, который

Сара Сильверман подает в суд на OpenAI, Meta за то, что они являются «плагиаторами промышленной силы»
Comedian и писательница Сара Сильверман.Увеличить / Актриса и писательница Сара Сильверман. Джейсон Кемпин / Персонал | Getty Images Северная Америка

В пятницу юридическая фирма Джозеф Савери подала федеральные коллективные иски США от имени Сары Сильверман и других авторов против OpenAI и Meta, обвинив компании в незаконном использовании материалов, защищенных авторским правом, для обучения языковых моделей ИИ, таких как ChatGPT и LLaMA.

Другие представленные авторы включают Кристофера Голдена и Ричарда Кадри, а более ранний коллективный иск, поданный той же фирмой 28 июня, касался авторов Пола Тремблея и Моны Авад. В каждом иске утверждается о нарушении Закона об авторском праве в цифровую эпоху, недобросовестной конкуренции и халатности.

Юридическая фирма Джозеф Савери не первый раз принимает судебные иски против генеративного искусственного интеллекта. В ноябре 2022 года та же компания подала иск против GitHub Copilot за предполагаемое нарушение авторских прав. В январе 2023 года та же юридическая группа повторила эту формулу, подав коллективный иск против Stability AI, Midjourney и DeviantArt из-за генераторов изображений AI. По словам адвоката Мэтью Баттерика, иск GitHub в настоящее время находится на рассмотрении. Процедурные маневры в испытании Stable Diffusion все еще продолжаются, и на данный момент нет ясного результата.

В пресс-релизе, опубликованном в прошлом месяце, юридическая фирма охарактеризовала ChatGPT и LLaMA как «промышленных плагиаторов, нарушающих права авторов книг». Авторы и редакторы связывались с юридической фирмой с марта 2023 года, написали адвокаты Джозеф Савери и Баттерик, потому что авторы «обеспокоены» «сверхъестественной способностью этих инструментов ИИ генерировать текст, аналогичный тому, который содержится в текстовых записях, защищенных авторским правом, включая тысячи книг."

Последние иски против Сильвермана, Голдена и Кадри были поданы в Окружной суд США в Сан-Франциско. Авторы требовали суда присяжных в каждом случае и добивались постоянного судебного запрета, который мог бы заставить Meta и OpenAI вносить изменения в свои инструменты искусственного интеллекта.

Мета отклонила запрос Арса на комментарий. OpenAI не сразу ответила на запрос Ars о комментариях.

Представитель юридической фирмы Савери отправил Арсу заявление, в котором говорится: "Если такое предполагаемое поведение будет продолжаться, эти модели в конечном итоге заменят авторов, чьи украденные работы приводят в действие эти продукты ИИ, с которыми они конкурируют. Этот новый костюм представляет собой более широкая борьба за сохранение прав собственности всех художников и других авторов."

Обвиняется в использовании «заведомо незаконных» наборов данных

Ни Meta, ни OpenAI не раскрывают полностью содержимое наборов данных, используемых для обучения LLaMA и ChatGPT. Но адвокаты авторов, которые подают в суд, говорят, что они определили вероятные источники данных из подсказок в заявлениях и документах, опубликованных компаниями или связанными с ними исследователями. Авторы обвинили OpenAI и Meta в использовании обучающих наборов данных, содержащих материалы, защищенные авторским правом, которые распространялись без согласия авторов или издателей, включая загрузку произведений с некоторых из самых известных пиратских сайтов электронных книг.

В иске OpenAI авторы утверждали, что, основываясь на разоблачениях OpenAI, ChatGPT, по-видимому, был обучен 294 000 книг, предположительно загруженных с «пресловутых веб-сайтов «теневых библиотек», таких как Library Genesis (также известная как LibGen), Z-Library (также известная как LibGen). Bok), Sci-Hub и Bibliotik». Мета сообщила, что LLaMA обучался на части набора данных под названием ThePile, который

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow