Sarah Silverman 起诉 OpenAI 和 Meta 为“工业实力剽窃者”

喜剧演员和作家莎拉·西尔弗曼。放大 / 女演员和作家莎拉·西尔弗曼。 Jason Kempin / 员工 |盖蒂图片社北美

周五,律师事务所 Joseph Saveri 代表 Sarah Silverman 和其他作者对 OpenAI 和 Meta 提起美国联邦集体诉讼,指控这些公司非法使用受版权保护的材料来训练 ChatGPT 和 LLaMA 等 AI 语言模型。

其他代理作者包括 Christopher Golden 和 Richard Kadrey,该公司早前于 6 月 28 日提起的集体诉讼包括作者 Paul Tremblay 和 Mona Awad。每起诉讼都指控违反《数字千年版权法》、不正当竞争法和疏忽。

约瑟夫·萨维里律师事务所对针对生成人工智能的媒体友好诉讼并不陌生。 2022 年 11 月,该公司以涉嫌侵犯版权为由对 GitHub Copilot 提起诉讼。 2023 年 1 月,同一法律团体重复了这一公式,就 AI 图像生成器对 Stability AI、Midjourney 和 DeviantArt 提起集体诉讼。律师 Matthew Butterick 表示,GitHub 诉讼目前正在悬而未决。稳定扩散试验的程序操作仍在进行中,目前尚无明确结果。

在上个月的一份新闻稿中,该律师事务所将 ChatGPT 和 LLaMA 描述为“侵犯图书作者权利的工业实力剽窃者”。律师 Joseph Saveri 和 Butterick 写道,作者和编辑自 2023 年 3 月以来一直在联系该律师事务所,因为作者“担心”“这些人工智能工具具有不可思议的能力,可以生成与受版权保护的文本记录中发现的类似文本,包括数千本书。”

最近针对 Silverman、Golden 和 Kadrey 的诉讼是在旧金山美国地方法院提起的。作者要求对每个案件进行陪审团审判,并寻求永久性禁令,迫使 Meta 和 OpenAI 更改其人工智能工具。

Meta 拒绝了 Ars 的置评请求。 OpenAI 没有立即回复 Ars 的置评请求。

Saveri 律师事务所的发言人向 Ars 发送了一份声明,称:“如果允许这种所谓的行为继续下去,这些模型最终将取代那些被盗作品为这些人工智能产品提供动力的作者,并与他们竞争。这套新服装代表了保护所有艺术家和其他创作者的财产权的更广泛的斗争。”

被指控使用“明显非法”的数据集

Meta 和 OpenAI 都没有完全公开用于训练 LLaMA 和 ChatGPT 的数据集的内容。但起诉作者的律师表示,他们从公司或相关研究人员发布的声明和文件中的线索推断出可能的数据来源。作者指责 OpenAI 和 Meta 使用包含未经作者或出版商同意的受版权保护材料的训练数据集,包括从一些最伟大的电子书盗版网站下载作品。

在 OpenAI 诉讼中,作者声称,根据 OpenAI 的披露,ChatGPT 似乎接受了 294,000 本书的训练,据称这些书籍是从“臭名昭著的‘影子图书馆’网站,如 Library Genesis(又名 LibGen)、Z-Library(又名)下载的。 Bok)、Sci-Hub 和 Bibliotik。” Meta 透露 LLaMA 是在名为 ThePile 的数据集的一部分上进行训练的,该数据集是

Sarah Silverman 起诉 OpenAI 和 Meta 为“工业实力剽窃者”
喜剧演员和作家莎拉·西尔弗曼。放大 / 女演员和作家莎拉·西尔弗曼。 Jason Kempin / 员工 |盖蒂图片社北美

周五,律师事务所 Joseph Saveri 代表 Sarah Silverman 和其他作者对 OpenAI 和 Meta 提起美国联邦集体诉讼,指控这些公司非法使用受版权保护的材料来训练 ChatGPT 和 LLaMA 等 AI 语言模型。

其他代理作者包括 Christopher Golden 和 Richard Kadrey,该公司早前于 6 月 28 日提起的集体诉讼包括作者 Paul Tremblay 和 Mona Awad。每起诉讼都指控违反《数字千年版权法》、不正当竞争法和疏忽。

约瑟夫·萨维里律师事务所对针对生成人工智能的媒体友好诉讼并不陌生。 2022 年 11 月,该公司以涉嫌侵犯版权为由对 GitHub Copilot 提起诉讼。 2023 年 1 月,同一法律团体重复了这一公式,就 AI 图像生成器对 Stability AI、Midjourney 和 DeviantArt 提起集体诉讼。律师 Matthew Butterick 表示,GitHub 诉讼目前正在悬而未决。稳定扩散试验的程序操作仍在进行中,目前尚无明确结果。

在上个月的一份新闻稿中,该律师事务所将 ChatGPT 和 LLaMA 描述为“侵犯图书作者权利的工业实力剽窃者”。律师 Joseph Saveri 和 Butterick 写道,作者和编辑自 2023 年 3 月以来一直在联系该律师事务所,因为作者“担心”“这些人工智能工具具有不可思议的能力,可以生成与受版权保护的文本记录中发现的类似文本,包括数千本书。”

最近针对 Silverman、Golden 和 Kadrey 的诉讼是在旧金山美国地方法院提起的。作者要求对每个案件进行陪审团审判,并寻求永久性禁令,迫使 Meta 和 OpenAI 更改其人工智能工具。

Meta 拒绝了 Ars 的置评请求。 OpenAI 没有立即回复 Ars 的置评请求。

Saveri 律师事务所的发言人向 Ars 发送了一份声明,称:“如果允许这种所谓的行为继续下去,这些模型最终将取代那些被盗作品为这些人工智能产品提供动力的作者,并与他们竞争。这套新服装代表了保护所有艺术家和其他创作者的财产权的更广泛的斗争。”

被指控使用“明显非法”的数据集

Meta 和 OpenAI 都没有完全公开用于训练 LLaMA 和 ChatGPT 的数据集的内容。但起诉作者的律师表示,他们从公司或相关研究人员发布的声明和文件中的线索推断出可能的数据来源。作者指责 OpenAI 和 Meta 使用包含未经作者或出版商同意的受版权保护材料的训练数据集,包括从一些最伟大的电子书盗版网站下载作品。

在 OpenAI 诉讼中,作者声称,根据 OpenAI 的披露,ChatGPT 似乎接受了 294,000 本书的训练,据称这些书籍是从“臭名昭著的‘影子图书馆’网站,如 Library Genesis(又名 LibGen)、Z-Library(又名)下载的。 Bok)、Sci-Hub 和 Bibliotik。” Meta 透露 LLaMA 是在名为 ThePile 的数据集的一部分上进行训练的,该数据集是

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow