OpenAI 推出工具来检测 AI 生成的文本,包括来自 ChatGPT 的文本

在记录了媒体出现的演变之后,OpenAI 推出了一种工具,试图区分人工编写的文本和人工智能生成的文本,例如公司自己的 ChatGPT 和 GPT-3 生成的文本.楷模。分类器不是特别准确 - 它的成功率约为 26%,OpenAI 指出 - 但 OpenAI 表示,当与其他方法结合使用时,它可能有助于防止滥用 AI 文本生成器。

“分类器旨在帮助减少人工智能生成的文本是由人类编写的错误说法。但是,它仍然有许多局限性——因此除了其他方法外,还应该使用它来确定文本的来源而不是成为主要的决策工具,”OpenAI 的一位发言人通过电子邮件告诉 TechCrunch。“我们正在提供这个初始分类器,以获取对此类工具有用性的反馈,并希望在未来分享改进的方法。”

随着围绕生成式 AI(尤其是文本生成 AI)的热情高涨,批评者呼吁这些工具的创造者采取措施减轻其潜在的有害影响。美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT,担心会影响学生的学习和该工具生成的内容的准确性。 Stack Overflow 等网站已禁止用户共享 ChatGPT 生成的内容,称该 AI 使用户很容易用可疑回复淹没线程。

OpenAI 的分类器 - 恰当地称为 OpenAI AI 文本分类器 - 在架构上很有趣。与 ChatGPT 一样,它是一种 AI 语言模型,在网络上的许多公开可用文本示例上进行训练。但与 ChatGPT 不同的是,它经过微调可以预测一段文本由 AI 生成的可能性,不仅来自 ChatGPT,还来自任何文本生成 AI 模型。

>

具体来说,OpenAI 对来自五个不同组织(包括 OpenAI 本身)的 34 个文本生成系统的文本训练了 OpenAI AI 文本分类器。该文本与维基百科中相似(但不完全相似)的人类文本、从 Reddit 上的共享链接获取的网站以及为以前的 OpenAI 文本生成系统收集的“人类演示”集合相匹配。 (然而,OpenAI 在一份支持文件中承认,它可能无意中将一些 AI 编写的文本错误分类为人类编写的文本,“鉴于 AI 生成的内容在互联网上的激增。”)

OpenAI 文本分类器不会对任何文本都起作用,这一点很重要。它至少需要 1,000 个字符,或大约 150-250 个单词。它没有检测到剽窃——这是一个特别不幸的限制,因为文本生成人工智能已经被证明会反刍它所训练的文本。 OpenAI 表示,由于其英语数据集,它更有可能在儿童或非英语语言书写的文本上出错。

在评估一段给定的文本是否由 AI 生成时,检测器在某种程度上回避了它的响应。根据其置信度,它会将文本标记为“非常不可能”由 AI 生成(小于 10% 的几率)、“不太可能”由 AI 生成(在 10% 到 45% 之间的几率)、“不清楚它是“AI 生成的(45% 到 90% 的可能性)”、“可能”由 AI 生成(90% 到 98% 的可能性)还是“可能”由 AI 生成(超过 98% 的可能性)。

出于好奇,我将一些文本输入分类器,看看它是如何工作的。尽管它自信地正确预测了 TechCrunch 关于 Meta 的 Horizo​​n Worlds 的文章中的几段和 OpenAI 支持页面的摘录不是 AI 生成的,但分类器在处理 ChatGPT 的文章长度文本时遇到了更多麻烦,最终未能将其完全分类.然而,他设法发现了 ChatGPT o...

OpenAI 推出工具来检测 AI 生成的文本,包括来自 ChatGPT 的文本

在记录了媒体出现的演变之后,OpenAI 推出了一种工具,试图区分人工编写的文本和人工智能生成的文本,例如公司自己的 ChatGPT 和 GPT-3 生成的文本.楷模。分类器不是特别准确 - 它的成功率约为 26%,OpenAI 指出 - 但 OpenAI 表示,当与其他方法结合使用时,它可能有助于防止滥用 AI 文本生成器。

“分类器旨在帮助减少人工智能生成的文本是由人类编写的错误说法。但是,它仍然有许多局限性——因此除了其他方法外,还应该使用它来确定文本的来源而不是成为主要的决策工具,”OpenAI 的一位发言人通过电子邮件告诉 TechCrunch。“我们正在提供这个初始分类器,以获取对此类工具有用性的反馈,并希望在未来分享改进的方法。”

随着围绕生成式 AI(尤其是文本生成 AI)的热情高涨,批评者呼吁这些工具的创造者采取措施减轻其潜在的有害影响。美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT,担心会影响学生的学习和该工具生成的内容的准确性。 Stack Overflow 等网站已禁止用户共享 ChatGPT 生成的内容,称该 AI 使用户很容易用可疑回复淹没线程。

OpenAI 的分类器 - 恰当地称为 OpenAI AI 文本分类器 - 在架构上很有趣。与 ChatGPT 一样,它是一种 AI 语言模型,在网络上的许多公开可用文本示例上进行训练。但与 ChatGPT 不同的是,它经过微调可以预测一段文本由 AI 生成的可能性,不仅来自 ChatGPT,还来自任何文本生成 AI 模型。

>

具体来说,OpenAI 对来自五个不同组织(包括 OpenAI 本身)的 34 个文本生成系统的文本训练了 OpenAI AI 文本分类器。该文本与维基百科中相似(但不完全相似)的人类文本、从 Reddit 上的共享链接获取的网站以及为以前的 OpenAI 文本生成系统收集的“人类演示”集合相匹配。 (然而,OpenAI 在一份支持文件中承认,它可能无意中将一些 AI 编写的文本错误分类为人类编写的文本,“鉴于 AI 生成的内容在互联网上的激增。”)

OpenAI 文本分类器不会对任何文本都起作用,这一点很重要。它至少需要 1,000 个字符,或大约 150-250 个单词。它没有检测到剽窃——这是一个特别不幸的限制,因为文本生成人工智能已经被证明会反刍它所训练的文本。 OpenAI 表示,由于其英语数据集,它更有可能在儿童或非英语语言书写的文本上出错。

在评估一段给定的文本是否由 AI 生成时,检测器在某种程度上回避了它的响应。根据其置信度,它会将文本标记为“非常不可能”由 AI 生成(小于 10% 的几率)、“不太可能”由 AI 生成(在 10% 到 45% 之间的几率)、“不清楚它是“AI 生成的(45% 到 90% 的可能性)”、“可能”由 AI 生成(90% 到 98% 的可能性)还是“可能”由 AI 生成(超过 98% 的可能性)。

出于好奇,我将一些文本输入分类器,看看它是如何工作的。尽管它自信地正确预测了 TechCrunch 关于 Meta 的 Horizo​​n Worlds 的文章中的几段和 OpenAI 支持页面的摘录不是 AI 生成的,但分类器在处理 ChatGPT 的文章长度文本时遇到了更多麻烦,最终未能将其完全分类.然而,他设法发现了 ChatGPT o...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow