OpenAI 推出工具来检测 AI 生成的文本，包括来自 ChatGPT 的文本

在记录了媒体出现的演变之后，OpenAI 推出了一种工具，试图区分人工编写的文本和人工智能生成的文本，例如公司自己的 ChatGPT 和 GPT-3 生成的文本.楷模。分类器不是特别准确 - 它的成功率约为 26%，OpenAI 指出 - 但 OpenAI 表示，当与其他方法结合使用时，它可能有助于防止滥用 AI 文本生成器。

“分类器旨在帮助减少人工智能生成的文本是由人类编写的错误说法。但是，它仍然有许多局限性——因此除了其他方法外，还应该使用它来确定文本的来源而不是成为主要的决策工具，”OpenAI 的一位发言人通过电子邮件告诉 TechCrunch。“我们正在提供这个初始分类器，以获取对此类工具有用性的反馈，并希望在未来分享改进的方法。”
随着围绕生成式 AI（尤其是文本生成 AI）的热情高涨，批评者呼吁这些工具的创造者采取措施减轻其潜在的有害影响。美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT，担心会影响学生的学习和该工具生成的内容的准确性。 Stack Overflow 等网站已禁止用户共享 ChatGPT 生成的内容，称该 AI 使用户很容易用可疑回复淹没线程。

OpenAI 的分类器 - 恰当地称为 OpenAI AI 文本分类器 - 在架构上很有趣。与 ChatGPT 一样，它是一种 AI 语言模型，在网络上的许多公开可用文本示例上进行训练。但与 ChatGPT 不同的是，它经过微调可以预测一段文本由 AI 生成的可能性，不仅来自 ChatGPT，还来自任何文本生成 AI 模型。
>
具体来说，OpenAI 对来自五个不同组织（包括 OpenAI 本身）的 34 个文本生成系统的文本训练了 OpenAI AI 文本分类器。该文本与维基百科中相似（但不完全相似）的人类文本、从 Reddit 上的共享链接获取的网站以及为以前的 OpenAI 文本生成系统收集的“人类演示”集合相匹配。（然而，OpenAI 在一份支持文件中承认，它可能无意中将一些 AI 编写的文本错误分类为人类编写的文本，“鉴于 AI 生成的内容在互联网上的激增。”）

OpenAI 文本分类器不会对任何文本都起作用，这一点很重要。它至少需要 1,000 个字符，或大约 150-250 个单词。它没有检测到剽窃——这是一个特别不幸的限制，因为文本生成人工智能已经被证明会反刍它所训练的文本。 OpenAI 表示，由于其英语数据集，它更有可能在儿童或非英语语言书写的文本上出错。

在评估一段给定的文本是否由 AI 生成时，检测器在某种程度上回避了它的响应。根据其置信度，它会将文本标记为“非常不可能”由 AI 生成（小于 10% 的几率）、“不太可能”由 AI 生成（在 10% 到 45% 之间的几率）、“不清楚它是“AI 生成的（45% 到 90% 的可能性）”、“可能”由 AI 生成（90% 到 98% 的可能性）还是“可能”由 AI 生成（超过 98% 的可能性）。

出于好奇，我将一些文本输入分类器，看看它是如何工作的。尽管它自信地正确预测了 TechCrunch 关于 Meta 的 Horizon Worlds 的文章中的几段和 OpenAI 支持页面的摘录不是 AI 生成的，但分类器在处理 ChatGPT 的文章长度文本时遇到了更多麻烦，最终未能将其完全分类.然而，他设法发现了 ChatGPT o...

技术 Feb 1, 2023 0 13 Add to Reading List

在记录了媒体出现的演变之后，OpenAI 推出了一种工具，试图区分人工编写的文本和人工智能生成的文本，例如公司自己的 ChatGPT 和 GPT-3 生成的文本.楷模。分类器不是特别准确 - 它的成功率约为 26%，OpenAI 指出 - 但 OpenAI 表示，当与其他方法结合使用时，它可能有助于防止滥用 AI 文本生成器。

“分类器旨在帮助减少人工智能生成的文本是由人类编写的错误说法。但是，它仍然有许多局限性——因此除了其他方法外，还应该使用它来确定文本的来源而不是成为主要的决策工具，”OpenAI 的一位发言人通过电子邮件告诉 TechCrunch。“我们正在提供这个初始分类器，以获取对此类工具有用性的反馈，并希望在未来分享改进的方法。”

随着围绕生成式 AI（尤其是文本生成 AI）的热情高涨，批评者呼吁这些工具的创造者采取措施减轻其潜在的有害影响。美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT，担心会影响学生的学习和该工具生成的内容的准确性。 Stack Overflow 等网站已禁止用户共享 ChatGPT 生成的内容，称该 AI 使用户很容易用可疑回复淹没线程。

OpenAI 的分类器 - 恰当地称为 OpenAI AI 文本分类器 - 在架构上很有趣。与 ChatGPT 一样，它是一种 AI 语言模型，在网络上的许多公开可用文本示例上进行训练。但与 ChatGPT 不同的是，它经过微调可以预测一段文本由 AI 生成的可能性，不仅来自 ChatGPT，还来自任何文本生成 AI 模型。

具体来说，OpenAI 对来自五个不同组织（包括 OpenAI 本身）的 34 个文本生成系统的文本训练了 OpenAI AI 文本分类器。该文本与维基百科中相似（但不完全相似）的人类文本、从 Reddit 上的共享链接获取的网站以及为以前的 OpenAI 文本生成系统收集的“人类演示”集合相匹配。（然而，OpenAI 在一份支持文件中承认，它可能无意中将一些 AI 编写的文本错误分类为人类编写的文本，“鉴于 AI 生成的内容在互联网上的激增。”）

OpenAI 文本分类器不会对任何文本都起作用，这一点很重要。它至少需要 1,000 个字符，或大约 150-250 个单词。它没有检测到剽窃——这是一个特别不幸的限制，因为文本生成人工智能已经被证明会反刍它所训练的文本。 OpenAI 表示，由于其英语数据集，它更有可能在儿童或非英语语言书写的文本上出错。

在评估一段给定的文本是否由 AI 生成时，检测器在某种程度上回避了它的响应。根据其置信度，它会将文本标记为“非常不可能”由 AI 生成（小于 10% 的几率）、“不太可能”由 AI 生成（在 10% 到 45% 之间的几率）、“不清楚它是“AI 生成的（45% 到 90% 的可能性）”、“可能”由 AI 生成（90% 到 98% 的可能性）还是“可能”由 AI 生成（超过 98% 的可能性）。

出于好奇，我将一些文本输入分类器，看看它是如何工作的。尽管它自信地正确预测了 TechCrunch 关于 Meta 的 Horizon Worlds 的文章中的几段和 OpenAI 支持页面的摘录不是 AI 生成的，但分类器在处理 ChatGPT 的文章长度文本时遇到了更多麻烦，最终未能将其完全分类.然而，他设法发现了 ChatGPT o...