Login
/
Register
Chinese
- English
- Chinese
- Russian
- Arabic
- German
- French
- Spanish
- Polish
- Nigeria
- Yoruba
- Igbo
- Ukrainian

Home
Contact
健康
商业
娱乐
技术
政治
时尚
运动的

Home
Contact
健康
商业
娱乐
技术
政治
时尚
运动的
旅行
生活方式
文化
Login
Register

Chinese

English
Chinese
Russian
Arabic
German
French
Spanish
Polish
Nigeria
Yoruba
Igbo
Ukrainian

Join Our Newsletter

Join our subscribers list to get the latest news, updates and special offers directly in your inbox

Home
技术
出现指令后，网站争先恐后地阻止 ChatGPT 爬虫

出现指令后，网站争先恐后地阻止 ChatGPT 爬虫

技术 Aug 13, 2023 0 15 Add to Reading List

出现指令后，网站争先恐后地阻止 ChatGPT 爬虫

隐藏的女人在云后面。”/>放大
盖蒂图片社
</figure><p>OpenAI 最近在其在线文档网站中添加了有关其网络爬虫 GPTBot 的详细信息，但没有发布公告。 GPTBot 是该公司用来获取网页以训练 ChatGPT 背后的 AI 模型（例如 GPT-4）的用户代理的名称。本周早些时候，一些网站迅速宣布打算阻止 GPTBot 访问其内容。</p>

<p>在新文档中，OpenAI 指出，使用 GPTBot 抓取的网页“有可能用于改进未来的模型”，并且允许 GPTBot 访问您的网站“可以帮助 AI 模型变得更加准确，并提高其整体功能和安全性” ”</p>
<p>OpenAI 声称设有过滤器，以确保 GPTBot 无法访问付费墙背后的来源、收集个人身份信息的来源或任何违反 OpenAI 政策的内容。</p>
<p>关于阻止 OpenAI 训练抓取的消息（如果他们尊重的话）来得太晚了，不足以影响当前的 ChatGPT 或 GPT-4 训练数据，这些数据在几年前就在没有宣布的情况下被抓取了。 OpenAI 收集了截至 2021 年 9 月的数据，这是 OpenAI 语言模型当前的“知识”门槛。</p>
<p>需要注意的是，新指令可能不会阻止 ChatGPT 或 ChatGPT 插件的网页浏览版本访问当前网站以向用户提供最新信息。这一点在文档中没有明确说明，我们联系了 OpenAI 进行澄清。</p>
答案在robots.txt中
<p>根据 OpenAI 文档，GPTBot 将通过用户代理令牌“GPTBot”进行识别，其完整字符串为“Mozilla/5.0 AppleWebKit/537.36（KHTML，如 Gecko；兼容；GPTBot/1.0；+https:// openai.com/gptbot）”。</p>

<p>OpenAI 文档还提供了如何防止 GPTBot 使用标准 robots.txt 文件抓取网站的说明，该文件是一个文本文件，位于网站根目录中，并告诉网络爬虫（例如那些使用由搜索引擎）不索引该网站。</p>
<p>就像将这两行添加到网站的 robots.txt 文件中一样简单：</p>
用户代理：GPTBot
禁止： /
<p>OpenAI 还指出，管理员可以使用不同的令牌将 GPTBot 限制在 robots.txt 中网站的某些部分：</p>
用户代理：GPTBot
允许：/directory-1/
禁止：/directory-2/
<p>此外，OpenAI 还提供了 GPTBot 运行的特定 IP 地址块，这些地址块也可能被防火墙阻止。</p>
<p>尽管有此选项，阻止 GPTBot 并不能保证站点的数据最终不会训练所有未来的 AI 模型。除了抓取工具忽略 robots.txt 文件的问题之外，还有其他不隶属于 OpenAI 的大型网站数据集（例如 The Pile）。这些数据集通常用于训练开源（或可用源）LLM，例如 Meta 的 Llama 2。</p>
一些网站反应仓促
<p>虽然从技术角度来看它取得了巨大成功，但 ChatGPT 也因其未经许可删除受版权保护的数据并将其价值集中在商业产品中的方式而受到争议。
</div>

<div class=

Facebook Twitter Whatsapp Linkedin Pinterest

What's Your Reaction?

0

Like

0

Dislike

0

Love

0

Funny

0

Angry

0

Sad

0

Wow

Related Posts

我们问过，你告诉我们：你仍在使用 Chromecast（显然）...
比亚迪超豪车：四引擎、360°油箱旋转、超百万价
间谍软件滥用蔓延成为欧洲议会高级官员的目标

Comments

Name

Email

Comment

Popular Posts

Stevie Nicks 和前男友 Lindsey Buckingham 在 Christine McVie ...

admin Jan 11, 2023 0 634
日本著名时装设计师 Issey Miyake 去世，享年 84 岁...

admin Aug 10, 2022 0 562
“这是休息时间”：鲍里斯·约翰逊（Boris Johnson）在“自恋”的辞职演讲中大打出手...

admin Jul 8, 2022 0 528
AMDD子公司因涉嫌“违约”而受到2.64亿美元的诉讼...

admin Sep 10, 2022 0 510
习近平的第三个任期是一个悲惨的错误

admin Oct 5, 2022 0 507

Our Picks

文化

Banda Iroko 会让你想跳舞，就像你疯狂地坠入爱河一样...

admin May 1, 2023 0 192
时尚

Lingua Franca 在 Waverly Inn 为 John Hardy Collab 干杯...

admin May 1, 2023 0 211
政治

“作为 NHS 骨干的员工应该加薪，而不是食品银行”...

admin May 1, 2023 0 181

Categories

政治(3531)
时尚(2391)
技术(4643)
商业(4007)
娱乐(4385)
运动的(4290)
健康(738)
旅行(3916)
生活方式(0)
文化(1002)

Random Posts

fixer

土耳其球迷玩弄政治并呼吁政府因地震灾难而辞职

土耳其球迷玩弄政治并呼吁政府因地震灾难而辞职

fixer

麦当劳将股息提高 10%

麦当劳将股息提高 10%

fixer

U19 女子板球世界杯：南非选手麦迪逊·兰兹曼上演世界杯首秀帽子戏法

U19 女子板球世界杯：南非选手麦迪逊·兰兹曼上演世界杯首秀帽子戏法...

fixer

凯特·米德尔顿 (Kate Middleton) 身穿绿色衣服参加 2023 年温网决赛，自拍和罗兰·穆雷 (Roland Mouret) 造型

凯特·米德尔顿 (Kate Middleton) 身穿绿色衣服参加 2023 年温网决赛，自拍和罗兰·穆雷 (Roland Mouret) ...

fixer

密歇根州荷兰郁金香天气指南

密歇根州荷兰郁金香天气指南

Tags

About

Latest Posts

谷歌添加人工智能答案，网络出版商准备迎接大屠杀...
提前计划伦敦：应对拥挤场所的技巧
访问墨西哥城之前需要了解的 10 件事

Social Media

Subscribe here to get interesting stuff and updates!

Copyright 2024 Vidianews - All Rights Reserved

Terms & Conditions