不想被OPENAI白嫖：纽约时报网站封杀GPT爬虫禁止其抓取网站内容 – 蓝点网

人参与 | 时间：2025-03-13 08:41:31

8 月 7 日 OPENAI 公布自己的不想被OI白报网互联网爬虫 GPTBot，该爬虫是嫖纽爬虫 OPENAI 用来在全网抓爬内容然后训练 AI 模型用的。尽管多数网站允许 GPTBot 抓爬内容，站封站内追风筝的人读后感不过也有些网站并不想给 OPENAI 白嫖，禁止所以在 robots.txt 文件里屏蔽了 GPTBot。其抓取网

比如知名新闻媒体《纽约时报》就在网站上封禁 GPTBot，容蓝禁止该爬虫访问纽约时报网站的点网任何内容，包括首页信息摘要等。不想被OI白报网

互联网档案馆的嫖纽爬虫存档显示，纽约时报大约是站封站内追风筝的人读后感在 8 月 17 日修改 robots.txt 文件屏蔽 GPTBot 的，而在稍早的禁止时候纽约时报则修改了服务条款，明确禁止任何公司抓取其内容用来训练人工智能模型，其抓取网所以之后修改 robots.txt 协议禁止 GPTBot 也倒是容蓝可以理解。

不想被OPENAI白嫖：纽约时报网站封杀GPT爬虫禁止其抓取网站内容

纽约时报与 OPENAI 矛盾还是点网挺深的，上个月纽约时报就表示正在考虑对 OPENAI 提起法律诉讼，不想被OI白报网因为 OPENAI 侵犯了纽约时报的版权。还有两名作者也在 7 月起诉了 OPENAI，因为 OPENAI 拿他们的作品训练 GPT 模型。

对于修改 robots.txt 阻止 OPENAI 抓爬这事儿，纽约时报拒绝置评，OPENAI 则没有回复置评请求。

最后：如果你也想控制 GPTBot 的抓爬，可以在你网站的 robots.txt 文件中加入指令，例如完全禁止 GPTBot 或允许 GPTBot 抓取一部分内容。

具体操作方法请看：如何禁止OPENAI的爬虫(GPTBot)抓爬网站附该爬虫的IP地址网段

顶: 5742踩: 617

汪洋大海网

不想被OPENAI白嫖：纽约时报网站封杀GPT爬虫禁止其抓取网站内容 – 蓝点网

人参与 | 时间：2025-03-13 08:41:31

评论专区

相关文章