Cloudflare 推出对人工智能数据抓取工具的默认阻断功能

| 批评评论 | 277条评论
277

云计算公司Cloudflare于周二宣布,已推出一项基于权限的新设置,允许客户自动阻止人工智能公司收集其数字数据,此举对出版商及人工智能技术竞赛产生深远影响。

Cloudflare 将推出按爬取次数付费的 AI 爬虫服务

| 批评评论 | 264条评论
264

如果创作者希望阻止所有AI爬虫访问其内容,他们应该能够做到这一点。如果创作者希望允许部分或全部AI爬虫免费访问其内容,他们也应该能够做到这一点。创作者应该掌握主动权。

用一个奇招检测并让Chromium机器人爬虫崩溃(机器人爬虫讨厌这个!)

| 技术技巧 | 52条评论
52

享受这个漏洞吧。把它留在你的工具箱里。在测试环境中让机器人崩溃时笑一笑。但也许不要在生产环境中部署它。尤其是当Googlebot能看到它的时候。

关于 JavaScript “工作证明(proof of work) “防抓取系统的思考

| 技术技巧 | 210条评论
210

人们越来越多地使用基于 JavaScript 的“工作证明”系统来应对激进的大语言模型 (LLM) 和其他网络抓取器的问题,在这种系统中,您的网络服务器要求访问客户端运行一些 JavaScript 来解决挑战