专治AI爬虫，Cloudflare推出“下一代蜜罐”

2025-03-25 10:54

网络基础设施服务商Cloudflare近日推出一项全新功能“AI Labyrinth”（AI迷宫），专门针对那些未经授权、肆意抓取网站数据的AI爬虫。这项工具不走寻常路，不直接拦截，而是用AI生成的“假内容”迷惑爬虫，让试图为ChatGPT这类大语言模型收集训练数据的AI公司空忙一场。 “下一代蜜罐”登场成立于2009年的Cloudflare提供网站基础设施和安全服务，尤其擅长抵御分布式拒绝服务（DDoS）攻击和恶意流量。

网络基础设施服务商Cloudflare近日推出一项全新功能“AI Labyrinth”（AI迷宫），专门针对那些未经授权、肆意抓取网站数据的AI爬虫。这项工具不走寻常路，不直接拦截，而是用AI生成的“假内容”迷惑爬虫，让试图为ChatGPT这类大语言模型收集训练数据的AI公司空忙一场。

“下一代蜜罐”登场

成立于2009年的Cloudflare提供网站基础设施和安全服务，尤其擅长抵御分布式拒绝服务（DDoS）攻击和恶意流量。这次推出的“AI迷宫”一改传统“拦截为主”的防御策略，转而将爬虫引入一个由逼真但无用页面组成的“迷宫”，消耗其计算资源。Cloudflare坦言，直接屏蔽爬虫有时会适得其反，反而提醒爬虫操控者自己已被发现。

“一旦检测到未经许可的爬取行为，我们不会直接拒绝，而是引导爬虫进入一系列AI生成的页面。这些页面看似真实，足以吸引爬虫深入探索，”Cloudflare在官方博客中写道，“但实际上，这些内容与我们保护的网站毫无关联，爬虫只能白费力气。”

为避免制造谣言，这些喂给爬虫的内容并非随意捏造，而是基于生物学、物理学或数学等领域的真实科学事实，由Cloudflare自家的Workers AI服务平台生成。普通用户无需担心误入歧途，这些陷阱页面对人类访客完全不可见。

Cloudflare将“AI迷宫”称为“下一代蜜罐”。传统蜜罐通常是隐藏链接，人类看不到，但爬虫会循迹而去。然而，现代爬虫已变得更加狡猾，能轻松识破简单陷阱。为此，Cloudflare设计了更复杂的假链接，加入元指令避免被搜索引擎收录，同时保持对数据抓取爬虫的吸引力。

“正常人不会连点四层链接，钻进AI生成的无意义内容里，”Cloudflare解释，“能这么做的，多半是爬虫。这为我们提供了一个全新手段，识别并标记恶意爬虫。”

通过这一过程收集的数据将进入机器学习系统，形成反馈循环，不断提升Cloudflare网络的爬虫检测能力，增强客户保护。值得一提的是，无论用户使用免费版还是付费版，只需在控制面板轻点开关，即可启用这一功能。

AI爬虫泛滥，网站主头痛

近年来，AI爬虫的激增已成为网络世界的一大难题。Cloudflare数据显示，其网络每天处理超500亿次AI爬虫请求，占总流量的近1%，这与业内传闻相符。许多爬虫未经网站主同意就抓取数据，用于训练大语言模型，引发了内容创作者和出版商的广泛不满，甚至诉诸法律。

今年1月，类似工具“Nepenthes”曾亮相，同样通过假内容迷惑爬虫，但其匿名开发者将其定位为“攻击性恶意软件”，意在困住爬虫数月。而Cloudflare则强调“AI迷宫”是合法安全功能，旨在为商用客户提供便捷保护。

这种AI防御性应用颇具创意，旨在保护网站主和创作者的权益，而非威胁其知识产权。然而，AI爬虫是否会迅速适应、绕过这些陷阱，仍是未知数，Cloudflare或需持续升级策略。此外，消耗AI公司资源可能引发争议，尤其在AI模型能耗与环境成本备受关注之际。

Cloudflare表示，目前发布的只是AI防御爬虫的“初代版本”。未来，他们计划让假内容更难识别，并与网站结构更紧密融合。

新的 AI 安全在 2025 年正对 CISO 及其团队构成挑战

安全团队总是必须适应变化，但2025年将出现的新发展可能会使变化特别具有挑战性。 AI 创新步伐的加快、日益复杂的网络威胁和新的监管政策将要求首席信息安全官（CISO）驾驭更复杂的环境。供应商正在迅速将AI 功能添加到现有产品中，其使用的基础大型语言模型（LLM）在增强产品能力的同时也暴露了新的攻击面给攻击者，企业CISO 需要了解他们面临这些威胁的严重程度，以及如何缓解这些威胁。

1/22/2025 11:18:41 AM

Zicheng

2025年网络安全投资的六大关键考量：应对新威胁的智慧决策

尽管在2021年至2022年间，网络安全预算有所增长，但近几年的增长势头已明显放缓。这意味着，网络安全领导者在采购决策时，必须更加审慎地考虑如何改善当前的安全和合规状况，以确保每一分投入都能带来实实在在的效益。那么，如何在2025年优化企业的网络安全预算，以有效应对不断演变的威胁呢?领导层需要深入了解当前的网络安全格局，并明确哪些举措能够帮助他们恰当地缓解风险。

2/19/2025 11:29:11 AM

Rita Gurevich

AI时代的头号安全威胁：机器身份

2025年以DeepSeek为代表的生成式AI技术迅猛发展，为企业带来了前所未有的创新机遇，也带来了新的安全风险。其中，非人类身份（Non-Human Identities, NHI）——如API密钥、令牌、加密密钥和服务账户——已成为网络安全的重大盲点。根据OWASP最新发布的《非人类身份十大风险》（NHI Top 10），NHI数量可能比人类身份多出10至50倍，是网络攻击的主要攻击面。

2/24/2025 1:44:35 PM

佚名

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

专治AI爬虫，Cloudflare推出“下一代蜜罐”

“下一代蜜罐”登场

AI爬虫泛滥，网站主头痛

相关资讯

新的 AI 安全在 2025 年正对 CISO 及其团队构成挑战

2025年网络安全投资的六大关键考量：应对新威胁的智慧决策

AI时代的头号安全威胁：机器身份