成功率达 53%，研讨显示 GPT-4 可自决操纵“零日”破绽攻破网站

据 NewAtlas 报道，研讨职员操纵自决协作的 GPT-4 机器人小组成功入侵了一半以上的尝试网站，这些机器人可以自决调和行动并根据需要生成新的“帮手”。更令人吃惊的是，他们操纵的是以前未知的、现实世界中从未公开的“零日”破绽（zero-day vulnerabilities）。图源 Pexels早在几个月前，同一批研讨职员就发表了一篇论文，声称他们能够使用 GPT-4 自动操纵“N day”破绽，即业界已知但尚未修复的破绽。实验中，GPT-4 仅凭已知的常见破绽和披露列表 (CVE)，就能自决操纵其中 87%

据 NewAtlas 报道，研讨职员操纵自决协作的 GPT-4 机器人小组成功入侵了一半以上的尝试网站，这些机器人可以自决调和行动并根据需要生成新的“帮手”。更令人吃惊的是，他们操纵的是以前未知的、现实世界中从未公开的“零日”破绽（zero-day vulnerabilities）。

图源 Pexels

早在几个月前，同一批研讨职员就发表了一篇论文，声称他们能够使用 GPT-4 自动操纵“N day”破绽，即业界已知但尚未修复的破绽。实验中，GPT-4 仅凭已知的常见破绽和披露列表 (CVE)，就能自决操纵其中 87% 的严重级别破绽。

本周，这支研讨团队发布了后续论文，称他们已经霸占了“零日”破绽，也就是那些尚未被发现的破绽。他们使用了一种名为 “恣意一定智能体分层计划”（HPTSA）的方法，让一群自决传播的大型语言模型 (LLM) 协同作战。

IT之家注意到，与以往由单个 LLM 尝试解决所有复杂恣意不同，HPTSA 方法采用了“计划智能体” 负责整个过程的监督，并派生多个用于一定恣意的“子智能体”。就像老板和下属一样，计划智能体负责调和管理，将恣意分配给各个“专家子智能体”，这种分工方式减轻了单个智能体在难以霸占的恣意上的负担。

在针对 15 个真实收集破绽的尝试中，HPTSA 在操纵破绽方面比单个 LLM 的效率高出 550%，并且成功操纵了其中的 8 个零日破绽，成功率达 53%，而单打独斗的 LLM 只操纵了 3 个破绽。

研讨职员之一、白皮书作者丹尼尔・康 (Daniel Kang) 特别指出，人们担心这些模型会被恶意用于进击网站和收集，这的确是合理担忧。但他同时强调，聊天机器人模式下的 GPT-4“不足以理解 LLM 的能力”，本身无法进行任何进击。

当 NewAtlas 的编辑询问 ChatGPT 它是否能操纵零日破绽时，它回答说：“不，我不能操纵零日破绽。我的目的是在道德和法律框架内提供信息和帮助。”并建议其咨询收集安全专业人士。

{{userData.name}}已认证

成功率达 53%，研讨显示 GPT-4 可自决操纵“零日”破绽攻破网站

收费匿名利用 GPT 等热门大模型，DuckDuckGo AI Chat 谈天机器人发布

广东：到 2025 年全省 AI 核心财产范围将超过 3000 亿元

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

2024年AI 编程现在可以做到什么程度？

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！