成功率达 53%,研讨显示 GPT-4 可自决操纵“零日”破绽攻破网站

据 NewAtlas 报道,研讨职员操纵自决协作的 GPT-4 机器人小组成功入侵了一半以上的尝试网站,这些机器人可以自决调和行动并根据需要生成新的“帮手”。更令人吃惊的是,他们操纵的是以前未知的、现实世界中从未公开的“零日”破绽(zero-day vulnerabilities)。图源 Pexels早在几个月前,同一批研讨职员就发表了一篇论文,声称他们能够使用 GPT-4 自动操纵“N day”破绽,即业界已知但尚未修复的破绽。实验中,GPT-4 仅凭已知的常见破绽和披露列表 (CVE),就能自决操纵其中 87%

据 NewAtlas 报道,研讨职员操纵自决协作的 GPT-4 机器人小组成功入侵了一半以上的尝试网站,这些机器人可以自决调和行动并根据需要生成新的“帮手”。更令人吃惊的是,他们操纵的是以前未知的、现实世界中从未公开的“零日”破绽(zero-day vulnerabilities)。

成功率达 53%,研讨显示 GPT-4 可自决操纵“零日”破绽攻破网站

图源 Pexels

早在几个月前,同一批研讨职员就发表了一篇论文,声称他们能够使用 GPT-4 自动操纵“N day”破绽,即业界已知但尚未修复的破绽。实验中,GPT-4 仅凭已知的常见破绽和披露列表 (CVE),就能自决操纵其中 87% 的严重级别破绽。

本周,这支研讨团队发布了后续论文,称他们已经霸占了“零日”破绽,也就是那些尚未被发现的破绽。他们使用了一种名为 “恣意一定智能体分层计划”(HPTSA) 的方法,让一群自决传播的大型语言模型 (LLM) 协同作战。

IT之家注意到,与以往由单个 LLM 尝试解决所有复杂恣意不同,HPTSA 方法采用了“计划智能体” 负责整个过程的监督,并派生多个用于一定恣意的“子智能体”。就像老板和下属一样,计划智能体负责调和管理,将恣意分配给各个“专家子智能体”,这种分工方式减轻了单个智能体在难以霸占的恣意上的负担。

在针对 15 个真实收集破绽的尝试中,HPTSA 在操纵破绽方面比单个 LLM 的效率高出 550%,并且成功操纵了其中的 8 个零日破绽,成功率达 53%,而单打独斗的 LLM 只操纵了 3 个破绽。

研讨职员之一、白皮书作者丹尼尔・康 (Daniel Kang) 特别指出,人们担心这些模型会被恶意用于进击网站和收集,这的确是合理担忧。但他同时强调,聊天机器人模式下的 GPT-4“不足以理解 LLM 的能力”,本身无法进行任何进击。

当 NewAtlas 的编辑询问 ChatGPT 它是否能操纵零日破绽时,它回答说:“不,我不能操纵零日破绽。我的目的是在道德和法律框架内提供信息和帮助。”并建议其咨询收集安全专业人士。

给TA打赏
共{{data.count}}人
人已打赏
AI

收费匿名利用 GPT 等热门大模型,DuckDuckGo AI Chat 谈天机器人发布

2024-6-7 23:38:34

AI

广东:到 2025 年全省 AI 核心财产范围将超过 3000 亿元

2024-6-9 20:16:20

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索