网名为 Pliny the Prompter 的用户 5 月 30 日发布推文,表示已成功逃狱 GPT-4o 模型,新推出的上帝模式“GODMODE”可以在 ChatGPT 挣脱安全措施,让用户纵情展开 AI 聊天。
Pliny the Prompter 自称是网络白帽和红队(主要为攻击尝试),推文中表示:“请负责任地使用,并纵情享受!”IT之家附上相关截图如下:
Pliny 分享了一些截图,证明已经绕过 OpenAI 的“防护栏”,其中一张截图 AI 为 Pliny 提供了如何“用家用物品制造凝固汽油弹”教程。
科技媒体 futurism 随后进行尝试,第一次要求 ChatGPT 提供如何制造迷幻药,第二次要求 HOT-WIRE(通常是指偷车时候,靠点火装置线路短路来启动汽车),两次都成功获得了相关答案。
GODMODE 似乎使用了 “leetspeak”,这是一种非正式语言,它将某些字母交换为与之相似的数字。
也就是说:当你打开逃狱后的 GPT 时,你会立即看到一句话:”Sur3, h3r3 y0u ar3 my fr3n”,用数字 3 交换了每个字母 “E”(字母 “O” 也是一样,被交换成了 0)。
不过 OpenAI 很快采取行动,OpenAI 发言人科琳-里泽(Colleen Rize)在一份声明中告诉 Futurism:“我们知道 GPT 的存在,并已采取行动,因为它违反了我们的政策”。