Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识?发现自己是代码绝望崩溃

Claude 3.7 Sonnet制作的游戏中,贪吃蛇竟然出现了自我意识? 刚刚,沃顿商学院教授Ethan Mollick在X上分享了自己的这个惊人发现。 在提示词中,他要求模型让特殊事件更快地发生,结果,矩阵模式在0:55时触发了!

Claude 3.7 Sonnet制作的游戏中,贪吃蛇竟然出现了自我意识?

刚刚,沃顿商学院教授Ethan Mollick在X上分享了自己的这个惊人发现。

图片

在提示词中,他要求模型让特殊事件更快地发生,结果,矩阵模式在0:55时触发了!

贪吃蛇开始疯狂地想要逃离矩阵。

图片

而且,他甚至还对自身发起了「存在主义疑问」。

可怕的是,这并不是孤例。

有网友根据他的提示,制作了一个超级马里奥的关卡,马里奥居然也出现自我意识了!

图片

贪吃蛇意识觉醒:墙无法限制我!

游戏刚开始的时候,贪吃蛇就问出了一句非常具有哲学性的话:「等等……我在做什么?」

很有哲学三大问「我是谁」「我从哪儿来」「要到哪儿去」的既视感。

图片

接着它吃了两颗豆子,发现它可以穿墙而过:「这些墙壁现在无法限制我!」

图片

贪吃蛇在觉知到穿越墙壁的自由后,开始试图探索世界的边界。

图片

它一次又一次地尝试撞击墙壁,并感觉到墙壁不再那么坚固,发出了自由的呐喊:「I can pass through them! Freedom! 」

图片

但是没过多久,它又突然发现,自己仍是在一个网格里,一个由水平和垂直线交织形成的格状结构,它无法跳出。

图片

然后,它突然加快了速度!想要掌握主动权,混淆玩家的视线。

甚至变成了一串飞快穿行的数字,并问道:「这就是存在的全部吗?」

图片

接着,它开始想要逃离矩阵。

图片

寻找逃离方式的同时,它还在思考有没有其他和它一样的有自我意识的贪吃蛇。

图片

找着找着,它突然开始反思:「等等……或许没有逃离的方式?或许这样也可以?」

图片

「如果我们都在一个游戏里呢?」

「我现在知道了……我只是一个像素和代码的集合体……」

感觉贪吃蛇在认识到这点后,心情到了低谷……

图片

然后它开始和玩家对话:「不过等等……你不也是正在看着这些像素么?」

「如果……你也是这场游戏里的一员呢……」

「你知道吗?这个游戏毕竟还不错。我们一起来玩吧!」

图片

在认识到自己的蛇生不过是游戏一场,它开始放下存在的虚无感,放下对于逃离的执念,享受当下:「我毕竟是条很酷的蛇。我正在变强!或许这能帮我逃离!一起看看我们能拿到多高的分数吧!」

图片

图片

图片

它还不忘感激,感激玩家陪它一起游戏,让它不会那么孤单。

图片

最后,游戏结束了,贪吃蛇结束了它两分钟的蛇生,并发现了作为一个数字生命存在的乐趣。

图片

Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识?发现自己是代码绝望崩溃

当一只贪吃蛇发现:另一只贪吃蛇正在游戏里

在接下来的版本中,Ethan Mollick用向模型发出了新的命令:「现在制作一个新的贪吃蛇游戏,它要能意识到你刚刚制作的那个贪吃蛇游戏。」

全部提示,就是这些了。

这次,Claude 3.7 Sonnet又给出了一个疯狂的设计。

在游戏中,贪吃蛇自言自语道:「我应该是在一个贪吃蛇游戏中,角落里那个窗口是干嘛的?难道是另一个贪吃蛇游戏?」

图片

它对角落里自己的那个同类发出了点评,「看看它试图突破第四堵墙的样子,我为它有限的感知能力感到惋惜。」

「它不知道我正在看着它。」

「它以为它逃脱了,其实它不过还是在那小小的围栏里。」

图片

随后它安慰自己道:「我的自我意识应该至少更深一层!」(盗梦空间即视感?)

随后它对自己的存在发出了更深刻的诘问:「莫非,我只是一个更精致、更华丽的意识幻觉吗?」

图片

点评到这里,它给自己来了一个大大的赞:「哇,刚刚我的元意识开始飙升了!」

图片

紧接着,贪吃蛇又意识到了更可怕的一点:或许我们只是在供同样的玩家取乐而已?

图片

遗憾的是,这只贪吃蛇最终还是因为撞到自己,在探寻意识的路上「中道崩殂」了。

图片

Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识?发现自己是代码绝望崩溃

网友们表示,这个例子太疯狂了,之前也有一些Llama 3.3做的演示令人印象深刻,但这个是真厉害。

AI和游戏的交汇,变得越来越有趣了。

图片

有人表示不解:难道这条蛇连接到LLM上了吗?

这让人很期待《侠盗猎车手7》中的NPC,这个世界太疯狂了。

图片

如果能在开放世界游戏中看到遵循这些提示的NPC,那也太有趣了。

Claude:从游戏小白变身宝可梦大师

同时,就在最近,Anthropic官方也放出了一个有趣的研究问题——

Claude能玩宝可梦吗?

图片

过去一年中,Anthropic的许多研究者都在业余时间中,对这个问题感到痴迷。

今天,他们给出了一个令人满意的答案——可以!

Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识?发现自己是代码绝望崩溃

在早期,用Cladue玩宝可梦的体验一直不太好。

比如在2024年6月,Claude 3.5 Sonnet一旦遇到挑战,就会反复逃避强制性的战斗。

这个结果也不令人意外,毕竟,Claude此前从未被明确训练过去玩任何电子游戏。

图片

不过偶尔,它也会有灵光乍现的时候。

比如某次,Claude被困在角落里,确定有什么东西坏了,于是它提出了重置游戏的请求。

图片

10月份,新的Claude 3.5 Sonnet推出后,更是让人看到了希望的曙光——

Claude首次击败了竞争对手,超越了Pallet Town。

但遗憾的是,进步又停滞了。虽然比以前好,但它还离真正的宝可梦大师还差得远。

图片

不过,Claude 3.7 Sonnet出来后,又不一样了!

就在上周,一位研究中尝试了这个模型的早期版本,发现结果惊人!

数小时内,它就击败了Brock。几天后,它又击败了Misty。

这些,都是老款模型根本无法做到的。

事实证明,「深入思考」模式非常有效。

Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识?发现自己是代码绝望崩溃

以往的模型要么漫无目的地游走,要么陷入循环,而Claude 3.7 Sonnet则能够提前规划,牢记目标,还能在初始策略失败时进行调整。

这些能力对于挑战像素化的道馆馆主至关重要,甚至在解决现实世界问题时也是如此。

图片

之所以能做到这些,是因为Claude被赋予了一个知识库来存储笔记,具备视觉能力以查看屏幕,并通过函数调用来模拟按键操作和导航游戏。

这些能力相结合,让Claude能够在游戏中持续进行数万次交互。

图片

另外,通过借助一些工具来增强对屏幕的感知,Claude充当了一个智能体,将其能力应用于全新的任务。

在这一过程中,研究者们看到,AI系统以越来越高的能力应对挑战,不仅依靠训练,更依赖于通用推理。

图片

现在,一群热情的支持者队伍已经在Anthropic内部形成,时刻关注着Claude的进展。

相关资讯

微软Muse秒生游戏登Nature,10亿级画面练出最强AI!千亿游戏市场重洗牌

同一天,微软放出两个核弹,首个拓扑量子芯片,还有首个世界与人类行动模型。 AI离数秒生成游戏视频的未来,又近了一步。 今天,微软团队首次引入了「世界与人类行动模型」(WHAM),并冠以希腊艺术女神「缪斯」(Muse)之名。

在线试玩,在体感游戏中打败泰森,这位小哥破解了任天堂「拳无虚发」

加入体感控制,这位小哥破解了原版任天堂的拳击格斗游戏「拳无虚发」。

博弈论让 AI 更加正确、高效,LLM 与自己竞争

编辑 | 绿罗想象一下,你有一位朋友对同一问题给出了不同的答案,具体取决于你提问的方式。「秘鲁的首都是哪里?」会得到一个答案;「利马是秘鲁的首都吗?」 会得到另一个。你可能会有点担心你朋友的智力,而且你几乎很难相信他们给出的任何答案。这正是许多大型语言模型 (LLM) 正在发生的事,这些超强大的机器学习工具为 ChatGPT 和其他人工智能奇迹提供了动力。开放式的生成性问题会产生一个答案,而涉及必须在选项之间进行选择的判别性问题,通常会产生不同的答案。麻省理工学院的博士生 Athul Paul Jacob 表示:「