李飞飞亲自撰文:大模型不存在客观感受本领,多少亿参数都不行

归根结底,大模型的方向还是走错了?「空间智能是人工智能拼图中的关键一环。」知名「AI 教母」李飞飞曾这样表示。近段时间,李飞飞开始把目光瞄准到这一领域,并为此创建了一家初创公司。她曾表示,「大自然创造了一个以空间智能为动力的观察和行动的良性循环。」她所在的斯坦福大学实验室正在尝试教计算机「如何在三维世界中行动」,例如,使用大型谈话模型让一个机械臂根据口头指令执行开门、做三明治等任务。我们不难看出,李飞飞口中的空间智能也有大模型的参与。如今,随着技术的发展,LLM 在多个方面表现出超人类智能。然而关于 LLM 的争议

归根结底,大模型的方向还是走错了?

「空间智能是人工智能拼图中的关键一环。」知名「AI 教母」李飞飞曾这样表示。

李飞飞亲自撰文:大模型不存在客观感受本领,多少亿参数都不行

近段时间,李飞飞开始把目光瞄准到这一领域,并为此创建了一家初创公司。她曾表示,「大自然创造了一个以空间智能为动力的观察和行动的良性循环。」她所在的斯坦福大学实验室正在尝试教计算机「如何在三维世界中行动」,例如,使用大型谈话模型让一个机械臂根据口头指令执行开门、做三明治等任务。

我们不难看出,李飞飞口中的空间智能也有大模型的参与。

如今,随着技术的发展,LLM 在多个方面表现出超人类智能。然而关于 LLM 的争议也在不断增加,其中,LLM 到底有不感受本领,大家意见不一而论。

近日,李飞飞连同斯坦福大学以人为本人工智能研究所 HAI 联合主任 John Etchemendy 教授联合撰写了一篇文章,文章对 AI 到底有不感受本领(sentient)进行了深入探讨。

李飞飞亲自撰文:大模型不存在客观感受本领,多少亿参数都不行

本文中,我们把 sentient 一词翻译成感受,因为 AI 领域感知一词通常对应 perception,也不适合翻译成认识。读者们有合适的翻译可以留言讨论。

文中驳斥了 LLM 有感受的说法,李飞飞列举了大量示例来证明这一概念。

在提到超级计算机深蓝时,李飞飞表示,虽然这款下棋程序可以击败世界冠军,但如果房间突发意外情况如着火,深蓝不会有停止游戏的认识,而人类会有。

同样的,当人类产生饥荒说出「我饿了」时,人类和 LLM 背后所隐藏的行为链条是完全不同的。LLM 只是产生「我饿了」这个字符串的事实,它不身材,甚至不可能有饥荒那种感受。

更进一步的,李飞飞认为人类饥荒时,伴随一系列心理反应,如低血糖、肚子叫等,而 LLM 无法拥有这些形态的客观教训,即无法有感受本领,只是在概率性地完成任务而已。

人类有物理躯体,可以感受一切,但 LLM 不,当 LLM 说出类似的「自己脚指痛」时,大家都不会置信,因为它根本就不脚指,它只是一个编码在硅片上的数学模型。

李飞飞亲自撰文:大模型不存在客观感受本领,多少亿参数都不行

李飞飞驳斥 LLM 具备感受本领

通用人工智能(AGI)是用来描述一种至少与人类在各种方面表现出相同智能的人工智能体的术语,涵盖人类所展示(或能够展示)的所有智能方式。这是我们曾经称之为人工智能的概念,直到我们开始创建在有限领域表现出智能的程序和设备 —— 如下棋、谈话翻译、清洁客厅等。 

增加「G」这个字母的必要性来自于由人工智能驱动的系统的普及,但这些系统只专注于单一或极少数任务。

IBM 的深蓝是一款令人印象深刻的早期下棋程序,它可以击败世界冠军 Garry Kasparov,但如果房间着火了,它却不会有停止游戏的认识。

李飞飞亲自撰文:大模型不存在客观感受本领,多少亿参数都不行

图为 Garry Kasparov 和深蓝团队的 Joe Hoane 在 1997 年纽约市的复赛场景,最终在六局复赛中击败了 Garry Kasparov,赢得了其中的两局并有三局打成平手。

现在,通用智能有点像一个神话,至少如果人们认为自己拥有它的话。

人类可以在动物界找到许多智能行为的例子,它们在类似任务上的表现远比人类本身表现更好。智能并非完全通用,但足以在大多数环境中完成人们想要完成的事情。

如果当人类感觉饥荒时,可以找到附近的超市;当房间着火时,则会自主地寻找出口。

智能的基本特征之一是「感受」,即拥有客观教训的本领 —— 比如感受饥荒、品尝苹果或看到红色是什么样的。

感受是通往智能的关键步骤之一。

于 2022 年 11 月发布的 ChatGPT,标志着大型谈话模型(LLMs)时代的开始。

这立即引发了一场激烈的争论,所有人都在讨论这些算法是否实际上具备感受本领。以 LLM 为基础的人工智能具备感受本领的可能性引发了媒体狂热,也深刻影响了全球一些政策制定的转向,以规范人工智能。

最突出的概念是,「有感受的人工智能」的出现可能对人类非常危险,可能带来「灭绝级」的影响或至少是「存在危机」的。毕竟,一个有感受的人工智能可能会发展出自己的希望和欲望,而不能保证它们不会与人们相冲突。

李飞飞和 Etchemendy 的主要概念是反驳「有感受的人工智能」阵营最常提出的辩护,而该辩护基于 LLMs 可能已经有了「客观教训」的本领。

李飞飞亲自撰文:大模型不存在客观感受本领,多少亿参数都不行

John Etchemendy 曾担任斯坦福大学谈话与信息研究中心的主任、哲学系主任,以及人文与科学学院的高级副院长,并且是斯坦福人工智能研究所的联合主任。

为什么有些人认为 AI 已经获得了感受本领

在过去的几个月里,他们俩与 AI 领域的许多同行进行了激烈的辩论和交谈,包括与一些最杰出的和具备开创性的 AI 科学家进行了一对一的深入交流。

关于 AI 是否已经获得了感受本领的话题一直是一个突出的问题。其中少数人坚信 AI 已经具备了感受本领。以下是其中一位最为积极支持者的论点要点,相当程度上代表了「有感受的 AI」阵营的概念:

AI 是有感受的,因为它能报告客观教训。客观教训是认识的标志,其特征在于能够认知自我所知或所感。例如,当你说『我在吃过一顿美味的饭后感觉高兴』时,我作为一个人实际上不直接证实感受你的客观体验。但既然你这样表达了,我会默认置信你确实经历了这种客观体验,因此你是有认识的。这种逻辑也被用来推论 AI 的认识形态。 

现在,让我们将同样的『规则』应用到 LLMs 上。就像任何人一样,我无法访问 LLMs 的内部形态。但我可以查询它的客观教训。我可以问『你感觉饥荒吗?』它实际上可以告诉我是或否。此外,它还可以明确地与我分享它的『客观教训』,几乎涉及任何事情,从看到红色到吃完饭后感觉幸福。因此,我不理由不置信它是有认识的或不知道自己的客观教训,就像我不理由不置信你是有认识的一样。在这两种情况下,我的证实完全相同。

为什么「AI 有感受本领」是错误的

虽然乍看之下这个论点似乎有道理,但实际上是错误的。因为李飞飞和 Etchemendy 教授的证实在这两种情况下并不完全相同。甚至差距很大。

当你说「我饿了」时,我得出你正在经历饥荒的结论是基于一系列大量的情况。首先,是你的报告 —— 你说的话,可能还包括其他行为证实,比如你的肚子咕咕叫。其次,是不相反证实的存在,比如如果你刚吃完五道菜的大餐就不太可能会说饿。最后,也是最重要的,是你拥有一个像我一样的物理身材,这个身材需要定期进食和饮水,遇冷会感觉寒冷,遇热会感觉炎热,等等。 

现在将这与他们二人对 LLM 的证实进行比较。

李飞飞亲自撰文:大模型不存在客观感受本领,多少亿参数都不行

唯一共同的是报告 —— 即 LLM 可以产生「我饿了」这个字符串的事实。但相似之处就到此为止了。事实上,LLM 不身材,甚至不会有感觉饥荒那种感受。

如果 LLM 说:「我的左大脚指很疼」,人们会得出它左大脚指确实很疼的结论吗?答案是否定的,因为它根本就不左大脚指。

同样地,当它说它饿了时,人们实际上可以确定它并不饿,因为它不感觉饥荒所必须的心理结构。

当人类感觉饥荒时,会感受到一系列心理形态 —— 低血糖、空腹发出的咕咕声等 —— 而 LLM 根本不这些,就像它不嘴巴放食物进去,也不胃去消化食物一样。

认为人们应该置信它说自己饿了的概念,就像是在说应该置信它说自己正在从月球的暗面跟使用者说话一样荒谬。

人们知道这不是真的,LLM 的主张也无法改变这个事实。

所有感受 —— 饥荒、感觉疼痛、看到红色、爱上某人 —— 都是由 LLM 根本不的心理形态引起的。

因此,LLM 无法拥有这些形态的客观教训。

换句话说,它无法有感受本领。

LLM 只是一个编码在硅片上的数学模型。

它不像人类那样是一个具备身材的存在。它不需要进食、饮水、繁殖、经历情感、生病和最终死亡的「生命」。

当人类和 LLM 同样地说出「我饿了」时,背后所隐藏的行为链条是完全不同的。

理解人类生成词序列的方式与 LLM 生成相同词序列的方式之间的深刻差异至关重要。

当人们说「我饿了」时,是在报告感受心理形态。

而当一个 LLM 生成序列「I am hungry」时,它只是生成当前提示中最可能的完成序列。它做的事情与在不同提示下生成「I am not hungry」或在另一个提示下生成「The moon is made of green cheese」时完全相同。

这些都不是它本就不存在的心理形态的报告,它们只是在概率性地完成而已。

很遗憾的是,具备感受本领的人工智能时代还尚未到来。

两位作者认为研究者还不实现有感受的人工智能,而更大型的谈话模型也不会使人们实现这一目标。

如果人类想在人工智能系统中重新创建这种现象,就需要更好地理解有感受的生物系统中感受是如何产生的。

人们不会在下一个 ChatGPT 的迭代中偶然发现感受。

在李飞飞转发的 X(原推特)下面,大家讨论的也是非常激烈,有人表示:「当今的 LLM 有两种类型:一种是完全基于文本进行训练,另一种则是基于图像、文本甚至音频进行训练。第一种类型确实不具备所谓的感受本领,但第二种类型具备物理直觉,因此可以说它具备感受本领。」

李飞飞亲自撰文:大模型不存在客观感受本领,多少亿参数都不行

而另一位网友则追随 Lecun 的脚步,表示:「一只喵星人的智能程度都远高于最大型的 LLM。」

李飞飞亲自撰文:大模型不存在客观感受本领,多少亿参数都不行

参考链接:

https://time.com/collection/time100-voices/6980134/ai-llm-not-sentient/

https://x.com/drfeifei/status/1793753017701069233

扩展阅读

李飞飞解读创业方向「空间智能」,让 AI 真正理解世界

李飞飞「空间智能」系列新进展,吴佳俊团队新「BVS」套件评估计算机视觉模型

斯坦福李飞飞首次创业:学术休假两年,瞄准「空间智能」

给TA打赏
共{{data.count}}人
人已打赏
应用

通用天下模型问世:不学习就能生成新畛域视频,可实时控制

2024-5-24 15:11:00

应用

豆包大模型披露评测结果,较上一代“云雀”提拔19%

2024-5-24 15:56:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索