研究称 GPT-4 通过了图灵测试,54% 的人将其误认为真人

感谢最新研究称,越来越多的人难以在图灵测试中区分 GPT-4 和人类。图源 Pexels据IT之家了解,“图灵测试”由计算机科学家艾伦・图灵在 1950 年提出,又被称为“模仿游戏”。测试的标准是机器能否像人类一样进行对话,让对方误以为其是真人。加州大学圣地亚哥分校的研究人员招募了 500 名参与者,让他们与四位“对话者”进行五分钟的交流,这四位“对话者”分别是真人、上世纪 60 年代的初代聊天机器人 ELIZA、以及驱动聊天机器人 ChatGPT 的 GPT-3.5 和 GPT-4。参与者在对话结束后需判断对方是
感谢最新研究称,越来越多的人难以在图灵测试中区分 GPT-4 和人类。

研究称 GPT-4 通过了图灵测试,54% 的人将其误认为真人

图源 Pexels

据IT之家了解,“图灵测试”由计算机科学家艾伦・图灵在 1950 年提出,又被称为“模仿游戏”。测试的标准是机器能否像人类一样进行对话,让对方误以为其是真人。

加州大学圣地亚哥分校的研究人员招募了 500 名参与者,让他们与四位“对话者”进行五分钟的交流,这四位“对话者”分别是真人、上世纪 60 年代的初代聊天机器人 ELIZA、以及驱动聊天机器人 ChatGPT 的 GPT-3.5 和 GPT-4。参与者在对话结束后需判断对方是人还是机器。

这项测试的结果发表于预印网站 arXiv 上,结果显示,有 54% 的参与者将 GPT-4 误认为真人。相比之下,预先设定好回复的 ELIZA 只有 22% 的人将其认作真人,GPT-3.5 则为 50%,而人类对话者被正确辨认的比例则为 67%。

研究称 GPT-4 通过了图灵测试,54% 的人将其误认为真人

研究人员指出,图灵测试过于简单,对话的风格和情感因素在测试中扮演着比传统智能认知更重要的角色。

电气和电子工程师协会 (IEEE) 的人工智能研究员内尔・沃森 (Nell Watson) 表示,单纯的智力并不能代表一切,真正重要的是足够智能地理解情境、他人的技能并具备同理心将这些要素结合起来。能力仅仅是 AI 价值的一部分,理解人类的价值观、偏好和界限也同样重要,正是这些品质才能让 AI 成为我们生活中忠诚可靠的管家。

沃森还提到,这项研究对未来的人机交互提出了挑战,人们将会对互动对象的真实性愈发疑虑,尤其是在涉及敏感话题时。同时,这项研究也凸显了 GPT 时代人工智能的巨大进步。

相关资讯

OpenAI CEO 阿尔特曼预测 AGI 可在 5 年内实现,但短期社会影响不大

OpenAI CEO 萨姆・阿尔特曼(Sam Altman)一直对通用人工智能(AGI)充满热情,并表示公司正在积极追求这一雄心勃勃的目标。 在最近的一次 Reddit AMA 中,阿尔特曼声称,使用现有的硬件就有可能实现 AGI。 虽然他没有明确说明具体需要什么,但此前他曾表示,实现他的 AI 愿景需要 7 万亿美元和多年的时间来建造 36 个半导体工厂和更多的数据中心。

王怀民院士:图灵计算模型仍是最深刻的理论基础,是新科学基础的基点

下文为国防科大王怀民院士在第 24 届全国高校计算机学科系主任 / 院长论坛上的主旨报告《人机物融合智能化时代,计算机学科专业创新人才培养》。机器之心做了不改变原意的整理。 在计算无处不在的当下,计算机学科专业却大有泯然众生之态。新时代的计算机学科专业创新人才该如何培养? 王怀民院士以 120 年的时间跨度回顾计算机学科专业的发源和发展历程,不同的历史阶段有着不同的发展模式,在时代的激流中什么改变了,什么是不变的?计算机科学和技术的发展具有国家战略意义,在人机物融合的新时代,如何理解从而实现科技创新?

杀猪盘被AI大模型套路,倒贴520块钱,骗子破大防

一个爆梗频出的 AI,让骗子破了大防。