斯坦福、华盛顿大学与Google DeepMind合作:AI智能体预测人类行为准确率高达85%

11月25日消息,据外媒报道,斯坦福大学、华盛顿大学与Google DeepMind的研究人员携手开发了一种能够逼真模拟人类行为的AI智能体。 研究团队将详细的访谈记录与先进的GPT-4o模型相结合,构建了这一模拟系统。 当用户向智能体提出问题时,系统会加载访谈数据,并促使AI模仿受访者的回答方式。

斯坦福、华盛顿大学与Google DeepMind合作:AI智能体预测人类行为准确率高达85%

11月25日消息,据外媒报道,斯坦福大学、华盛顿大学与Google DeepMind的研究人员携手开发了一种能够逼真模拟人类行为的AI智能体。

研究团队将详细的访谈记录与先进的GPT-4o模型相结合,构建了这一模拟系统。当用户向智能体提出问题时,系统会加载访谈数据,并促使AI模仿受访者的回答方式。为获取这些宝贵的访谈记录,研究团队对每位受访者进行了长达两小时的深入访谈,并利用OpenAI的Whisper技术将对话内容精准转录成文本。

为了全面评估AI对人类行为的预测能力,研究团队设计了包括《通用社会调查》、大五人格评估以及多个行为经济学实验在内的测试。结果显示,基于访谈数据的AI在预测社会调查问题时,准确率高达85%,远超仅依赖人口统计信息的传统方法。

在五项社会科学实验的对比测试中,AI的表现与人类高度一致,相关系数高达0.98,充分展示了其强大的模拟能力。访谈驱动的AI相较于传统的人口统计法展现出了显著优势,不仅预测更为准确,还能有效减少人口统计类别之间的偏差。

目前,研究团队已将包含这1000个AI模型的数据集公开在GitHub上,并建立了严格的两层访问机制,以确保数据的安全与合规使用。综合性数据对研究人员完全开放,而涉及个别参与者的详细数据则需经过特殊审批方可访问。

相关资讯

面向软件工程的AI智能体最新进展,复旦、南洋理工、UIUC联合发布全面综述

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本篇综述的作者包括来自复旦大学 CodeWisdom 团队的研究生刘俊伟、王恺欣、陈逸轩和彭鑫教授、娄一翎青年副研究员,以及南洋理工大学的陈震鹏研究员和伊利诺伊大学厄巴纳 - 香槟分校(U

世界最大 AI Agent 生态系统,微软推出全新“自主 AI 智能体”

就在刚刚,微软公布了世界最大 AI Agent 生态系统:现在,已经有十万家企业通过 Copilot Studio 创建智能体了。

Salesforce 首席执行官:大语言模型可能已接近技术上限,AI 的未来是智能体

他认为人工智能的未来在于自主代理(即俗称的“AI智能体”),而不是目前用于训练 ChatGPT 等聊天机器人的大型语言模型(LLM)。