万物皆可《毁灭战士》，专家利用 GPT-4V 模型运行该游戏

作者：故渊

2024-03-13 10:19

英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》，探讨了如何让 GPT-4V 模型来玩《毁灭战士》游戏。de Wynter 为此设计了一个系统，使用 GPT-4V（GPT4 的多模态衍生版本，可以接收图像作为输入）捕捉游戏引擎的画面截图，并返回游戏状态的结构化描述。他设计了一个 Agent 模型，根据视觉输入信息，并对比此前历史记录作出决策，并将其反应转化为《毁灭战士》游戏可以理解的按键命令。简单地说，系统会截取游戏截图，并利用这些截图找出游戏中发生

英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》，探讨了如何让 GPT-4V 模型来玩《毁灭战士》游戏。

万物皆可《毁灭战士》，专家利用 GPT-4V 模型运行该游戏

de Wynter 为此设计了一个系统，使用 GPT-4V（GPT4 的多模态衍生版本，可以接收图像作为输入）捕捉游戏引擎的画面截图，并返回游戏状态的结构化描述。

他设计了一个 Agent 模型，根据视觉输入信息，并对比此前历史记录作出决策，并将其反应转化为《毁灭战士》游戏可以理解的按键命令。

简单地说，系统会截取游戏截图，并利用这些截图找出游戏中发生的事情。然后，它利用系统的另一部分，即代理模型，来决定游戏的下一步行动。Agent 模型将其决策转化为游戏可以理解的命令，比如按哪个键。

万物皆可《毁灭战士》，专家利用 GPT-4V 模型运行该游戏

根据测试结果，目前 GPT-4V 运行《毁灭战士》游戏存在几个问题：

GPT4 缺乏对象永久性，这意味着游戏中的敌人没有出现在屏幕画面中，它会忘记他们。

GPT4 在推理和清晰解释自己的行为方面也很吃力，经常提供错误信息。

尽管存在这些局限性，但 de Wynter 认为，GPT4 能够在没有事先训练的情况下玩 DOOM，这一点非常了不起。

IT之家附上论文参考

WILL GPT-4 RUN DOOM?

相关标签：

GPT 游戏 GPT4 de Wynter

相关资讯

如何应对生成式大模型「双刃剑」？之江实验室发布《生成式大模型安全与隐私白皮书》

如何应对生成式大模型「双刃剑」？之江实验室发布《生成式大模型安全与隐私白皮书》

研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。

Anthropic 新研究：打错字就能“越狱”GPT-4、Claude 等 AI 模型

Anthropic 新研究：打错字就能“越狱”GPT-4、Claude 等 AI 模型

据 404 Media 报道，人工智能公司 Anthropic 近期发布了一项研究，揭示了大型语言模型（LLM）的安全防护仍然十分脆弱，且绕过这些防护的“越狱”过程可以被自动化。研究表明，仅仅通过改变提示词（prompt）的格式，例如随意的大小写混合，就可能诱导 LLM 产生不应输出的内容。

用C++和虚幻引擎开发视频游戏，斯坦福CS193u课程资料公开

用C++和虚幻引擎开发视频游戏，斯坦福CS193u课程资料公开

用C++开发一款视频游戏要掌握哪些知识？

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手从DeepSeek-V3发布谈大模型的技术突破与未来机遇 3 到 5 秒即可同声传译 40 余种语言，时空壶推出 W4 Pro 实时翻译耳机全网都在扒的DeepSeek团队，是清北应届生撑起一片天 OpenAI发布新年目标，Agent智能体或将迎来百模大战

标签云