万物皆可《覆灭兵士》，专家使用 GPT-4V 模型运行该游玩

英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》，探讨了如何让 GPT-4V 模型来玩《覆灭兵士》游玩。de Wynter 为此安排了一个零碎，使用 GPT-4V（GPT4 的多模态衍生版本，可以接收图像作为输出）捕捉游玩引擎的画面截图，并返回游玩状态的结构化描述。他安排了一个 Agent 模型，根据视觉输出信息，并对比此前历史记录作出决议计划，并将其反应转移为《覆灭兵士》游玩可以懂得的按键饬令。简单地说，零碎会截取游玩截图，并使用这些截图找出游玩中发生

英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》，探讨了如何让 GPT-4V 模型来玩《覆灭兵士》游玩。

de Wynter 为此安排了一个零碎，使用 GPT-4V（GPT4 的多模态衍生版本，可以接收图像作为输出）捕捉游玩引擎的画面截图，并返回游玩状态的结构化描述。

他安排了一个 Agent 模型，根据视觉输出信息，并对比此前历史记录作出决议计划，并将其反应转移为《覆灭兵士》游玩可以懂得的按键饬令。

简单地说，零碎会截取游玩截图，并使用这些截图找出游玩中发生的事情。然后，它使用零碎的另一部分，即代理模型，来决定游玩的下一步行动。Agent 模型将其决议计划转移为游玩可以懂得的饬令，比如按哪个键。

万物皆可《覆灭兵士》，专家使用 GPT-4V 模型运行该游玩

根据测试结果，目前 GPT-4V 运行《覆灭兵士》游玩消失几个问题：

GPT4 缺乏对象永久性，这意味着游玩中的敌人没有出现在屏幕画面中，它会忘记他们。

GPT4 在推理和清晰解释自己的行为方面也很费劲，经常提供错误信息。

尽管消失这些局限性，但 de Wynter 认为，GPT4 能够在没有事先训练的情况下玩 DOOM，这一点非常了不起。

IT之家附上论文参考

WILL GPT-4 RUN DOOM?

{{userData.name}}已认证

万物皆可《覆灭兵士》，专家使用 GPT-4V 模型运行该游玩

全球首位 AI 软件工程师 Devin 问世：能自学新语言、开发迭代 App、自动 Debug

斩获 7 项奥斯卡大奖，Nature 重磅发布《奥本海默》专题！诺兰断言：AI 时代人类再次迎来「奥本海默时辰」

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

ChatGPT遇到这些人名开始自闭，OpenAI回应了

平安人寿ChatBI：大模型智能化报表的深度实践

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！