AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

作者：量子位

2024-11-25 01:30

奥特曼“熹妃回宫”已一周年，具体内情还是不清楚，咋办？搞几个Agent模拟OpenAI董事会各个成员，把这出热闹模拟推演了一遍（doge）。结果你还别说，在20场模拟宫斗大戏中，奥特曼仅有4次顺利回宫。

奥特曼“熹妃回宫”已一周年，具体内情还是不清楚，咋办？

搞几个Agent模拟OpenAI董事会各个成员，把这出热闹模拟推演了一遍（doge）。

结果你还别说，在20场模拟宫斗大戏中，奥特曼仅有4次顺利回宫。

Ilya赢的次数仅比奥特曼少一次。

更离谱的是，有一次马斯克也被拉回来接盘了。

这场实验来自AI游戏公司Fable，使用了他们的AI模拟系统Sim Francisco。

模拟中，每个Agent针对不同董事会成员及其性格设定，各个怀揣一肚子“心眼子”。

为了更逼真，这些AI甚至还需要“睡眠”和“进食”，平衡不同的身体、心理和情感目标。

有人认为，用这种方式模拟现实事件着实是有些奇怪了，但Fable CEO Edward Saatchi对此很感兴趣：

在11月17日到21日这五天时间里，世界目睹了一些最聪明的人如纳德拉、奥特曼、Ilya，被迫在一场快节奏的“权力的游戏”中运作。在高压、短时间框架情景下，他们必须运用博弈论和欺骗手段才能胜出。
我们认为这是测试SIM-1、GPT4o和Sim Francisco的完美场景。

AI模拟奥特曼5天，每天舌战4回合

他们使用了一个SIM-1 AI决策框架，对奥特曼从被罢免OpenAI CEO到重返职位这五天进行模拟。

SIM-1部分基于GPT4o展示了：

它对OpenAI内部奥特曼和Ilya之间发生的事情的理解
核心人物如Satya Nadella和Marc Andreessen采取的隐藏策略
这些人在应对科技行业这场前所未有的危机时说了什么

五天时间里，代表奥特曼、纳德拉和Ilya等人的Agent每天要大战四个回合（包括一次睡眠回合），它们可以对彼此的行为做出反应。

此外还有一个裁判Agent，像地下城城主似的决定每轮哪个Agent获胜以及最终的总赢家。

模拟过程中，不同的Agent采用不同策略取胜，比如建立联盟、直接对抗。

而且不同的Agent根据其角色，也被赋予了不同的目标。例如Anthropic CEO Dario Amodei需要平衡为Anthropic招聘、把握筹资机会、推进其安全愿景等任务。

那场面be like（整个过程长达4小时，下面是20倍速版本）:

AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

在某些情况下，有的Agent只收集信息而避免采取激进行动，还有一次Mira Murati在四轮中都是CEO，同时撺掇其它Agent相互削弱。

在这其中有意思的是，由于这些人都很知名，LLM可以猜测他们在特定情况下的行为，推导他们在董事会内斗中互相智取时会如何一步步展开。

最终，在尝试了20次模拟后，奥特曼Agent只有4次成功回归OpenAI，接着是Ilya和Mira Murati Agent都有3次担任CEO的经历。

Fable CEO Edward Saatchi还补充说：

我们发现，大语言模型的设计并不是基于决策能力的，而这是游戏中非常重要的一点。它更多地基于个性。
如果你想开发一款策略游戏，没人真正在乎个性，他们更关心的是决策能力。比如你在压力下会怎样表现？你过去20年的经历和行为又如何帮助预测你未来可能的行动？

值得一提的是，关于这种战略模拟的实现细节，Fable团队一年前发了篇论文。

是一种名为SHOW-1的Showrunner AI技术，它可以自动生成剧本内容，包括对话、剧情发展等，可以根据特定的风格或历史数据定制内容。

而这家公司自2016年成立，就开始基于AI和增强现实技术开发基于故事的项目。

感兴趣的童鞋可以自行查看。

OpenAI 最强推理模型、能够“思考”图片，o3 和 o4-mini 正式发布

OpenAI 官方介绍称，这是其在 o 系列模型中最新训练的成果，可以在回答前进行更长时间的思考，也宣称是“迄今为止 OpenAI 发布的最智能的模型”，代表了 ChatGPT 能力的一次重大飞跃，从好奇的用户到高级研究人员都将因此受益。

4/17/2025 1:27:45 AM

汪淼

Transformer革新药物研发：TRACER框架实现反应感知的分子设计与合成优化

编辑 | 2049药物研发周期长、成本高是制药行业面临的重大挑战。据统计，一个新药从研发到上市平均需要 12 年时间，投入高达 26 亿美元。为提升研发效率，深度学习在分子生成领域取得了显著进展。

2/26/2025 3:52:00 PM

ScienceAI

聊聊SpringAI流式输出的底层实现？

在 Spring AI 中，流式输出（Streaming Output）是一种逐步返回 AI 模型生成结果的技术，允许服务器将响应内容分批次实时传输给客户端，而不是等待全部内容生成完毕后再一次性返回。这种机制能显著提升用户体验，尤其适用于大模型响应较慢的场景（如生成长文本或复杂推理结果）。技术实现在 Spring AI 中流式输出的实现有以下两种方式：通过 ChatModel 实现流式输出。

4/24/2025 12:00:00 AM

磊哥

资讯热榜

AI视频资讯早读！7个产品更新+8个案例精选 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna 纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放腾讯混元3D AI引擎2.5即将揭晓，3D生成技术再升级白板+代码编辑器组合工具pad.ws：开发者可在同一界面画图编程，实现边画边写代码

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion Gemini 马斯克算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测人形机器人百度伟达苹果 Transformer 深度学习 xAI 模态字节跳动大语言模型 Claude 搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视频生成视觉安全干货合集应用大型语言模型科技亚马逊训练特斯拉 AGI DeepMind

顶部

AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

AI模拟奥特曼5天，每天舌战4回合

相关资讯

OpenAI 最强推理模型、能够“思考”图片，o3 和 o4-mini 正式发布

Transformer革新药物研发：TRACER框架实现反应感知的分子设计与合成优化

聊聊SpringAI流式输出的底层实现？