AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

理论
14小时前
编辑

量子位

奥特曼“熹妃回宫”已一周年，具体内情还是不清楚，咋办？搞几个Agent模拟OpenAI董事会各个成员，把这出热闹模拟推演了一遍（doge）。结果你还别说，在20场模拟宫斗大戏中，奥特曼仅有4次顺利回宫。

奥特曼“熹妃回宫”已一周年，具体内情还是不清楚，咋办？

搞几个Agent模拟OpenAI董事会各个成员，把这出热闹模拟推演了一遍（doge）。

结果你还别说，在20场模拟宫斗大戏中，奥特曼仅有4次顺利回宫。

AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

Ilya赢的次数仅比奥特曼少一次。

更离谱的是，有一次马斯克也被拉回来接盘了。

AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

这场实验来自AI游戏公司Fable，使用了他们的AI模拟系统Sim Francisco。

模拟中，每个Agent针对不同董事会成员及其性格设定，各个怀揣一肚子“心眼子”。

为了更逼真，这些AI甚至还需要“睡眠”和“进食”，平衡不同的身体、心理和情感目标。

AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

有人认为，用这种方式模拟现实事件着实是有些奇怪了，但Fable CEO Edward Saatchi对此很感兴趣：

在11月17日到21日这五天时间里，世界目睹了一些最聪明的人如纳德拉、奥特曼、Ilya，被迫在一场快节奏的“权力的游戏”中运作。在高压、短时间框架情景下，他们必须运用博弈论和欺骗手段才能胜出。
我们认为这是测试SIM-1、GPT4o和Sim Francisco的完美场景。

AI模拟奥特曼5天，每天舌战4回合

他们使用了一个SIM-1 AI决策框架，对奥特曼从被罢免OpenAI CEO到重返职位这五天进行模拟。

SIM-1部分基于GPT4o展示了：

它对OpenAI内部奥特曼和Ilya之间发生的事情的理解
核心人物如Satya Nadella和Marc Andreessen采取的隐藏策略
这些人在应对科技行业这场前所未有的危机时说了什么

五天时间里，代表奥特曼、纳德拉和Ilya等人的Agent每天要大战四个回合（包括一次睡眠回合），它们可以对彼此的行为做出反应。

此外还有一个裁判Agent，像地下城城主似的决定每轮哪个Agent获胜以及最终的总赢家。

AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

模拟过程中，不同的Agent采用不同策略取胜，比如建立联盟、直接对抗。

而且不同的Agent根据其角色，也被赋予了不同的目标。例如Anthropic CEO Dario Amodei需要平衡为Anthropic招聘、把握筹资机会、推进其安全愿景等任务。

那场面be like（整个过程长达4小时，下面是20倍速版本）:

AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

在某些情况下，有的Agent只收集信息而避免采取激进行动，还有一次Mira Murati在四轮中都是CEO，同时撺掇其它Agent相互削弱。

在这其中有意思的是，由于这些人都很知名，LLM可以猜测他们在特定情况下的行为，推导他们在董事会内斗中互相智取时会如何一步步展开。

最终，在尝试了20次模拟后，奥特曼Agent只有4次成功回归OpenAI，接着是Ilya和Mira Murati Agent都有3次担任CEO的经历。

AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

Fable CEO Edward Saatchi还补充说：

我们发现，大语言模型的设计并不是基于决策能力的，而这是游戏中非常重要的一点。它更多地基于个性。
如果你想开发一款策略游戏，没人真正在乎个性，他们更关心的是决策能力。比如你在压力下会怎样表现？你过去20年的经历和行为又如何帮助预测你未来可能的行动？

值得一提的是，关于这种战略模拟的实现细节，Fable团队一年前发了篇论文。

是一种名为SHOW-1的Showrunner AI技术，它可以自动生成剧本内容，包括对话、剧情发展等，可以根据特定的风格或历史数据定制内容。

而这家公司自2016年成立，就开始基于AI和增强现实技术开发基于故事的项目。

感兴趣的童鞋可以自行查看。

AI推演OpenAI内斗结果：奥特曼仅有20%胜率，马斯克也有机会接盘？？？

给TA打赏

共{{data.count}}人

人已打赏

限定120分钟科研挑战，o1和Claude表现超越人类

2024-11-25 12:50:14

将活体神经元植入大脑，他和马斯克闹掰后开辟脑机接口新路线

2024-11-25 13:50:00

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

推理模型 DeepSeek-R1-Lite 预览版上线，号称媲美 OpenAI o1-preview
11月20日
TOP2

AI自动操作VS Code，自然语言搞定各种配置，来自阿里通义智能计算实验室 | 开源
11月20日
TOP3

九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊
11月20日
SU 哈佛亚马逊最新研究：量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了
11月16日
微软在东京开设其日本首个研发中心，专注于将机器人技术与 AI 相结合
11月18日
AI 助力脑瘤手术：10 秒内精准识别残留肿瘤
11月14日
登Science封面！基因组基础模型Evo重磅发布，AI解码分子、DNA、RNA和蛋白质
11月15日
闲鱼注册用户突破 6 亿，AI 技术已应用于闲置交易全链路
11月18日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部