智能体或带来灾难性风险，图灵奖得主Bengio指明新路径Scientist AI：世界模型+推理机

2025-02-27 03:54

编辑丨coisini领先的人工智能公司越来越专注于构建通用 AI 智能体，旨在让系统能够自主规划、行动并追求目标，几乎涵盖人类能够执行的所有任务。虽然这些系统可能非常有用，但不受约束的 AI 智能体对人类安全构成了重大风险。一些学者认为我们迫切需要一种更安全且仍具实用性的替代方案，以取代当前以智能体为导向的发展路径。

编辑丨coisini

领先的人工智能公司越来越专注于构建通用 AI 智能体，旨在让系统能够自主规划、行动并追求目标，几乎涵盖人类能够执行的所有任务。虽然这些系统可能非常有用，但不受约束的 AI 智能体对人类安全构成了重大风险。

一些学者认为我们迫切需要一种更安全且仍具实用性的替代方案，以取代当前以智能体为导向的发展路径。

最近，图灵奖得主 Yoshua Bengio 以第一作者身份发表了一篇论文 ——《Superintelligent Agents Pose Catastrophic Risks: Can Scientist AI Offer a Safer Path?》。该论文提出了一种在设计上可信且安全的非智能体 AI 系统 ——Scientist AI。

论文地址：https://arxiv.org/abs/2502.15657

Scientist AI 旨在通过观察来解释世界，而不是在其中采取行动以模仿或取悦人类。它包含一个生成理论以解释数据的世界模型，以及一个问答推理机。这两个组件在操作时都明确考虑了不确定性，以减少过度自信预测的风险。

Scientist AI 可用于协助人类研究人员加速科学进步。特别地，Scientist AI 可以作为防范 AI 智能体的护栏，最终使我们能够在享受人工智能创新带来的好处的同时，避免当前发展路径所带来的风险。

Scientist AI 简介

受柏拉图式理想化科学家形象的启发，研究团队提出了 Scientist AI 的设计与构建方案。Scientist AI 基于 SOTA 概率深度学习技术，并借鉴科学过程的方法论，即首先理解或建模世界，然后基于这些知识进行概率推断。

图灵奖得主 Yoshua Bengio

Scientist AI 展示了如何将概率预测转化为实验设计，从而消除科学发现中对强化学习智能体的需求。与旨在追求目标的自主 AI 不同，Scientist AI 的训练目标是提供对事件的解释及其估计概率。研究团队还提出了确保 Scientist AI 保持非自主性的策略。

Scientist AI 没有内置的情境意识，也没有能够驱动行动或长期计划的持久目标。它包含一个世界模型和一个概率推理机。世界模型根据从世界中观察到的一组数据生成解释性理论，推理机则基于世界模型进行无状态输入到输出的概率估计。

更准确地说，世界模型根据观察数据输出解释性理论的后验分布，推理机随后将后验分布与高效的概率推理机制结合起来，估计任何问题 X 的答案 Y 的概率。形式上，推理机接收一对输入（X, Y），也称为查询，输出在给定与问题 X 相关的条件下 Y 的概率。

Scientist AI 具有以下特性：

1. 世界模型生成的理论和推理机处理的查询都使用逻辑语句表达，这些语句可以用自然语言或形式语言表示。世界模型采样的语句形成因果模型，即以因果关系的形式提供解释。

2. 根据世界模型，任何查询都有一个唯一的正确概率，这是通过全局优化 AI 的贝叶斯训练目标得到的结果。推理机的输出近似于这个唯一的正确概率。

3. Scientist AI 可以生成涉及潜在或未观察变量的解释，从而对其进行概率预测。

最后，研究团队还预见了 Scientist AI 的三大主要应用场景：

1. 作为一种工具，帮助人类科学家显著加速科学进步，包括医疗等高回报领域；

2. 作为一种防护机制，通过双重检查自主 AI 提议的行动并确保其安全部署，从而防范自主 AI 的风险；

3. 作为一种 AI 研究工具，帮助更安全地构建未来更智能（甚至超级智能）的 AI。

感兴趣的读者可以阅读论文原文，了解更多研究内容。

历时7年完成，大获称赞的概率数值计算新书在线可看

蒂宾根大学的 Philipp Hennig 教授及其合著者编写了一本名为《Probabilistic Numerics: Computation as Machine Learning》的新书，适合初级研究者学习使用。

7/6/2022 3:06:00 PM

机器之心

谷歌发布AI科研助手:Gemini2.0驱动的虚拟科学家

谷歌日前正式宣布推出基于Gemini2.0的AI科研助手系统——AI co-scientist，旨在为科学家提供虚拟协作，从而生成新颖的研究假设和建议。这套系统不仅具备常规的文献审查和总结功能，更突破性地加入了原创知识发掘能力。 AI co-scientist能够模拟科学方法的推理过程，根据已有证据和具体研究目标，为科研人员提供新颖的研究假设和建议方案。

2/20/2025 11:49:00 AM

AI在线

「AI Scientist」会给科学带来什么？AI for Science 热潮下的争议

编译 | KX8 月份，Transformer 作者创业公司 Sakana AI 宣布推出 AI Scientist，声称「首个用于自动化科学研究和开放式发现的 AI 系统！」当 Sakana AI 着手创建「AI Scientist」来处理整个科学过程时，他们并不知道他们能走多远。他们创建的系统真的能够生成有趣的假设、运行实验、评估结果并撰写论文吗？参与「AI Scientist」研究的不列颠哥伦比亚大学的博士后研究员 Cong Lu 说，他们最终得到的是一个 AI 工具，并认为它相当于一个早期的博士生。他说，它

9/16/2024 11:13:00 PM

ScienceAI

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

智能体或带来灾难性风险，图灵奖得主Bengio指明新路径Scientist AI：世界模型+推理机

相关资讯

历时7年完成，大获称赞的概率数值计算新书在线可看

谷歌发布AI科研助手:Gemini2.0驱动的虚拟科学家

「AI Scientist」会给科学带来什么？AI for Science 热潮下的争议