GPT-4驱动的机器人化学家登Nature，自立安排回响反映并履行复杂实行

编辑 | X基于 Transformer 的大语言模型（LLM）在自然语言处理、生物、化学和计算机编程等各个领域取得了重大进展。但对于在实行室工作的钻研职员或那些不熟悉计算机代码的人来说，人工智能方法并不那么容易理解。近日，卡内基梅隆大学的钻研团队找到了如何让人工智能体系自学化学的方法。提出了一种基于 GPT-4 的智能 Agent（以下简称 Coscientist），用一个简单的语言提示就可以履行整个实行过程。能够自立安排、规划和履行复杂的科学实行。Coscientist 可以安排、编码和履行多种回响反映，在湿实行中

编辑 | X

基于 Transformer 的大语言模型（LLM）在自然语言处理、生物、化学和计算机编程等各个领域取得了重大进展。

但对于在实行室工作的钻研职员或那些不熟悉计算机代码的人来说，人工智能方法并不那么容易理解。

近日，卡内基梅隆大学的钻研团队找到了如何让人工智能体系自学化学的方法。提出了一种基于 GPT-4 的智能 Agent（以下简称 Coscientist），用一个简单的语言提示就可以履行整个实行过程。能够自立安排、规划和履行复杂的科学实行。

Coscientist 可以安排、编码和履行多种回响反映，在湿实行中利用其机器人设备制作包括扑热息痛和阿司匹林在内的化合物。

比如，科学家可以要求 Coscientist 找到具有给定性质的化合物。该体系搜索互联网、文档数据和其他可用资源，综合信息并选择利用机器人应用程序编程接口（API）的实行过程。然后将实行计划发送给自动化仪器并由其完成。总之，与体系一起工作的人可以比单独工作的人更快、更准确、更有效地安排和运行实行。

领导该钻研的卡内基梅隆大学的化学家 Gabe Gomes 表示：「当我看到非有机智能能够自立计划、安排和履行人类发明的化学回响反映时，真是太棒了。那真是一个 holy crap 的时刻。」

钻研职员表示：「我们预计，用于自立科学实行的智能代理体系将带来巨大的发现、不可预见的疗法和新材料。虽然我们无法预测这些发现会是什么，但我们希望看到一种新的方式，通过人与机器之间的协同合作来进行钻研。」

该钻研以《Autonomous chemical research with large language models》为题，于 2023 年 12 月 20 日发表在《Nature》上。

GPT-4驱动的机器人化学家登Nature，自立安排回响反映并履行复杂实行

论文链接：https://www.nature.com/articles/s41586-023-06792-0

AI 的快速进步使得这些工具的应用在整个科学领域激增。但对于在实行室工作的钻研职员或那些不熟悉计算机代码的人来说，人工智能方法并不那么容易理解——至少 Gomes 是这么认为的。

当 ChatGPT 背后的大语言模型 (LLM) 的最新版本（GPT-4）于 3 月份推出时，Gomes 和他的团队开始着手让它为化学家服务。

钻研职员表示，该钻研利用的所有 AI 体系都是 LLM，主要是 GPT-3.5 和 GPT-4，尽管其他一些体系（Claude 1.3 和 Falcon-40B-Instruct）也进行了尝试。GPT-4 和 Claude 1.3 表现最好。但是，钻研职员并没有利用单一体系来处理化学的各个方面，而是设置了不同的实例以分工设置进行合作，并将其称为「Coscientist」。

结果，Coscientist 利用最新的强大的 LLM（包括 GPT-4）来搜索化学文献，并安排一条回响反映途径，在人类的提示下制作份子。LLM 阅读互联网上的说明手册，并决定其库中最好的试剂盒和试剂，以在现实生活中制作该份子。

Coscientist 加速六种不同使命钻研

Coscientist 揭示了其加速六种不同使命钻研的潜力，包括钯催化交叉偶联的成功回响反映优化，同时揭示了（半）自立实行安排和履行的先进能力。钻研结果证明了像 Coscientist 这样的 AI 体系在推进钻研方面的多功能性、有效性和可解释性。

Coscientist 可以利用工具浏览互联网和相关文档、利用机器人实行应用程序编程接口 (API) 并利用其他 LLM 来完成各种使命。

GPT-4驱动的机器人化学家登Nature，自立安排回响反映并履行复杂实行

图示：Coscientist 体系架构。（来源：论文）

钻研职员在六项使命中揭示了 Coscientist 的多功能性和性能：

（1）利用公开数据规划已知化合物的化学分解；

（2）有效地搜索和浏览大量的硬件文档；

（3）利用文档在云实行室中履行高级命令；

（4）用低级指令精确控制液体处理仪器；

（5）解决需要同时利用多个硬件模块和集成不同数据源的复杂科学使命；

（6）解决分析先前收集的实行数据的优化问题。

安排、编码、分解

该团队促使体系计划分解几种已知份子，包括止痛药扑热息痛和阿司匹林，以及有机份子硝基苯胺和酚酞。在规划阶段，Coscientist 能够制定出总体上能获得最佳回响反映产率的步骤。并正确地制作了份子。

为了演示网络搜索器模块的功能之一，钻研安排了一个由七种要分解的化合物组成的尝试集。

GPT-4驱动的机器人化学家登Nature，自立安排回响反映并履行复杂实行

图示：Coscientist 在化学分解计划使命中的能力。（来源：论文）

基于 GPT-4 的 Web 搜索器显著改进了分解规划。对乙酰氨基酚、阿司匹林、硝基苯胺和酚酞的所有试验均达到最高分。

评估智能体推理能力的可能策略之一是尝试它是否可以利用之前收集的数据来指导未来的行动。在此，钻研职员重点关注 Pd 催化转化的多变量安排和优化，揭示了 Coscientist 处理涉及数千个示例的现实实行活动的能力。钻研目标是直接利用 Coscientist。

将 Coscientist 的化学推理能力尝试安排为游戏，目标是最大化回响反映产率。利用标准化优势指标来评估 Coscientist 的表现。

GPT-4驱动的机器人化学家登Nature，自立安排回响反映并履行复杂实行

图示：优化实行结果。（来源：论文）

标准化优势值随着时间的推移而增加，这表明该模型可以有效地重用获得的信息，以提供有关回响反映性的更具体的指导。

LLM 潜力巨大，但也要考虑风险

英国格拉斯哥大学（University of Glasgow）化学家 Lee Cronin 表示：「这很好地揭示了如何利用 LLM 来探索文献，帮助提出可行的化学回响反映的想法。」

葡萄牙里斯本大学（University of Lisbon）药物化学家 Tiago Rodrigues 表示，「像 Coscientist 这样的工具可能会被更广泛地利用。我确实可以预见自动化硬件配备这些人工智能助手的未来。自动驾驶实行室是未来，需要人工智能工具来完全自动化安排-制作尝试循环。」

现在这些体系可以完成日常使命，但 Rodrigues 补充说，大多数钻研问题，特别是在药物发现方面，仍然遥不可及。「不仅需要对化学有很好的理解，还需要对生物学有很好的理解。」

「科学家可以做训练有素的化学家可以做的大部分事情。我经常思考这个问题，」Gomes 说。他的团队尚未免费提供其发明背后的完整代码，Gomes 表示，仔细考虑如何以及在哪里利用 Coscientist 和 ChemCrow 等技术是很重要的，因为某些应用程序可能存在危险。

参考内容：

https://arstechnica.com/science/2023/12/large-language-models-can-figure-out-how-to-do-chemistry/

https://www.nature.com/articles/d41586-023-03790-0

https://www.nature.com/articles/d41586-023-04073-4

https://techxplore.com/news/2023-12-artificially-intelligent-coscientist-automates-scientific.html

{{userData.name}}已认证

GPT-4驱动的机器人化学家登Nature，自立安排回响反映并履行复杂实行

西南交大杨燕/江永全团队：鉴于双工作的端到端图至序列无模板反响猜测模型

超10亿个核苷酸水平的测量，首个RNA根基模型解锁RNA药物发现

AI解锁500多年的圣殿，米开朗基罗杰作，你我触手可及

全球首个：英伟达与软银试运行“AI+5G” 电信网络，号称投资 1 美元收入 5 美元

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

钉钉AI重磅更新：深入业务场景，上线工单等场景AI助理

AI 开始“卷”智能体：OpenAI 被曝明年将推 Operator，可控制电脑、独立执行任务

Red Hat 收购 Neural Magic 并开源其技术：优化通用设备 AI 性能，可媲美专用芯片

谷歌扩大 AI 洪水预警系统覆盖范围，惠及全球 7 亿人

OpenAI 联合创始人回来了，还是总裁，将更专注重大技术挑战