快速筛选海量数据，即时做出明智决策，MIT、普林斯顿&卡内基梅隆大学团队利用LLM进行聚变研讨

编辑 | X可控核聚变能具有安全、清洁、燃料丰富等优点，是解决人类未来能源题目的主要选择之一。也许最有前途的核聚变装置是托卡马克（Tokamak）。尽管前景光明，但在人类和经济型托卡马克发电厂之间仍然存在重要的悬而未决的题目。自核聚变研讨开始以来，科学家们已经发表了数千份有关该主题的文件——论文、会议记录，甚至是世界各地聚变反应堆先前试验的书面日记。这样的信息源泉可能需要用一辈子的时光来阅读，甚至需要更长的时光来理解。然而，在圣地亚哥 DIII-D 国家聚变办法进行的实际聚变试验中，研讨职员在两次试验之间只有大约

编辑 | X

可控核聚变能具有安全、清洁、燃料丰富等优点，是解决人类未来能源题目的主要选择之一。也许最有前途的核聚变装置是托卡马克（Tokamak）。尽管前景光明，但在人类和经济型托卡马克发电厂之间仍然存在重要的悬而未决的题目。

自核聚变研讨开始以来，科学家们已经发表了数千份有关该主题的文件——论文、会议记录，甚至是世界各地聚变反应堆先前试验的书面日记。这样的信息源泉可能需要用一辈子的时光来阅读，甚至需要更长的时光来理解。

然而，在圣地亚哥 DIII-D 国家聚变办法进行的实际聚变试验中，研讨职员在两次试验之间只有大约 10 分钟的时光来定位该信息，并利用这些信息来为下一次运行做出调整。

论文共同作者，普林斯顿等离子体物理试验室 Joseph Abbate 博士说：「每次核聚变都在几秒钟内结束，在下一次核聚变之前，你有一个很短的时光窗口来解决任何题目，并做出任何必要的改变。你必须在很短的时光内做出很多决定。」

现在，来自普林斯顿大学、卡内基梅隆大学（CMU）和麻省理工学院 (MIT) 的科学家已经应用大型说话模型（ChatGPT、Bard 和 LLaMA 等工具背后的驱动力）来帮助核聚变研讨职员快速筛选数量惊人的数据，以便即时做出更明智的决策。该模型允许用户识别具有相似特征的先前试验，提供有关设备控制系统的信息，并快速返回有关聚变反应堆和等离子体物理学题目的答案。

「令人惊讶的是，核聚变研讨是应用大型说话模型来帮助人类的理想方案，」论文一作、卡内基梅隆大学的博士候选人 Viraj Mehta 说。「一方面，在论文、摘要和海报以及研讨职员和操作员在每次聚变试验后写的笔记中，有大量关于聚变的可用文章。另一方面，你需要快速获取这些信息。这是这些模型的亮点所在。」

该研讨以「Towards LLMs as Operating Copilots for Fusion Reactors」为题，于 2023 年 12 月 16 日发表在 NeurIPS 2023 AI for Science Workshop 上。

快速筛选海量数据，即时做出明智决策，MIT、普林斯顿&卡内基梅隆大学团队利用LLM进行聚变研讨

论文链接：https://openreview.net/forum?id=yGVChrbJ4E

研讨职员在普林斯顿大学校园举办的研讨生主导的黑客马拉松上为他们的项目奠基了基础，在此期间，团队确定了可以对现有说话模型进行的调整，以利用其能力进行聚变研讨。这些模型在经过互联网上数万亿个单词的训练后，因其能够生成类似人类文本的能力而迅速成名。

在仅仅几个晚上的协作编码中，该团队通过使用称为检索加强生成的过程加强原始大说话模型，为他们的研讨奠基了基础。检索加强生成允许人们使用额外的数据源来补充模型的一般数据集（通常基于特定截止日期之前发布的互联网文本），以提高模型相应的准确性和质量。在这种情况下，研讨职员添加了一个信息数据库，其中包括 DIII-D 先前试验的 shot 日记和注释，这些信息在互联网上不公开存在。

「在黑客马拉松上，我们能够从一群人那里获得即时反馈和灵感，保持项目向前发展，使我们能够克服任何障碍，最终为我们的模型奠基坚实的基础，」Abbate 说。

通过加强模型，研讨职员收到了对各种提示的有用相应，从如何操作特定设备的信息到建议更改设备参数。此外，他们可以构建题目，要求模型参照生成相应的确切试验或论文，从而提高模型的可信度。

Abbate 说：「这就像房间里有另一个助手一直陪伴在你身边，他了解反应堆中进行的每一次聚变试验，并可以根据过去发生的情况提供建议。」

虽然研讨职员在黑客马拉松上为他们的模型奠基了基础，但此后他们改进了他们的研讨，以便可以在实际的聚变办法中复制。例如，Abbate 正在与 DIII-D 的操作员合作，探索在该办法中实施该框架的方法，以便在那里进行试验的每个研讨小组都可以访问该框架。

该团队还指出，该框架可以应用于不再运行的聚变反应堆，使科学家能够访问信息源，否则这些信息可能会随着反应堆操作员退休或转移到其他办法而被遗忘。合著者、麻省理工学院研讨生 Allen Wang 证明，为 DIII-D 开发的相同框架可以适用于 Alcator C-Mod，这是麻省理工学院的一个聚变反应堆，已于 2016 年停止运行。

「有些机器已经关闭了几十年，没有人记得这些试验期间发生了什么，」主要作者、普林斯顿等离子体物理试验室 (PPPL) 的研讨物理学家 Egemen Kolemen 说。「但是通过收集所有文本数据并将它们插入说话模型中，我们可能会重新学习一些关键信息，这些信息可以帮助我们解决未来反应堆面临的题目。」

Mehta 充说，该模型对于担任反应堆会议领导者的年轻聚变研讨职员来说也可能是一个有价值的工具，他和 Abbate 在研讨生生涯中多次担任过这一角色。

他说：「有了这个模型，可以参照现有的每一篇核聚变论文，我们创造了一个工具，让下一代研讨职员比以前更容易地获取信息。」

参照内容：https://techxplore.com/news/2023-12-leveraging-language-fusion-energy.html

{{userData.name}}已认证

快速筛选海量数据，即时做出明智决策，MIT、普林斯顿&卡内基梅隆大学团队利用LLM进行聚变研讨

大模型加持的「全科AI家教」正式上岗，一场解放家长的教训革命在路上了

2023小米百万美金大奖出炉：彭湃OS、车身一体化压铸技巧获奖

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

平安人寿ChatBI：大模型智能化报表的深度实践

ChatGPT遇到这些人名开始自闭，OpenAI回应了

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！