Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

编辑 | 萝卜皮粒子加速器的自主调节是一个活跃且具有挑战性的研究领域,其目标是实现先进的加速器技术和尖端的高影响力应用,例如物理发现、癌症研究和材料科学。 但是,自主加速器调节仍然严重依赖经验丰富的熟练操作员的手动操作。 德国亥姆霍兹协会旗下 DESY(Deutsches Elektronen Synchrotron)的研究人员建议使用大型语言模型(LLM)来调整粒子加速器。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

编辑 | 萝卜皮

粒子加速器的自主调节是一个活跃且具有挑战性的研究领域,其目标是实现先进的加速器技术和尖端的高影响力应用,例如物理发现、癌症研究和材料科学。但是,自主加速器调节仍然严重依赖经验丰富的熟练操作员的手动操作。

德国亥姆霍兹协会旗下 DESY(Deutsches Elektronen Synchrotron)的研究人员建议使用大型语言模型(LLM)来调整粒子加速器。

该团队通过一个原理验证示例展示了 LLM 仅根据操作员的自然语言提示来调整加速器子系统的能力,并将其性能与当前最先进的优化算法,如贝叶斯优化(BO)和强化学习训练优化(RLO),进行了比较。

LLM 可以对非线性现实目标进行数值优化,未来有望帮助加速将自主调谐算法部署到日常粒子加速器操作中。

该研究以「Large language models for human-machine collaborative particle accelerator tuning through natural language」为题,于 2025 年 1 月 1 日发布在《Science Advances》。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

粒子加速器是一种精密的机器,旨在将电子和质子等亚原子粒子加速到极高的速度,通常接近光速。这些设备在各种应用中发挥着至关重要的作用,从物理学的基础研究到医学的实际应用,例如癌症治疗和材料科学。

随着这些不同应用的需求不断增长,对先进调谐和控制方法的需求也日益增加,以管理粒子加速的复杂动态。尽管如此,由于其复杂性,粒子加速器的调谐至今仍通常由经验丰富的操作员手动完成。

在此背景下,自主调谐方法的出现代表着一项重大进步。通过利用数值优化和机器学习(ML)领域的方法,自主系统有望加快加速器调谐程序,降低成本并最大限度地减少停机时间,同时还支持先进的操作模式以实现最先进的测量。

在最新的研究中,DESY 的研究人员介绍了一种使用 LLM 进行粒子加速器自主调谐的方法。

他们探究了当前最先进的 LLM 是否能够解决粒子加速器调谐任务,以及它们是否为当前最先进的粒子加速器调谐提供了一种有潜力的替代方案。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

图示:使用 LLM 调整粒子加速器的优化方案流程图。(论文)

为此,研究人员比较了 14 种不同的 LLM(包括 Gemma、GPT 4、Llama 2 、Vicuna 7B 、Mistral、Starling-LM 等主流大模型的不同版本)和 4 种不同的提示模板(调整提示、解释提示、思路链提示和优化提示),并评估了基于 LLM 的方法与其他调谐算法(包括 RLO 和 BO)的比较。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

图示:每个模型和提示的成功运行和试验的次数。(来源:论文)

考虑到 14 种不同的开放权重和商业 LLM 以及 4 种不同的提示的组合,研究人员发现 34 种 LLM 提示组合中只有 18 种能够成功实现本文中考虑的横梁参数调整任务的优化。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

图示:LLM 运行良好和不良调节时的磁体设置和光束参数轨迹。(来源:论文)

虽然通常可以使用 LLM 进行加速器调优,但模型和提示的选择至关重要。与最先进的加速器调优算法相比,该团队进一步发现 LLM 暂时无法与 RLO 和 BO 竞争。

性能最佳的 LLM 提示组合,即 GPT 4 Turbo 与优化提示,实现了平均约 50% 的归一化光束改进,这仅为 RLO 和 BO 分别实现的约 99% 和 93% 的一半。

虽然 LLM 的性能没有达到竞争水平,但也会产生高昂的计算成本,从而导致推理时间长、金钱成本高以及对环境的影响显著。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

图示:成功的调整运行次数、平均标准化 MAE 改进以及每个 LLM 相对于其大小、LMSYS Chatbot Arena ELO 评级、MMLU 分数、MT-bench 分数和 HellaSwag 分数的平均标准化累积 MAE。(来源:论文)

虽然这些明显的缺点意味着 LLM 还不是最先进的加速器调优算法的可行替代方案,但该团队的结果提供了一个有趣的概念证明。LLM 领域正在迅速发展,几乎每天都会发布更强大的模型。

该团队已经证明,更强大的模型通常在加速器调优任务上表现更好,这意味着 LLM 领域的必然进步也将带来更好的加速器调优任务表现。最终,这种发展可以使通过自然语言直观地部署自主加速器调优解决方案成为一种可行的选择。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期

图示:已评估提示的示例。(来源:论文)

团队认为在不久的将来 LLM 不会直接替代最先进的加速器调谐算法,而是会成为人类粒子加速器操作员的「副驾驶员」。它们可以为与加速器操作相关的各种任务提供自然语言界面,例如从日志中检索信息、生成报告或根据大量诊断测量结果诊断加速器的状态。

研究人员相信 LLM 还可用于在联合设置中协调最先进的加速器调整算法(例如 RLO 和 BO),从而决定或帮助操作员决定下一步调整加速器的哪个部分、使用哪种算法以及期望获得哪种结果。

此外,LLM 还可用于协助人类操作员部署最先进的调整算法,例如,通过响应有关期望结果的自然语言提示,提出 Xopt 配置或目标函数和合适的执行器。

从长远来看,让 LLM 直接执行调整的方法可以通过使用 ReAct 提示方案或使用 LLM 检查磁体设置(如 RLO 和 BO)在类似设置中是否合理来改进。

论文链接:https://www.science.org/doi/10.1126/sciadv.adr4173

相关资讯

94岁诺奖得主希格斯去世,曾预言「上帝粒子」的存在

一位用诗意的语言揭示宇宙秘密的人。一位 94 岁伟大科学家的逝世,引发了人们广泛的哀思。4 月 10 日消息,诺贝尔物理学奖得主、著名物理学家彼得・希格斯(Peter Higgs)于周一去世,享年 94 岁。希格斯因提出希格斯玻色子也被称为「上帝粒子」而闻名。根据爱丁堡大学的一份声明我们得知(彼得・希格斯是该校的荣誉退休教授),希格斯经历短暂的生病后,于 4 月 8 日星期一在家中安静的离开。对于老爷子的去世,爱丁堡大学校长 Peter Mathieson 沉重的表示:「彼得・希格斯是一位杰出的科学家 —— 一位真

准确率达 80%,深度学习识别布朗运动中纳米粒子形状

编辑 | 绿萝随着纳米粒子在医疗、制药和工业领域的实际应用。从材料的角度出发,需要对每个纳米粒子的性质和团聚状态进行评价并进行质量控制。评估液体中纳米粒子的一种方法是分析布朗运动的轨迹。虽然纳米粒子跟踪分析技术(Nano-tracking analysis,NTA) 是一种用于测量从微观到纳米尺度的单个粒子的简单方法,但它不能评估纳米粒子的形状一直是一个长期存在的问题。NTA 在使用 Stokes-Einstein 方程量化粒子大小时总是假设球形,但无法验证所测量的粒子是否真的是球形的。东京大学的研究团队提出了一种

172个机构合作,发现奇异粒子,机器学习分析约1.6亿次粒子碰撞数据

ATLAS 事件显示了本研究中神经网络发现的与标准模型预测偏差最大的八个事件之一。(来源:欧洲核子研究中心)编辑 | X粒子物理学家的任务是挖掘大量不断增长的碰撞数据,寻找尚未发现的粒子证据。特别是,他们正在寻找未包含在粒子物理标准模型中的粒子,科学家怀疑我们目前对宇宙构成的理解是不完整的。近日,来自 ATLAS 合作组的 172 个研究机构的科学家,使用一种受大脑启发的机器学习算法——神经网络,来筛选大量粒子碰撞数据,搜索数据中的异常特征或异常现象。研究团队使用一种称为异常检测的机器学习方法来分析大量 ATLAS