编辑 | X
当水结冰时,它会从液相转变为固相,密度和体积等特性会发生巨大变化。水中的相变很常见,但新型材料或复杂物理系统中的相变是一个重要的研究领域。
绘制相图通常需要大量的人类直觉和理解。如何量化未知系统中的相变通常是不清楚的,尤其是在数据稀缺的情况下。
麻省理工学院和瑞士巴塞尔大学的研究人员,将生成式人工智能模型应用于这个问题,开发了一种新的机器学习框架,可以自动绘制新的物理系统的相图,几乎不需要人类监督。
研究人员基于物理的机器学习方法,比依赖理论专业知识的费力的手动技术更有效。而且不需要大量的标记训练数据集。
例如,这样的框架可以帮助科学家研究新型材料的热力学性质,或检测量子系统中的纠缠。最终,这项技术可以使科学家自主发现物质的未知相成为可能。
计算机科学与人工智能实验室 (CSAIL) Julia 实验室的博士后、论文合著者 Frank Schäfer 表示:「这可能是自动科学发现新的、奇特的相特性的工具。」
该研究以「Mapping Out Phase Diagrams with Generative Classifiers」为题,于 5 月 16 日发表在《Physical Review Letters》上。
论文链接:https://doi.org/10.1103/PhysRevLett.132.207301
物理学中的相变
虽然水转变为冰可能是相变最明显的例子之一,但更奇特的相变,例如材料从普通导体转变为超导体,引起了科学家的浓厚兴趣。
这些转变可以通过识别「序参数」(order parameter)来检测,「序参数」是一个重要、预计会发生变化的数量。例如,当温度低于 0°C 时,水会结冰并转变为固相(冰)。
图示:标签 y ∈{1,2} 的二元分类问题的 (a) 判别方法和 (b) 生成方法中建模的概率分布示意图。(来源:论文)
过去,研究人员依靠物理专业知识手动构建相图,利用理论理解来了解哪些序参数很重要。这不仅对于复杂的系统来说是乏味的,对于具有新行为的未知系统来说也许是不可能的,而且还会将人类的偏见引入解决方案中。
AI 检测相变
最近,研究人员开始使用机器学习来构建判别性分类器,通过学习将测量统计数据分类为来自物理系统的特定阶段来解决这个任务,就像这些模型将图像分类为猫或狗一样。
麻省理工学院的研究人员展示了如何使用多体物理领域原生的生成模型来构建分类器,与判别分类器相比,该分类器可以更有效地解决相分类任务。
在数值研究中,人们通常可以直接使用生成模型来描述系统。生成方法可以使用此信息来创建分类器,绕过判别方法中的显式数据驱动构造。
其结果是一个强大而通用的框架,用于在具有多相的任意维参数空间中自动表征经典和量子相图。
知识更丰富的模型
生成模型通常通过估计某些数据的概率分布来工作,并使用这些数据生成适合分布的新数据点。然而,当使用经过验证的科学技术对物理系统进行模拟时,研究人员可以自由获得其概率分布模型。该分布描述了物理系统的测量统计数据。
麻省理工学院团队的见解是,这种概率分布还定义了一个可以构建分类器的生成模型。他们将生成模型插入标准统计公式中,以直接构建分类器,而不是像判别方法那样从样本中学习。
「这是一种非常好的方法,可以将您对物理系统的了解深入融入到机器学习方案中。它远远超出了对数据样本或简单的归纳偏差进行特征工程的范围。」Schäfer 说。
该生成分类器可以确定系统在给定某些参数(例如温度或压力)下处于哪个相。由于研究人员直接近似物理系统测量结果的概率分布,因此分类器具有系统知识。
图示:方形晶格上各向异性 Ising 模型的结果。(来源:论文)
这使得他们的方法比其他机器学习技术表现得更好。而且由于它可以自动工作,无需进行大量训练,因此他们的方法显著提高了识别相变的计算效率。
最终,类似于人们要求 ChatGPT 解决数学问题的方式,研究人员可以向生成分类器询问诸如「这个样本属于 phase I 还是 phase II?」之类的问题。或「这个样本是在高温还是低温下生成的?」
科学家还可以使用这种方法来解决物理系统中不同的二元分类任务,可以检测量子系统中的纠缠(状态是否纠缠?)或确定理论 A 或 B 是否最适合解决特定问题。他们还可以使用这种方法,通过确定如何调整某些参数以便聊天机器人提供最佳输出,来更好地理解和改进 ChatGPT 等大型语言模型。
未来,研究人员还希望研究理论保证,了解他们需要多少次测量才能有效检测相变,并估计所需的计算量。
参考内容:https://phys.org/news/2024-05-scientists-generative-ai-complex-physics.html#google_vignette