编辑 | X
当水结冰时,它会从液相转化为固相,密度和体积等特性会发生巨大变化。水中的相变很常见,但新型材料或复杂物理体系中的相变是一个重要的钻研领域。
绘制相图通常需要大量的人类直觉和理解。如何量化未知体系中的相变通常是不清楚的,尤其是在数据稀缺的情况下。
麻省理工学院和瑞士巴塞尔大学的钻研职员,将生成式人工智能模型应用于这个问题,开发了一种新的机械进修框架,可以主动绘制新的物理体系的相图,几乎不需要人类监督。
钻研职员基于物理的机械进修要领,比依赖理论专业知识的费力的手动技术更有效。而且不需要大量的标记训练数据集。
例如,这样的框架可以帮助科学家钻研新型材料的热力学性质,或检丈量子体系中的胶葛。最终,这项技术可以使科学家自主发现物质的未知相成为可能。
计算机科学与人工智能实验室 (CSAIL) Julia 实验室的博士后、论文合著者 Frank Schäfer 表示:「这可能是主动科学发现新的、奇特的相特性的工具。」
该钻研以「Mapping Out Phase Diagrams with Generative Classifiers」为题,于 5 月 16 日发表在《Physical Review Letters》上。
论文链接:https://doi.org/10.1103/PhysRevLett.132.207301
物理学中的相变
虽然水转化为冰可能是相变最明显的例子之一,但更奇特的相变,例如材料从普通导体转化为超导体,引起了科学家的浓厚兴趣。
这些转化可以通过识别「序参数」(order parameter)来检测,「序参数」是一个重要、预计会发生变化的数量。例如,当温度低于 0°C 时,水会结冰并转化为固相(冰)。
图示:标签 y ∈{1,2} 的二元分类问题的 (a) 判断要领和 (b) 生成要领中建模的概率分布示意图。(来源:论文)
过去,钻研职员依靠物理专业知识手动建立相图,利用理论理解来了解哪些序参数很重要。这不仅对于复杂的体系来说是乏味的,对于具有新行为的未知体系来说也许是不可能的,而且还会将人类的偏见引入处理方案中。
AI 检测相变
最近,钻研职员开始利用机械进修来建立判断性分类器,通过进修将丈量统计数据分类为来自物理体系的特定阶段来处理这个任务,就像这些模型将图像分类为猫或狗一样。
麻省理工学院的钻研职员展示了如何利用多体物理领域原生的生成模型来建立分类器,与判断分类器相比,该分类器可以更有效地处理相分类任务。
在数值钻研中,人们通常可以直接利用生成模型来描述体系。生成要领可以利用此信息来创建分类器,绕过判断要领中的显式数据驱动构造。
其结果是一个强大而通用的框架,用于在具有多相的任意维参数空间中主动表征经典和量子相图。
知识更丰富的模型
生成模型通常通过估计某些数据的概率分布来工作,并利用这些数据生成适合分布的新数据点。然而,当利用经过验证的科学技术对物理体系进行模拟时,钻研职员可以自由获得其概率分布模型。该分布描述了物理体系的丈量统计数据。
麻省理工学院团队的见解是,这种概率分布还定义了一个可以建立分类器的生成模型。他们将生成模型插入标准统计公式中,以直接建立分类器,而不是像判断要领那样从样本中进修。
「这是一种非常好的要领,可以将您对物理体系的了解深入融入到机械进修方案中。它远远超出了对数据样本或简单的归纳偏差进行特征工程的范围。」Schäfer 说。
该生成分类器可以确定体系在给定某些参数(例如温度或压力)下处于哪个相。由于钻研职员直接近似物理体系丈量结果的概率分布,因此分类器具有体系知识。
图示:方形晶格上各向异性 Ising 模型的结果。(来源:论文)
这使得他们的要领比其他机械进修技术表现得更好。而且由于它可以主动工作,无需进行大量训练,因此他们的要领显著提高了识别相变的计算效率。
最终,类似于人们要求 ChatGPT 处理数学问题的方式,钻研职员可以向生成分类器询问诸如「这个样本属于 phase I 还是 phase II?」之类的问题。或「这个样本是在高温还是低温下生成的?」
科学家还可以利用这种要领来处理物理体系中不同的二元分类任务,可以检丈量子体系中的胶葛(状态是否胶葛?)或确定理论 A 或 B 是否最适合处理特定问题。他们还可以利用这种要领,通过确定如何调整某些参数以便聊天机械人提供最佳输出,来更好地理解和改进 ChatGPT 等大型语言模型。
未来,钻研职员还希望钻研理论保证,了解他们需要多少次丈量才能有效检测相变,并估计所需的计算量。
参考内容:https://phys.org/news/2024-05-scientists-generative-ai-complex-physics.html#google_vignette