Nature子刊,基于量子实验数据进行机器学习,用于解决量子多体问题

编辑 | 萝卜皮量子硬件实现方面的进步使得人们能够获取传统计算机无法模拟的数据。将传统机器学习 (ML) 算法与这些数据相结合,有望揭示隐藏的模式。与仅使用传统计算机相比,这种混合方法扩展了可有效解决的问题类别,但由于当前量子计算机中噪声的普遍存在,这种方法仅能用于解决受限问题。韩国首尔大学(Seoul National University)的研究人员扩展了混合方法的适用性,用于解决多体物理学中的挑战,例如预测给定哈密顿量的基态性质以及对量子相进行分类。通过在具有 127 个量子比特的超导量子硬件上进行各种减少误

图片

编辑 | 萝卜皮

量子硬件实现方面的进步使得人们能够获取传统计算机无法模拟的数据。将传统机器学习 (ML) 算法与这些数据相结合,有望揭示隐藏的模式。

与仅使用传统计算机相比,这种混合方法扩展了可有效解决的问题类别,但由于当前量子计算机中噪声的普遍存在,这种方法仅能用于解决受限问题。

韩国首尔大学(Seoul National University)的研究人员扩展了混合方法的适用性,用于解决多体物理学中的挑战,例如预测给定哈密顿量的基态性质以及对量子相进行分类。

通过在具有 127 个量子比特的超导量子硬件上进行各种减少误差的程序实验,研究人员设法从量子计算机中获取了精确的数据。

这使研究人员能够证明理论上建议的经典 ML 算法,可以在多达 44 个量子比特的系统中使用。该结果验证了经典 ML 算法在处理量子实验数据方面的可扩展性和有效性。

该研究以「Machine learning on quantum experimental data toward solving quantum many-body problems」为题,于 2024 年 8 月 30 日发布在《Nature Communications》。

图片

随着信息存储和处理技术的进步,机器学习在生物学、化学和物理学领域的应用受到了广泛关注,尤其是在多体物理学中。然而,经典算法在处理强相互作用系统时存在局限性,而量子计算机虽有潜力解决这些问题,但现有设备仍易产生误差。

为应对这一挑战,科学家提出了将经典计算机与量子计算机结合的混合方法,并引入了量子态学习方法,如经典影子技术(Classical Shadow)。这种方法能够有效利用经典设备和机器学习技术,解决部分复杂问题,但量子计算误差仍是限制其应用和扩展的主要障碍。

一种混合方法

在这里,首尔大学的研究人员通过实验验证了混合方法对多体物理学中重要问题的适用性。先前的研究从经典计算机上的张量网络算法中获取了机器学习的训练数据。随着系统规模的增加,特别是超过二维,这些方法面临局限性,凸显了量子计算机在生成训练数据方面的实用性。

实验表明,量子计算机数据的经典 ML 不仅适用于一维多体物理问题,也适用于二维多体物理问题。在实验中,先前的研究主要使用经典阴影来估计给定量子态的可观测量。然而,基于严谨的算法,并对训练数据应用各种误差减少程序,该团队成功地将从量子计算机获得的经典阴影用于机器学习任务,将其应用范围扩展到预测给定状态的物理可观测量之外。

图片

图示:基于量子实验数据的经典机器学习(ML)。(来源:论文)

该团队实现了经典的 ML 算法来解决与基态属性预测和量子相分类相关的问题。这些问题可以分别被视为传统 ML 中的回归和分类。

图片

图示:预测基态特性。(来源:论文)

对于回归,由于需要预测准确的值,因此使用了各种 QEM,从而将准确的 ML 模型应用于 12 量子比特系统。

关于分类任务,研究人员扩展了之前区分对称保护拓扑 (SPT) 相的工作,在更一般的环境中执行分类任务并将系统大小增加到 44 个量子比特。

图片

图示:区分拓扑有序相和平凡相的实验结果。(来源:论文)

此外,借助测量辅助状态准备方法,可以生成合适的训练数据,研究人员证明了在包含多达 25 个量子位的系统中拓扑有序相和平凡相之间的成功相分类,从而证实了可扩展 ML 算法的适用性。

该团队在 IBM 提供的超导量子比特设备上进行了实验。

该团队设计了实验来提取 ML 模型使用的数据之间的关系。实验中,研究人员分别从由 9 个量子比特组成的拓扑有序相和平凡相中采集了 10 个数据点,并将局部随机幺正应用于定点状态。

图片

图示:从预训练的 ML 模型中提取相位分类器。(来源:论文)

然后,在特征图 φ(ρ) 形成的特征空间上使用 SVM,将输入的量子态转换为由子系统 Renyi-2 纠缠熵组成的向量。在这种情况下,ML 相当于找到子系统 Renyi-2 纠缠熵的最佳线性组合。

训练后的 ML 模型的评估是使用 100 个数据集进行的(每个数据集由 6000 个状态组成,以与训练数据相同的方式生成,但通过经典模拟)。

研究人员观察到,从 ML 模型中得到的相位分类器比之前使用的 Renyi-2 TEE 的非线性序参数更能有效地区分量子相位。这一结果归因于在训练数据中故意引入误差,这种技术被称为数据增强。

此外,通过比较训练数据中具有和不具有测量误差缓解(MEM)的模型的预测误差,研究人员能够确认适当的误差缓解技术可以帮助提高 ML 性能。

展望与结语

该团队的结果表明,使用经典 ML 处理量子实验数据,并采用针对特定问题的错误减少程序来研究量子多体物理。

与在准备量子态后立即进行测量不同,在测量之前保留状态重要特征的压缩量子变换可以降低量子态的维数,从而减少经典 ML 的计算时间。

使用基于量子系统动态模拟数据的 ML 研究非平衡特性,将是该工作一个非常有希望的推广。此外,使用通过应用各种误差缓解技术或其他适合经典阴影的方法获得的实验数据,来训练 ML 模型代表了进一步研究的一个有希望的途径。

因此,研究人员认为基于他们的研究成果的未来工作,将继续扩展容错量子计算机之前的量子设备的有用应用。

论文链接:https://www.nature.com/articles/s41467-024-51932-3

相关资讯

稳健且准确,AlphaFold 结合两种 AI 方法,实现蛋白质化学位移自动分配

编辑 | 绿萝化学位移分配对于基于核磁共振 (NMR) 的蛋白质结构、动力学和相互作用研究至关重要,可提供重要的原子级见解。然而,获得化学位移分配是劳动密集型的并且需要大量的测量时间。为了解决这一限制,苏黎世联邦理工学院(ETH Zurich)的研究人员之前提出了 ARTINA——一种用于自动分配二维 (2D)–4D NMR 谱的深度学习方法。近日,研究人员提出了一种将 ARTINA 与 AlphaFold 和 UCBShift 相结合的综合方法,能够减少实验数据、提高准确性并增强大型系统的稳健性,从而实现化学位移

发现38万种新材料、17天自主合成41种新化合物,DeepMind一日两篇论文登上Nature

编辑 | 萝卜皮从计算机芯片、电池到太阳能电池板等现代技术都依赖于无机晶体。开发这些新技术,所需的晶体必须稳定,否则材料就会分解,而每个新的、稳定的晶体背后可能需要研究人员数月或者更久的艰苦实验。Google DeepMind 材料团队分享了 220 万颗新晶体的发现,相当于近 800 年的知识。该团队推出了新的深度学习工具,用于材料探索的图网络 (GNoME),可通过预测新材料的稳定性来显著提高发现的速度和效率。论文链接: GNoME,科学家可以使人类已知的技术上可行的材料数量成倍增加。在其 220 万个预测中,

可直接比较潜在新药的性能,杜克大学团队开发新的药物AI模型

编辑 | 白菜叶目前的分子机器学习模型往往将单个分子作为输入,来预测其生物、化学或物理特性。然而,此类算法需要大型数据集,并且尚未针对预测分子之间的性质差异进行优化,限制了它们从较小数据集学习的能力,也限制了直接比较两个分子预期性质的能力。杜克大学(Duke University)的研究人员开发了 DeepDelta,这是一种成对深度学习方法,可以同时处理两个分子,并学习从小数据集中预测两个分子之间的属性差异。在 10 个 ADMET 基准任务中,DeepDelta 方法显著优于两种已建立的分子机器学习算法:定向消