编辑 | X
量子纠缠是量子计算的核心资源。将纠缠集成到量子机器学习(QML)模型的测量中,导致训练数据大小大幅减少,超过指定的预测误差阈值。然而,对数据纠缠度如何影响模型性能的分析理解仍然难以捉摸。
在此,来自武汉大学、北京大学、南洋理工大学和悉尼大学的研究团队,通过建立量子「没有免费的午餐」 (no-free-lunch,NFL) 定理来解决这一知识差距。
与之前的发现相反,研究证明纠缠数据对预测误差的影响表现出双重效应,具体取决于允许的测量数量。通过足够数量的测量,增加训练数据的纠缠可以一致地减少预测误差,或减小实现相同预测误差所需的训练数据大小。相反,当允许的测量很少时,使用高度纠缠的数据可能会导致预测误差增加。
该研究为设计先进的 QML 协议提供了重要指导,特别是对于那些专为在有限访问量子资源的早期量子计算机上执行而定制的协议。
相关研究以《Transition role of entangled data in quantum machine learning》为题,于 5 月 2 日发布在《Nature Communications》上。
论文链接:https://www.nature.com/articles/s41467-024-47983-1
量子纠缠与 NFL 定理
量子纠缠是量子领域的一个非凡特征,它使量子计算机超越了传统计算机。在过去的十年中,各种利用纠缠的量子算法被设计用来推进密码学和优化,与传统方法相比,提供运行时加速。
在量子计算机的卓越能力和机器学习取得的惊人成功的推动下,一个被称为量子机器学习 (QML) 的新兴前沿领域出现,寻求在特定学习中超越经典模型。该领域已经取得了实质性进展。
机器学习中表征与数据集相关的学习模型能力的一个基本概念是「没有免费的午餐」 (no-free-lunch,NFL) 定理。NFL 定理得出了一个重要的见解:无论采用何种优化策略,模型的最终性能都取决于训练数据的大小和类型。
基于先前关于纠缠作用和经典 NFL 定理的发现,一个合理的推测是,高纠缠数据有助于提高 QML 模型的性能,并降低样本复杂性,尽管代价是使用大量量子资源来准备数据。这在量子计算的早期阶段可能是无法承受的。
纠缠数据对预测误差具有双重影响
在该研究中,研究人员否定了上述推测,并展示了当 QML 模型非相干学习量子动力学时纠缠数据的过渡作用,如图 1 所示。
图 1:带有纠缠数据的量子 NFL 设置的图示。(来源:论文)
在非相干学习场景中,量子学习器仅限于利用具有不同纠缠程度的数据集对未知 unitary 进行操作,并使用在投影测量下收集的有限测量结果来推断其动态,这与参考文献在学习问题和训练数据方面的情况不同。
纠缠数据是指与参考系统纠缠的量子态,纠缠程度用 Schmidt rank(r)定量表征。经过严格证明,在 NFL 的背景下,根据允许的测量数量 m,纠缠数据对预测误差具有双重影响。
研究人员进行数值模拟来展示纠缠数据的过渡作用、测量数量的影响以及训练数据大小(N)在确定预测误差中的作用。
图 2:非相干学习量子动力学时量子 NFL 定理的模拟结果。(来源:论文)
模拟结果如图 2 所示。从 图 2b 可以看出,对于 N = 2 和 N = 8,当测量数足够大,即 m > 1000 时,预测误差随着测量数 m 的增加和 r 的增加而不断减小。另一方面,对于 N = 8 情况下 m ≤ 100 的少量测量,随着 r 的不断增加,平均预测误差在超过临界点(m = 10 时 r = 3, m = 100 时 r = 4)后先减小后增大。即纠缠数据在确定有限次测量的预测误差方面起过渡作用。
对于不同大小的训练数据,这一观察结果也在图 2b 中得到了验证,其中对于较小的测量时间 m = 10,增加 r 对于降低预测误差没有帮助。相比之下,较大的训练数据量始终会导致较小的预测误差。
研究结果引发了一些需要进一步研究的重要方向。第一个研究方向是探索纠缠数据的过渡作用是否存在于其他 QML 任务中。
另一个研究方向是在通过使用辅助量子系统来利用量子动力学和测量中的纠缠时,是否存在类似的过渡作用。
注:封面来自网络