编辑 | 枯叶蝶
近日,天津大学激光与光电子研讨所吴亮副教授、姚建铨院士团队联合自然语言处理实验室熊德意教授团队报道了一种使用多频次补偿输出的深度进修模型来增强光谱猜测成效的方案。
该方案可无效地提高现有光学数据集的利用率,在不额外增加训练成本的基础上,增强了与超外表结构对应的光谱响应的猜测成效。
有关研讨成果以「Enhanced spectrum prediction using deep learning models with multi-frequency supplementary inputs」为题,于 2024 年 5月16 日发表在《APL Machine Learning》。
论文链接:https://doi.org/10.1063/5.0203931
研讨背景
近年来,深度进修技术的快速发展为各个领域带来了前所未有的变革和创新,成为了多门学科处理复杂且庞大的数据的无效工具。
基于神经搜集的方法可以无效地检测目标数据的有关特征和潜在模式,但如果深度进修模型直接进修这些来自分别领域、分别格式的有关数据仍存在一定的挑战。
特别的,近年来结合深度进修技术的研讨领域普遍面临着现有数据集的体量小、质量低等问题,影响了模型对于目标任务的进修成效。
在整个「AI for Science」的研讨过程中,耗费成本最高的个人主要是数据集的构建,因此,如何更无效地利用现有数据集至关重要。
天津大学团队经研讨证明,在目标频谱猜测过程中向现有数据集添加补偿的多频输出信息,可以显著提高搜集的猜测准确率。这种方法为深度进修和光子学、复合材料设计和生物医学等其他领域的跨学科研讨和应用提供了新的数据集使用思路。
研讨亮点
研讨的创新点在于提出了全频次范围的光谱信息拆分思想,表现为结合实际设计需求,将全频次光谱信息按照工作频次个人及非工作频次个人进行进修任务拆分。
为展示该方案的普适性,工作中将目标工作频段细化为低频信息 (0-1 THz)个人和高频信息 (1-2 THz)个人来演示模型进修的增强成效。
与对该工作频次范围数据进行直接猜测相比,在补偿了其他频次信息后,整体的透射光谱数据猜测误差下降了 80% 左右,其中基于 Transformer 的模型在补偿低频信息后,猜测误差仅为直接猜测的 40% 左右,设计的超外表结构和模型架构如图一所示:
图1 (a)-(b) 超外表结构示意图,其中棕色个人代表「1」像素,黄色个人代表「0」像素。(c) CNN、LSTM、GRU 和 Transformer 搜集示意图,正向搜集中,模型的输出是25*25像素的超外表矩阵,输出是光学响应,而逆向搜集则相反。其中图中标注的「H」和「L」分别代表高频和低频的有关振幅和相位数据。
为更直观的展示优化后分别工作频次下振幅及相位参量的猜测成效,这里随机选取一些超外表结构在 CST Studio Suite 软件中进行仿真演示,如图二所示:
图2 优化后高频和低频数据的猜测成效示意图。(a)-(f) 通过将真实数据(紫色实线)与猜测数据(黑色虚线)进行比较,证明优化搜集模型在分别频次范围内的分别猜测性能。绿色区域表示用作补偿输出的频次信息数据,而黄色区域表示用于验证优化猜测性能的区域。其中a和b代表x偏振态高频和低频振幅的猜测结果。(c)-(d) y偏振态高频和低频振幅的猜测结果。(e)-(f) 高频和低频相位的猜测结果。
总结与展望
该研讨通过对分别光学问题的进修任务进行有针对性的数据集拆分,无效地提高了现有数据集的利用效率,进而提升了深度进修模型的进修成效。
这一优化方案无效缓解了现有光学数据集(特别是太赫兹波段的有关数据集)较少的问题,也为更多结合深度进修技术但数据昂贵的研讨领域,如复合材料设计、医学影像分析、金融数据猜测等提供了一种对数据集进行优化的新视角。
第一作者:邢效华,任玉琪 指导教师:吴亮,熊德意,姚建铨
论文合作者:邹蝶,张乾坤,毛炳轩
致谢:张霜教授(香港大学)、韩家广教授在论文工作过程中的帮助。有关研讨受到国家重点研发计划、国家自然科学基金等项目支持。
通讯员:张乾坤 史森方