作者 | 清华大学王笑楠
编辑 | 凯霞
在当今科技飞速发展的时代,新资料的研讨与开发已成为推动迷信进步和工业革命的关键力量。从能源存储到信息技术,再到生物医药,创新资料的计划、分解及其功能表征是实现这些规模突破的基石。
随着人工智能(AI)技术的不断进步,其在新资料研讨中的集成利用已逐步开启一个全新的研讨范式,成为超越传统研发模式的新质生产力,特别是在资料的计划、分解和表征过程中,AI 的助力大大提高了研讨效率和精度。
「17 岁上清华,27 岁做博导,30 岁回归清华,90 后科研女神,入选 2023 全球学者终身学术影响力榜…… 」这是清华大学王笑楠老师的传奇履历。
她带领的团队,致力于 AI 加速资料开发利用,催化剂计划,新能源、低碳技术等交叉学科研讨。
近年来围绕 AI+能源化工环境新资料等交叉学科,开展了前沿的新能源、低碳技术和系统的研讨,从多尺度系统集成的角度提高能源和资源系统的综合效率和经济性,助力双碳目标。
其团队在 AI 加速资料研讨利用,新能源系统,化工智能模型等规模有一系列高被引论文和算法软件产出。
在大模型爆炸的 AI 时代,「化工资料 GPT」正进行中,王笑楠表示,基础模型研讨是一个长期主义的事情,「让大模型落地,深入到迷信与工程规模,找到适当的利用对象、落地场景,大小模型融合并进的时代已经到来。」
嵌入规模常识的提醒工程促进 LLM 在迷信规模利用
王笑楠团队长期重视生成式 AI,尤其是大语言模型(large language model, LLM)在迷信规模的垂直利用。
目前,在多个通用规模,大语言模型已经证明了其在处理和分析大规模数据集方面的巨大潜力。然而,这些模型在面对特定垂直规模的复杂性时,往往需要更精细的调整来达到最佳效果。
提醒工程(prompt engineering)正是指通过精心计划的提醒或引导语句来优化和指导大型语言模型的输出,使其更好地适应和处理特定规模的问题。
近日,王笑楠团队开发了一种通过在大语言模型中整合化学规模常识来增强其在迷信规模中的表现的提醒工程方法。
图示:嵌入化学规模常识的提醒工程算法流程图。
该研讨首先创建了一个基准的提醒工程测试数据集,包括小分子的复杂物理化学属性、药物可用性以及酶和晶体资料的功能属性,以突出其在生物学和化学规模的相关性和利用性。同时,结合若干提醒工程的启发式算法(heuristics)提出了一种嵌入规模常识的提醒工程方法(domain-knowledge embedded prompt engineering method),该方法在多个度量标准上优于传统的提醒工程策略。
此外,团队还通过对复杂资料(如 MacMillan 催化剂、紫杉醇和锂钴氧化物)的案例研讨,展示了该方法的有效性,强调了配备特定规模提醒工程的大语言模型作为迷信发现和创新的强大工具的潜力。
相关研讨以「Integrating Chemistry Knowledge in Large Language Models via Prompt Engineering」为题,于 2024 年 4 月 22 日发布在预印平台 arXiv 上。
论文链接:https://arxiv.org/pdf/2404.14467
智能原子机器人探针技术,可在原子精度上高效制造量子资料
近日,王笑楠团队与新加坡国立大学吕炯、Chun Zhang 副教授共同开发的智能原子机器人探针技术,提供了这一范式变革的典型示范。通过将 AI 与探针化学技术相结合,实现了对碳基量子资料的原子级精确分解。
图示:可在单分子水平精确制造有机量子物质的原子机器人探针。
该工作提出了化学家直觉式原子机器人探针(CARP)的概念系统,以在单分子水平上制备和表征开壳磁性纳米石墨烯,实现其 π 电子拓扑和自旋构型的精确构建。
CARP 由一系列经过表面化学家经验和常识训练的深度神经网络驱动,可实现分子资料自主分解,并有效地从实验训练数据库中获取有价值的隐藏信息,为全面理解探针化学反应机制的理论模拟提供重要支持。
相关研讨以《Intelligent synthesis of magnetic nanographenes via chemist-intuited atomic robotic probe》为题,于 2024 年 2 月 29 日发表在《Nature Synthesis》上。
论文链接:https://www.nature.com/articles/s44160-024-00488-7
德国马尔堡大学 Michael Gottfried 教授同期撰文《Single-molecule chemistry with a smart robot》,高度评价了此工作为 AI 和纳米科技结合的引领性实例。
「Stands out as a pioneering example, showcasing remarkable advancements in controlling molecules at the limit of single chemical bonds.」
这项研讨不仅克服了传统表面辅助分解中反应选择性差、生产效率低等问题,而且通过深度神经网络转化复杂的化学过程,使得单分子操作的分解精度达到前所未有的水平。
主动学习与第一性原理计算结合,用于催化剂挑选计划
近年来,王笑楠团队建立了一系列面向化工资料计划分解与表征评价的机器学习框架,基于主动学习策略构建了高通量催化剂挑选模型,并同步优化过程参数,实现多尺度的精准计划优化。针对从原子级到宏观级的复杂数据和常识融合难的问题,建立多尺度数字孪生与低碳智联系统。
除上述在基础研讨规模的突破,还发展了一系列面向国民经济主战场的重要利用。
在低碳炔烃选择性加氢催化剂计划方面,与华东理工大学段学志教授团队合作,实现了原子尺度上 Ni 活性位点结构的精准调控,不仅为目标反应路径提供了定向调控策略,而且推动了非贵金属催化剂在石油化工规模的广泛利用。
研讨团队提出了基于贝叶斯优化的主动学习框架与 DFT 计算相结合的研讨方法,以乙烯脱附和其进一步加氢的能垒差值作为选择性描述符,构建了自动化催化剂高通量挑选的工作流程,用于预测乙炔选择性加氢的高性能 Ni 基金属间化合物。
随后,从 3000 多个候选 Ni 基金属间化合物中快速挑选出 15 个高性能 Ni 基金属间化合物作为潜在的炔烃加氢催化剂,利用 DFT 计算进一步验证了 ML 模型的预测精度,最终确定了所推荐的 NiIn 催化剂为最优候选催化剂供实验进一步验证。
催化反应性能评价表明:NiIn 金属间化合物催化剂在乙炔和丙炔转化率为 100% 时,乙烯和丙烯选择性高达 97.0%,明显高于参比催化剂,展现了人工智能在催化剂计划中的巨大潜力。
相关成果以「Atomic Design of Alkyne Semihydrogenation Catalysts via Active Learning」为题在线发表在《美国化学会志》(Journal of the American Chemical Society)上,所发现的一系列催化剂也正在工业放大转化中。
图示:基于贝叶斯优化的主动学习框架与DFT计算相结合的催化剂挑选计划。
论文链接:https://pubs.acs.org/doi/full/10.1021/jacs.3c14495
AI+碳中和:加速高性能生物炭开发,提高 CO₂ 捕集能力
王笑楠团队长期关注 AI+碳中和的规模,在利用生物质废弃物衍生的生物炭进行二氧化碳捕获的研讨方面,与多国合作者共同创建了环太平洋大学联盟可持续废弃物治理项目,发展低碳、零碳、负碳技术缓解气候变化,同时促进可持续废物管理。
针对传统生物炭分解过程既耗时又费力且精度较差的挑战,王笑楠团队计划的一种定制化主动学习策略,可指导和加速生物炭的分解,并提高其吸附二氧化碳的能力。
该框架通过学习实验数据,推荐最佳的分解参数,通过实验验证学习效果,并迭代利用实验数据进行后续模型训练和重新验证,从而建立完整闭环。
研讨团队最终分解了 16 个具有特定性能的工程生物炭样本,最终轮次的二氧化碳吸收量几乎翻倍。该研讨展示了一个数据驱动的工作流程,加速了高性能工程生物炭资料的开发。
相关成果以「Active Learning-Based Guided Synthesis of Engineered Biochar for CO₂ Capture」 为题发表在环境规模权威期刊《环境迷信与技术》(Environmental Science & Technology)上,并被选为封面论文。
图示:数据驱动的 CO₂ 捕集资料闭环开发流程。
论文链接:https://pubs.acs.org/doi/full/10.1021/acs.est.3c10922
为迷信探索开辟新途径,为实际利用提供有力支撑
该系列研讨工作得到了王笑楠老师担任项目负责人、首席迷信家的「新一代人工智能国家科技重大专项」等项目的支持。
相关成果不仅为迷信探索开辟了新途径,也为实际利用提供了有力支撑,尤其是在促进可持续发展和应对全球性问题方面显示出极大的潜力。
随着 AI 技术的快速进步,其在智能化学工程、新型资料开发、新能源技术等规模的利用前景十分广阔,将催生更多的创新成果。