化学
为矛盾的理论提供统一解释,牛津大学等揭秘非晶硅结构
编辑丨coisini非晶硅(α-Si)是研究最广泛的无序网络固体之一,其结构已经被研究了几十年。 两种主要理论分别基于连续随机网络模型和「类晶体」模型,后者被定义为在保持整体非晶网络的同时,表现出类似于晶体状态的局部结构有序性。 然而,这种局部有序性的程度一直不明确。
11天实现18种广谱抗菌素设计,体外验证成功率94.4%,浙大侯廷军等用LLM方法从头设计AMP
编辑 | 萝卜皮大型语言模型 (LLM) 在化学和生物医学研究中取得了显著进展,可作为各种任务的多功能基础模型。 浙江大学侯廷军、谢昌谕以及南方医科大学姜志辉等课题组组成的联合团队提出了 AMP-Designer,这是一种基于 LLM 的方法,用于快速设计具有所需特性的抗菌肽 (AMP)。 在 11 天内,AMP-Designer 实现了 18 种具有广谱抗革兰氏阴性细菌活性的 AMP 的从头设计。
ByteQC:通往大规模实用化量子化学计算的曙光
编辑 | ScienceAI真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。 为了解决这一问题,近日字节跳动 ByteDance Research 团队开发并开源了 ByteQC ——基于 GPU 加速的大规模量子化学计算工具集。 该工具集使用强大的 GPU 算力,大幅度加速了常见的量子化学算法,同时结合领域内前沿的量子嵌入方法实现了量子化学「黄金标准」精度下的大规模量子化学体系的模拟。
Transformer革新药物研发:TRACER框架实现反应感知的分子设计与合成优化
编辑 | 2049药物研发周期长、成本高是制药行业面临的重大挑战。 据统计,一个新药从研发到上市平均需要 12 年时间,投入高达 26 亿美元。 为提升研发效率,深度学习在分子生成领域取得了显著进展。
Nature重磅:微软生成式AI材料设计工具,稳定性提升2倍,实验验证误差低于20%!
编辑 | 2049材料创新是推动技术进步的关键驱动力之一。 从 20 世纪 80 年代锂钴氧化物的发现到如今的锂离子电池技术,材料科学的每一次突破都深刻影响着我们的日常生活。 然而,传统的材料发现方法依赖于耗时且昂贵的实验试错过程,而计算筛选方法虽然加速了这一过程,但仍然受限于已知材料的数量。
2024 诺贝尔化学奖得主:「模型幻觉」给我无限创造力
万万没想到,一直备受批评的 AI「幻觉」问题,竟然在科学领域具有极大的应用价值?
AI赋能传统力场:字节跳动开发高精度通用小分子力场ByteFF
编辑 | ScienceAI小分子力场是药物发现中的重要工具,在计算机辅助药物设计中发挥关键作用。 化学空间覆盖广泛且高效精确的小分子力场将为药物发现奠定可靠的基础。 尽管基于机器学习的 MLFF(如 ANI-2x,MACE-OFF23 等)能够提供非常精确的小分子势能面预测,但它们的训练需要海量数据量,且推理速度较慢,还存在外推场景不确定度大等问题。
AI 驱动科学大爆发!从蛋白质到数学证明,2024 年最值得关注的科技突破
编辑 | ScienceAI2024 年对于 AI for Science 而言,可谓硕果累累:两个诺贝尔奖再度聚焦人工智能与科学的先驱性结合。 其一是诺贝尔化学奖,颁发给了在蛋白质设计与蛋白质结构预测领域做出开创性贡献的 David Baker 博士、John Jumper 博士以及Demis Hassabis 博士;其二是诺贝尔物理学奖,授予了 John J. Hopfield 博士与 Geoffrey Hinton 博士,以表彰他们在人工神经网络及其机学习核心原理方面的奠基性工作。
ScienceAI 2024「AI+材料&化学」专题年度回顾
编辑 | 2049在数字化转型的背景下,人工智能技术正在从根本上改变化学与材料科学的研究范式。 2024年,这场技术革新在多个领域展现其变革力量。 在分子设计领域,基于图神经网络(GNN)和 Transformer 架构的深度学习模型,结合分子动力学模拟,实现了分子性质的精确预测与优化。
LLM学习原子「结构语言」,生成未知化合物的晶体结构,登Nature子刊
编辑 | 萝卜皮生成合理的晶体结构通常是预测材料化学成分及其性质的第一步,但当前大多数预测方法计算成本高,制约了创新进程。 通过使用优质生成的候选结构来预测晶体结构,可以突破这一瓶颈。 在最新的研究中,英国雷丁大学(University of Reading)的研究人员介绍了 CrystaLLM,这是一种基于晶体学信息文件 (CIF) 格式的自回归大型语言建模 (LLM) 的多功能晶体结构生成方法。
打破GNN与语言模型间壁垒,图辅助多模态预训练框架用于催化剂筛选,登Nature子刊
编辑 | KX吸附能是一种反应性描述符,必须准确预测,才能有效地将机器学习应用于催化剂筛选。 该过程涉及在催化表面上的不同吸附构型中找到最低能量。 尽管图神经网络在计算催化剂系统的能量方面表现出色,但它们严重依赖原子空间坐标。
AI 驱动化学空间探索,大语言模型精准导航,直达目标分子
作者 | 「深度原理」陆婕妤编辑 | ScienceAI现代科学研究中,化学空间的探索是化学发现和材料科学的核心挑战之一。 过渡金属配合物(TMCs)的设计中,由金属和配体组成的庞大化学空间为多目标优化的搜索带来了难度。 为了解决这一问题,来自「深度原理」 (Deep Principle) 和康奈尔大学的研究者们开发了一种名为 LLM-EO(Large Language Model for Evolutionary Optimization)的新型工作流程算法,释放大型语言模型(LLM)的生成和预测潜能,显著提高了化学空间探索的效率。
成功率提升15%,浙大、碳硅智慧用LLM进行多属性分子优化,登Nature子刊
编辑 | 萝卜皮优化候选分子的物理化学和功能特性一直是药物和材料设计中的一项关键任务。 虽然人工智能很适合处理平衡多个(可能相互冲突的)优化目标的任务,但是例如多属性标记训练数据的稀疏性等技术挑战,长期以来阻碍了解决方案的开发。 在最新的研究中,浙江大学侯廷军团队、中南大学曹东升团队以及碳硅智慧团队联合开发了一种分子优化工具 Prompt-MolOpt。
化学空间导航仪:流生成式AI引导分子属性控制
作者 | 康奈尔大学魏光浩编辑 | ScienceAI分子设计是药物发现和材料科学中的一个核心挑战。目前,潜在可行的药物类小分子化合物的数量估计在10^23到10^60之间。这意味着即使使用最先进的计算方法,也无法穷举地搜索所有可能的分子结构。
中国科大、科大讯飞团队开发ChemEval:化学大模型多层次多维度能力评估的新基准
编辑 | ScienceAI近日,认知智能全国重点实验室、中国科学技术大学陈恩红教授团队,科大讯飞研究院 AI for Science 团队发布了论文《ChemEval: A Comprehensive Multi-Level Chemical Evaluation for Large Language Models》,介绍了新研发的一个面向化学领域大模型能力的多层次多维度评估框架 ChemEval。论文链接: : (NLP)的领域中,大语言模型(LLMs)已经成为推动语言理解与生成能力不断进步的强大引擎。随着这些
筛选数十亿化合物库,华盛顿大学药物AI虚拟筛选平台,登Nature子刊
编辑 | KX基于结构的虚拟筛选在药物发现中发挥着重要作用,科学家对数十亿种化合物库的筛选越来越感兴趣。但只有少数的筛选取得成功,此外,对于基于物理的对接方法而言,对整个超大型库进行虚拟筛选耗时且成本高昂。基于此,华盛顿大学研究团队开发了一种高度准确的基于结构的虚拟筛选方法 RosettaVS,用于预测对接姿势和结合亲和力。RosettaVS 在广泛的基准测试中优于其他最先进的方法。研究人员将其整合到一个新的开源 AI 加速虚拟筛选平台中,用于药物发现。利用这个平台,针对两个不相关的靶标,即泛素连接酶靶标 KLHD
打开AI黑匣子,「三段式」AI用于化学研究,优化分子同时产生新化学知识,登Nature
编辑 | KXAI 工具的强大功能,令人难以置信。但如果你试图打开引擎盖并了解它们在做什么,你通常会一无所获。AI 常常被视为「黑匣子」。对于化学来说,AI 可以帮助我们优化分子,但它无法告诉我们为什么这是最佳的——重要的特性、结构和功能是什么?近日,伊利诺伊大学厄巴纳-香槟分校(UIUC)的一个跨学科研究团队打开了黑匣子,研究人员通过将 AI 与自动化学合成和实验验证相结合,找到了 AI 所依赖的化学原理,从而改进用于收集太阳能的分子。研究找到了比现有稳定四倍的捕光分子,同时给出了使其保持稳定的重要见解 ——这是
「两全其美」,从头设计分子,深度学习架构S4用于化学语言建模
编辑 | KX生成式深度学习正在重塑药物设计。化学语言模型 (CLM) 以分子串的形式生成分子,对这一过程尤为重要。近日,来自荷兰埃因霍芬理工大学(Eindhoven University of Technology)的研究人员将一种最新的深度学习架构(S4)引入到从头药物设计中。结构化状态空间序列(Structured State Space Sequence,S4)模型在学习序列的全局属性方面表现卓越,那么 S4 能否推进从头设计的化学语言建模?为了给出答案,研究人员系统地在一系列药物发现任务上对 S4 与最先