AI在线 AI在线

分子

效率高、成本低,从单一结构到平衡分布,微软AI分子预测框架登Nature子刊

编辑 | 紫罗近年来,深度学习技术在分子微观结构预测中取得了巨大的进展。然而,分子的宏观属性和功能往往取决于分子结构在平衡态下的分布,仅了解分子的微观结构还远远不够。获得这些分布的传统方法,如分子动力学模拟,但这些方法昂贵又耗时。在此,来自微软研究院科学智能中心(Microsoft Research AI4Science)的研究人员,提出了一种可用于预测分子结构平衡分布的深度学习框架,称为分布式图分析器(Distributional Graphormer,DiG)。DiG 框架能够有效生成不同的构象,并提供状态密度
5/14/2024 2:11:00 PM
ScienceAI

辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用

编辑 | X尽管蛋白质结构预测取得了重大进展。但对于 80% 以上的蛋白质,迄今为止尚未发现小分子配体。识别大多数蛋白质的小分子配体仍具有挑战性。现在,奥地利科学院分子医学研究中心 CeMM 的研究人员与辉瑞公司合作,开发了一种方法来预测数百种小分子与数千种人类蛋白质的结合活性。这项大规模研究揭示了数以万计的配体-蛋白质相互作用,通过探索这些相互作用,从而可以开发化学工具和治疗方法。此外,在机器学习和人工智能的支持下,它可以「公正」地预测小分子如何与活体人类细胞中存在的所有蛋白质相互作用。相关研究以《Large-s
4/26/2024 3:39:00 PM
ScienceAI

药物分子设计新策略,微软条件扩散模型DiffLinker登Nature子刊

编辑 | 紫罗药理学领域的化学空间高达 10^60,在广阔的化学空间中进行搜索,给药物设计带来了巨大的挑战。基于片段的药物发现一直是早期药物开发的有效范例。然而,该领域面临的一个挑战是,如何设计断开的感兴趣分子片段之间的连接子(linker),生成化学上合理的候选药物分子。在此,来自微软研究院科学智能中心(AI4Science)、洛桑联邦理工学院、牛津大学和 MIT 的研究团队,提出了一种用于分子 linker 设计的 E(3) 等变三维条件扩散模型 DiffLinker。与以前只能连接分子片段对的方法不同,新方法
4/16/2024 6:13:00 PM
ScienceAI

化学能力超GPT-4,首个化学领域百亿级大模型,思必驰、上交大、苏州实验室联合发布

编辑 | ScienceAI2024年3月12日,思必驰-上海交大智能人机交互联合实验室、苏州实验室共同发布了首个针对化学科学的百亿级专业化大模型ChemDFM。模型参数现已完全开源以帮助和促进大模型辅助化学科研领域的相关研究()。此外,ChemDFM的研究论文也已作为相关领域的第一篇研究论文于arXiv预印本网站上公开发表。论文链接:,引入了海量的化学基础与前沿知识,充分学习并掌握化学科学的专有语言与表达方式,最终以130亿的参数量在大多数化学相关的能力上超越了公认最强大的模型GPT-4。此外,在进一步的评测中C
4/7/2024 5:54:00 PM
ScienceAI

从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

编辑 | 凯霞全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的方法来对抗耐药菌株。AI 方法可以发现新的抗生素,但现有方法有明显的局限性。性质预测模型很难扩展到大型化学空间。直接设计分子的生成模型可以快速探索广阔的化学空间,但生成的分子难以合成。在此,斯坦福大学和麦克马斯特大学(McMaster University)的研究人员发明了一种新的生成式 AI 模型 SyntheMol,可以设计数十亿种新的抗生素分子,这些分子价格低廉且易于在实验室中合成。SyntheMol 可以从近 300 亿个分子的化学空
4/1/2024 4:44:00 PM
ScienceAI

优于SOTA,腾讯AI Lab开发双重扩散模型,实现靶标配体3D分子生成和先导化合物优化

编辑 | 萝卜皮基于结构的生成化学,通过探索广阔的化学空间来设计对靶标具有高结合亲和力的配体,在计算机辅助药物发现中至关重要。然而,传统的计算机方法受到计算效率低下的限制,机器学习方法则因自回归采样而面临瓶颈。为了解决这些问题,腾讯 AI lab、香港城市大学、锐格医药(Regor Therapeutics Group)的研究人员开发了一种条件深度生成模型 PMDM,用于生成适合特定靶标的 3D 分子。PMDM 由具有局部和全局分子动力学的条件等变扩散模型组成,使 PMDM 能够考虑条件蛋白质信息从而有效地生成分子
3/29/2024 6:15:00 PM
ScienceAI

准确率 >98%,基于电子密度的 GPT 用于化学研究,登 Nature 子刊

编辑 | 紫罗可合成的分子化学空间是巨大的。要想有效地驾驭这一领域,需要基于计算的筛选技术,如深度学习技术,以快速跟踪感兴趣的化合物发现。然而,使用算法进行化学发现需要将分子结构转换为计算机可用的数字表示形式,并开发基于这些表示形式的算法来生成新的分子结构。近日,来自英国格拉斯哥大学(University of Glasgow)的研究人员,提出了一种基于电子密度训练的机器学习模型,用于生产主客体 binders。这些以简化分子线性输入规范 (SMILES) 格式读出,准确率 98%,从而能够在二维上对分子进行完整的
3/26/2024 3:12:00 PM
ScienceAI

100%化学有效,高度类似药物,川大开发数据和知识双驱动的AI分子生成框架

编辑 | 萝卜皮基于深度学习的分子生成在许多领域都有广泛的应用,特别是药物发现。然而,目前的深度生成模型大多数是基于配体的,在分子生成过程中没有考虑化学知识,往往导致成功率相对较低。四川大学的研究团队提出了一种基于结构的分子生成框架,称为 PocketFlow;该框架明确考虑了化学知识,可在蛋白质结合袋内生成新型配体分子,用于基于结构的从头药物设计。在各种计算评估中,PocketFlow 表现出了最先进的性能,生成的分子具有 100% 化学有效且高度类似药物。研究人员将PocketFlow应用于两个与表观遗传调控相
3/25/2024 5:56:00 PM
ScienceAI

预测所有生物分子,David Baker 团队蛋白质设计新工具 RoseTTAFold All-Atom 登 Science

编辑 | ScienceAI在蛋白领域,华盛顿大学 David Baker 团队又带来了新进展。蛋白质是生命存在不可或缺的分子,但它们不是细胞中唯一的分子,参与生命过程它们必须与其他分子相互协作。近年来,AlphaFold 和 RoseTTAFold 等蛋白质结构预测算法,席卷了结构生物学领域。深度学习方法彻底改变了蛋白质结构预测和设计方式,但目前仅限于纯蛋白质系统。问题是,这些模型忽略了许多影响蛋白质结构的化学类型。「例如,许多生物学涉及蛋白质与小分子相互作用。」华盛顿大学教授 David Baker 说。「这是
3/8/2024 6:31:00 PM
ScienceAI

受 ChatGPT 启发,结合 Transformer 和 RL-MCTS 进行从头药物设计

编辑 | 萝卜皮通过从头药物设计发现新型治疗化合物是药物研究领域的一项关键挑战。传统的药物发现方法通常资源密集且耗时,这促使科学家探索利用深度学习和强化学习技术力量的创新方法。在这里,美国查普曼大学(Chapman University)的研究人员开发了一种称为 drugAI 的新型药物设计方法,该方法利用编码器-解码器 Transformer 架构与通过蒙特卡罗树搜索(RL-MCTS)进行的强化学习来加快药物发现过程,同时确保生产具有药物样特性和对其靶标具有强结合亲和力的有效小分子。与两种现有的基准方法相比,dr
2/22/2024 2:14:00 PM
ScienceAI

发现、合成并表征303个新分子,MIT团队开发机器学习驱动的闭环自主分子发现平台

编辑 | X传统意义上,发现所需特性的分子过程一直是由手动实验、化学家的直觉以及对机制和第一原理的理解推动的。随着化学家越来越多地使用自动化设备和预测合成算法,自主研究设备越来越接近实现。近日,来自 MIT 的研究人员开发了由集成机器学习工具驱动的闭环自主分子发现平台,以加速具有所需特性的分子的设计。无需手动实验即可探索化学空间并利用已知的化学结构。在两个案例研究中,该平台尝试了 3000 多个反应,其中 1000 多个产生了预测的反应产物,提出、合成并表征了 303 种未报道的染料样分子。该研究以《Autonom
1/2/2024 4:14:00 PM
ScienceAI

实现量子化学精度,同时规避几何弛豫瓶颈,深度对比学习用于分子性质有效预测

编辑 | 紫罗数据驱动的深度学习算法可以准确预测高级量子化学分子特性。然而,它们的输入必须限制在与训练数据集相同的量子化学几何弛豫水平,从而限制了它们的灵活性。采用替代的经济有效的构象生成方法会引入域偏移(domain-shift)问题,从而降低预测精度。近日,来自韩国首尔大学的研究人员提出了一种基于深度对比学习的域适应(domain-adaptation)方法,称为局部原子环境对比学习(Local Atomic environment Contrastive Learning,LACL)。LACL 通过比较不同的
12/14/2023 1:54:00 PM
ScienceAI

改进分子表征学习,清华团队提出知识引导的图 Transformer 预训练框架

编辑 | 紫罗学习有效的分子特征表征以促进分子特性预测,对于药物发现具有重要意义。最近,人们通过自监督学习技术预训练图神经网络(GNN)以克服分子特性预测中数据稀缺的挑战。然而,当前基于自监督学习的方法存在两个主要障碍:缺乏明确的自监督学习策略和 GNN 的能力有限。近日,来自清华大学、西湖大学和之江实验室的研究团队,提出了知识引导的图 Transformer 预训练(Knowledge-guided Pre-training of Graph Transformer,KPGT),这是一种自监督学习框架,通过显著增
11/23/2023 3:55:00 PM
ScienceAI

更低计算成本,基于单电子约化密度矩阵的机器学习电子结构方法

编辑 | 萝卜皮密度泛函理论(DFT)的定理建立了多体系统的局部外部势与其电子密度、波函数以及单粒子约化密度矩阵之间的双射映射。在此基础上,罗格斯大学(Rutgers University)和纽约大学(New York University)的研究人员证明基于单电子约化密度矩阵(reduced density matrices)的机器学习模型可用于生成替代电子结构方法。该团队为从小分子(如水)到更复杂的化合物(如苯和丙醇)的系统生成局部和混合 DFT、Hartree-Fock 和完整构型相互作用理论的替代品。代理模
10/29/2023 6:56:00 PM
ScienceAI

生成的分子几乎 100% 有效,用于逆向分子设计的引导扩散模型

编辑 | 绿萝「从头分子设计」是材料科学的「圣杯」。生成深度学习的引入极大地推进了这一方向,但分子发现仍然具有挑战性,而且往往效率低下。以色列理工学院(Technion-Israel Institute of Technology)和意大利威尼斯大学(University Ca’ Foscari of Venice)的研究团队,提出一种用于逆向分子设计的引导扩散模型:GaUDI,它结合了用于属性预测的等变图神经网络和生成扩散模型。研究人员通过将单目标和多目标任务应用于生成的 475,000 个多环芳香族系统数据集,
10/24/2023 11:26:00 AM
ScienceAI

以「钥匙和锁」方式设计分子,浙大&碳硅智慧开发3D分子生成新模型SurfGen

编辑 | 紫罗高效的从头设计是计算机辅助药物发现的巨大挑战。上个月,浙大侯廷军团队和碳硅智慧合作提出了一种基于蛋白口袋的三维(3D)分子生成模型——ResGen,ResGen 计算效率更高,比之前最好的技术快大约八倍。研究成果发表在《Nature Machine Intelligence》上。近日,该团队又在《Nature Computational Science》发表了其最新研究,提出用于基于结构的分子设计新模型——SurfGen。近年来,真实的结构特异性三维分子生成已经开始出现,但大多数方法将目标结构视为偏向
10/13/2023 6:09:00 PM
ScienceAI

图生成扩散模型综述:算法与在分子和蛋白质建模上应用

论文简要回顾了扩散模型在图数据上的算法及相关应用的若干研究。论文链接::(Graph-based Data)可以保存现实世界实体(节点)之间丰富多样的关系信息,包括实体间的关联联系、属性特征、以及拓扑结构,已经在社交网络分析、推荐系统、生物信息学等领域有广泛的应用。图生成模型旨在理解和学习现有的图数据分布,并合成新的图样本。这对于研究图数据中潜在的图结构关系,理解现有数据中的模式、关联和隐藏的信息具有重要的意义。生成模型可以用于探索图数据不同尺度的关系、发现社区结构、预测节点属性等。主要的图生成范式分为两类:自回归
6/30/2023 6:29:00 PM
ScienceAI

以大模型加速新药研发,成本降低70%:一家大厂的「云端」实战

最近几年,AI 加持下的新药研发成为被寄予厚望的赛道之一。从流程上看,药物研发分为药物发现、临床前研究、临床研究、审批与上市四个阶段。医药界有一个「双十定律」的说法 —— 即需要超过 10 年时间、10 亿美元的成本,才有可能成功研发出一款新药。即使如此,也只有约 10% 新药能被批准进入临床期。目前,AI 技术的参与主要集中于药物发现阶段。挑战在于,虽然 AI 技术加快了一部分工作的推进速度,但 AI 技术与药物研发的 “联姻” 并不是一蹴而就的,囿于算法低效、数据割裂、数据安全、算力瓶颈等挑战,药物研发仍然是一
5/19/2023 9:03:00 AM
机器之心