蛋白质

活性提升65倍,山大新AI工具定向进化高活性酶,外部数据集验证成功率达80%

编辑丨&准确预测酶动力学参数对于酶的探索和修饰至关重要,但现有模型面临过拟合导致准确率低或泛化能力差的问题。 以山东大学为主导的团队提出了一种基于预训练模型和分子指纹的深度学习模型 CataPro ,并用它来预测转换数(k(cat))、米歇尔常数(K(m))和催化效率(k(cat)/K(m))。 与以前的基线模型相比,CataPro 在无偏数据集上表现出明显增强的准确性和泛化能力。

生信工具评测方法:基于蛋白质对的计算机预测工具评估

编辑 | 白菜叶计算机模拟蛋白质功能注释对于缩小因测序加速而导致的对蛋白质活性理解的差距至关重要。 存在多种功能注释方法,而且它们的数量一直在增长,尤其是随着深度学习技术的发展。 但是,目前尚不清楚这些工具是否真的具有预测性。

原子级精确,David Baker团队开发RFdiffusion变体对抗体进行从头设计

编辑 | 萝卜皮抗体在现代医学中发挥着核心作用,但目前还没有完全在计算机中设计与特定表位结合的新型抗体的方法。 相反,抗体发现目前依赖于动物免疫或随机文库筛选方法。 华盛顿大学 David Baker 团队证明,结合使用微调 RFdiffusion 网络的计算蛋白质设计与酵母展示筛选,可以生成抗体可变重链(VHH)和单链可变片段(scFv),以原子级精度结合用户指定的表位。

基于药效团与GPT从头生成分子,北大开发TransPharmer助力药物发现

编辑 | 萝卜皮深度生成模型推动了药物发现,但生成的化合物通常结构新颖性有限,限制了药物化学家的灵感。 为了解决这个问题,北京大学的研究人员开发了 TransPharmer,这是一种生成模型,它将基于配体的可解释药效团指纹与基于生成预训练 Transformer(GPT)的框架相结合,用于从头生成分子。 TransPharmer 在无条件分布学习、从头生成和药效团约束下的骨架构建方面表现出色。

90%成功响应率,整合约9000个样本,统合癌症蛋白质组学的LLM驱动平台

编辑丨&功能蛋白质组学为癌症机制提供了关键见解,有助于发现新的生物标志物和治疗靶点。 为了充分利用他们整合的将近 500 份高质量抗体的精选组合,美国德克萨斯大学决定采用 LLM 驱动来使资源更高效。 他们推出了 DrBioRight 2.0,这是一个由最先进的大型语言模型提供支持的直观生物信息学平台。

首个强化生成模型AbNovo实现多目标、多约束抗体从头设计,发表于ICLR 2025

编辑 | ScienceAI近期,上海交通大学医学院张海仓课题组联合中原人工智能产业技术研究院与中国科学院计算技术研究所,提出了一项名为AbNovo 的抗体设计新方法。 该方法基于强化学习与深度扩散模型,能够在多目标、多约束条件下实现抗体从头设计。 该研究以「Multi-objective antibody design with constrained preference optimization」为题发表在国际机器学习顶会ICLR2025上。

微软 BioEmu-1 推动药物研发:从“单帧画面”到“电影”,AI 精准预测蛋白质结构变化

微软研究院最新推出的AI模型BioEmu-1,能够预测蛋白质的动态变化,为生物医学和药物发现领域带来革命性进展。不同于AlphaFold的静态结构预测,BioEmu-1模拟蛋白质在不同构象间的转换,显著加快研究速度并降低成本。#生物医学# #AI技术#

每小时处理80,000个蛋白质,大卫·贝克、微软等发布Seq2Symm,实现蛋白质对称性精准预测

编辑 | 2049在生物系统中,蛋白质很少以单体形式发挥功能,它们通常需要组装成更高级的复合物。 这些复合物中,由多个相同蛋白质链通过非共价键相互作用形成的结构被称为同源寡聚体,它们的空间排布形成特定的对称性,这对蛋白质的稳定性、折叠和功能至关重要。 然而,从单条序列精确预测蛋白质可能形成的对称结构一直是一项挑战。

ICLR 2025 | Deep Signature 高效表征生物大分子复杂运动的新方法

编辑 | ScienceAI理解蛋白质动力学行为对于解析其功能机制和开发分子疗法至关重要。 然而,生物过程通常涉及复杂的高维动力学以及原子间相互作用,这对现有计算处理技术构成了巨大挑战。 本文介绍了来自香港城市大学李皓亮研究团队所提出的 Deep Signature,一个用于生物大分子复杂运动表征学习的深度学习框架。

登Science,MIT团队推出新蛋白质语言模型ProtGPS,预测蛋白在活细胞内的功能位置

编辑 | 萝卜皮蛋白质是维持细胞运转的主要动力,细胞中有成千上万种蛋白质,每种蛋白质都发挥着特殊的功能。 研究人员早就知道,蛋白质的结构决定了它的功能。 最近,科学家逐渐意识到,蛋白质的定位对其功能也至关重要。

LLM时代,计算蛋白质科学进展如何?香港理工大学等发布系统性综述

编辑丨coisini作为生命的基本构建单元,蛋白质在几乎所有基本生命活动中扮演着不可或缺的角色,例如新陈代谢、信号传导、免疫反应等。 如下图所示,蛋白质遵循序列 - 结构 - 功能范式。 图注:蛋白质遵循序列-结构-功能范式。

David Baker 利用 AI 设计蛋白质,一招制蛇毒,或将彻底改变蛇咬治疗

编辑丨&蛇中毒是一种严重的个人健康威胁,每年导致约 10 万人死亡和 30 万人永久残疾,尤其是在医疗资源匮乏的地区。 目前的抗蛇毒血清主要依赖于动物血浆提取的多克隆抗体,存在成本高、副作用大、对某些毒素效果有限等问题。 今年诺贝尔化学奖得主 David Baker 团队的一项研究揭示了蛇咬伤治疗可能改变游戏规则。

「定制化」结合蛋白质,几何深度学习方法加速开发精准药物,登Nature

编辑 | 萝卜皮蛋白质是生命的基础,具有多样的生物功能,如输送氧气、传递化学信号和防御病原体。 其分子表面的特异性决定了其功能,这一特性被用于药物开发,通过设计分子与特定蛋白质结合来改变其结合方式,甚至开发「分子胶」来治疗疾病。 奥地利科学院(ÖAW)的 Michael Bronstein、瑞士洛桑联邦理工学(EPFL)的 Bruno Correia 等,率先使用了一种名为「MaSIF(molecular surface interaction fingerprinting)」的几何深度学习架构,用于设计具有所需分子表面特性的新蛋白质。

高灵敏探索质谱,滑铁卢、中原AI院团队基于深度学习的端到端方法

编辑 | 萝卜皮基于质谱的蛋白质组学中肽段鉴定对于理解蛋白质功能和动力学至关重要。 传统的数据库搜索方法虽然应用广泛,但依赖于启发式评分函数,必须引入统计估计才能获得更高的鉴定率。 加拿大滑铁卢大学 (University of Waterloo)和中原人工智能研究院(中原 AI 院)的研究团队提出了 DeepSearch,一种基于深度学习的串联质谱端到端数据库搜索方法。

活性提高42倍,ML引导的无细胞表达加速酶工程,登Nature子刊

编辑 | 萝卜皮酶是人类生活中不可或缺的天然催化剂,不仅助我们消化食物,还能增强香水香味、提高洗衣效率,甚至用于疾病治疗。 科学家们正使用酶工程创造新酶,用于吸收温室气体、降解环境毒素、研发高效药物。 但是,酶工程受限于快速生成和使用大量序列功能关系数据集进行预测设计的挑战。

AI赋能蛋白质研究:SaprotHub让蛋白质AI模型训练和调用不再有门槛!

编辑 | ScienceAI近年来,AI 技术在蛋白质研究领域发挥了越来越重要的作用。 从 AlphaFold2 在结构预测任务上的脱颖而出,到各类蛋白质语言模型(PLMs)在功能预测方面的重大进展,生物研究者们可以利用各式各样的 AI 模型来辅助他们的研究。 然而,随着模型变得越来越复杂,如何训练和调用这些 AI 模型对于缺乏机器学习专业知识的研究者来说是一件非常具有挑战的任务,也因此限制了 AI 技术在实际研究中的应用。

模拟5亿年进化的ESM3在Science发布了,可推理蛋白质序列、结构和功能

编辑 | 萝卜皮2024 年夏天 EvolutionaryScale 推出了 ESM3,一款面向蛋白质语言的大模型,成功在自然进化未曾涉足的区域设计出功能性蛋白。 同期上线了该研究的预印版本。 时隔半年,该研究以「Simulating 500 million years of evolution with a language model」为题,于 2025 年 1 月 16 日在《Science》发布。

准确预测蛋白质功能新SOTA,中南大学推出全新深度学习模型,登Nature子刊

编辑丨&预测蛋白质功能的计算方法对于理解生物学机制和治疗复杂疾病具有重要意义。 然而,现有的预测计算方法缺乏可解释性,难以理解蛋白质结构和功能之间的关系。 在研究中,来自中南大学的团队提出了一种基于深度学习的解决方案,名为 DPFunc,用于使用域引导的结构信息进行准确的蛋白质功能预测。