ScienceAl 2024「AI+药物&医疗&基因组&细胞」专题年度回顾

编辑 | 白菜叶2024 年，药物、医疗、基因组学和细胞生物学领域迎来了前所未有的技术突破与创新。从 AI 驱动的药物设计到基因编辑的精准控制，从单细胞分析到多模态医疗决策，这一年见证了科学与技术的深度融合，为人类健康带来了无限可能。在药物研发领域，AI 驱动的分子设计与优化方法不断涌现，显著提升了新药发现的效率与精准度。

编辑 | 白菜叶

2024 年，药物、医疗、基因组学和细胞生物学领域迎来了前所未有的技术突破与创新。

从 AI 驱动的药物设计到基因编辑的精准控制，从单细胞分析到多模态医疗决策，这一年见证了科学与技术的深度融合，为人类健康带来了无限可能。

在药物研发领域，AI 驱动的分子设计与优化方法不断涌现，显著提升了新药发现的效率与精准度。

基因与细胞研究方面，单细胞技术与深度学习的结合，为解析复杂生物系统提供了前所未有的工具，推动了精准医学的发展。

与此同时，医疗 AI 在诊断、治疗决策和患者管理中的应用日益广泛，多模态数据整合与智能算法的进步，正在为个性化医疗开辟新的路径。

接下来，ScienceAI 将回顾 2024 年 AI 在药物、医疗、基因、细胞等领域的一些重要研究进展。

温馨提示：点击文章标题可直达文章。

像拼乐高一样设计新药，EPFL、牛津团队AI方法精确设计优化分子3D结构
医疗智能导诊助手来了，复旦大学、复旦附属眼耳鼻喉科医院、中山医院吴淞医院联合发布PIORS
麦吉尔大学Ding Lab基于深度学习开发单细胞水平转座子位点表达定量模型，登Nature子刊
跨物种纳米抗体虚拟筛选，清华集成深度学习和蛋白质语言模型，登Nature子刊
新SOTA，浙大、中科院深度学习模型可靠、准确预测蛋白-配体，助力药物开发
性能远超当前SOTA，首个可解释RNA的AI植物基础模型来了，整合1124种植物RNA信息
仅总参数量0.1%、单GPU 15分钟完成微调，人类基因组基础模型NT登Nature子刊
精确属性控制，湖大、西电从头药物设计AI方法，登Nature子刊
准确率84.09%，腾讯AI Lab发布Interformer，用于蛋白质-配体对接及亲和力预测，登Nature子刊
九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊
生成超10万bp的DNA序列，北理工邵斌团队生成式DNA大语言模型，登Nature子刊
登Science封面！基因组基础模型Evo重磅发布，AI解码分子、DNA、RNA和蛋白质
谷歌、MIT等开发多智能体医疗决策框架MDAgents，医学LLM新用法
数字病理与AI辅助诊断，助力肿瘤精准诊疗
类GPT化学语言模型，9秒生成100种化合物，微软AI药物设计平台登Nature子刊
分类准确率达99%，山大团队提出基于对比学习的基因数据分类方法
TMI2024 | 阿大、同济等提出TraCoCo，用于3D医学图像半监督分割
Nature 子刊，化学语言模型自动设计多靶点配体
成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊
Nature子刊，北大陈语谦团队提出多模态单细胞数据整合和插补的深度学习方法
仅8B参数，可与GPT-4媲美，上交大团队构建多语言医学大模型
化学空间导航仪：流生成式AI引导分子属性控制
AI发现超16万种新RNA病毒？阿里云、中山大学合作研究登Cell
精准预测流产风险，上海交大等开发可解释AI算法，为早期预防带来希望
中国科学院团队发布GeneCompass：解析基因调控密码，打造干湿融合新范式
Science 发文，高通量蛋白质组学和人工智能的革命
OpenAI o1 在医学领域的初步研究，我们离 AI 医生更近了吗？
Nature子刊，川大团队机器学习结合MD，预测蛋白质变构，助力药物研发
上交大、复旦中山团队开发糖尿病专用大语言模型，助力个性化糖尿病管理
大语言模型如何助力药物开发? 哈佛团队最新综述
抗体亲和力增强17倍，百奥几何、复旦团队AI方法模拟细微蛋白质互作，登Nature子刊
AI蛋白大模型推动生物产业变革，分子之心完成A轮融资
筛选数十亿化合物库，华盛顿大学药物AI虚拟筛选平台，登Nature子刊
效率提高近百倍，山大团队AI新方法解析复杂器官空间组学，登Nature子刊
从头设计「超难」癌症抗体，大卫贝克团队AI生物计算方法的新应用
迈向「多面手」医疗大模型，上交大团队发布大规模指令微调数据、开源模型与全面基准测试
更高分辨率，更经济，深度生成模型与主动学习策略结合，推进大规模单细胞研究
纳米级精度，病毒感染1h内即可检测到，南方医科大学细胞核AI工具登Nature子刊
高效准确预测DDI，福大、元星智药团队解释性药物AI模型，登Nature子刊
识别精度高达76.32%，浙大、之江团队用深度学习加速大规模药物发现和再利用
命中率达60%，AlphaFold预测受体的三维结构，加速药物开发
Nature观点，人工智能在医学中的测试一片混乱，应该怎么做？
中科院计算所团队提出CarbonNovo，基于AI进行蛋白质结构和序列的端到端从头设计
从头设计抗体，腾讯、北大团队预训练大语言模型登Nature子刊
糖蛋白组学新方法，复旦开发基于Transformer和GNN的混合端到端框架，登Nature子刊
如何让细胞进行计算？国内四高校提出生物计算元器件设计全新方法，登Cell
AI成像新标准，仅1%原始数据可达最佳性能，通用医学基础模型登Nature子刊
Nature子刊，诺华团队评测ML模型在靶向蛋白质降解剂中的特性预测
效率高，无需标签，谷歌团队用AI挖掘临床数据，改善基因发现和疾病预测，登Nature子刊
基于Transformer的新方法，可从纳米孔测序中准确预测DNA甲基化
登Science，药物亲和力增加37倍，AI对蛋白、抗体复合物进行无监督优化
生成式 AI 在医疗保健中的前沿应用及其挑战
整合多组学数据，华大基因团队图神经网络模型SpatialGlue登Nature子刊
登Nature子刊，拓扑Transformer模型进行多尺度蛋白质-配体互作预测，助力药物研发
模拟5亿年的进化信息，首个同时推理蛋白质序列、结构和功能的生物学大模型
AI小分子药物发现的「百科全书」，康奈尔、剑桥、EPFL等研究者综述登Nature子刊
登Nature，超越GPT-4V，MIT、哈佛开发人类病理学多模态AI「副驾驶」
「复活」古生物分子，AI解决抗生素耐药性，复旦、宾大合作团队两篇论文登Cell和Nature子刊
22个任务超越SOTA，43个任务媲美SOTA，Google推出医学治疗通用大模型
取代昂贵量子方法，南科大AI方法实现蛋白质-药物系统多尺度量子「精炼」
助力药物发现，北京蛋白质组学研究中心提出基于蛋白质序列的深度迁移学习框架
1.8B参数，阿里云首个联合DNA、RNA、蛋白质的生物大模型，涵盖16.9W物种
Nature重磅：微软潘海峰华盛顿大学王晟团队发布首个全切片数字病理学模型GigaPath
Science发文，量子计算机有望加速材料、催化剂和药物的开发
哥大和耶鲁团队开发新算法，阐明结肠癌耐药机制
准确预测药物-靶点相互作用，江南大学提出深度学习融合GNN新方法MINDG
结合量子特征、2万个分子动力学模拟，新蛋白-配体复合物ML数据集，登Nature子刊
准确率82.5%，设计多药理学化合物，加州大学开发新AI平台设计未来抗癌药物
赛诺菲与OpenAI、Formation Bio合作，加速AI药物发现
多功能RNA分析，百度团队基于Transformer的RNA语言模型登Nature子刊
多模态AI是医学的未来，谷歌推出三个新模型，Med-Gemini迎来大升级
预测配体-靶标对的结合亲和力，哈工大开发新SOTA药物表示模型
AI 找出限制抗生素耐药性的最佳治疗策略，预防「超级细菌」
91.1% 准确率，性能远超 GPT-4 系列模型，谷歌推出多模态医学大模型 Med-Gemini
首次，西湖大学用蛋白质语言模型定向改造碱基编辑器，登Cell子刊
深度学习与化学语言模型结合，用于药物从头设计，登Nature子刊
新SOTA，仅几个标记基因即可自动标记，复旦大学开发空间转录组学语义注释贝叶斯框架
从基因组到蛋白质组连续翻译，南开大学开发通用跨模态数据分析方法
平均准确率达96.4%，中山大学&重庆大学开发基于Transformer的单细胞注释方法
辉瑞 AI 方法登 Science，揭示数以万计的配体-蛋白质相互作用
OpenAI和Moderna合作，推进mRNA医学
AI可以改写人类基因组吗？首次由AI从头设计的基因编辑器成功编辑人类细胞中DNA
体外命中率提高75%，Model Medicines&加州大学开发AI驱动的药物发现框架
预测蛋白质共调控和功能，哈佛&MIT训练含19层transformer的基因组语言模型
药物分子设计新策略，微软条件扩散模型DiffLinker登Nature子刊
登Science，药物亲和力＜5纳摩尔，加州大学开发特异性药物结合蛋白的从头计算方法
Nat. Mach. Intell.|设计超高效疫苗，普林斯顿团队开发首个解码mRNA序列大模型
CVPR 2024｜FairCLIP：首个多模态医疗视觉语言大模型公平性研究
少量数据实现高通用性，KAIST开发药物设计3D分子生成新框架
从300亿分子中筛出6款，结构新且易合成，斯坦福抗生素设计AI模型登Nature子刊
优于SOTA，腾讯AI Lab开发双重扩散模型，实现靶标配体3D分子生成和先导化合物优化
优于人类专家，GPT-4 准确注释单细胞类型，成本低且稳健
促进癌症治疗，之江实验室团队开发端到端深度学习模型 DeepAEG
100%化学有效，高度类似药物，川大开发数据和知识双驱动的AI分子生成框架
准确率达95.16%，快速识别恶性肿瘤细胞，厦大和上海交大团队开发域泛化深度学习算法
登Nature子刊，哈佛医学院发布迄今最大计算病理学基础模型，适用30+临床需求
里程碑时刻！David Baker 团队利用 AI 从头设计抗体
可发现药物靶点，哈佛、Hopkins、中国科学院等机构基于Transformer开发了一种可对蛋白翻译动态变化建模的深度学习方法
18个月，开创AI药研先例，Insilico公开其首款AI药物研发全过程，登Nature子刊
更全面、更准确的方法，佐治亚理工学院团队用DL对scRNA-seq数据进行批次效应和条件效应建模
加速药物重新定位再利用，中南大学团队开发基于自适应图卷积网络的新方法
70 亿参数训练，从DNA、RNA、蛋白质到全基因组，生物学通用大模型新标杆
剑桥大学团队用深度学习工具评估纳米抗体的天然性，助力抗体药开发
进行药物靶标亲和力预测，浙大&华科大团队开发扩展图学习卷积网络方法
受 ChatGPT 启发，结合 Transformer 和 RL-MCTS 进行从头药物设计
首次大规模多语言评估，支持7种语言，生物医学领域7B开源LLM
旨在构建首个通用生物学AI模型，前Google DeepMind科学家联手创建Biooptimus
GPDRP：基于图 Transformer 和基因通路的药物反应预测多模态框架
制药新工具、有望规避免疫反应，多伦多大学团队用AI框架重新设计参与基因治疗的关键蛋白质
超越基于CNN和Transformer的SOTA框架，多伦多大学团队开发用于生物医学图像分割的通用网络
预测蛋白质动态对接？上海交大&星药科技&中山大学等团队开发新的深度等变生成模型
可多模态数据集成、插补和跨模态生成，中科院&树兰医院&北师大团队开发带有掩码模块的深度生成框架
悉尼大学和香港D24H的研究人员，开发用于亚细胞空间转录组数据分割的自监督学习方法
未来五年AI如何改变各学科？从LLM到AI蛋白设计、医疗保健......
药物-靶标亲和力预测，上科大团队开发了一种Transformer编码器和指纹图谱相结合的方法
ICLR2024 | Harvard FairSeg: 第一个研究分割算法公平性的大型医疗分割数据集
罗氏制药和GRCEH团队开发可解释机器学习方法，用于分析治疗性抗体的免疫突触和功能表征
如何利用革命性的蛋白质结构工具来发现药物？AlphaFold 发现了数千种可能的致幻剂
不担心字节跳动、腾讯等大厂竞争，英矽智能CEO Alex Zhavoronkov谈AI药物发现
在24项场景中优于人类医生，Google团队开发基于自博弈的诊断对话大模型
Nat.Commun.|山东大学团队基于图transformer开发了一种稀有细胞群组学分析方法
NVIDIA 与 Deepcell 合作，加速生成式 AI 在单细胞研究中的应用

ScienceAl 2024「AI+药物&医疗&基因组&细胞」专题年度回顾

相关资讯

仅总参数量0.1%、单GPU 15分钟完成微调，人类基因组基础模型NT登Nature子刊

空间蛋白质组学：构建复杂组织的尺度图谱

如何更科学地研究AI+科学？顶级学者将云集这次ICML研讨会