IgLM

用于抗体设计的深度生成蛋白语言模型

编辑 | 萝卜皮用于治疗应用的单克隆抗体的发现和优化依赖于大型序列库,但受到低溶解度、低热稳定性、高聚集和高免疫原性等可开发性问题的阻碍。在数百万个蛋白质序列上训练的生成语言模型是按需生成逼真、多样化序列的强大工具。约翰霍普金斯大学的科学家和工程师团队提出了免疫球蛋白语言模型 (IgLM),这是一种深度生成语言模型,用于通过重新设计可变长度的抗体序列跨度来创建合成库。IgLM 将抗体设计制定为基于自然语言文本填充的自回归序列生成任务。该团队在 558M 抗体重链和轻链可变序列上训练 IgLM,以每个序列的链类型和来
  • 1