PLMSearch

3倍灵敏度,搜索百万蛋白对只需几秒,复旦、山大、上海交大开发新的蛋白质语言模型

编辑 | 萝卜皮同源蛋白质搜索是蛋白质注释和分析最常用的方法之一。与结构搜索相比,仅从序列中检测远程进化关系仍然具有挑战性。复旦大学、山东大学以及上海交通大学的研究团队提出了 PLMSearch(Protein Language Model),一种仅以序列作为输入的同源蛋白质搜索方法,能够捕获隐藏在序列后面的远程同源信息。PLMSearch 可以像 MMseqs2 一样在几秒钟内搜索数百万个查询目标蛋白质对,同时将灵敏度提高三倍以上,可与当前最先进的结构搜索方法相媲美。此外,与传统的序列搜索方法不同,PLMSear
  • 1