西湖大学

如何让细胞进行计算?国内四高校提出生物计算元器件设计全新方法,登Cell

编辑 | 萝卜皮作者 | 论文团队细胞犹如一台计算机,每时每秒都在接收、分析和处理来自环境中的不同信息:外界信息通过细胞内高度并行的信号转导途径进行分析和处理,进而以预定义的方式从「存储设备」(即 DNA)中读取信息(基因的表达)或写入指令(DNA 修饰和编辑),指导自身或周围细胞对环境信息做出响应。一直以来,如何有效利用生物体本身的计算能力,通过对生物体进行改造使之能够执行人类给定的计算任务,并由此开发出基于生物系统的新概念计算机都是计算机科学与生物技术领域交叉融合的热点问题。近期,来自国防科技大学、西湖大学、浙

首次,西湖大学用蛋白质语言模型定向改造碱基编辑器,登Cell子刊

编辑 | ScienceAI在基因组编辑领域,单碱基编辑器通过将可编程的DNA结合蛋白与碱基修饰酶融合,实现在不引起DNA双链断裂的情况下,对基因组中特定碱基进行精确修改。尽管依赖于胞嘧啶(C)碱基编辑器(CBE)或腺嘌呤(A)碱基编辑器(ABE)介导的脱氨反应,这些编辑器能够实现C到胸腺嘧啶(T)或A到鸟嘌呤(G)的突变,但它们在诱导所有类型的点突变,尤其是颠换突变方面仍存在局限性。近期,西湖大学团队在《Molecular Cell》上发表了一篇题为「Protein language models-assiste

4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源

编辑 | ScienceAI蛋白质结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破,大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。西湖大学的研究人员利用Foldseek来处理蛋白质结构,将其编码成一维的离散token,并与传统的氨基酸进行结合,形成了结构感知词表(Structure-aware Vocabulary),以此将结构信息嵌入到模型输入中,增强模型的表征能力。在预训练上,论文使用了目
  • 1