细胞

哥伦比亚大学研究人员开发新型 AI 模型,可精准预测人体细胞基因表达

哥伦比亚大学瓦格洛斯医学院的研究团队开发了一种新型人工智能(AI)模型 ——“通用表达转换器”(GET),能够准确预测任何人类细胞中的基因活性,从而揭示细胞的内部机制。这一研究成果发表在最新一期的《自然》杂志上,有望彻底改变科学家研究癌症、遗传疾病等的方式。

支持细胞与细胞器建模,更全能的空间算法推动更高效的细胞时空研究

编辑丨toileter于过去的十年中,计算建模已经成为生物学必备的工具包常客之一。 而在生物学中,功能与结构密切相关。 为了能更好地研究亚细胞或者细胞器中信号转换,如何制造一个逼真的建模成为了一项挑战。

效率提高近百倍,山大团队AI新方法解析复杂器官空间组学,登Nature子刊

编辑 | 萝卜皮空间组学技术以细胞和亚细胞分辨率解析复杂器官的功能组件。山东大学的研究团队引入了空间图傅里叶变换  (Spatial Graph Fourier Transform,SpaGFT),并将图信号处理应用于各种空间组学分析平台,以生成可解释的表示。这种表示支持空间可变基因识别并改进基因表达推断,在分析人类和小鼠空间转录组数据方面优于现有工具,效率是现有工具的百倍。SpaGFT 可以识别人类淋巴结 Visium 数据中 B 细胞成熟的免疫区域,并使用内部人类扁桃体 CODEX 数据表征次级滤泡的变化。此外

如何让细胞进行计算?国内四高校提出生物计算元器件设计全新方法,登Cell

编辑 | 萝卜皮作者 | 论文团队细胞犹如一台计算机,每时每秒都在接收、分析和处理来自环境中的不同信息:外界信息通过细胞内高度并行的信号转导途径进行分析和处理,进而以预定义的方式从「存储设备」(即 DNA)中读取信息(基因的表达)或写入指令(DNA 修饰和编辑),指导自身或周围细胞对环境信息做出响应。一直以来,如何有效利用生物体本身的计算能力,通过对生物体进行改造使之能够执行人类给定的计算任务,并由此开发出基于生物系统的新概念计算机都是计算机科学与生物技术领域交叉融合的热点问题。近期,来自国防科技大学、西湖大学、浙

万字长文,腾讯、清华等多位生物大模型作者专访,畅谈AI生物学,解析大型细胞模型技术

编辑 | KX大型语言模型(LLM)在自然语言处理和理解领域已取得重大突破。在生物学领域,一些采用类似 LLM 结构的大型细胞模型(Large Cellular Model,LCM)被开发用于单细胞转录组学,比如:scBERT、Geneformer、scGPT、scFoundation 和 GeneCompass。这些模型展示了 LCM 在各种生物任务中的应用潜力,并说明了 LCM 彻底改变未来生物学研究的可能性。大型细胞模型的示意图。近日,《Quantitative Biology》期刊采访了一些最具影响力的 L

哥大和耶鲁团队开发新算法,阐明结肠癌耐药机制

编辑 | 萝卜皮信号通路活性异常是肿瘤发生和进展的标志,30 多年来一直指导着靶向抑制剂的设计。然而,由快速、特定环境的信号网络重新布线诱导的适应性抵抗机制继续挑战治疗效果。利用蛋白质组学技术和神经网络,哥伦比亚大学和耶鲁大学的研究团队引入了 VESPA(Virtual Enrichment-based Signaling Protein-activity Analysis),一种旨在阐明细胞响应和适应药物扰动机制的算法;并用它来分析用临床相关抑制剂和对照介质处理的结直肠癌细胞的 7-point 磷酸化蛋白质组时间

十年磨一「图」,谷歌震撼发布纳米级人脑图谱!AI 加持人类大脑研究

【新智元导读】就在今天,人们被这张 1 立方毫米的纳米级人脑皮层图震撼到了。谷歌的十年神经科学成果 —— 人脑图谱,也登上了 Science。其中,科学家们发现了此前从未发现的细胞,和全新的连接模式。人类大脑皮层,可以以纳米级分辨率建模了!谷歌研究的连接组学团队,已经成立十年了。作为纪念,就在今天,团队放出了这张 1.4PB 的人脑连接组图。就是在这张图中,谷歌的科学家发现了此前从未发现的特征细胞。图中包含 57k 个细胞,和 150M 个突触。1 立方毫米的大脑,以惊人的细节被绘制出来。这张图带给人的冲击力,实在

从基因组到蛋白质组连续翻译,南开大学开发通用跨模态数据分析方法

编辑 | 萝卜皮近期,科学家在单个细胞内同时分析多组学模态的进展,使得细胞异质性和分子层次结构的研究成为可能。然而,技术限制导致多模态数据的高噪声和高昂的成本。在这里,南开大学的研究团队提出了 scButterfly,一种基于双对齐变分自动编码器和数据增强方案的多功能单细胞跨模态翻译方法。通过对多个数据集的全面实验,研究人员证明 scButterfly 在保留细胞异质性、同时翻译各种背景的数据集和揭示细胞类型特异性生物学解释方面优于基线方法。同时,scButterfly 可应用于单模态数据的综合多组学分析、低质量单

平均准确率达96.4%,中山大学&重庆大学开发基于Transformer的单细胞注释方法

编辑 | 萝卜皮使用测序 (scATAC-seq) 技术对转座酶可及的染色质进行单细胞测定,可在单细胞分辨率下深入了解基因调控和表观遗传异质性,但由于数据的高维性和极度稀疏性,scATAC-seq 的细胞注释仍然具有挑战性。现有的细胞注释方法大多集中在细胞峰矩阵上,而没有充分利用底层的基因组序列。在这里,中山大学与重庆大学的研究人员提出了一种方法 SANGO,通过在 scATAC 数据中的可及性峰周围整合基因组序列来进行准确的单细胞注释。SANGO 在跨样本、平台和组织的 55 个配对 scATAC-seq 数据集

优于人类专家,GPT-4 准确注释单细胞类型,成本低且稳健

编辑 | 萝卜皮GPT-4 是一种专为语音理解和生成而设计的大型语言模型。哥伦比亚大学梅尔曼公共卫生学院(Columbia University Mailman School of Public Health)的 Wenpin Hou 和杜克大学医学院(Duke University School of Medicine)的 Zhicheng Ji 证明,大语言模型 GPT-4 可以在单细胞 RNA 测序分析中使用标记基因信息准确注释细胞类型。「注释单个细胞的细胞类型的过程通常非常耗时,需要人类专家比较跨细胞簇的基

准确率达95.16%,快速识别恶性肿瘤细胞,厦大和上海交大团队开发域泛化深度学习算法

编辑 | 萝卜皮单细胞和空间转录组测序是两种最近优化的转录组测序方法,越来越多地用于研究癌症和相关疾病。细胞注释,特别是恶性细胞注释,对于这些研究中的深入分析至关重要。然而,当前的算法缺乏准确性和泛化性,使得难以一致、快速地从泛癌数据中推断出恶性细胞。为了解决这个问题,厦门大学和上海交通大学的研究团队提出了 Cancer-Finder,一种基于域泛化(Domain Generalization,DG)的深度学习算法,可以快速识别单细胞数据中的恶性细胞,平均准确率达到 95.16%。重要的是,通过用空间转录组数据集替

上海人工智能实验室团队开发具有多核光纤单元旋转功能的AI驱动投影断层扫描

编辑 | 白菜叶光学断层扫描已成为一种非侵入性成像方法,可提供对亚细胞结构的三维洞察,从而能够更深入地了解细胞功能、相互作用和过程。传统的光学断层扫描方法受到有限的照明扫描范围的限制,导致分辨率各向异性和细胞结构的不完整成像。为了克服这个问题,上海人工智能实验室、德国德累斯顿工业大学(Technische Universität Dresden)以及马克斯·普朗克学会(Max Planck Society)的研究人员采用了紧凑的多核光纤细胞旋转器系统,该系统有助于对微流控芯片内的细胞进行精确的光学操纵,从而实现具有

哈工大&南医大开发深度学习框架,用于从单细胞RNA测序数据中识别细胞间相互作用

编辑 | 萝卜皮细胞间相互作用(CCIs)在细胞分化、组织稳态和免疫反应等许多生物过程中发挥着关键作用。随着高通量单细胞RNA测序(scRNA-seq)技术的快速发展,从不断增加的 scRNA-seq 数据中识别CCIs变得非常重要。然而,受算法限制,当前基于统计策略的计算方法忽略了高度稀疏性和异质性的 scRNA-seq 数据中包含的一些关键潜在信息。哈尔滨工业大学和南方医科大学的研究团队开发了一个名为 DeepCCI 的深度学习框架,用于从 scRNA-seq 数据中识别有意义的 CCI。在灵活且易于使用的软件

哈工大开发深度学习框架,用于从单细胞RNA测序识别细胞相互作用

编辑 | 萝卜皮细胞间相互作用(CCIs)在细胞分化、组织稳态和免疫反应等许多生物过程中发挥着关键作用。随着高通量单细胞RNA测序(scRNA-seq)技术的快速发展,从不断增加的 scRNA-seq 数据中识别CCIs变得非常重要。然而,受算法限制,当前基于统计策略的计算方法忽略了高度稀疏性和异质性的 scRNA-seq 数据中包含的一些关键潜在信息。哈尔滨工业大学和南方医科大学的研究团队开发了一个名为 DeepCCI 的深度学习框架,用于从 scRNA-seq 数据中识别有意义的 CCI。在灵活且易于使用的软件

中国科学院团队两篇齐发:首个跨物种生命基础大模型+新型细胞命运预测AI模型发布

作者 | 中国科学院多学科交叉研究团队编辑 | ScienceAI被称为20世纪人类三大科学计划之一的人类基因组计划,拉开了深度解析生命奥秘的序幕。由于生命过程具有多维度、高度动态的特点,传统实验研究手段难以系统精准地破解基因密码的底层共性规律,亟需运用强大的计算技术来实现基因数据的表征建模与知识发现。当前,以大模型为核心的人工智能技术在计算机视觉和自然语言理解等领域引发了革命,展示出了对数据和知识的深入理解的能力,有望应用到生命科学研究领域,系统精准地破解基因密码的底层共性规律。近日,由中国科学院多学科交叉研究团

单细胞生物学基础大型语言模型scGPT更新版来了,在超3300万个细胞上进行预训练

编辑 | 紫罗就在前不久,多伦多大学研究团队发布首个单细胞生物学基础大型语言模型:scGPT,其在超 1000 万个细胞上进行预训练。现在,该研究团队首次尝试对超过 3300 万个细胞进行生成预训练来更新 scGPT。论文的通讯作者、多伦多大学助理教授 Bo Wang 在推特激动发文:「令人兴奋的 scGPT 更新:自 4 月份发布以来,受到社区的极大关注,我们很高兴地宣布单细胞多组学数据的基础模型 scGPT 的首次重大更新。」更新后的研究以「scGPT: Towards Building a Foundatio

13万个注释神经元,5300万个突触,普林斯顿大学等发布首个完整「成年果蝇」大脑连接组

这将进一步推动科学家们探索在 3D 环境中对果蝇大脑进行精确的计算机模拟。