突破性进展!浙大scNiche框架精准识别细胞生态位,助力精准医疗

编辑 | 2049随着单细胞空间组学技术的快速发展,科研人员可以在单细胞分辨率水平上系统探索组织中细胞状态、功能和相互作用。 然而,如何从这些海量的空间组学数据中精确识别和表征细胞生态位(cell niche)仍是一个重大挑战。 近日,浙江大学药学院团队开发了一个名为 scNiche 的计算框架,可以从单细胞分辨率的空间组学数据中有效识别和表征细胞生态位。

图片

编辑 | 2049

随着单细胞空间组学技术的快速发展,科研人员可以在单细胞分辨率水平上系统探索组织中细胞状态、功能和相互作用。

然而,如何从这些海量的空间组学数据中精确识别和表征细胞生态位(cell niche)仍是一个重大挑战。

近日,浙江大学药学院团队开发了一个名为 scNiche 的计算框架,可以从单细胞分辨率的空间组学数据中有效识别和表征细胞生态位。

该研究以「Identification and characterization of cell niches in tissue from spatial omics data at single-cell resolution」为题,发表于 2025 年 2 月 16 日的《Nature Communications》。

图片

论文链接:https://www.nature.com/articles/s41467-025-57029-9

代码地址:https://github.com/ZJUFanLab/scNiche

研究背景

当前空间组学技术虽能获取单细胞分辨率的分子图谱,但现有计算方法多基于同质性假设,难以捕捉细胞微环境中的异质性特征。

传统方法如 HMRF 和 BayesSpace 采用 Potts 模型强制邻近细胞共享相同标签,这种简化处理导致肿瘤-免疫界面等复杂微环境识别困难。BASS 等改进方法虽引入层次模型,但在多样本整合和大规模数据处理上仍显不足。

研究团队发现,细胞自身分子特征、邻域分子特征和细胞组成特征这三个视角的信息互补性,为克服现有方法的不足提供了新思路。

scNiche框架的三维解析

scNiche 框架采用了独特的设计理念,将细胞本身及其微环境的各种特征统一定义为细胞的不同「视角」特征。具体来说,scNiche 默认在预定义的 k-nearest neighbors 范围内提取三类特征:细胞的分子表达谱、其邻域的分子表达谱以及邻域的细胞组成。

与之前大多数深度学习方法不同,scNiche 首先为不同视角的特征构建独立的图网络,然后利用图神经网络将这些多视角特征整合成一个有意义的联合表示。

这种模型架构包含三个关键组件:多图自编码器(M-GAE)、图融合网络(GFN)和多视图互信息最大化(MMIM)模块。

M-GAE 模型基于图卷积网络(GCN)构建,通过视图特定的 GCN 编码器层编码多视图数据的互补信息,GFN 捕获不同视图图之间的关系并生成包含所有视图全局节点关系的一致性图。

MMIM 模块通过提升任意视角中相邻样本表示之间的相似性来引导更适合聚类的联合表示学习。该模块采用了基于 Shannon 熵的互信息度量方法,通过最大化样本与其近邻的互信息来增强模型对细胞微环境结构的识别能力。

图片

图示:scNiche 概览。(来源:论文)

性能验证

scNiche 的扩展性通过包含 3,698,530 个细胞的小鼠全脑 MERFISH 数据集得到验证。

得益于其创新的 subgraph-based batch training strategy(通过随机采样构建子图进行分批次训练),该方法能够准确识别包括丘脑-纹状体边界在内的不同脑区结构。

在基准测试中,scNiche 在空间蛋白质组学数据集(CODEX、IMC)和空间转录组数据集(STARmap、MERFISH)上均实现了最高的 adjusted Rand index (ARI) 和 macro-F1 分数,显著优于现有方法。

在 10X Visium 数据分析中,即使用 Cell2location 的反卷积结果替代原始细胞组成特征,模型仍保持较好的表现。

在基因表达随机归零的鲁棒性测试中,scNiche 在低 dropout 率时表现相对稳定,但当 dropout 率较高时,所有方法(包括 scNiche)的性能都会显著下降。

图片

图示:小鼠全脑 MERFISH 数据集的性能评估。(来源:论文)

临床应用

在 19 例混合型与 15 例区室化三阴性乳腺癌样本中,scNiche 揭示了独特的免疫微地理特征。

Niche 6 中巨噬细胞高表达 CD11b(p=0.011)和 PD-L1(p=0.016)等免疫调节蛋白,形成免疫抑制微环境;而 Niche 12 中的巨噬细胞呈现出与肿瘤细胞的高度共定位特征(proportion=0.67, p=0.002)。

研究发现 Keratin+ 肿瘤细胞在 Niche 5 与 Niche 11 呈现差异化分布:前者 CK17 表达显著高于后者(p=0.014),且特异性富集于不同患者群体,这为个体化治疗提供了潜在靶点。

图片

图示:乳腺癌微环境解析。(来源:论文)

在肝损伤研究中,scNiche 发现与正常肝脏门静脉周围区域(Niche 1)相比,肝损伤组织中的 Niche 10 显著上调了多个抗氧化基因(如 Gpx3、Gsta1、Gsta2、Gsto1)以及组织纤维化相关基因(如 Ctsl、Ctsb 等 cathepsins 编码基因),揭示了肝损伤微环境的适应性分子特征。

图片

图示:疾病特异性肝损伤的微环境。(来源:论文)

未来展望

scNiche 通过创新的多视角融合架构,在保持单细胞分辨率的同时,实现了跨样本、跨条件的微环境对比分析。其在肝损伤研究中揭示的 zonation 模式重构现象,为器官纤维化机制研究提供了新视角。

但需注意,对于低分辨率的空间转录组数据,微环境解析精度可能受限。未来研究方向包括:整合组织学图像特征以提升空间分辨率、结合单细胞空间映射(如 Tangram、CytoSPACE)或重建技术扩展应用场景,以及开发统一的空间多组学数据解析框架。

相关资讯

如何让细胞进行计算?国内四高校提出生物计算元器件设计全新方法,登Cell

编辑 | 萝卜皮作者 | 论文团队细胞犹如一台计算机,每时每秒都在接收、分析和处理来自环境中的不同信息:外界信息通过细胞内高度并行的信号转导途径进行分析和处理,进而以预定义的方式从「存储设备」(即 DNA)中读取信息(基因的表达)或写入指令(DNA 修饰和编辑),指导自身或周围细胞对环境信息做出响应。一直以来,如何有效利用生物体本身的计算能力,通过对生物体进行改造使之能够执行人类给定的计算任务,并由此开发出基于生物系统的新概念计算机都是计算机科学与生物技术领域交叉融合的热点问题。近期,来自国防科技大学、西湖大学、浙

AI+超材料双向突破,浙大综述揭示超材料研究进展,登Nature子刊

编辑 | 2049在电磁波调控的舞台上,超材料曾凭借其人工设计的亚波长结构,打破了自然材料的物理限制,实现了负折射、隐身斗篷等奇异现象。 然而,当工程师试图将这类「魔法材料」应用于动态环境时,却发现传统超材料如同精密的机械手表 —— 虽能精准运行,却无法根据环境变化自主调整。 这种矛盾在自动驾驶、智能通信等实时场景中尤为突出,亟待新的技术范式突破。

AI做生物实验?还能迭代?浙大集成PLM和「自动化生物工厂」革新蛋白质工程范式

编辑 | 萝卜皮传统的蛋白质工程方法(如定向进化)虽然有效,但通常速度缓慢且劳动密集。 机器学习和「自动化生物工厂」的进步为优化这些过程提供了新的机会。 浙江大学的研究人员设计了一个基于蛋白质语言模型的自动进化平台,这是一个在设计-构建-测试-学习循环内实现蛋白质工程自动化的闭环系统。