Nat. Commun.|人类水平的准确性，哈佛医学院团队使用机器学习，从空间蛋白质组数据中赶快、精确地识别细胞类别

编辑 | 萝卜皮高度多重蛋白质成像正在成为分析细胞和构造内天然环境中蛋白质分布的有效技术。然而，现有的利用高复杂空间蛋白质组学数据的细胞诠释办法是资源密集型的，并且需要迭代的专家输入，从而限制了它们对于广泛数据集的可扩展性和实用性。哈佛医学院（Harvard Medical School）团队引入了 MAPS（Machine learning for Analysis of Proteomics in Spatial biology），这是一种机器学习办法，有助于从空间蛋白质组数据中赶快、精确地识别细胞类别，并具有

编辑 | 萝卜皮

高度多重蛋白质成像正在成为分析细胞和构造内天然环境中蛋白质分布的有效技术。然而，现有的利用高复杂空间蛋白质组学数据的细胞诠释办法是资源密集型的，并且需要迭代的专家输入，从而限制了它们对于广泛数据集的可扩展性和实用性。

哈佛医学院（Harvard Medical School）团队引入了 MAPS（Machine learning for Analysis of Proteomics in Spatial biology），这是一种机器学习办法，有助于从空间蛋白质组数据中赶快、精确地识别细胞类别，并具有人类水平的准确性。

MAPS 在多个内部和公开可用的 MIBI 和 CODEX 数据集上进行了验证，在速度和准确性方面优于当前的诠释技术，即使对于通常具有挑战性的细胞类别（包括免疫起源的肿瘤细胞）也能达到病理学家级别的精度。

该研讨以「MAPS: pathologist-level cell type annotation from tissue images through machine learning」为题，于 1 月 2 日发布在《Nature Communications》。

Nat. Commun.|人类水平的准确性，哈佛医学院团队使用机器学习，从空间蛋白质组数据中赶快、精确地识别细胞类别

细胞亚型的精确描述对于阐明生物构造在其自然环境中的结构和功能的复杂性至关重要。高重空间蛋白质组学技术（例如 MIBI、CODEX、cycIF 和 IMC）的最新进展，允许在单个构造切片内询问 40-60 个蛋白质组标记，为表型和功能研讨的细胞和构造结构内的蛋白质表达和分布提供了宝贵的见解。

然而，这些办法可能面临与构造降解、图像配准困难以及循环进程中表位丢失相关的障碍。

高度多重的图像可以为了解生物进程提供新的方向，但它们也给数据处理带来了挑战，比如需要自动化管线从每个单细胞中提取信息。现有的细胞诠释办法取决于无监督的聚类技术，需要随后的手动管理和视觉验证，这个进程可能明显是劳动密集型的，并且需要特定领域的专业知识。

因此，需要一种计算量轻、赶快的自动化细胞分类办法，在达到人类水平的准确性的同时，提高空间蛋白质组数据分析的效用和可扩展性。

哈佛医学院的研讨团队开发了 MAPS（Machine learning for Analysis of Proteomics in Spatial biology），这是一种机器学习包，可在跨多个空间蛋白质组学平台进行基准测试时实现准确、赶快的细胞诠释，并具有最高的同类功能。MAPS 可以提高细胞诠释进程的速度和质量，以便研讨人员可以分配更多的下游工作来原位揭示新的生物进程。

Nat. Commun.|人类水平的准确性，哈佛医学院团队使用机器学习，从空间蛋白质组数据中赶快、精确地识别细胞类别