西湖大学郭天南解答AI虚拟细胞难题：在三重数据支持下的闭环学习系统

2025-04-10 01:09

编辑丨&细胞是生命的基本单位，对于了解健康、衰老和疾病至关重要，是药物开发和合成生物学的重要研究对象。基于细胞的实验需要大量资源，且出现突变的概率相当高，直接导致了生物医学实验中难以复现的困境。通过数十亿年的进化，第一个碳基细胞出现在地球上，然而现如今借由虚拟技术，「硅基细胞」的发现与发展正在为科学界提供变革的机会。

编辑丨&

细胞是生命的基本单位，对于了解健康、衰老和疾病至关重要，是药物开发和合成生物学的重要研究对象。基于细胞的实验需要大量资源，且出现突变的概率相当高，直接导致了生物医学实验中难以复现的困境。

通过数十亿年的进化，第一个碳基细胞出现在地球上，然而现如今借由虚拟技术，「硅基细胞」的发现与发展正在为科学界提供变革的机会。

最近，人工智能虚拟单元（AIVC）的概念被提出，集成了人工智能和多模态数据，用以创建细胞功能的综合计算模型。这些 AIVC 有望实现精确和可扩展的计算机实验。

来自杭州西湖大学的郭天南团队解答了关于 AIVC 的几个关键问题，比如什么构成了培养这些数字实体的理想「培养基」？应该优先考虑哪些细胞类型进行虚拟培养？

这些解答以「Grow AI virtual cells: three data pillars and closed-loop learning」为题，于 2025 年 3 月 25 日刊登于《Cell Research》。

三个数据支柱

团队提出，AIVC 的进化或增长依赖于三个基本组成部分和营养物质：先验知识、静态架构和动态状态。这些数据支柱与深度学习算法相结合，构成了 AIVC 开发的基础。

随着人工智能的快速发展，可以开发一个集成所有这些数据源的综合基础模型，作为构建 AIVC 的基础。团队将先验知识指定为 AIVC 构建的第一支柱，以其封装了对模型构建至关重要的基本细胞生物学机制。

图 1：通过闭环学习实现 AIVC 增长和进化的数据支柱。（图源：论文）

然而，虽然先验知识支柱富含多样化的细胞生物学信息，但它不能直接用于构建特定的 AIVC 模型。为了实现这一目标，需要对特定细胞进行全面表征，捕获其在形态与分子层面上的完整细胞结构及其相互作用。

接下来，静态架构是第二个重要支柱。它集成了纳米级分子结构和来自分子建模、冷冻电子显微镜、冷冻电子断层扫描、相关光学和电子显微镜与其他多尺度分析的空间分辨数据。

组织扩增技术可以进一步提高空间分辨率，补充上述高分辨率成像方法和组学技术。这种集成方法提供了详细的三维背景信息，对于准确的 AIVC 建模至关重要。

为了弥补在生命系统的动态性质上的缺陷，团队引入了动态状态作为 AIVC 开发的第三个支柱，以此来构建实时的 AIVC。这些数据包括自然过程，如衰老、发育和致癌作用，以及包括物理、化学和遗传干预在内的诱发扰动。

图 2：计算机模拟的原子环境下的细胞环境（图源：网络）

随着转录组学、蛋白质组学和代谢组学等高通量组学技术的进步，现在可以分析不同细胞状态下的数千种分子。为了构建有效的 AIVC，必须全面捕获广泛的细胞状态并最大限度地提高它们的多样性，以确保高精度区分它们，这需要大量的动态细胞特异性数据。

由于细胞的相似性，它们在构建 AIVC 方面的价值有限。为了更好地了解扰动对细胞行为的影响，新兴的空间组学技术需要能对分子分布进行大规模映射。故而，人工智能驱动的静态和动态数据集成对于构建功能稳健和可预测的 AIVC 至关重要。

闭环主动学习系统

为了发展 AIVC，团队将从静态、数据驱动的模型过渡到能够发展智能自适应系统。

闭环 AIVC 开发的作框架从自主化学实验室的最新突破中汲取灵感。这一愿景的核心是建立闭环框架，将计算预测与机器人实验相结合，特别是针对动态状态数据中的差距。

团队新提出的闭环主动学习系统可以根据它们减少模型不确定性或揭示新调控机制的潜力，优先考虑高影响扰动。随着实验循环进行，虚拟细胞得以不断进化，趋近于真实细胞乃至获得全新的特性。

尝试的方向

团队建议从一个相对简单但信息丰富的模型开始，例如酵母（S. cerevisiae）。这种生物体的基因组相对较小，拥有丰富的扰动组学和成像数据，以及已建立的遗传作和高通量实验方案。

后续则以人类癌细胞作为重要目标，推动 AIVC 在人类病理生理学与精准医疗中的发展应用。

未来，AIVCs 有望在药物开发、疾病建模和基础生物学研究中发挥重要作用。后续系统将在 AI 预测与机器人实验中进行针对性设计，完善对细胞的理解。科学界的努力将会助力释放 AIVC 的全部潜力。

原文链接：https://www.nature.com/articles/s41422-025-01101-y

谷歌旗下带来细胞器动力学的「全息解码器」，启动亚像素级细胞器分析

编辑丨&细胞器经历不断的形态变化和动态相互作用，这是细胞稳态、应激反应和疾病进展的基础。尽管细胞器的形态与运动十分重要，但由于其复杂的结构，高速的运动模式与目前现有分析技术的局限性，量化细胞器形态仍具有挑战性。美国旧金山 Calico Life Sciences 的团队推出了一个名为 Nellie 的模型，这是一种自动化且无偏倚的管道，用于分割、跟踪和提取不同细胞内结构的特征。

3/5/2025 12:57:00 PM

ScienceAI

哥伦比亚大学研究人员开发新型 AI 模型，可精准预测人体细胞基因表达

哥伦比亚大学瓦格洛斯医学院的研究团队开发了一种新型人工智能（AI）模型 ——“通用表达转换器”（GET），能够准确预测任何人类细胞中的基因活性，从而揭示细胞的内部机制。这一研究成果发表在最新一期的《自然》杂志上，有望彻底改变科学家研究癌症、遗传疾病等的方式。

1/12/2025 6:12:49 PM

远洋

智能电子粘附皮肤：机器人与环境交互的新进展！

编辑丨ScienceAI皮肤是人类与外界交互的重要窗口，而机器人要像人类一样灵活适应复杂环境，也需要一套能够「感知」与「操控」的智能皮肤。以往的电子皮肤侧重模仿皮肤组织的传感功能，常常忽略了皮肤附属器的特异化功能（如鳞片的保护、摩擦控制功能）。近期，新加坡南洋理工大学夏焜校长讲席教授、清华大学高华建院士、南洋理工王一凡教授、湘潭大学王秀锋教授团队联合，在《Science Advances》上发表了最新研究成果：一款突破性设计的智能电子粘附皮肤！

2/14/2025 4:45:00 PM

ScienceAI

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型全能且实用！实战测评谷歌最新模型Gemini 2.5 Pro 大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战模态编码器|CLIP详细解读 DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI 50组多风格提示词，全面测评Midjourney V7生图效果！斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习 GPT 开源微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习模态苹果 AI视频驾驶文本搜索 xAI 人形机器人 Copilot 神器推荐 LLaMA 大语言模型具身智能字节跳动 Claude 算力安全应用视频生成科技视觉干货合集亚马逊 2024 AGI 特斯拉 DeepMind 架构

顶部

西湖大学郭天南解答AI虚拟细胞难题：在三重数据支持下的闭环学习系统

相关资讯

谷歌旗下带来细胞器动力学的「全息解码器」，启动亚像素级细胞器分析

哥伦比亚大学研究人员开发新型 AI 模型，可精准预测人体细胞基因表达

智能电子粘附皮肤：机器人与环境交互的新进展！