多中心医学图像分析模型，VFMGL框架破解数据孤岛难题，93.4% Dice系数的卓越表现

2025-03-05 05:48

编辑丨&在众多中下游任务中，收到广泛而多样的数据集训练的基础模型表现出的强大性能，在医疗领域表现却不甚得人心。受到到数据量、异质性和隐私问题等问题的严重阻碍，基础模型得不到更进一步的发展。桂林航空航天大学联合江门市中心医院等推出了 Vision Foundation Model General Lightweight（VFMGL）框架，以促进各种医疗任务的专家临床模型的去中心化构建。

编辑丨&

在众多中下游任务中，收到广泛而多样的数据集训练的基础模型表现出的强大性能，在医疗领域表现却不甚得人心。受到到数据量、异质性和隐私问题等问题的严重阻碍，基础模型得不到更进一步的发展。

桂林航空航天大学联合江门市中心医院等推出了 Vision Foundation Model General Lightweight（VFMGL）框架，以促进各种医疗任务的专家临床模型的去中心化构建。

通过对一系列医疗任务和场景的广泛实验和分析，VFMGL 被证明在医学图像分类和分割任务中都取得了卓越的性能，有效地应对了数据异构性带来的挑战。

该研究以「General lightweight framework for vision foundation model supporting multi-task and multi-center medical image analysis」为题，于 2025 年 3 月 1 日刊登于《Nature Communications》。

VFMGL

近年来，在自然语言处理领域，大规模语言模型使用了自我监督学习方法从大规模文本语料库中学习语言的内在结构，使大规模语言模型能够在多个自然语言处理任务中有着良好表现。

在计算机视觉领域，视觉模型（VFM）基于自监督方法在具有不同质量和自然图像多样性的大型未标记数据集上进行训练，可以产生各类通用特征。而在医学领域，有效的通用知识可以缓解个体患者差异对模型性能的干扰。

但当上述 VFM 直接应用到医学图像分析时，由于自然图像与医学成像存在的差异，可能会导致各类干扰。因此，医疗领域迫切需要一种技术来从 VFM 中获取通用知识，使模型能够在确保准确性的同时降低训练和部署复杂性。

全新的 VFMGL 框架可以自适应地从 VFM 获取与医疗任务相关的常识，实现 VFM 的轻量化；同时可以维护数据隐私，促进跨多个医疗机构合作。它适用于各种分类与分割中的医疗任务，在特征和模型级别提供可解释性。

图 1：VFMGL 框架概述。（图源：论文）

研究表明，神经网络非常有能力捕获特定于特定数据集的特征模式，以提高模型性能。VFMGL 利用联邦学习（FL）技术，支持在每个中心内严格保存医疗数据传输本地模型参数，跨多个中心聚合共享模型，保证本地数据的隐私性和安全性。

基于对因样本缺乏而导致共享模型缺少足够的知识进行预测的考虑，团队提出了我们提出了 DDBL 方法，该方法基于共享模型知识从每个中心选择低异质性数据。

与由模型逻辑层输出驱动的 KD 方法相结合，DDBL 使局部模型能够学习多个中心所拥有的常识，抑制它们学习特定特征模式的倾向，同时使用冗余参数进一步增强跨中心泛化能力。

VFMGL 在不同任务中的表现

乳腺癌是美国女性中最常见的癌症，大约 12% 的女性在其一生中被诊断出患有乳腺癌。而在整体的治疗过程中，识别淋巴结中的转移对乳腺癌患者具有重要意义。

在识别乳腺癌转移的组织图像鉴定中，VFMGL 鉴定率高达 97.15%，对非转移性乳腺组织图像的鉴定率高达 99.4%。有助于对全玻片图像进行准确的定性评估，以了解患者乳腺癌细胞转移的状态。

图 2：五个中心的 5 个模型的雷达图比较。（图源：论文）

相对乳腺癌，前列腺疾病则是男性的常见疾病。从磁共振成像（MRI）扫描中精确描绘前列腺对于诊断和制定这些疾病的治疗策略至关重要。由于成像方案差异、线圈使用不同，AI 分割的准确性受到极大影响。

在此用例中，VFMGL 表现出正确识别非前列腺区域的出色能力。它减少了因为中心异质性带来的可能会导致目标区域的过度分割或远处区域的错误分割。

图 3：六个中心的雷达图。（图源：论文）

细胞核的分割提供了基本的视觉信息和形态特征，例如大小、形状或颜色。这些信息和特征不仅有助于进一步处理病理图像，还可以帮助病理学家诊断和分析病情的进展。

VFMGL 解决了病理图像背景复杂、细胞核分布分散导致的细胞分割难的问题，在每个中心都表现出优异的性能。与其他方法相比，VFMGL 更有效地区分相邻的细胞核区域并减少错误分割的情况。

VFMGL 在各种场景和任务中保持了出色的稳健性，即使面临数据分布的不同变化也是如此。它对数据分布的变化表现出很强的抵抗力，预测性能仅有轻微的波动。

框架的总结

VFM 强大的特征提取能力和一般表示能力使其在预测未知目标时具有稳健性。团队提出的轻量化技术也使得模型参数大小可以压缩到其原始大小的八分之一，理论计算工作量可以减少到其原始值的十二分之一。

对本地模型在此阶段学习的特征的进一步探索揭示了它们与其他中心区分开来的独特特征，来自 VFM 的一般知识帮助局部模型在本地数据上实现稳健的特征表达。与现有的 FL 算法相比，开发的 VFMGL 表现出卓越的性能，证明了其在医学分类和分割方面的有效性。

VFMGL 处理各种医疗任务的能力已在一个私有数据集和三个公共数据集上得到验证。这个全新的模型还在医学图像分类与分割方面展示了自己的潜力。

考虑到 VFMGL 未来潜在的实际应用，实验团队分析了来自独立中心的数据特征与实验集的相似性。结果表明数据特征相似度越高则该中心的局部模型的预测性能越好。

团队最后提出，自适应特征和常见特征对模型稳健性和泛化的贡献仍需要进一步探索，这有助于发现进一步提高模型性能的方法。

论文链接：https://www.nature.com/articles/s41467-025-57427-z

代码链接：https://github.com/baofengguat/VFMGL/tree/main

交大O1医疗探索：延长AI思考时间，解锁复杂推理诊断

编辑 | ScienceAI当医生面对复杂病例时，往往需要反复思考、权衡多种可能性，才能得出准确诊断。以鉴别诊断为例，它要求医生生成可能的诊断列表，并通过评估临床发现，逐步排除不符合条件的选项。如今，AI 也学会了这种「深思熟虑」的诊断方式。

1/15/2025 3:39:00 PM

ScienceAI

人工智能如何改变制药行业，对医学的未来意味着什么？

编辑 | 白菜叶制药行业以严谨的研究、复杂的药物开发流程和尖端技术的使用而闻名，而现在，由于人工智能的出现，该行业正在经历一场变革。从疾病识别和诊断、药物发现、临床试验优化到提高制造效率等应用，人工智能正在加速该行业的发展。制药行业拥有大量生物、化学数据和患者数据，因此具有独特的优势，可以充分利用人工智能的潜力。

3/3/2025 12:03:00 PM

ScienceAI

谷歌旗下带来细胞器动力学的「全息解码器」，启动亚像素级细胞器分析

编辑丨&细胞器经历不断的形态变化和动态相互作用，这是细胞稳态、应激反应和疾病进展的基础。尽管细胞器的形态与运动十分重要，但由于其复杂的结构，高速的运动模式与目前现有分析技术的局限性，量化细胞器形态仍具有挑战性。美国旧金山 Calico Life Sciences 的团队推出了一个名为 Nellie 的模型，这是一种自动化且无偏倚的管道，用于分割、跟踪和提取不同细胞内结构的特征。

3/5/2025 12:57:00 PM

ScienceAI

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验 Figma 推 AI 革命：开发智能应用制作器与网站创建工具扣子空间Coze Space正式开启内测支持 MCP 扩展集成腾讯混元3D AI引擎2.5即将揭晓，3D生成技术再升级

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora 3D Anthropic AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测百度人形机器人伟达苹果 Transformer 深度学习模态 xAI 字节跳动 Claude 大语言模型搜索驾驶文本神器推荐具身智能 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊特斯拉 AGI 训练 2024

顶部

多中心医学图像分析模型，VFMGL框架破解数据孤岛难题，93.4% Dice系数的卓越表现

相关资讯

交大O1医疗探索：延长AI思考时间，解锁复杂推理诊断

人工智能如何改变制药行业，对医学的未来意味着什么？

谷歌旗下带来细胞器动力学的「全息解码器」，启动亚像素级细胞器分析