覆盖97.6%泌尿就医人群,蚂蚁集团开源首个医疗专科推理数据集

12月28日,由信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,这将提升大模型在医疗领域的专业性。图说:蚂蚁集团商业机器智能部总经理顾进杰介绍国内首个医疗专科推理数据集在医疗行业,通用型语言模型在应对医疗问诊时,会直接给出答案,而医生则会根据专业知识进行反复的症状探讨,才能给出答案。另外,大模型的幻觉问题和推理能力不足,当前高质量的中文医学专科数据集又较为稀缺,这对训练出色的医疗领域大模型提出了挑战。为克服这些难题,

12月28日,由信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上,蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集,这将提升大模型在医疗领域的专业性。

覆盖97.6%泌尿就医人群,蚂蚁集团开源首个医疗专科推理数据集图说:蚂蚁集团商业机器智能部总经理顾进杰介绍国内首个医疗专科推理数据集

在医疗行业,通用型语言模型在应对医疗问诊时,会直接给出答案,而医生则会根据专业知识进行反复的症状探讨,才能给出答案。另外,大模型的幻觉问题和推理能力不足,当前高质量的中文医学专科数据集又较为稀缺,这对训练出色的医疗领域大模型提出了挑战。

为克服这些难题,蚂蚁集团与上海仁济医院泌尿科专家团队联合研发,基于医生团队临床经验,通过构造模拟病例数据的方式,推出了首个中文医疗专科问答推理数据集RJUA-QA,这也是业内首个临床专科数据集。

数据集由训练、验证、测试三部分组成,包含2132个问答对,每个问答对由医生根据临床经验编写的问题、专家提供的回答以及用于帮助推理的上下文构成,病种覆盖了97.6%以上的泌尿科就医人群,能真实复刻诊疗场景。数据集能提高大模型在医疗诊断推理方面的能力,并作为在严肃可控场景下应用的评测基准。

顾进杰进一步介绍了蚂蚁百灵大模型在医疗领域的技术进展。“专业性、可控性、轻量化是大模型技术在医疗行业落地的三个重要挑战和机会。”顾进杰说。

专业性上,由于医疗行业有超百个科室,每个专科和疾病,都需要专业的调试。蚂蚁集团联合医疗专家共同研发了多模态医疗知识引擎,进一步推动中国专业医疗数据集的构建与开放。

在可控性方面,百灵大模型结合知识图谱技术,让大模型的每一个回答都有据可依。“生成内容可以满足不同医院、不同科目的定制需求,包括风格与调性等”,顾进杰说。蚂蚁集团在超大规模图学习和知识图谱技术长期积累,今年联合OpenKG发布的OpenSPG开源项目,重新定义了工业界的知识图谱语义架构,知识检索增强技术也是大幅提升大模型正确性与可控性的重要课题。

医疗行业有数据隐私、专业知识和系统自主性的需求,考虑到机构的算力成本与便捷部署,百灵大模型还攻坚了轻量化技术。在12月份开源的模型轻量化框架(PIA)中,集成了模型剪枝、压缩、量化、推理加速等全链路环节的优化,具备开箱即用、功能无损、低代码接入等优点,可在天级别完成10倍以上压缩比。

目前,蚂蚁百灵大模型在中英文的医疗考试以及基准测试达到或超过了GPT4水准,例如,在中文医疗LLM评测榜单promptCBLUE上,取得A榜第一,B榜第二的成绩;在国际医疗问答榜单PubMedQA中,以80.6%的准确率取得了前五的成绩,而且是前十中参数量最小的模型,更适合被机构部署和使用。

本次峰会也是2024中国信通院ICT+深度观察报告会上海分会场,以“智能涌现,创新生态”为主题,共同探索大模型的前沿技术创新和落地应用实践,为行业发展提供新思路、新方法、新路径。

相关资讯

蚂蚁集团开源新算法,可助大模型推理提速2-6倍

近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。图:新算法在不同开源大模型上的提速表现。这套新算法名为Lookahead推理加速框架,能做到效果无损,即插即用,该算法已在蚂蚁大量场景进行了落地,大幅降低了推理耗时。以Llama2-7B-chat模型与Dolly数据集为例,实测token生成速度可由48.2个/秒,升至112.9个/秒,提速2.34倍。而在蚂蚁内部的RAG(检索增强生成)数据集上,百灵大模型AntGLM 10B版本的加速比达到5.36,与此同时,显存增加和内存消耗几乎

蚂蚁百灵大模型最新进展:已具备原生多模态能力

7月5日,在2024世界人工智能大会“可信大模型助力产业创新发展”论坛上,蚂蚁集团公布了其自研的百灵大模型最新研发进展:百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力,可以直接理解并训练音频、视频、图、文等多模态数据。原生多模态被认为是通往AGI的必经之路,在国内,目前只有为数不多的大模型厂商实现了这一能力。记者从大会现场的演示看到,多模态技术可以让大模型更像人一样感知和互动,支撑智能体体验升级,百灵的多模态能力已应用于“支付宝智能助理”上,未来还将支持支付宝上更多智能体升级。(蚂蚁集团副总裁徐

多模态遥感大模型的探索与实践,蚂蚁集团遥感大模型负责人王剑带来深度解读

7月5日,在世界人工智能大会组委会办公室、上海市徐汇区人民政府指导下,由上海人工智能实验室、AI在线、全球高校人工智能学术联盟主办的 2024 WAIC 云帆奖暨人工智能青年论坛成功举办。论坛汇聚来自斯坦福大学、牛津大学、UCLA、加州大学、苏黎世联邦理工学院、香港大学、清华大学、北京大学、上海交通大学等海内外高校、研究机构及企业的30余位往届及新晋云帆奖得主线下参会,凝聚国际青年AI科学家的智慧,积极探索AI能力边界,为中国AI发展蓝图贡献新生力量。蚂蚁集团遥感大模型负责人王剑作作为2024 WAIC 云帆奖代表