在第16个世界孤独症关注日到来之际,位于中国科学院合肥创新工程院的星元智能AI团队颁布了国内首个孤独症垂类大说话模型Starlight。
孤独症是一类先天性的神经发育妨碍,患者会出现社会交往妨碍、兴趣局限和刻意重复的行为。近年来钻研显示,其患病率逐渐上升,根据美国疾控中心(CDC)公布最新的孤独症患病率筛查数据显示,每36名8岁孩子中就有1名为谱系妨碍(2.8%),且至今病因不明,症状将伴随终身,孤独症患者的病愈程度关乎千万家庭的生活品质。
近些年随着AI技术的不断突破,给孤独症病愈难题的攻克带来了更多的可能性。
在一次公益活动的参与中,团队发现了许多孤独症孩子在病愈过程中一直存在巨大挑战,由于资源短缺和高昂的费用,许多家庭无法持续为自己的孩子供应专业的病愈服务,而在家庭干预中,父母又缺少专业的学问和经验。于是,怀着“用AI(爱)让星星的孩子不再孤独”愿景,这个团队决定为这些孤独症孩子和家庭供应技术支持。
星元智能AI团队经过近两年的钻研和实验,于2021年颁布了一款鉴于学问图谱的孤独症家庭干预支持公益平台“星星之心”,为家长及行业从业者免费供应包括居家教学、信息查询、供需对接、前沿钻研、社区分享等数字化信息支持,上线3个月迅速累计1万多位忠实用户,获得广泛好评。
在用户的使用反应过程中,团队发现当前孤独症教育中的一个重要症结,是对疑似孤独症孩子缺乏系统的初期自我筛查体系,集中体现为无法为孤独症孩子供应高效的评价手段。
2022年9月,星元智能颁布METASTAR智能评价系统,鉴于大量的诊疗案例、临床数据、历史文献和专家的临床经验,根据DSM-5孤独症谱系妨碍诊疗标准,对孤独症筛查诊疗的指标体系进行循证,鉴于多模态融合的机器进修算法框架进行建模和训练,研发鉴于AI技术的数智化评价筛查工具,为孤独症的初期筛查供应更加便捷和可靠的方法,为医生临床诊疗供应辅助信息,以实现初期筛查、初期诊疗。
评价筛查通过学问提取、学问表示、学问存储和学问检索四个步骤,这里我们用到中文分词、词性标注和命名实体识别,配合Gensim实现主题模型,最终应用ElasticSearch检索。
2023年3月,为迎接第16个世界孤独症关注日,星元智能AI团队颁布国内首个孤独症垂直领域的大说话模型——Starlight。鉴于说话大模型的对话系统,用户可无妨碍地向其提问任何有关孤独症谱系妨碍的疑问,并得到即时解答。
Starlight利用临床钻研中产生的信息汇总成庞大的数据库,对约2.5T的诊疗样本进行深度进修,辅以监督微调、反应自助、强化进修等前沿技术,训练出一套高效的NLP算法,用纯attention搭建出transformer说话大模型。该模型具备强大的自然说话处理能力和高质量对话生成能力,可以和用户进行非常流畅的自然说话沟通,同时在扩展性、可部署性和数据安全性都有很高表现。
谈及大模型未来的应用,团队表示,目前正考虑结合OpenPose可用姿态估计库,通过图像和视频的视觉传达,构建更加完善的多模态模型。