日前,钟南山院士团队与腾讯公司披露了一项利用大数据与人工智能技术,定量评价不同大众防控策略对新冠疫情控制成效的研讨。研讨团队开发了一种新的反现实推理模型框架,通过引入隐含交互因子项,最大程度排除了随时间变化的混同因素的作用,对包含 145 个国度和地区、8 种大众防控策略的动态数据,从事更加准确,且符合真实世界运转的量化分析。
研讨结果表明,更快、更精准地施行疫情防控,才能灵验停止新冠肺炎疫情的发展。这也是新冠防控领域首次引入该技术从事研讨。
这项研讨成果已在国际著名医学期刊 Value in Health(《安康价值》)刊出,题为《Quantifying the Effect of Public Activity Intervention Policies on COVID-19 Pandemic Containment Using Epidemiologic Data From 145 Countries》。
论文链接:https://www.sciencedirect.com/science/article/pii/S1098301521017940
据了解,广州呼吸安康研讨院院长何建行和腾讯安康副总裁吴文达为该论文共同通讯作者,钟南山院士为指导作者,广州呼吸安康研讨院的梁文华教授、杨子峰教授、曾志奇博士,以及腾讯天衍实验室的孙继超博士、郑冶枫博士为这项新研讨的共同第一作者。这也是继去年 2 月,钟南山院士团队与腾讯公司共同成立大数据及人工智能联合实验室,双方在抗击新冠肺炎疫情上的最新研讨成果。此前,双方还联合研发了新冠重症 AI 预测系统,有助于合理地为新冠患者从事早期分诊。
“反现实推理模型”:一个基于反现实逻辑设计的算法模型
这项研讨中使用的 “反现实推理模型框架” 是 2021 年 7 月由 MIT 和斯坦福大学提出的一种基于机器学习的因果分析模型架构,最初应用于经济促进策略分析(如减税对 GDP 增长的作用)。该模型使用了反现实逻辑从事算法设计,表现为假设 “如果没有…… 就会(不会)……”,通常在大众管理领域用来评价策略作用。以房价控制策略为例,原本 A、B、C 三地房价因为受到温和通胀作用,会按照规律上涨,但突然 A 地限购了,要计算限购的作用,就要将“如果不限购其未来房价数据” 与“实际限购房价的数据”从事比较,得到的差值就是对限购策略作用的评价值。
对本研讨而言,简单的理解就是,先用一套机器学习模型,基于所有国度在所有未施行管控策略时的数据构建病毒灵验传递数 R_t 的拟合模型,用 “反现实推理模型框架” 来预测某地如果不采取防控办法下(反现实)病毒灵验传递数 R_t’值,以及该地施行防控办法后的病毒灵验传递数 R_t 真实数据,通过计算两个数据的差值的期望值,得到该防控办法的平均效力值。
但在实际操作中,腾讯天衍实验室的科学家们对原模型从事了更符合 “新冠疫情防控策略” 评价的优化改进(模型公式如图),通过融合多种传统面板数据的因果推断模型,包含双效固定效力模型、矩阵补全模型等,并隐式地引入潜在因子交互项,使其在复杂场景下能满足统计学的先验假设,对于像新冠疫情这样随时间变化的动态数据,能够从事更灵验的量化研讨,这也是研讨者在新冠疫情防控研讨开发并引入该模型框架的主要原因。
“新模型”的新用法:能获得更接近真实世界的运算结果
新冠疫情爆发后,全球几乎所有国度和地区都先后施行了不同程度的防控办法。虽然,已有很多研讨对各种管控办法停止疫情的成效从事了分析,但许多传统研讨存在国度样本数量小、统计方法过于简单,或只采用传统的因果推断模型(如双效固定效力模型)从事研讨,难以应对新冠疫情传递中诸多不可测量的混同因素作用,比如,不同国度间和地区的经济、文化、交通、人口密度,不同时间点人们自发的防护办法,当地的检测能力不同等,因此导致了统计效能不足,结果偏差较大等问题。
而新的反现实推理模型框架最大的特点是,通过引入时间效力、国度 / 地区效力,以及隐含的交互混同效力项,以一种隐含因子的方式排除了各种未知的“混同因子”,最大程度消除了各种动态因素对统计结果的作用。
为了进一步核验该模型的量化结果,科学家们还引入了 Pre-Trend 检验(图)。结果表明,在策略施行前,估计值与真实值残差趋于 0 波动,证明了模型的灵验性,这说明在该反现实推理模型框架下量化的管控策略成效是无偏估计量,这也使得在新的 “反现实推理模型” 框架下,研讨人员获得的研讨结果将更准确、更符合真实世界的疫情发展情况。
研讨印证:防控要快且准,三种办法成效最显著
研讨人员利用新的 “反现实推理模型” 框架,对全球 145 个国度和地区,包括欧洲 36 个,亚洲 36 个,非洲 47 个,北美 13 个,南美 11 个,大洋洲 2 个从事了研讨,跟踪了这些国度 / 地区在 2019 年 12 月 31 日到 2020 年 7 月 1 日新冠病毒在全球掀起第一波大流行期间,普遍采取的 8 种防控办法数据,具体包括:关闭学校、关闭工作场所、取消大众活动、限制人群聚集、大众交通管制、居家生活建议、限制国内流动、限制国际旅行。
结果显示:防控越快,起效越快。研讨表明,大多数疫情防控办法在施行后约 7 至 14 天,反映病毒灵验传递的“再生数” Rt 会迅速降低,防控成效随着时间的推移而增强,在 25 至 32 天后达到最大抑制成效,Rt 平均降低约 30% 。
反现实推理模型计算出 8 项防控办法施行后不同时间段对 Rt (灵验传递数)的抑制效力
研讨还指出,在疫情暴发早期(熏染缓慢增长期)施行的防控办法,办法越严格、持续时间越长,最终熏染人数会越少。但是,处于疫情中后期(熏染快速增长期)施行防控办法的话,结果则正好相反——防疫办法越严格,持续时间越久,最终熏染人数反而增加。论文第一作者孙继超博士指出,造成这一结果的原因并非疫情防控办法失效,而是反向因果关系导致:到了熏染人数快速增长暴发的时候,才开始制定严格的管控办法,此时已经收效甚微。这意味 “亡羊补牢” 为时已晚,在疫情出现苗头的时候尽快行动,才能实现最大成效。
研讨结果同时显示:刚性防控,成效更好。取消大众活动、关闭学校、关闭工作场所 3 项办法对疫情控制成效更为显著。研讨者推测,这 3 项办法均属强制性办法,执行的可行性更高,因此,更有可能对停止疫情生效。
反现实推理模型对 8 项管控办法成效的定量评价结果
研讨通过大数据分析找到了更可靠的证据,印证了疫情防控办法对抑制新冠肺炎疫情的定量作用,并建议应在疾病流行的早期,施行更严格的疫情防控办法,以更好地停止疫情。目前,钟南山院士团队和腾讯安康正在持续利用大数据与人工智能等互联网科技手段,围绕新冠预警预测、传染病防控等领域展开深入的科研合作,进一步为疫情防控提供有力的证据支持。