近日,《柳叶刀 (The Lancet)》子刊 EBioMedicine 发表了一项中国科学家应用自适应 AI 模型和多源数据,预测重庆市流感活动度的研究,这是中国首个基于 AI 和大数据的流感实时预测模型,也是 AI 在传染病预测领域中非常有影响力的成果。
该研究成果由平安科技、平安智慧城市与重庆市疾病预防控制中心、陆军军医大学和清华大学联合完成。
众所周知,流感持续威胁着全球公共卫生安全。季节性流感每年导致全球数亿人发病,数十万人死亡。此外,流感病毒基因持续变异,全球流感大流行的风险持续存在。
对流感活动进行监测和预测,并及时作出相应防控准备,对于季节性流感和流感大流行的防控至关重要。然而,传统流感监测由于数据的报送、整理和统计处理需要时间,流感活动水平相关的指标往往滞后一到两周才能获得,这对流感这个急性呼吸道传染病的防控是十分不利的,有时会导致错过疫情控制的最佳时机。
为解决流感活动指标数据的滞后问题,在过去十多年中,人们对流感活动的预测进行了大量探索。其中,谷歌流感趋势(Google Flu Trends)开创了利用谷歌搜索数据预测流感活动水平的新格局。此后,包括互联网搜索数据、流感监测数据、Twitter 上与流感相关的帖子、维基百科访问日志和电子健康记录在内的多源电子数据与数学模型相结合,具有非常好的疾病跟踪和预测效果。
然而,许多此类研究是在国家层面进行的,其预测结果很难转化为可供地方卫生官员做出更好决策的可操作信息。局部地区,比如一个城市的流感活动并不等同于国家层面的情况。因为,受地区特定天气变化、经济和社会活动、人口免疫和个人习惯等因素影响,局部地区的流感疫情往往表现出更加多样化的流行模式。
如今,已有一些研究在纽约、墨尔本、香港等城市建立了流感预测模型,做了很多有价值的探索和尝试。但是目前在流感活动无规律的城市地区进行流感活动度预测,仍然缺乏较高精度的有效方法。因此,一种更加科学、更加智能的流感预测方法已经成为实施流感疫情防控的迫切需要。
(来源:Pixabay)
为了解决这一关键的公共卫生问题,课题组利用重庆地区多源数据,包括卫生系统的流感监测数据如流感样病例(ILI)数据,以及外源性的天气数据、互联网搜索数据、舆情等数据,融合多种前沿人工智能算法,创新性地建立了一个自适应人工智能模型 (Self-adaptive AI Model,SAAIM),对重庆地区 2014-2017 年总体流感活动水平进行了回顾式预测,并对重庆地区 2018 年的流感活动水平进行了实时预测,可提前一周准确预测流感活动,在实际应用中验证了模型的有效性。
研究人员表示,重庆是一个流感活动极不规律的典型城市,这种不规律性给流感预测带来了极大挑战。
理论上,该模型融合人工智能算法建立自适应模型,动态调整参数,可准确捕捉流感疫情变化中的规律性的一面和不规律性的一面。在实际应用上,及时可靠的流感预测,可以帮助政府机构对公共卫生资源进行科学的、前瞻性的配置,使得医疗卫生机构能够在流感疫情高峰来临前做好准备,提高疾病防控效率、降低政府医疗财政负担和个人疾病经济负担。
研究人员表示,这是我国第一个基于人工智能和大数据的流感实时预测模型,可以为季节性流感趋势不规律的城市提供准确的实时流感预测。
专访研究论文共同第一作者、平安科技人工智能中心副总工程师徐亮博士和重庆市疾控中心传防所呼吸道及新发传染病防制科科长宿昆博士
DeepTech:AI 在实时流感预测过程中,发挥了怎样的价值?
徐亮:我们融合了前沿的 AI 算法,创新性地建立了一个自适应人工智能模型(Self-adaptive AI Model,SAAIM),对重庆地区 2014-2017 年总体流感疫情流行趋势进行了回顾式预测,并对重庆地区 2018 年的流感情况进行了在线预测,可提前一周准确预测流感活动,在实际应用中验证了模型的有效性。流感预测过程中,AI 的运用不仅是对于传统流感监测手段的革新,也是在实际应用过程中不断自我调整、优化,提升预测精度。我们在本次论文中提出的 SAAIM 作为国内首个实时的 AI 流感预测模型,在流感防控的理论与实际应用上均具有价值。
理论上:(1)结合多源大数据与人工智能方法,提前一周预测流感活动,克服了传统流感监测“定时抽样、每周汇总”方式带来的结果相对滞后的问题;(2)融合多种人工智能算法建立自适应模型,动态调整参数,可准确捕捉流感不规律的季节性趋势,为此类地区的流感预测提供了有效的方法;(3)模型对流感流行的特征重要性的分析,揭示出了流感流行的一些相关因子,为公共卫生工作者对于流感流行的研究提供了新思路。
实际应用上:(1)及时可靠的流感预测,可以帮助政府机构对公共卫生资源进行科学的、前瞻性的配置,并使得医疗卫生机构能够在流感季中提前准备、合理应对病人流量;(2)长期来看,流感预测的发布还可提升公众对于流感等传染性疾病的防控意识。实施有效的流感预测,是实现疾病防控关口前移的必然路径。
DeepTech:该 AI 模型都收集了哪些方面的数据?
徐亮:该 AI 模型借助平安集团长期积累的庞大数据库,整合了卫生系统内部的数据及可能影响流感发病的外源性数据。具体地,在本次发表的论文中,我们使用到了重庆地区的多源数据,包括卫生系统内部的流感监测数据如历史流感样病历百分比(ILI%),外源性的天气数据,以及互联网舆情数据如百度搜索数据和新浪微博舆情数据。
庞大的数据量、丰富的数据维度为模型提供了客观的数据输入,使得模型能够深入挖掘宏观层面无法统计的细颗粒度信息,从而提升预测精准度。
DeepTech:实时流感预测都能预测哪些指标?准确度如何?又会产生哪些实际意义?
徐亮:采用 AI+多源大数据进行流感预测时,我们的目标依然采用流行病学中的专业指标,即流感样病例百分比(ILI%),这也是国际流感监测最通用的指标。但另一方面,我们也对流感活动的相关因子进行了特征构建与分析,从而不仅仅预测流感活动情况,还能揭示流感流行的相关因素,从而帮助疾控专家和民众针对相关因素采取针对性措施。
模型的准确率超过 90%,同时自 2018 年在重庆市疾控中心上线应用以来,线上预测的准确率始终保持在 90% 以上,并且根据疾控专家的经验输入进行优化,提升预测精度。
流感预测模型不仅仅是传染病防控的理论创新,而且能在实际防控中发挥作用。我们基于研究成果开发了流感预测系统,于 2018 年第 12 周起,在重庆市疾控中心落地应用,提前一周预测流感活动情况,为流感防控做出了预警,帮助卫生部门开展流感活动的线上监测与提前应对。疾病预测模型的建立与智能传染病预测系统的上线,可以帮助卫生部门更加科学地、准确地开展事前预测预警,助力政府部门在相关疾病的防控工作中提升效率,降低疾病预防和控制成本。对于普通民众而言,定期发布的传染病流行指数也提升了民众对于疾病的了解及卫生安全意识,从而变被动事后处理为主动提前防范。因此,我们的疾病预测模型不仅仅是在医疗卫生的技术上实现跨越,对民众的预防效果进行改善,也是对人民的健康意识起到正面的影响,实现真正的疾病防控关口前移。
宿昆:流感样病例百分比(ILI%, Influenza-like Illness Percentage),即监测门诊流感样病例数占监测门诊就诊总人数的百分比,是国际上衡量流感活动强度的重要通用指标,目前模型预测的准确度达到了 90% 以上。预测工作对流感这个急性呼吸道传染病的实时防控,有着重要的现实意义,具体包括:(1)准确的预测和基于预测的防控建议使得卫生部门有能力做出及时的和科学的决策,在流感疫情高峰来临前及时调配卫生资源和促进医院做好接诊准备;(2)预测模型纳入了多维数据,进入模型的各数据因子的权重结果可以为流感疫情动因研究提供线索,从而为防控提供指导方向;(3)长远来看,流感预测和健康指导服务可以激发市民关注传染病疾病的防控,从而推动全民健康素养和水平。
DeepTech:该 AI 模型是否会适用于其它传染病?
宿昆:AI 模型也适用于其它传染病预测,我们同时也研发了手足口病预测模型,准确率也在 90% 以上。AI 模型也可以用于慢性非传染病的防制工作中。
徐亮:我们针对慢性病建立预测筛查模型,如慢阻肺危险因素筛查模型,准确率达
92%。在未来,我们还会继续研发更多的传染病、慢性病预测模型,并将研发成果与实际业务场景相结合,通过人工智能更好地服务政府进行公共卫生管理,指导人民群众进行疾病预防,为健康中国的建设作出贡献。
DeepTech:该 AI 模型是否会适用于其它城市?在推广到其它城市的过程中会有哪些困难?
宿昆:基于 AI 的流感预测模型可以适用于其它城市,但是也必须指出的是,适合重庆市的模型不能照搬到其它城市。正如世界上没有两片完全相同的叶子的道理一样,每个城市都有着自己的独特的社会、自然、经济、人群等环境或条件,这些整体影响着当地的流感疫情。因此,在开发其它城市的流感预测模型时,可能会遇到的主要困难是流感疫情动因数据的筛查和模型的调试。
徐亮简介
今年 6 月,《麻省理工科技评论》公布了第 19 届 35 Innovators Under 35 评选结果,即 2019 年度 全球“35 岁以下科技创新 35 人”榜单。在此次的 35 名上榜者中,共有 8 位华人,其中就包括平安科技副总工程师徐亮。
图 | 徐亮(来源:麻省理工科技评论)
《麻省理工科技评论》指出,徐亮和他的团队研发了一个人工智能平台,该平台正在转变中国城市改善公共卫生、减少犯罪和提高公共管理效率的方式。徐的团队与市政机构进行了密切的合作,这些机构提供给他们千万份的健康记录和海关过境记录等数据。在处理完全部数据,去除识别细节,并通过其他形式进行了训练之后,这个名为 PADIA 的平台就被整合到这些机构的计算机系统中。该平台帮助重庆和深圳的公共卫生部门预测流感暴发,准确率超过 90%。深圳的一家地方政府机构使用该系统,将处理文件的时间缩短了 95%。还有一些省份已经利用它发现了近 10 亿元(1.5 亿美元)的医疗诈骗。政府使用人工智能在许多国家引起了争论。徐也意识到了隐私泄露和失业等问题,但他仍对人工智能将现代教育和医疗保健带到传统上被忽视领域的潜力感到乐观。他指出,农村地区的教师可以利用人工智能庞大的知识库找到问题的答案,而缺乏受过训练的人员来解释医学扫描结果的社区卫生中心可以使用人工智能算法来帮助诊断严重疾病。
宿昆简介
宿昆,流行病与卫生统计学博士,重庆市疾控中心传防所呼吸道及新发传染病防制科科长。主要从事突发公共卫生事件应急调查处置,牵头流感、人禽流感、不明原因肺炎、新发传染病等项目管理工作。曾参与霍乱、人感染 H7N9 禽流感等重大疫情现场调查处置工作,获得全国人感染 H7N9 禽流感防控先进个人等荣誉称号。主要科研方向为传染病预测预警和卫生应急调查处置,正在主持的课题包括重庆市流感预测预警研究和人感染 H7N9 禽流感防控研究,曾参与美国 NIH、WHO、欧盟、国家科技重大专项等科研项目,以第一作者发表 SCI 论文多篇。