2019年12月在中国武汉爆发的COVID-19大流行,已导致全球至少6.03亿例病例和超过640万人死亡(截至2022年9月)。1.由于一些政府实施了一系列全国性和更局部的封锁,社会、经济和卫生系统后果造成了大量额外的干扰、发病率和死亡率2.这一流行病需要采取一系列政策、公共卫生和临床决策,对社会运作、经济和保健提供产生重大影响。做出这些决定总是很复杂的,但对大多数地方来说,缺乏相关数据加剧了这一问题3..相比之下,少数领土在大流行期间大幅发展了数据能力,为指导本国决策和国际审议提供了重要见解。

应在大流行的各个阶段提供关键数据来源。对在数据能力方面具有积极异常值的领土进行案例研究,可以吸取可能可转移的教训,以便更好地利用数据对未来的流行病和大流行病作出反应。由于COVID-19大流行尚未结束,本文所载的想法应被视为一项正在进行的工作。

数据需求

所有大流行病都有其独特的层面,这取决于致病传染因子的性质、国家和国际非药物反应的速度,以及疫苗和治疗剂的可得性和部署情况。但是,有可能确定大流行病的一些核心阶段,并因此考虑在这些阶段理想情况下应可用于支持决策的数据来源。世卫组织(世界卫生组织)大流行阶段框架概述了大流行的核心阶段,该框架最初是为流感制定的3.

尽管大多数政府在一定程度上发展了大流行数据应对能力,但少数国家在COVID-19期间为发现与政策相关的见解做出了不成比例的贡献。这些地方的例子包括冰岛、以色列、卡塔尔、苏格兰和台湾(其中一些在表中讨论1).

表1用于支持大流行病应对的国家数据基础设施案例研究

拥有相关数据集是基本的,但还不足以确保有能力以数据为基础的政策应对大流行病。还需要不同利益攸关方访问数据的权限(最好由国家科学委员会协调和授予),以及将这些数据整理、链接、分析、可视化、解释和传达给政府机构、决策者、卫生系统领导人和其他受众的能力(通常跨越国界)。这些步骤都很耗时,但在大流行病感染呈指数级增长的背景下,时间是一种奢侈。因此,作为国家大流行病防范计划的一部分,必须适当重视数据基础设施和管道。

数据基础设施

有必要尽可能实时地获取不同的数据,包括电子健康记录、旅行和其他与健康有关的数据,最好是每个人的数据。关键数据集可以潜在地存储在一个中央安全仓库中,就像卡塔尔的情况一样(表2)1).这需要足够的计算能力,在处理数百万行数据时,计算能力可能非常强大。将这些不同的数据集汇集在一起可以通过确定性或概率方法完成;在可能的情况下,使用唯一标识符最有效地实现这一点45.另一种方法是将数据留在原地,并部署面向服务的体系结构(SOA)方法,该方法通过应用程序编程接口(api)在不同的数据集之间创建接口。这需要前期的工程成本,但提供了定期同步更新的潜力,并伴随着下游资源需求的大幅减少。

信息治理

需要对获取健康和其他敏感数据进行仔细监管6并要求各种流程到位,以确保数据不被不当使用。这些检查通常是广泛和耗时的。然而,在大流行病等全球紧急情况的背景下,需要改变提供这些数据的风险平衡。因此,制定政策和计划是很重要的,这可能需要特别的立法。例如,台湾通过立法,允许获取移动电话数据1).同样,英国政府当时的卫生和社会保健国务大臣发布了患者信息控制(COPI)通知,允许在医疗保健组织和其他相关机构之间共享机密的患者信息,以保障公众健康7

分析能力

在生成基于数据的洞察能力方面,另一个关键的速率限制步骤是缺乏数据处理和分析能力。需要训练有素的工作人员,他们最好熟悉有关数据集,能够及时检查、清理、链接、分析和帮助政策受众和其他人可视化数据。这需要具备多种技能的员工一起工作8.例如,花时间开发数据字典和共享源代码可以极大地提高分析的效率和方法的透明度。

透明度

与以往一样,以透明的方式进行分析是很重要的9提供探索性分析。例如,在大流行的早期阶段,尚不清楚哪些变量对于确定COVID-19预后不良风险最大的患者最有用,因此需要进行若干探索性分析。重要的是要透明地报告这种探索性分析。其他提高透明度的建议包括:报告元数据;在可能的情况下,提前指定统计分析计划(SAP),并公开提供这些计划;通过GitHub等存储库提供源代码;并且,在可能的情况下,提供实际或合成的数据,以促进复制和验证研究以及新分析师的培训。虽然当务之急是向政策制定者提供见解,但在预印本和同行评议期刊上发表分析报告,以便对方法进行独立验证,并与全球社区分享见解,也有相当大的价值

国际合作

在许多情况下,能够跨国家、区域或全球运行分析非常重要10.然而,这是困难的,因为跨越国界移动主权数据集是不可能的,因此需要联邦分析与某种形式的数据综合。最突出的例子是约翰·霍普金斯大学冠状病毒资源中心COVID-19检测仪表板(方框)1).

其他例子包括分析英国各国的数据,以调查封锁措施对卫生系统功能的影响,调查罕见的疫苗安全信号,如脑静脉窦血栓形成1112在美国,人们关注的变异(巴西的Gamma和苏格兰的Delta)对疾病严重程度和疫苗效力减弱的影响13以及通过国际COVID-19数据联盟在40多个国家开展的工作;https://icoda-research.org)调查封锁措施对围产期结局的影响14

结论

随时获得高质量的多维数据是产生有效证据和明智政策应对大流行病的基础,但大多数地方在这方面都遇到了困难。许多分析需要跨越国际边界,这最有可能通过联合分析方法实现,但需要政府之间的协调。在大流行期间,一些地区在卫生数据科学方面表现出色,这为未来的流行病和大流行提供了一个可能开发和部署的框架(方框)2).