江苏省疾病预防控制中心,南京(210009)
刘文东 胡建利 艾 静 吴 莹 戴启刚 梁 祁 李 媛 汤奋扬△ 朱叶飞△
近年来,早期预警已成为传染病防制领域的研究热点,许多国家广泛开展了相应的理论及应用研究,引进了一系列预警模型,进而建立了早期预警应用系统[1-2]。2003年SARS发生后,我国也积极开展传染病预警应用研究[3],2004年实现传染病网络直报之后相继开发了国家传染病自动预警系统(China infectious diseases automated alert and response system,CIDARS),并在全国范围内推广运行[4]。但几年的实践表明,该系统应用的预警方法过于简单和单一,预警分析的灵敏度、特异度及时效性均不够理想,有必要引入新的方法技术,改善预警效果,从而提高该系统在传染病应急防制中的应用价值[5-6]。
在我国,流行性腮腺炎(以下简称腮腺炎)是引发传染病突发公共卫生事件最多的病种之一,因此,研究腮腺炎的早期预警具有典型意义。本文以江苏省腮腺炎疫情资料为基础,探讨累积和控制图模型(cumulative sum control chart,CUSUM)在腮腺炎早期预警中的应用价值,同时也为其他传染病的预警研究提供参考和借鉴。
1.资料来源
2004-2012年江苏省腮腺炎疫情数据来自“中国疾病预防控制信息系统”子系统——“疾病监测信息报告管理系统”(即传染病网络直报系统),2012腮腺炎突发公共卫生事件数据来自子系统“突发公共卫生事件报告管理系统”;从另一个子系统“国家传染病自动预警系统(CIDARS)”中下载2012年 全省腮腺炎自动预警数据。
2.CUSUM模型及国家传染病自动预警系统(CIDARS)简介
(1) CUSUM模型
CUSUM模型是英国剑桥大学Page于1954年提出的一种控制图模型,其原理是通过不断累积观察值与基线水平的差值,放大观察数据出现的波动,从而可以更加迅速、灵敏地探测到微小的异常情况。预警统计量S计算公式如下:
S0=0
Si=max[0,Si-1+zi-k]
其中,k为参考值,是CUMSUM模型的两个待定参数之一;Si表示当前期的预警统计量,Si-1为上一期的预警统计量,zi为当前期观察值相对于历史基线的偏移量,其计算公式如下:
预警分析时,首先判断Si>h是否成立(h为预警阈值,是CUSUM模型中另一个待定参数),即当前预警统计量是否超过预警阈值h,如果超过则发出预警信号。
(2) CIDARS
CIDARS是中国疾控中心在传染病网络直报系统基础上开发的传染病早期预警应用系统,并于2008年4月开始在全国范围内正式投入运行。该系统对于鼠疫、霍乱、传染性非典型肺炎、脊髓灰质炎、人感染高致病性禽流感、肺炭疽、白喉、丝虫病、不明原因肺炎等9个低发或罕见病种采用单病例预警,即发现一例即产生预警;对于包括流行性腮腺炎在内的19个常见多发的病种采用移动百分位数法进行预警,其中腮腺炎预警阈值为P80(第80百分位数)。
3.预警分析与效果评价
以江苏省2012年报告的腮腺炎突发公共卫生事件作为目标事件。CUSUM模型统计量的计算采用短基线法,为了消除周末效应的影响,根据当前日是工作日或周末建立不同的历史基线:如果是工作日则向后回溯14个工作日作为历史基线;如果是周末,则向后回溯14个休息日(周六或周日)作为历史基线。
分析CUSUM模型及CIDARS的预警信号,如果一条预警信号落在某一起突发共卫生事件起止时间范围内,则视为对该事件的有效预警,反之则为错误预警;对于同一个事件的时间区间内产生的多次预警计为1次有效预警。用灵敏度、特异度、及时性等3个指标对CUSUM模型以及CIDARS的预警效果进行评价和比较:
灵敏度=有效预警事件数/报告的事件总数×100%
特异度=无预警信号产生的天数/无突发公共卫生事件发生的天数×100%
及时性(天)=某事件有效预警日期-该事件的起始日期
本研究中原始数据的整理在Excel 2007中完成,CUSUM模型预警试验在Matlab2011b中完成,CUSUM模型与自动预警系统之间预警效果的假设检验在SAS8.1中完成。
1.江苏省腮腺炎流行概况
我省自2004年开始腮腺炎疫情网络直报,近10年间全省腮腺炎流行起伏波动较大,有一定的周期性流行的倾向,但由于数据积累年份太少无法进行检验;2010年报告病例数最低,全省仅有553例;2012年则是高发年份,全省报告发病19104例,较2011年增加115.50%。见图1。
图1 2004-2012年江苏省流行性腮腺炎流行趋势
我省腮腺炎流行有明显的季节性,全年呈双峰型分布,发病最高峰出现在5-6月,次高峰出现在11-12月。各地区发病数差异较大,2012年报告发病数前3位的地区依次是苏州市(3208例)、徐州市(2751例)、连云港市(2207例),计占全省发病总数的42.75%;发病数后3位依次是盐城市(400例)、泰州市(471例)、扬州市(705例)。
2012年全省报告腮腺炎突发公共卫生事件14起,其中13起发生在3-6月,1起在12月;14起事件均为某一个区县范围内的局部暴发疫情,发生场所均在学校,发病数最多262例、最少12例。所有事件中,从首例病例发生日期到该事件确认报告日期之间的间隔时间(即事件报告及时性)最短为1天,最长达29天,中位数为8天。另外值得注意的是,有4起事件的所有病例均集中在同一天报告,占事件总数的28.57%。
2.CUSUM模型预警分析与评价
(1) 模型参数选择
以2011年11月1日-2012年12月31日全省110个区县每日发病数为实验数据,从2012年1月1日起以CUSUM模型进行前瞻性试验。模型中的两个待定参数h(h=1,2,3,4)、k(k=0.5,1.0,1.5,2.0,2.5)依次选择不同数值进行组合试验,计算每一种组合下的预警灵敏度、特异度,以灵敏度为纵坐标、1-特异度为横坐标绘制ROC曲线,最终确定模型参数为h=3,k=0.5,见图2。
图2 ROC曲线
(2) CUSUM模型预警分析及效果评价
CUSUM模型全年共产生1688条预警信号,每天信号数最少0条,最多22条,平均每天4.62条;各区县全年产生信号数最少0条,最多24条,平均15.35条。CIDARS全年发出预警信号2609条,每天信号数最少1条,最多38条,平均每天7.15条;各区县全年预警信号最少0条,最多达67条,平均23.72条。
对于14起目标事件,CUSUM模型均发出了有效预警,灵敏度为100%,CIDARS对9起事件发出了有效预警,灵敏度为64.29%,CUSUM模型预警灵敏度显著高于CIDARS(χ2=6.09,P=0.0136)。CUSUM模型和CIDARS特异度分别为95.84%、94.35%,前者高于后者,差异有统计学意义(χ2=602.48,P<0.0001)。从事件开始日期到发出预警日期之间的时间间隔(即预警及时性),CUSUM模型最短0天,最长29天,中位数为3.5天;CIDARS最短2天,最长23天,中位数为6天;CUSUM模型与CIDARS预警及时性无统计学差异(Z=0.9173,P=0.359)。CUSUM模型及CIDARS对目标事件的预警分析结果见表1。
CUSUM模型是常见的传染病突发公共卫生事件早期预警方法之一,是当前国外一些传染病预警应用系统的核心方法[7-9]。国内也有学者开展CUSUM模型的应用研究[10-11]。本文研究中,CUSUM模型对于腮腺炎局部暴发疫情的早期探测效果良好,预警分析的灵敏度、特异度均明显高于CIDARS的移动百分位数法,并且预警信号数比CIDARS减少35.30%,可以极大地降低基层预警信号核实的工作量,减少传染病预警的运行成本,提高可接受性。
表1 CUSUM模型与自动预警系统预警结果统计
本研究中同时也存在一些有待改进和完善之处:
(1)CUSUM模型对于腮腺炎预警分析的及时性不够理想,其原因主要在于数据质量较差。14起目标事件中,普遍存在病例报告延迟的现象,其中近1/3的事件所有病例均在事件确认后在某一天集中进行网络直报,致使模型无法在事件萌芽阶段及时做出预警。本研究的所有目标事件均发生在各级各类学校,因此加强学校公共卫生管理,建立晨检制度和传染病零报告制度,提高学校传染病报告及时性,可以从根本上解决这一问题。
(2)本研究中以区县为单位进行预警分析,但当前的传染病突发公共卫生事件多是局部暴发疫情,疫情波及范围多局限于某区县的一个或几个乡镇,由于暴发规模小,发生病例少,必须累积到一定数量才能在区县水平上发现异常。因此可以考虑将预警分析的空间尺度进一步缩小,以乡镇为单位进行实时预警将进一步提高模型的灵敏度和特异度、及时性。
(3)当前,包括CUSUM模型在内的各种控制图模型在传染病监测预警中的应用都是以现行的行政区划为基础[3,11]。有研究表明,我国传染病突发公共卫生事件主要发生在学校[12-13],如果以学校为单位开展预警分析将极大提高模型的预警效能。但在传染病网络直报系统中学生所在学校多填在“患者工作单位一栏”,而且不是必填字段,因此学生所在学校信息大多缺失,不能用于学校突发事件的早期探测,因此建议在网络直报系统中尽量完善所在学校信息。
(4)当前以控制图模型为基础的预警方法多是对各个空间单位独立进行预警探测[7,9,11],忽略了空间相关性的存在,对于跨区域的局部暴发事件(即同时波及几个相邻空间单位)探测能力降低。因此,如果在CUSUM模型算法中引入空间相关性将具有突破性意义。可以考虑建立空间邻接矩阵,以此明确各空间单位之间的(一阶或多阶)邻接关系,进而通过不同的权重将具有邻接关系的空间单位合成一个新的空间单位,再对其进行预警分析。
(5)不同的预警模型在预警分析时具有各自的优势,在实际运用中可以考虑将定性方法与定量方法相结合、将时间预警技术与空间预警技术相结合,通过多种预警技术的联合应用提高预警分析的能力[14]。
参 考 文 献
1.Tsui FC,Espino JU,Dato VM,et al.Technical description of RODS:a real-time public health surveillance system.Journal of the American informatics association,2003,10(5):399-408.
2.Desenclos JC.RAISIN-a national programme for early warning,investigation and surveillance of healthcare-associated infection in France.Euro surveill,2009,14(46):1-8.
3.杨维中,郉慧娴,王汉章,等.七种传染病控制图法预警技术研究.中华流行病学杂志,2004,25(12):1039-1041.
4.杨维中,兰亚佳,李中杰,等.国家传染病自动预警系统的设计与应用.中华流行病学杂志,2010,31(11):1240-1244.
5.杨维中,李中杰,赖圣杰,等.国家传染病自动预警系统运行状况分析.中流行病学杂志,2011,3(5):431-435.
6.梁万年.加强我国传染病预警的研究与应用.中华流行病学杂志,2011,32(5):429-430.
7.Watkins RE,Eagleson S,Bert V,et al.Applying cusum-based methods for the detection of outbreaks of Ross River virus disease in Western Australia.BMC medical informatics and decision making,2008,8:37.
8.Boyle JR,Sparks RS,Keijzers GB,et al.Prediction and surveillance of influenza epidemics.MJA,2011,194(4):S28-S33.
9.Fricker RD,Hegler BL,Dunfee DA.Comparing syndromic surveillance detection methods:EARS’ versus a CUSUM-based methodology.Statist Med,2008,27:3407-3429.
10.张洪龙,赖圣杰,李中杰,等.累积和控制图法在传染病暴发探测中的应用.中华流行病学杂志,2010,31(12):1406-1409.
11.窦相峰,王全意,贾蕾,等.累积和模型在细菌性痢疾早期预警中的应用.首都公共卫生,2010,4(5):201-204.
12.鲁琴宝,龚震宇,林君芬.浙江省2004-2007年学校突发公共卫生事件流行病学分析.中国学校卫生,2008,29(8):718-719.
13.刘文东,吴莹,梁祁,等.江苏省2006-2009年突发公共卫生事件流行特征分析.现代预防医学,2012,39(5):1071-1074.
14.杨维中.传染病预警理论与实践.北京:人民卫生出版社,2012.