基于COX比例风险模型分析心力衰竭影响因素

2021-09-23 10:45:35王定坤杨杉
电脑知识与技术 2021年24期
关键词:射血肌酐年龄

王定坤 杨杉

摘要:文章用Cox比例风险模型对心力衰竭的影响因素进行了数据分析,研究结论显示,影响心力衰竭的主要因素是年龄、射血分数、高血压情况、血清肌酐浓度。根据模型我们可以帮助医疗专业人员了解患者存在的潜在风险,以便专业人员能够更早地采取行动。

关键词:Cox比例风险模型;Schoenfeld残差分析;心力衰竭影响因素

心力衰竭是指人体心脏的收缩功能的减退以及舒张功能受阻,不能很好地将静脉回心血量排到心脏外,造成静脉系统血液堆积,动脉系统血液不够,从而引起肺瘀血、腔静脉瘀血等疾病。心力衰竭是心脏方面的疾病,并且发病大多是从左心衰竭开始的。随着时间的推移,心脏逐渐不能提供全身的供血进而引起下半身肿胀、心跳加快或不规则、突然严重的呼吸急促和咳嗽等症状。心力衰竭已成为全球的最大死因,我国心衰患病率估计已达1.3%,保守估计至少有1000万人患有心力衰竭,特别是老年人占据大部分比例。如今中国已成为全球拥有最多心衰患者群的国家之一。本研究将死亡事件设置为结局,探究可能引起病人死亡的主要因素,由于每一个研究对象都有其各自的生存时间(从随访开始的时间一直到死亡、失访或随访结束的时间),由于这一特性所以选用Cox比例风险模型(Cox proportional-hazards model,也称为Cox回归)进行分析处理。数据由13个变量组成,对此13个变量进行Cox生存分析以评估影响患者死亡最大因素进而尽最大的可能提升患者的生存几率。

1 相关知识

1.1 Cox回归原理分析

Cox回归模型又被人们称为比例风险回归模型。由于生存时间与生存结果作为该回归模型的因变量,并且多个变量也可被同时分析进而分析出对生存期的影响。因为该模型上述的特性,自从模型被研发以来,大量运用在了医学分析领域。并且该模型能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。由于其上述显著的优势,该模型已被大量的学者所使用。

2 模型建立及实例分析

2.1数据集简介

本数据集为从R公司检索到的心力衰竭预测数据集。该数据集由13个变量组成分别描述了患者的基本状况。年龄:用于描述患者患病年龄的定量数据、是否贫血(1/0):为一个二进制变量、肌酐磷酸激酶、是否患有糖尿病(1/0):为一个二进制变量、射血分数百分数:用于显示每次收缩时离开心脏的血液百分比、是否高血压(1/0)、血小板:发挥的主要作用,是生理性止血以及维持血管内皮完整性。血清肌酐:一种定量数据,用于描述肾脏功能的好坏、血清钠:一种定量变量,显示患者血液中的血清钠水平,以mmol/L为单位、性别男性1女性0、是否吸烟(1/0):为一个二进制变量、到访时间:一个定量数据显示患者死亡前几天的到访时间、是否死亡(1/0):为一个二进制变量。

2.2模型构建

本次研究方法使用的软件为IBM SPSS Statistics 26统计分析软件,在进行Cox回归分析之前,先利用单变量分析的方法例如KM法绘制生存曲线或者Logrank检验等方法检测所有因变量与自变量之间存在的关系,筛选掉一些可能不存在实际意义的变量,之后再通过多因素分析的方法,以保证其结果更加精确可靠。纳入的变量主要包括单因素分析差异有统计学意义的变量,为避免漏掉一些重要因素,作为探索性分析,此时将P值小于0.1,均作为具备统计学差异。在进行单因素分析时,并没有发现差异有统计学意义,但是在实验中认为与因变量关系密切的自变量。

在创建Cox回归分析时,我们将时间选取为到访时间,状态选取为是否死亡,协变量选取为是否贫血、肌酐磷酸激酶、是否患有糖尿病、射血分数百分数、是否高血压、血小板、血清肌酐、性别、是否吸烟,对于变量的筛选选取的方法为最大似然估计的向前逐步回归法(Forward LR)。

最终得到的模型如表1所示:

由表1可发现,血清肌酐、年龄、射血分数(百分数)、高血压的回归系数均为0,其次Score统计量为77.352, P<0.01;对数似然比检验x2=70.522, P<0.01,由以上数据可说明模型中至少有一个自变量的HR值不为1,模型整体检验有统计学意义,而且随着变量的加入,-2log likelihood的值逐渐变小,说明引入新的自变量后模型效果更加优秀,新纳入的变量是有效的。

2.3 数据分析

由表2的数据可得出参数估计的结果,从表格中可看出通过最后筛选后的模型仅包含通过变量筛选最终纳入模型的变量存在4个,包括年龄/射血分数/高血压情况/血清肌酐浓度。表达式为h(t)=h0(t)exp(0.044*年龄+(-0.049)*射血分数(百分数)+0.466*高血压+0.338*血清肌酐)。

1)其中由年龄P<0.001,具有统计学意义,相对危险度HR=Exp(B)=1.045,95%可信区间为(1.027,1.064),说明年龄为影响患者生存的独立危险因素。患者每增加一岁,引起将来死亡风险为原来的1.045倍。

2)射血分数:P<0.001,具有统计学意义,相对危险度HR=Exp(B)=0.952, 95%可信区间为(0.933,0.971),说明射血分数值为影响患者生存的独立保护因素。患者射血分数每增加一个单位,引起将来死亡风险为原来的0.952倍。

3)高血压情况:P=0.027,具有统计学差异,相对危险度HR=Exp(B)=1.594, 95%可信区间为(1.053,2.414),说明高血压为影响患者生存的独立危险因素。患者患有高血压引起将来死亡风险为不患有高血压的1.594倍。

4)血清肌酐浓度:P<0.001,具有统计学意义,相对危险度HR=Exp(B)=1.402, 95%可信区间为(1.231,1.596),说明血清肌酐浓度值为影响患者生存的独立危险因素。患者血清肌酐每增加一个单位,引起将来死亡风险为原来的1.402倍。

为更好地解释危险因素风险,将连续变量年龄按照四分位数进行四等分转化为等级资料,其结果如下:

其余变量解释如前,将年龄四分位之后,其解释如下,年龄每增加一个等级,其发病风险为原有的1.401倍。

2.4 模型验证

而在实际的生存分析过程中,一些自变量对风险函数的影响会发生改变,而Cox回归模型在应用之前的前提为进行比例风险假定,该比例风险假定也被称为PH假定,只有当PH假定条件成立时,

Cox回归模型的结果有意义。考虑到年龄和死亡发生事件一般不呈线性关系,即对此假设进行假设检验。采用的方法为Schoenfeld残差法进行检验。

由图1可知,年龄与死亡发生存在正相关性,即随着年龄的增大,死亡发生的风险也在增大。即不满足该PH假定:年龄与死亡发生事件无关。即采用Cox时间依存协变量进行分段Cox回归分析。

由图易得实验结果与前方实验结果一致,得出结论时间协变量并无意义。

3 结语

对于患有心血管疾病或者有患心血管疾病隐患的病人,我们应该采取的手段是早发现早治疗。通过我们的模型,我们可以分析出例如患者每增加一岁,引起将来死亡风险为原来的1.045倍。患者患有高血压引起将来死亡风险为不患有高血压的1.594倍。

患者血清肌酐每增加一个单位,引起将来死亡风险为原来的1.402倍。从我们的模型中可以发现对于年龄较大,有高血压且血清肌酐较大的患者,我们更应该重点关注其患者的各项体征进而最大限度地提高患者的生存机率。因此,我们模型的最终目的是帮助医疗专业人员了解患者存在的潜在风险,以便专业人员能够更早地采取行动。毕竟对于预测一个疾病的发生再采取行动总比当疾病发生了再去阻止更加有效。

参考文献:

[1] 張旭.基于COX比例风险模型的高职单招生行为影响因素与管理对策分析[J].无线互联科技,2020,17(19):86-87,92.

【通联编辑:唐一东】

猜你喜欢
射血肌酐年龄
变小的年龄
M型超声心动图中左室射血分数自动计算方法
射血分数保留的心力衰竭影像学研究进展
老年人群收缩压与射血分数保留的心力衰竭预后的关系
TOO YOUNG TO LOCK UP?
年龄歧视
算年龄
益肾活血法治疗左室射血分数正常心力衰竭的疗效观察
血肌酐水平对慢性心力衰竭患者预后判断的临床意义
哈尔滨医药(2015年5期)2015-12-01 03:58:09
肌酐-胱抑素C公式在糖尿病肾病超滤过检出中的作用