朱浩雨,陈基明*,葛亚琼,邵颖,高静,李颖
1.皖南医学院弋矶山医院影像中心,安徽芜湖 241001;2.通用电气(中国)有限公司,上海 210000; *通讯作者 陈基明yjsyycjm@126.com
乳腺癌淋巴血管浸润(lymphovascular invasion,LVI)是浸润性乳腺癌周围淋巴和血管系统中肿瘤栓塞的病理表现[1]。LVI的存在是浸润性乳腺癌不良预后的因素之一[2]。然而LVI 状态是切除后病理标本中确定,因此术前预测是否存在LVI 有重要意义,MRI的部分特征包括肿瘤邻近血管征、瘤周水肿、肿瘤表观扩散系数(ADC)值与LVI 相关[3-5]。影像组学是目前研究热点,提供了基于医学图像的许多定量特征的信息[6-7]。目前较多研究采用单个参数与浸润性乳腺癌LVI 相关性研究,本研究利用临床资料、形态学特征、病理结果及影像组学标签等多参数变量建立影像组学模型,探讨MRI影像组学术前预测浸润性乳腺癌LVI 状态的价值。
1.1 研究对象 回顾性分析2013年1月—2019年12月皖南医学院弋矶山医院经手术病理证实的浸润性乳腺癌患者,根据术后病理结果分为LVI 浸润性乳腺癌50例和非LVI 浸润性乳腺癌90例,均为女性。纳入标准:①MRI 检查与手术间隔时间≤2 周;②均为肿块或结节型单病灶;③既往未进行放射治疗、内分泌治疗及化学药物治疗,无乳腺手术史。排除标准:①图像质量不佳影响观察与测量,MRI 检查前行穿刺检查;②临床资料不完整的患者。
1.2 仪器与方法 采用GE Signa HDxt 3.0T MR 扫描仪,8 通道乳腺专用相控阵线圈。患者取俯卧位,双侧乳腺自然悬垂于线圈内,扫描范围为腋窝至乳腺下缘。采用轴位和矢状面扫描;扫描参数:LAVA T1WI:TR 5.68 ms,TE 2.20 ms,TI 16 ms,层厚2.0 mm,层间距0 mm,视野(FOV)340 mm×340 mm,矩阵348×348;STIR T2WI:TR 11 000 ms,TI 240 ms,TE 60 ms,层厚4.0 mm,层间距0.4 mm,FOV 340 mm×340 mm,矩阵320×192。扩散加权成像(DWI):单次激发SE-EPI:b=800 s/mm2,TR 6600 ms,TE 60 ms,层厚4.0 mm,层间距0.4 mm,FOV 340 mm×349 mm,矩阵130×96。增强扫描采用双筒高压注射器静脉注射对比剂钆-二乙烯二胺五醋酸,注射流速2.5 ml/s,剂量0.1 mmol/kg,轴位平扫后注入对比剂后即行LAVA T1WI 扫描,参数同上。每期扫描60 s,扫描8 期,共480 s。
1.3 特征提取及影像组学标签的建立 将所有患者的STIR T2WI、DWI和DCE-MRI 图像从PACS 系统以DICOM 格式导入ITK-SNP 3.6.0 软件,由2名分别具有5年和10年工作经验的放射科医师参考DCE-MRI 图像(病灶强化最明显期相),分别沿所有病灶边缘所有层面手动勾画ROI、融合成3D-ROI(图1),然后转入AK 3.2.0 软件提取纹理特征(包括直方图特征、形态特征、灰度共生矩阵特征、游程矩阵特征及哈塔里克特征)。采用组内相关系数(ICC)评价2名医师提取特征的一致性,ICC>0.80为一致性较好,保留一致性较好的特征,采用7∶3将数据分为训练组和验证组,在训练组上运用mRMR 以及LASSO 回归对纹理特征进行降维、筛选出最佳特征子集,构建影像组学标签,再根据特征按照权重计算标签得分,并在验证组上进行验证。
图1 手动勾画ROI 及3D-ROI 融合。女,51岁,浸润性乳腺癌。A 为磁共振增强图像,用软件在病灶边缘勾画ROI;B 为磁共振增强图像中肿瘤所在层面的所有 ROI 融合成3D-ROI
1.4 病理检查 患者术前进行穿刺检查,行免疫组化分析获得雌激素受体(estrogen receptor,ER)、孕激素受体(progesterone receptor,PR)、增殖细胞核抗原-67(Ki-67)及人表皮生长因子受体-2(human epidermal growth factor receptor 2,HER2)信息,其中ER、PR、Ki-67 为阳性细胞所占百分比,用小数表示;HER2 分为阳性和阴性,判断标准:免疫组化结果“+++”判断阳性,若“++”则进一步应用原位杂交方法确定HER2 基因扩增状态。
1.5 统计学方法 采用SPSS 20.0 软件和R 3.5.2 软件(http://www.Rproject.org)。采用Kolmogorov-Smirnov检验进行正态性检验,符合正态分布的计量资料用±s表示,偏态分布的计量资料用中位数表示。计数资料比较采用χ2检验或Fisher 确切概率法,计量资料比较采用独立样本t检验(正态分布且方差齐)或Mann-WhitneyU检验(偏态分布或方差不齐)。采用多因素Logistic 回归分析构建预测模型并绘制影像组学诺曼图,绘制校正曲线评价模型的拟合优度,并用Hosmer-Lemeshow 检验评价校正曲线的一致性(P>0.05 表示拟合优度较好),绘制受试者工作特征(ROC)曲线评价模型的鉴别效能。P<0.05 为差异有统计学意义。
2.1 训练组和验证组的临床资料、形态学特征和病理结果 在训练组和验证组中,LVI 与非LVI 患者的年龄、乳腺密度、DWI 信号特征、强化程度、ER、PR、Ki-67、HER2 差异均无统计学意义,分叶征、ADC值和淋巴结状态差异均有统计学意义,训练组毛刺征有统计学意义(表1)。
表1 LVI和非LVI 患者在训练组和验证组中的临床资料、形态学特征和病理结果
2.2 影像组学特征提取的一致性 2名医师测量组间(ICC=0.825,95%CI0.641~0.912)及组内(ICC>0.80)特征提取的一致性均较好。
2.3 纹理特征提取及影像组学标签建立 AK 软件从STIR T2WI、DWI和DCE-MRI 每个序列图像均提取1044个纹理特征、3个序列联合提取3132个纹理特征,经mRMR 去除冗余特征,再经LASSO 回归筛选最优超参数λ(图2A)以及在此时λ 系数不为0 的特征(图2B),得到在STIR T2WI、DWI和DCE-MRI 图像中及联合序列价值较大特征分别为5、4、4、10个(表2),将各序列中各个特征所对应加权系数乘积进行线性组合得到每个患者的影像组学标签得分。对3个独立序列和联合序列的影像组学标签在训练组和验证组进行ROC 曲线分析,得到联合序列影像组学标签在训练组和验证组中诊断效能较好(训练组中AUC=0.81,95%CI0.72~0.90;验证组中AUC=0.71,95%CI0.54~0.88)(图3)。
表2 训练组中联合序列所有特征降维后得到诊断价值较大的特征及权重
图2 采用LASSO 进行特征筛选。A 为联合序列训练组中使用LASSO 方法对纹理特征进行降维,应用10 折交叉验证方法确定最优化Lambda 的值约为0.05(B 下方显示),左侧垂直虚线代表最佳Lambda值对应的Log(Lambda)值,选取标准为最小化标准,图片顶端数值为特征数;B为联合序列训练组中不同纹理特征在LASSO收敛系数图,虚线为使用十倍交叉运算的Lambda值绘制,每条曲线代表每一个自变量的变化轨迹,图中显示了10个非零系数的纹理特征
图3 联合序列、DWI、DCE-MRI 及STIR T2WI 4个影像组学标签在训练组(A)和验证组(B)的ROC 曲线
2.4 建立影像组学预测模型 将临床资料、形态学特征、病理结果及影像组学标签,结合采用多因素Logistic 回归建立影像组学预测模型,模型纳入的变量有毛刺、分叶征、ADC值、强化程度、HER2、淋巴结状态及影像组学标签,其中ADC值(OR=0.04,P=0.005)、分叶征(OR=16.2,P=0.001)与淋巴结状态(OR=4.0,P=0.001)为独立预测因子。影像组学预测模型在训练组和验证组中的AUC值分别为0.93、0.91,优于影像组学标签的诊断效能(表3)。因此,对影像组学模型绘制诺曼图(图4),训练组和验证组的校正曲线均显示了良好的校正性能(图5),Hosmer-Lemeshow 检验该模型的拟合优度,得到一个不显著的统计学结果(训练组:χ2=10.03,P=0.26,验证组:χ2=5.46,P=0.71),表明模型未偏离完美的拟合。
表3 联合序列影像组学标签和影像组学模型诊断效能
图4 影像组学预测模型中的7个变量组成的诺曼图。每个变量对应在影像组学预测模型中的得分,每个变量的得分相加得到总分,总分越高代表患者存在LVI的可能性越大
图5 影像组学诺曼图在训练组(A)和验证组(B)的校正曲线
为术前评价浸润性乳腺癌LVI 状态,本研究纳入与乳腺癌LVI 状态密切相关的影响因素建立了影像组学标签及影像组学预测模型,结果显示影像组学模型预测浸润性乳腺癌LVI的诊断效能优于联合序列影像组学标签的诊断效能。影像组学标签仅反映肿瘤本身异质性,纳入评价因素较少,而浸润性乳腺癌LVI 状态受多种复杂因素影响,机制复杂,临床特征、组织病理、肿瘤周围、分子生物学及与肿瘤生物学过程相关的周围微环境等均影响其LVI 状态,纳入临床、形态学特征、病理及组学标签的影像组学模型诊断效能明显提高,与Ouyang 等[8]的研究结果相似,优于Liu 等[9]的研究结果。本研究构建预测浸润性乳腺癌LVI 状态的诺曼图建立了简单易行的术前评价方法,医师可以在术前通过简单评分进行个体化的评价LVI 状态的可能性。
既往研究表明LVI 与患者年龄、体重、肿瘤大小、腋窝淋巴结转移、肿瘤的组织学分级有关[10-11],Ouyang 等[8]研究显示LVI 与乳腺密度、肿瘤部位、大小、边缘、分叶征、DWI 表现、强化模式、TIC 模式、淋巴结转移、病理类型有关。本研究模型由毛刺、分叶征、ADC值、强化程度、HER2、淋巴结状态及影像组学标签组成。毛刺、分叶征是恶性肿瘤的典型征象,乳腺癌的毛刺、分叶征是肿瘤细胞浸润生长突入邻近正常乳腺组织所致;ADC值大小与细胞内外空间比例及细胞形态有关,细胞密度、细胞外空间迂曲度及黏附度增加等因素也可影响细胞内外空间中水扩散的改变,乳腺癌LVI的肿瘤细胞密度增加,水分子扩散运动受限、ADC值降低,而ADC 可以反映肿瘤内部信息[12]。DCE-MRI 能够反映组织或病灶微血管生成和血流灌注情况,乳腺癌LVI 存在时肿瘤恶性程度相对较高,肿瘤对周围组织的侵犯较明显,肿瘤新生毛细血管逐渐增多、功能不成熟。Kustic 等[13]研究表明,HER2是乳腺癌不良预后因素之一,HER2 高表达时,表现为侵袭力强,细胞增殖旺盛,提示乳腺癌的浸润和转移,本研究表明HER2 状态与浸润性乳腺癌LVI 存在密切相关。乳腺癌细胞LVI 是淋巴结转移途径,Zhu 等[14]研究表明LVI的存在与局部淋巴结受累密切相关,与本研究结果一致。
常规乳腺MRI 扫描包括STIR T2WI、DWI和DCE-MRI 序列,从形态及功能反映肿瘤的形态特征及功能状态,临床工作中常是多序列综合判断肿瘤的特征。目前研究仅在单个序列的少量纹理特征[15],如直方图等纹理特征,本研究更深入地挖掘 STIR T2WI、DWI和DCE-MRI 及联合序列定量客观反映肿瘤异质性的纹理特征建立影像组学模型的价值。为了获得最优模型,从STIR T2WI、DWI和DCE-MRI及联合序列提取价值较大的纹理特征建立影像组学标签,通过对比3个序列及联合序列的影像组学标签在训练组和验证组中的AUC值,得出联合序列建立的影像组学标签在训练组和验证组的诊断效能较好,从形态学、肿瘤内部扩散特征及微血管生成和血流灌注情况不同角度反映肿瘤异质性。
本研究的局限性:①本研究为回顾性研究,可能存在选择偏倚;②未进行多中心的外部验证;③手动勾画受个人主观因素影响,且图像STIR T2WI 与DWI及DCE-MRI 很难完全匹配。
总之,基于临床资料、形态学特征、病理结果及纹理特征建立的影像组学模型对术前预测浸润性乳腺癌脉管浸润具有较高的价值。