1、临床研究1294浙江临床医学2023年9月第25卷第9期肺结节超高分辨率CT靶扫描影像组学联合机器学习在原位腺癌与微浸润腺癌鉴别中的价值胡栩晟 郭艺帆 李鲁 陈晓珺*【摘要】目的 基于肺结节超高分辨率CT(UHRCT)靶扫描影像组学特征,分别采用Logistic回归(LR)和支持向量机(SVM)构建机器学习模型,以鉴别磨玻璃结节(GGN)中的原位腺癌(AIS)和微浸润腺癌(MIA)。方法 回顾性分析手术病理证实肺腺癌的198例患者(AIS56例;MIA142例),按分层抽样将患者随机分为训练组(n=138)和验证组(n=60)。手动分割GGN,从中提取影像组学特征。采用最小冗余最大相关性算法和
2、套索算法对影像组学特征进行降维,分别使用LR和SVM构建预测模型。采用受试者操作特征(ROC)曲线评价模型的预测性能。结果 在训练组中,LR和SVM曲线下面积(AUC)分别为0.787(95%CI:0.7120.863)和0.896(95%CI:0.8420.951)。在验证组中,LR和SVM的AUC分别为0.824(95%CI:0.7130.936)和0.839(95%CI:0.7340.945)。结论 基于肺结节UHRCT靶扫描影像组学结合机器学习能较好鉴别AIS与MIA,为患者GGN个性化分析提供潜在方法。【关键词】肺结节 影像组学 超高分辨率CT 靶扫描【Abstract】Object
3、ive Todiscriminatebetweenadenocarcinomainsitu(AIS)andminimallyinvasiveadenocarcinoma(MIA)withinground-glassnodules(GGN),machinelearningmodelswereconstructedusinglogisticregression(LR)andsupportvectormachine(SVM)basedonradiomicsfeaturesextractedfromultra-high-resolutionCT(UHRCT)targetscanimages.Metho
4、ds 198patientswithsurgicallyandpathologicallyconfirmedlungadenocarcinomawereretrospectivelyincluded(AIS56cases;MIA142cases),patientswererandomlydividedintoatraininggroup(n=138)andavalidationgroup(n=60)accordingtostratifiedsampling.ManuallysegmentedtheGGNandextractedtheradiomicsfeaturesfromit.Themini
5、mumredundancyandmaximumrelevancealgorithmandtheLassoalgorithmwereusedtoreducethedimensionalityoftheradiomicsfeatures,andthepredictionmodelwasconstructedusingLRandSVMrespectively.Thepredictiveperformanceofthemodelwasevaluatedbyreceiveroperatingcharacteristic(ROC)curve.Results Inthetraininggroup,thear
6、eaunderthecurve(AUC)ofLRandSVMwere0.787(95%CI:0.7120.863)and0.896(95%CI:0.8420.951),respectively.Inthevalidationgroup,theAUCofLRandSVMwere0.824(95%CI:0.7130.936)and0.839(95%CI:0.7340.945),respectively.Conclusion UHRCTtargetscanofpulmonarynodules-basedradiomicscombinedwithmachinelearningcanidentifyAI
7、SandMIAwell,providingapotentialmethodforGGNpersonalizedanalysisinpatient.【Key word】Pulmonarynodule Radiomics UltrahighresolutionCT Targetscan2021 年 WHO 对肺腺癌进行重新分类,取消了2015 年浸润前病变和浸润性病变的概念,将不典型腺瘤增生(atypicaladenomahyperplasia,AAH)、原位腺癌(adenocarcinomainsitu,AIS)归类为腺体前驱病变,腺癌则包括微浸润腺癌(minimallyinvasiveaden
8、ocarcinoma,MIA)和侵袭性腺癌(invasiveadenocarcinoma,IAC)1。MIA 病理表现为肿瘤组织穿透基底膜,浸润纤维间质,肿瘤细胞分层表现2-4,应归为肺腺癌。临床实践中,通过肺结节超高分辨率CT(ultrahighresolutioncomputedtomography,UHRCT)靶扫描能够细致观察磨玻璃结节(ground-glassnodule,GGN)结节外观形态特征,进而诊断肺结节良恶性。该检查技术具有小视野、多矩阵、小间距等特点5,但目前在独立鉴别 AIS 和 MIA 中的价值有限6。影像组学可定量分析并提取医学图像中肉眼无法识别的潜在定量特征,通过
9、机器学习方法构建相关预测模型以达到疾病诊断、疗效或预后预测等目的7。在本研究基于肺结节 UHRCT 靶扫描,从 GGN中提取影像组学特征,构建 Logistic 回归(LR)和支持向量机(SVM)模型用于鉴别 AIS 和 MIA。1 资料与方法1.1 临床资料 回顾性分析 2018 年 112 月 198 例经手术治疗并病理证实为 AIS 或 MIA 的 GGN 患者。纳入标准:胸部 CT 发现孤立性 GGN(包括纯 GGN 和部分实性结节),并接受肺结节 UHRCT 靶扫描;术前无化疗、放疗或远处转移;无其他恶性肿瘤病史;肺结节 UHRCT 靶扫描 DICOM 格式数据完整。排除标准:同一肺
10、叶存在多个 GGN;GGN 伴有空洞或实性结节;CT 检查前行肺恶性肿瘤活检;肺结节UHRCT 靶扫描图像中存在呼吸运动伪影。根据分层抽样,以 7 3 将所有患者划分为训练组和验证组。1.2 图像采集 应用飞利浦 Brilliance64CT 机进行肺结节 UHRCT 靶扫描成像。患者取仰卧位,扫描时保持深吸气。扫描参数如下:探测器准直 0.625mm6mm;螺距 0.64;管电压 120kV;管电流 300mA;重建层厚、层间距均为0.67mm;FOV250mm;矩阵=1,0241,024;重构卷积函数为 A。基金项目:金华市科技重点项目(2021-3-041)作者单位:310003 浙江省
11、中医院(胡栩晟 郭艺帆)321099 浙江省金华市中心医院(李鲁 陈晓珺)*通信作者1295浙江临床医学2023年9月第25卷第9期1.3 GGN 标注 GGN 感兴趣区域(ROI)分割在 ITK-SNAP3.6.0(www.itksnap.org)上完成。在轴位图像上,沿着 GGN 的轮廓进行手动描绘(见图 1),最终获得整个 GGN的 3D-ROI。由 1 名具有 5 年胸部 CT 诊断经验的放射科医师经培训后完成所有 GGN 的 ROI 标注。在1 个月后,由上述医师和另一名具有 10 年胸部 CT 诊断经验的放射科医师再次对所有患者进行标注,用于评估观察者内和观察者间的一致性。若影像组
12、学特征的组内和组间相关系数(ICC)均 0.75 则认为具有较好的可信度。注:A.图像放大并显示边缘,B.进行逐层勾画图1 肺结节勾画示意图1.4 影像组学特征提取 将 GGN 的 CT 图像和相应标注导入 AK 软件(AnalysisKit,GEHealthcare,US)进行特征提取,可分为以下几大类:一阶特征,形状特征,灰度共生矩降,灰度尺寸区域矩阵,灰度游程度矩阵,邻域灰度差矩阵,灰度相关矩阵。见 PyRadiomics文档(http:/pyradiomics.readthedocs.io)。1.5 特征选择和模型构建 筛选出组内和组间 ICC 均0.75 的影像组学特征。采用最小冗余
13、度和最大相关性(mRMR)算法对这些特征进行排序,获取相关度最高的前 20 个特征。采用套索(LASSO)算法进一步筛选剩余影像组学特征。采用LR和SVM从中选择与分类结果最相关的特征并计算相应的系数,构建用以鉴别 AIS和 MIA 的机器学习模型。1.6 统计学分析 采用 R 软件(版本 3.5.0)。计量资料以(xs)表示,用 Mann-WhitneyU 检验,计数资料以 n(%)表示,用 2检验。对机器学习模型进行受试者操作特征(ROC)分析,并计算曲线下面积(AUC)。基于 Youden 指数计算模型的准确性、敏感性、特异性、阳性预测值(PPV)和阴性预测值(NPV)。P0.75 的影
14、像组学特征有 295,在此基础上组间ICC0.75 的特征有 204 个。经 mRMR 和 LASSO 进行特征降维后,分别用采 LR 和 SVM 从中选出与分类对象最相关的特征集以构建模型。筛选用于构建模型的影像组学特征列见图 2。图2 Logistic回归(A)和支持向量机(B)构建影像组学模型的特征及相应系数2.3 机器学习模型的鉴别能力分析 在训练组中,LR模型的 AUC 为 0.787(95%CI:0.7120.863),SVM 模型的 AUC 为 0.896(95%CI:0.8420.951);在验证组中,LR 模型的 AUC 为 0.824(95%CI:0.7130.936),S
15、VM 模型的 AUC 为 0.839(95%CI:0.7340.945)。见表 2、图 3。表2 训练组和验证组机器学习模型的鉴别能力AUC95%CI敏感性特异性准确性PPVNPV训练组LR 模型0.7870.7120.8630.8750.6300.7000.4860.926SVM 模型0.8960.8420.9510.9750.7400.8070.6000.987验证组LR 模型0.8240.7130.9360.7500.7860.7760.5710.892SVM 模型0.8390.7340.9450.8750.7620.7930.5830.941图3 训练组(A)和验证组(B)中LR和SV
16、M模型的ROC曲线3 讨论在早期肺腺癌研究领域中,较多研究者聚焦于区分 IAC、AIS 和 MIA,部分研究将 AIS 和 MIA 归为一类8。事实上,区分 AIS 与 MIA 在临床上具有重要意义。AIS 尚不具有侵袭性,规律的定期随访不会降低患者的生存率。一项前瞻性观察研究发现,纯玻璃结节或混合磨玻璃结节的 A 期肺癌的生存率明显高于实性结节,且不管磨玻璃结节中实性成分的比例,其 5 年生存率较高9。故此类患者可避免手术带来的潜在伤害。MIA 则已穿透基底膜,浸润纤维间质,需要手术治疗1296浙江临床医学2023年9月第25卷第9期避免进一步发展为 IAC。本研究基于肺结节 UHRCT 靶
17、扫描,影像组学结合两种常用的机器学习方法(LR 和SVM)鉴别 AIS 和 MIA。将精密扫描技术与高通量定量特征相结合,有助于早期肿瘤侵袭性的识别、AIS 与MIA 的鉴别,辅助临床医师制定个体化临床决策。既往研究大多集中在 GGN 的形态学上进行定性分析,如肿瘤直径、分叶征、毛刺征、空泡征、血管集束征、胸膜凹陷征、空洞征等10-12。然而,不同分化程度的肿瘤在形态学上常表现为征象重叠,不具备较高的特异性。影像组学是一种可以客观挖掘复杂生物信息学的潜在工具,可改善诊断、疗效和预后的准确性,从而促进更好临床决策。目前,影像组学常用于鉴别肺结节的浸润程度,而不根据肺腺癌的病理学分类进行分组13-
18、14。另外,基于病理学分类的影像组学研究又大多是基于常规胸部 CT 检查。WU 等15收集 121 例病理证实的肺腺癌 GGN,分析在 HRCT 图像上从结节内和结节周围提取的影像组学特征是否能够有效鉴别IA、MIA 和 AIS。在基于胸部 CT 影像组学特征的 LR 和 SVM 模型中,本研究发现某些特征在鉴别 AIS 和 MIA 的能力方面表现出色。可以明显观察到纹理特征如ClusterProminence、GLCMEntropy和GLCMEnergy在两种模型中均被赋予重要性,提示这些特征可能对揭示 AIS与 MIA 之间微小差异具有关键意义。此外,像素强度特征(如 Range 和 Ma
19、xIntensity)以及图像结构性特征(如 SurfaceVolumeRatio、VolumeMM 和 SurfaceArea)也被证明对区分 AIS 与 MIA 过程至关重要。这些发现突显了纹理、像素强度和图像结构特征在区分 AIS 与 MIA时的重要性,且这些影像组学特征可能为提供关于 AIS和 MIA 之间微观差异以及宏观差异的信息,深入探究这些特征所代表的病理生理学意义有助于准确诊断。由于 UHRCT 采用的矩阵为 10241024,故其图像分辨率较高,单位面积有效像素是普通 CT 的 4 倍左右16。此外,目标扫描采用小视场、高矩阵、小间距技术,显著提高图像的空间分辨率,有助于显示
20、肺小结节更多的影像特征。因此,相比常规 CT,UHRCT 单个体素内包含的组织病理学信息更细致化,或有助于提高影像组学模型的预测性能。本研究结果提示基于肺结节UHRCT 靶扫描的两种机器学习模型均能较好鉴别 AIS和 MIA 这两种相近病理亚型。综上,基于肺结节 UHRCT 靶扫描,从 GGN 中提取影像组学特征构建LR和SVM模型能较好鉴别AIS和MIA,为 GGN 的临床决策提供一种潜在的无创性方法。参考文献1 侯立坤,张莉萍,黄焰,等.2021版WHO胸部肿瘤分类浸润性肺腺癌新分级的应用及与靶向基因变异分布特征的相关性J.中华病理学杂志,2023,52(2):129-135.2 BASH
21、IRU,KAWAB,SIDDIQUEM,etal.Non-invasiveclassificationofnon-smallcelllungcancer:AcomparisonbetweenrandomforestmodelsutilisingradiomicandsemanticfeaturesJ.BrJRadiol,2019,92(1099):20190159.3 LIUSL,WANGR,ZHANGY,etal.Precisediagnosisofintraoperativefrozensectionisaneffectivemethodtoguideresectionstrategyfo
22、rperipheralsmall-sizedlungadenocarcinomaJ.JClinOncol,2016,34(4):307-313.4 王亮,孔令淳,王泽学.肺腺癌CT影像组学特征与病理结果对照研究J.中国CT和MRI杂志,2022,20(9):109-111.5 赵锦桥.高分辨率CT靶扫描技术对肺磨玻璃密度结节的诊断价值分析J.中西医结合心血管病电子杂志,2019,7(33):89.6 RAGERO,NKOULOUR,EXQUISN,etal.Whole-bodySPECT/CTversusplanarbonescanwithtargetedSPECT/CTformetastat
23、icworkupJ.BiomedResInt,2017,2017:7039406.7 范丽,方梦捷,董迪,等.影像组学对磨玻璃结节型肺腺癌病理亚型的预测效能J.中华放射学杂志,2017,51(12):912-917.8 HANL,ZHANGP,WANGY,etal.CTquantitativeparameterstopredicttheinvasivenessoflungpureground-glassnodules(pGGNs)J.ClinRadiol,2018,73(5):504.e1-504504.e7.9 HATTORIA,SUZUKIK,TAKAMOCHIK,etal.Prognos
24、ticimpactofaground-glassopacitycomponentinclinicalstageIAnon-smallcelllungcancerJ.JThoracCardiovascSurg,2021,161(4):1469-1480.10 LIULH,LIUM,WEIR,etal.CTfindingsofpersistentpuregroundglassopacity:Canwepredicttheinvasiveness?J.AsianPacJCancerPrev,2015,16(5):1925-1928.11 JINX,ZHAOSH,GAOJ,etal.CTcharact
25、eristicsandpathologicalimplicationsofearlystage(T1N0M0)lungadenocarcinomawithpureground-glassopacityJ.EurRadiol,2015,25(9):2532-2540.12 ICHINOSEJ,KOHNOT,FUJIMORIS,etal.Invasivenessandmalignantpotentialofpulmonarylesionspresentingaspureground-glassopacitiesJ.AnnThoracCardiovascSurg,2014,20(5):347-352
26、.13 SUNYL,LIC,JINL,etal.Radiomicsforlungadenocarcinomamanifestingaspureground-glassnodules:InvasivepredictionJ.EurRadiol,2020,30(7):3650-3659.14 CHOHH,LEEG,LEEHY,etal.MarginalradiomicsfeaturesasimagingbiomarkersforpathologicalinvasioninlungadenocarcinomaJ.EurRadiol,2020,30(5):2984-2994.15 WULY,GAOC,
27、XIANGP,etal.CT-imagingbasedanalysisofinvasivelungadenocarcinomapresentingasgroundglassnodulesusingperi-andintra-nodularradiomicfeaturesJ.FrontOncol,2020,10:838.16 BRABANTL,DIERICKM,PAUWELSE,etal.EDART,adiscretealgebraicreconstructingtechniqueforexperimentaldataobtainedwithhighresolutioncomputedtomographyJ.JXraySciTechnol,2014,22(1):47-61.