1、Chinese Journal of Biomedical Engineering2023年10 月2023October中医生国No.5Vol.42报程物学学42卷5 期基于MRI与优化3D-ResNet18的鼻咽癌复发预测模型李焖逸李李彬*邱前辉2刘遗斌2田联房1(华南理工大学自动化科学与工程学院,广州510 6 40)2(南方医科大学附属广东省人民医院(广东省医学科学院)耳鼻咽喉科,广州510080)摘要:鼻咽癌的治疗后复发是导致治疗失败的重要原因,同时也对患者的生活质量、治愈率甚至生存率产生严重的不利影响。因此,实现鼻咽癌复发情况的有效预测对患者的预后具有积极作用。磁共振成像(MRI)
2、具有软组织高分辩率功能,是鼻咽癌的首选检查手段。鼻咽癌在MRI中的影像表现存在较大差异,病变组织灰度不均匀且界限模糊,基于MRI的鼻咽癌病灶手工标注的难度大、成本高、准确性存在局限;而自动分割准确率也欠佳,导致依靠鼻咽癌病灶精确分割的浅层影像特征提取和计算精度较低,以致基于影像组学特征工程和传统机器学习方法的鼻咽癌复发预测模型性能不佳。对此,本研究提出一种基于MRI和Nesterov加速梯度优化3D-ResNel18的鼻咽癌复发预测模型。通过距离正则化水平集和均衡化增强的鼻咽癌MRI病灶自动检测,自动获取去允余的增强影像数据,基于Nesterov加速梯度算法优化的改进3D-ResNet18网络
3、模型,提取鼻咽癌深度特征并实现复发预测,为病人的治疗方案提供指导。研究在140 例鼻咽癌患者的MRI影像上展开并完成模型训练与交叉验证分析。改进模型的敏感性、特异性和准确率分别为8 0.0%、6 4.6%和7 2.3%,AUC值为0.7 5,同条件下分别对比3D-ResNet10模型和Momentum优化方法的配对t检验P值分别为0.0 40 和0.0 0 6,所改进模型具有显著优势。基于MRI和优化3D-ResNet18的鼻咽癌复发预测模型可实现鼻咽癌复发的有效预测关键词:鼻咽癌;复发预测模型;残差神经网络;网络优化中图分类号:R318文献标志码:A文章编号:0 2 58-8 0 2 1(2
4、 0 2 3)0 5-0 58 3-11Predictive Model for Nasopharyngeal Carcinoma Recurrence with MRI andOptimized 3D-ResNet18Li JiongyiLi Bin*Qiu Qianhui?Liu Yibin?Tian Lianfang(School of Automation Science and Engineering,South China University of Technology,Guangzhou 510640,China)2(Department of Otolaryngology&H
5、ead and Nech Surgery,Guangdong Provincial Peoples Hospital(Guangdong Academy of Medical Sciences),SouthernMedical University,Guangzhou510080,China)Abstract:Recurrence of nasopharyngeal carcinoma(NPC)after treatment is an important factor of treatmentfailure,which is extremely harmful to the quality
6、of life,cure rate and even survival rate of patients with NPC.Therefore,effective prediction of nasopharyngeal carcinoma recurrence plays crucial roles in the prognosis ofNPC.Magnetic resonance imaging(MRI)has high resolution of soft tissue,which is a preferred inspectionmethod of NPC.Each imaging o
7、f NPC in MRI is quite different,and the gray level of lesion tissue is unevenand the boundaries are blurred,which cause the fact that manual segmentation is difficult,costly,and haslimited accuracy,while automatic segmentation of NPC lesions in MRI has low accuracy rate.As a result,low-level image f
8、eature extraction and computation based on NPC lesion segmentation has low accuracy rate as well.Performance of NPC recurrence prediction model with radiomics feature engineering and traditional machinelearning methods is poor.To solve this problem,a nasopharyngeal carcinoma recurrence prediction mo
9、del wasproposed with MRI and Nesterov accelerating gradient optimized 3D-ResNet18.Through the automatic detectiondoi:10.3969/j.issn.0258-8021.2023.05.008doi:10.3969/j.issn.0258-8021.2023.05.008收稿日期:2 0 2 2-0 7-0 8,录用日期:2 0 2 3-0 6-19基金项目:国家自然科学基金(6 2 2 7 3155);2 0 2 1年广东省科技专项资金(大专项+任务清单)(2 10 7 1914
10、58 6 37 37)*通信作者(Corresponding author),E-ma i l:b i n l e e s c u t.e d u.c n;q i u q i a n h u i g d p h.o r g.c n584中42.卷生医国程报学学物of NPC lesion by distance regularized level-set evolution and histogram equalization in MRI,the enhancedimaging data without redundancy was automatically obtained.The im
11、proved 3D-ResNet18 network modeloptimized by Nesterov accelerated gradient algorithm was used to extract the deep features of NPC and achieverecurrence prediction,providing guidance on the patients treatment plans.The research was conducted on MRIimages of 140 patients with NPC to complete the model
12、 training and cross-validation analysis.Recurrence ofNPC was predicted with sensitivity,specificity,accuracy,and AUC of 80.0%,64.6%,72.3%and 0.75respectively.The p values of paired t-test comparing 3D-ResNetlO model and Momentum optimization methodunder the same conditions were 0.040 and 0.006 respe
13、ctively.The results showed that the predictive model ofnasopharyngeal carcinoma recurrence with improved 3D-ResNetl8 can effectively predict the nasopharyngealcarcinoma recurrence.Key words:nasopharyngeal carcinoma;recurrence prediction model;ResNet;network optimization引言鼻咽癌是一种耳鼻咽喉科的常见恶性肿瘤疾病,常发于鼻咽顶部
14、和咽隐窝。根据国际癌症研究机构(International Agency for Research on Cancer,IARC)的统计结果,2 0 2 0 年全球鼻咽癌新增患者133354例,新增患者数量在36 个癌症种类中排在第2 4位,为中国华南地区的高发病率肿瘤。鼻咽癌的发病除了地域因素影响外,还与遗传因素2 EB(Ep s t e i n-Ba r r v i r u s)病毒感染、饮食和吸烟习惯有关门鼻咽癌患者经过治疗后的生存率相对可观,患者的5年生存率可达到8 0%以上,8 年生存率可达68.5%4。然而,在经历完整治疗后,仍有10%20%的鼻咽癌患者会出现复发51。研究表明,鼻
15、咽癌局部无复发5年生存率比鼻咽癌5年总生存率高7.4%6,因此,鼻咽癌复发是造成鼻咽癌治疗失败至关重要的原因。对于大多数出现复发的患者,未能及时检查并予以治疗和提前干预,将造成病情的加重,威胁患者生存。所以,有效的鼻咽癌复发预测方法可以进一步提高患者的生存率和生活质量。鼻咽癌复发预测本质上是特征分类问题,基于特征工程的机器学习模型方法是研究该问题的常用方法。来自加拿大的研究团队从鼻咽癌患者的MRI影像中提取出42 个纹理特征,利用Logistic回归实现了对鼻咽癌患者放化疗后复发与转移的预测7);南方医科大学的研究团队同样提出一种基于支持向量机的鼻咽癌复发及转移的预测模型,从8 5名III-I
16、Vb期鼻咽癌患者的PET/CT影像提取并筛选2 0 个影像组学特征和临床特征,通过支持向量机(s u p p o r t v e c t o r ma c h i n e,SVM)实现局部复发和远处转移的预测8 ;在医学影像技术还未成熟的更早以前,泰国玛希隆大学的学者收集了198 2 年至2 0 0 7年确诊的鼻咽癌患者的临床信息,分别训练多层感知机与不同的模糊推理模型并得到有效的预测性能9;国内也有相关研究通过鼻咽癌MRI影像细致分割的肿瘤特征预测放化疗后疾病稳定或疾病进展10 。除了以复发预测为目标的研究外,也有学者研究与鼻咽癌复发相关的重要影像特征,为相关研究的开展提供支撑2。诚然,基于
17、MRI影像组学特征工程和传统机器学习的鼻咽癌复发预测模型测试结果并不差,但是常见的鼻咽癌在MRI中的影像表现差异性较大,并且病变组织往往会出现灰度不均匀和组织界限模糊的情况。随着研究病例数的增加,鼻咽癌MRI病灶精确分割的难度与成本有所提高,其分割准确性的不足也会对复发预测结果产生不利的影响比起对人工特征提取依赖性较高的传统机器学习方法,深度学习具有自动特征提取的优势,在MRI影像病灶特征提取时不需要高精度的病灶细致分割处理。而在各类医学影像与临床研究中,深度学习也凭借其优异的特征分类能力得到了广泛的应用。深度神经网络(deepneuralnetwork,D NN)被应用于病人肺部CT的良恶性
18、分类13;深度胶囊网络CapsNet被用于肝癌的MRI影像预后评估中,实现病人肝移植治疗后的肝癌复发预测14;卷积神经网络(convolutional neural networks,CNN)模型也被用于脑部影像诊断中高低级别脑胶质瘤的分类与阿兹海默症的识别中1516 ;深度学习方法在其他常见癌症如乳腺癌和前列腺癌的复发诊断与预测中也得到有效的应用(17 18除了上述研究采用的神经网络模型,在目前深度学习领域性能表现较好的网络模型中,残差网络(r e s i d u a l n e t w o r k,Re s Ne t)具有突出的特征分类能5855期李炯逸,等:基于MRI与优化3D-ResN
19、et18的鼻咽癌复发预测模型力和泛化能力,基于残差网络的改进模型被应用于实现各种特征分类任务中。ResNet模型可以辅助实现神经胶质瘤的分类,减少不必要的活检伤害(19;在识别行人口罩问题中ResNet也被应用于关键特征的提取环节2 0 。残差网络虽然在众多模型中性能优异,但是一般梯度下降法在反向传播过程中的参数更新,往往难以克服在平坦区域上无法收敛或收敛困难的问题。因此,有效的网络优化对网络模型的收敛效率和性能具有重要意义。尽管鼻咽癌肿瘤的主观特征和影像组学特征可以从经过肿瘤分割的患者MRI影像中获得,但是鼻咽癌MRI影像的人工病灶精确手工标注和自动分割难度大且准确率不高。研究表明,经过专业
20、的鼻咽癌肿瘤分割的区域匹配准确性大约为8 0%85%21,依赖影像特征工程和传统机器学习方法的鼻咽癌复发预测模型存在一定的性能缺陷。对此,本研究以鼻咽癌患者治疗前MRI影像作为研究对象,提出一种基于MRI和Nesterov加速梯度优化3D-ResNet18的鼻咽癌复发预测模型,基于Nesterov加速梯度优化的ResNet网络可以有效提高模型的训练收敛效率。首先对鼻咽癌患者MRI影像进行自动区域裁剪与图像增强,实现3D鼻咽癌感兴趣区域(regionof interest,RO I)的自动检测,得到的预处理数据通过网络训练,自动学习与提取鼻咽癌复发深度特征并完成特征分类,构建有效的鼻咽癌复发预测
21、模型。模型在特征提取过程中不需要对肿瘤进行细致复杂的病灶分割。1材料和方法1.1基于MRI与优化3D-ResNet18的鼻咽癌复发智能预测模型基于MRI与优化3D-ResNet18的鼻咽癌复发智能预测模型如图1所示。首先采用基于距离正则化水平集的自动裁剪方法实现鼻咽癌ROI轮廓的自动分割与外接ROI区域的计算,并对经过裁剪的ROI区域影像进行重采样,得到规格40 40 7 的三维影像数据;再运用基于直方图均衡化的图像增强方法提高影像特征表现能力,实现3D鼻咽癌MRI影像ROI的自动检测。经过预处理的3D影像数据作为基于PReLu的3D-ResNet18网络模型输人进行训练,神经网络模型通过前向
22、传播过程得到的输出结果,计算与输出期望之间的误差损失,再由反向传播算法逐层更新网络参数。前向传播过程基于3D-ResNet网络模型实现,通过卷积运算、残差连接鼻咽癌病例确诊MRI影像选取与标签分类基于距离正则化水平集自动分割和均衡化增强的鼻咽癌ROI自动检测方法基于距离正则化水平集的3D鼻咽癌ROI的自动裁剪算法基于直方图均衡化的图像增强基于加速梯度优化网络的鼻咽癌基于PReLu的3D-ResNet18网络模型特征分类模型基于Nesterov加速梯度的网络优化算法鼻咽癌复发预测图1鼻咽癌复发预测模型Fig.1NPC recurrence prediction model与全连接层提取与分类鼻咽
23、癌复发相关特征,利用Nesterov加速梯度优化实现模型参数的学习与优化,得到有效的鼻咽癌复发预测模型1.2基于距离正则化水平集自动分割和均衡化增强的鼻咽癌富ROI自动检测方法在鼻咽癌的临床诊断与患者预后中,MRI提供了高效的肿瘤成像辅助手段,但是完整的影像包含了其他非相关的组织或器官,为学习模型引入不必要的干扰信息,且鼻咽癌肿瘤发展位置也不固定,所以,鼻咽癌ROI的获取是重要的预处理过程,对后续的深度特征提取与分类结果也具有重要影响。基于常用的影像特征提取的鼻咽癌相关研究需要肿瘤细致分割的方法获取鼻咽癌影像ROI,然而基于MRI的鼻咽癌病灶手工标注的难度大、成本高、准确性存在局限,而自动分割
24、准确率也偏低。为此,本课题研究了一种基于距离正则化水平集自动分割和均衡化增强的鼻咽癌ROI自动检测方法,对经过自动初步选定轮廓的患者T1加权冠状面序列成像进行基于距离正则化水平集的3D鼻咽癌ROI自动区域裁剪,并运用基于直方图均衡化的图像增强进一步优化鼻咽癌复发感兴趣区域的表示能力。1.2.1基于距离正则化水平集的3D鼻咽癌ROI的自动裁剪算法为了实现包含完整肿瘤信息的鼻咽癌ROI区域自动裁剪,并解决传统水平集方法重复初始化带来的低效率和对初始曲线的过度依赖性问题22-24586中生医国42卷报学程学物本课题研究了一种基于距离正则化水平集(distanceregularized level s
25、etevolution,D RLSE)的3D鼻咽癌ROI的自动裁剪算法。该算法对经过初选区域轮廓的患者T1加权冠状面序列成像进行距离正则化水平集分割处理,利用外接矩体信息得到包含较完整肿瘤信息的3D鼻咽癌ROI区域。这种自动区域裁剪方法无需完成肿瘤的细致分割,有效提高了影像数据的预处理效率。该算法依赖鼻咽癌的解剖结构信息与空间相关性,自动选定鼻咽部大范围的3D初始区域轮廓,在此基础上,运用基于轮廓边界的距离正则化水平集分割方法,通过变分迭代计算对区域边界以法线方向进行迭代更新,得到随时间变化的封闭边界C(t)曲线。方法定义与图像坐标相关的水平集函数(x,y,t),更新区域边界内外具有互为正负的
26、函数值,且边界函数值(C(t),t)恒为零值,得到如式(1)所示关系与如式(2)所示曲线的演化过程。=0(1)atat=F.N(2)at式中,F为法线方向更新速度函数,N为边界单位法线向量,且有N=-/I,于是水平集演化过程如式(3)所示y=FIVI(3)x距离正则化水平集演化方法在水平集方法基础上进行了适当的改进,距离正则化水平集加人了能量函数以约束标准初始化方程,能量函数E()计算方程如式(4)所示E()=R()+Exr()(4)式中,R()指水平集函数的正则项,如式(5)所示,u是大于O的常数,E()为外部能量函数。R():=p(I V1)dx(5)式中,p为R()的能量密度函数,令s=
27、ll,为了使得能量密度函数p(s)具有两个极小值点s=0与s=1,定义p(s)的表达式如式(6)所示11-cos(2Ts)0s1(2 元)(6)S2引人能量函数后的距离正则化水平集演化过程如式(7)所示Eex()div(7)atd距离正则化水平集演化过程使原先确定的初始边界通过迭代,不断逼近图像的局部轮廓。本研究的基于距离正则化水平集的3D鼻咽癌ROI的自动裁剪算法的流程中,输人为鼻咽癌MRI的T1冠状面影像;输出为鼻咽癌ROI三维图像,包括4个步骤。步骤1:基于鼻咽癌的解剖结构信息与空间相关性自动选定大范围初选3D矩体轮廓Cimial;步骤2:距离正则化水平集的30 次迭代提取3D鼻咽癌RO
28、I轮廓Cresul=/(x,y)/(x,y)=0)(8)C步骤3:确定ROI轮廓的外接矩体为自动检测的ROI区域;步骤4:对ROI进行重采样:n-1n-1I(x,y)=ZZI(i.j)*W(i.i)(9)=0i=01.2.2基于直方图均衡化的图像增强影像数据的动态范围影响着其对于图像特征的表达,而鼻咽癌MRI中的局部曝光度过低的问题不利于模型训练过程的特征提取。为了增强鼻咽癌ROI影像的动态范围,采用基于直方图均衡化的图像增强方法进一步优化图像的结构和表现能力。直方图均衡化算法(histogramequalization,H E)是一种将原图像像素点以一定关系映射到新的图像中的方法,使得生成图
29、像像素点可以更均匀分布在每个灰度级上,并具有更高的对比度,直方图均衡化的映射关系如式(10)所示fi.jgiuj=flor(L-1)ZPn(10)n=o式中,P,指灰度值为n的像素点个数所占图像像素点总个数的比例,f表示原图像,g表示输出图像,L为表示灰度级的常数,一般取值2 56;floor为取整函数。1.3基于Nesterov加速梯度优化3D-ResNet18的鼻咽癌特征分类模型传统机器学习针对鼻咽癌MRI的特征分类任务需要完成困难的病灶分割,有效的复发预测模型也因其效率与准确性的不足而难以构建,并且鼻咽癌肿瘤影像中除了形状、边缘等浅层影像特征或与鼻咽癌复发相关之外,还存在着一定的深度复发
30、特征信息及其潜在联系。对此,结合ResNet网络在深度特征提取与分类性能上的优势,采用ResNet18(255875期李炯逸,等:基于MRI与优化3D-ResNet18的鼻咽癌复发预测模型作为鼻咽癌复发预测模型的构建基础,并对其网络结构做适当改进,将实现图像特征分类的ResNet18模型改进为基于MRI的三维特征提取与分类的3D-ResNet18模型,网络同时基于Nesterov加速梯度优化等方法对训练的梯度更新过程进行优化,加速了网络送代训练的收敛。模型在鼻咽癌影像特征提取中可以有效避免困难的病灶分割工作,实现鼻咽癌深度复发特征的提取与分类预测1.3.1基于PReLu的3D-ResNet18
31、网络模型残差神经网络ResNet是一种对传统卷积神经网络CNN进行改进的网络结构,并在图像分类问题上具有优越的性能,而鼻咽癌MRI作为三维空间的研究对象,不仅存在更高维的空间特征信息,同时其空间样本的局部联系也更加复杂,适用于处理二维图像的传统神经网络模型应用效果不佳,为此将原模型改进为三维结构,弥补原模型的相应缺陷。除了为适应空间特征而改进的网络结构外,将网络前向通道的神经元激活函数ReLu改进为激活函数PReLu,改善了神经网络模型的稳定性与性能。ResNet网络结构的提出解决了因网络层数较深引起的网络退化问题,弥补了深层卷积神经网络训练难度大且训练难以收敛的缺陷,网络性能优势得到显著提升
32、,受到ResNet网络结构的启发,一种结合GoogLeNet与ResNet的网络结构2 6 被提出,而另一网络结构ResNeXt27也在同年被提出并以优秀的性能获得ILSVRC竞赛亚军,残差网络结构的提出推动了深度学习领域的发展以及深度网络模型在特征分类任务的应用。ResNet中的卷积计算提供了良好的局部感受域,通过局部连接获取输入数据的边缘、纹理等局部浅层特征与深度特征信息,在处理图像特征问题上具有优势。残差网络在设计残差单元时于其输人输出上并联了新的短连接前向通道,形成一个恒等映射通道,则有残差单元输人x与输出y关系如式(11)所示,网络结构由若干残差单元级联组成y=F(x,W)+Wx(1
33、1)式中,F为卷积层所在分支函数关系,包含两层卷积运算,W、指恒等映射的输人输出关系,用于匹配F的输入输出维度关系,表达式隐含了归一化和激活函数的作用。基于PReLu的改进3D-ResNet18模型继承ResNet基本结构,并采用PReLu作为ResNetl8原模型中的激活函数,PReLu是常用激活函数ReLu的改进2 8 ,与ReLu函数不同的是,PReLu函数在计43201-4-3-2-101234X图2PReLu函数Fig.2PReLufunction算数值小于0 的情况时函数值不为0,而是得到,=入,z(z;0),其中入,的初始值为0.2 5,其初始函数如图2 所示。除此之外,其参数入
34、,为模型可训练的参数,模型在训练过程中可以根据计算得到的相应梯度对参数进行更新。改进的激活函数PReLu引起网络增加的参数与其对应通道数相同,所以并不会增加模型过拟合的风险。网络模型通过反向传播更新网络模型中的卷积层与全连接层权值,由于ResNet模型中应用归一化方法,卷积运算后归一化的输出已然为标准的分布形态,故模型运算中偏置的作用几乎不存在,偏置量不参与前向传播过程或反向传播过程的参数更新。论文中鼻咽癌预处理影像数据输入网络参与前向传播过程,经过网络结构运算实现鼻咽癌肿瘤深度特征提取与分类,以损失函数关系得到网络输出复发分类与真实复发分类标签的误差,再经过反向传播算法得到的网络中各层卷积层
35、和全连接层神经元的误差分别如式(12)和式(13)所示C(8/+1*rot(w/+1)g(z)(12)(W1+1)T/+1)g(z,)(13)式中,C指代价函数;w指全连接层权重参数;w指卷积核权重参数;rot函数表示卷积核权重做18 0 度旋转;z指第1层权重计算的输出z=wal-1;(z)表示激活函数输出a,=(z)对z的变化敏感性;为点乘运算。神经网络依靠计算的各层神经元之间的误差,可以得到卷积层和全连接层权重的梯度分别如式(14)和式(15)所示=8,rot(al-1)(14)=a-10,(15)aw58842卷生医报学程学国物网络模型通过前向传播与反向传播的循环迭代的过程实现网络训练
36、,并通过网络优化方法,对这些权重以计算得到的梯度为基础进行高效率的参数更新,使网络的输出损失值不断下降,最终得到有效的鼻咽癌复发特征分类模型学习模型之所以选择ResNet作为基础网络结构以构建鼻咽癌复发预测模型,原因在于ResNet不存在深度网络常见的网络退化问题,并且它在未增加训练难度的前提下可以有效提高分类准确性。理论上神经网络层次越深,其提取深度特征信息的能力越强大,然而,传统的卷积神经网络随着网络层数增加会产生网络退化问题,使得训练过程中的训练集准确率趋于饱和甚至下降。残差网络ResNet的提出,从网络结构上解决了网络退化问题,同时提高了特征提取能力;残差网络比传统卷积网络增加的短连接
37、更有助于拟合高维函数。为实现更有效的鼻咽癌复发预测,采用的基于PReLu的3D-ResNet18模型在原模型的基础上做了相应改进,体现了更加充分的空间能力,网络结构中的卷积核结构、卷积步长和池化步长都为适应空间化做了相应调整,改进的3D-ResNet有效保留了影像中的肿瘤的三维特征。鼻咽癌MRI的ROI自动检测与基于优化3D-ResNet的特征分类模型如图3所示,鼻咽癌的原MRI影像经过预处理过程后,作为3D-ResNet18网络模型的输人参与模型的参数学习更新,通过神经网络中基础的卷积层及其之间的联系提取影像中的鼻咽癌复发深度特征,在全连接层中实现特征分类,借助网络残差连接与网络优化方法强化
38、模型的学习能力,最终得到有效的鼻咽癌复发特征提取与分类模型1.3.2基于Nesterov加速梯度的网络优化算法网络模型的反向传播过程也是梯度下降的过程,梯度下降是模型不断调整参数以逼近损失函数最小值的重要方式,在不发生过拟合的情况下,理论上模型输出计算所得损失函数越小,模型准确率相对越高,所以,基于损失函数最小化的参数寻优是神经网络训练的关键,论文的3D-ResNet18网络模型采用交叉损失函数,并且针对网络训练中出现的收敛问题,改进模型在反向传播中加人梯度优化算法Nesterov加速梯度,以缓解梯度下降过程中的振荡收敛,有效加快网络模型的收敛速度,交叉损失函数表达式L如式(16)所示L=-y
39、 ln()-(1-y)ln(1-)(16)式中,指样本的真实分类标签,指网络模型对样本的预测分类标签。Nesterov加速梯度(Nesterovacceleratedgradient,NA G)是一种梯度方向优化方法,与随机梯度下降(stochastic gradientdescent,SG D)、AdaGrad、RM Sp r o p 等学习率优化方法不同的是,学习率优化只考虑神经元的历史梯度对学习率的衰减优化作用,而梯度方向优化则增加了所有维度在历史梯度更新上的惯性作用。NAG方法于2 0 13年开始应用于神经网络优化2 91,该方法是动量法Momentum的改进,Momentum的计算与
40、步骤较简单,其梯度更新如式(17)和式(18)所示A0I=Ao,-Vf(o,)(17)Block33x3BatchPReLuConvNormDRLSE77x7AvgConvPoolboundRect64layer128layer256512ecurlayerresampleHElayernonkecur图3鼻咽癌MRI的ROI自动检测与基于优化3D-ResNet的特征分类模型Fig.3Automatic ROI detection of MRI in NPC and feature classification model with optimized 3D-ResNet5895期李炯逸,等:
41、基于MRI与优化3D-ResNet18的鼻咽癌复发预测模型0+1=0,+0 1(18)式中,u为动量因子,取值0.9;指学习率;e,指梯度更新的大小与方向;f(.)指.的梯度。Momentum的更新过程考虑了梯度惯性的影响,方法比起普通的SGD方法更加类似于真实物理环境中物体逼近凹点的过程,在训练的前期过程中由于惯性作用,Momentum的收敛速度更快且可以避免一定的局部震荡问题,但是从梯度计算上看,Momentum计算梯度惯性与当前梯度的过程是同时进行的,当动量因子u较大时,收敛过程或仍然存在着不够稳定的情况。为了使Momentum方法收敛过程更加合理,NAG方法将梯度更新过程做了修正,修正
42、后得到如式(19)所示梯度更新表达式。Ao+=o,-Vf(0,+Ao,)(19)修正后的NAG方法首先计算当前点,的梯度惯性并配合动量因子做参数更新,而后再计算更新点,+u,当前的梯度,根据学习率进一步更新得到+1值。NAG方法的梯度更新比Momentum更具合理性,方法每次迭代都相当于提前认知了下一步的梯度,其收敛效率优于Momentum。尽管Nesterov加速梯度优化仅仅是在Momentum的基础上对梯度位置选择的改进,但是其收敛的稳定性与模型最终的优化性能都可以达到更好的效果2 9】,并且实验结果表明,在基于3D-ResNet18的鼻咽癌复发预测模型的优化中,Nesterov加速梯度优
43、化具有更佳的整体收敛性与模型预测准确率。1.4鼻咽癌复发预测模型验证评估1.4.1数据集划分与交叉验证研究对象均为确诊于2 0 14至2 0 16 年的鼻咽癌患者,总共140 例,其中包含7 0 例治疗后复发病例以及7 0 例治疗后无复发病例。治疗后出现复发的病例中,大部分为短期复发,复发时间集中在放化疗后半年到一年,并且部分患者出现了淋巴结复发现象。学习模型所采用样本材料为鼻咽癌患者确诊时MRI的T1冠状面加权像。按7:3的比例将140份影像数据分为98 例训练样本和42 例测试样本,其中复发与无复发的病例各半。如表1所示的样本分布情况,研究对预训练样本采用5折交叉验证分为训练集和验证集,神
44、经网络模型在训练集数据上的训练实现参数更新,采用提前停止的方法生成有效的预测模型,由模型在验证集上的准确率决定训练的送代次数,最终得到交叉验证的训练模型在测试集上的结果。表1样本分布情况Tab.1Datadistribution复发病例/例无复发病例/例总计/例训练集494998测试集212142总计70701401.4.2基于配对t检验的模型性能评估方法配对t检验的本质是两个样本之间差值与0 之间的单样本t检验,即分析样本差异是否具有特殊性。除了采用准确率、敏感性、特异性与AUC值评估模型性能外,还采用基于配对t检验的假设检验方法评估基于Nesterov加速梯度优化的3D-ResNet18的
45、预测模型性能优势,对不同模型在测试集上的结果分别设计检验。检验过程选择在交叉验证中在测试集上准确率相近的实验组做分析,检验样本选取神经网络模型全连接层后Softmax函数的输出与样本错误标签的差值,这部分输出结果在分类问题中反映的是预测真实标签结果的概率,可以反映模型实现准确预测的能力,且样本值近似于正态分布。通过配对t检验实现对ResNet18模型比ResNetlo模型,以及Nesterov加速梯度优化比Momentum动量法的优势差异的分析2结果2.1基于距离正则化水平集自动分割的鼻咽癌ROI自动检测结果基于距离正则化水平集的3D鼻咽癌ROI的自动裁剪算法过程如图4所示,以研究对象一位鼻咽
46、癌病例的冠状面T1加权MRI为例,方法首先根据鼻咽癌的空间相关性自动选定MRI影像中的大范围初选矩体轮廓如图4(a)上方红色矩形框线所示,主要包含鼻咽癌高发部位的咽隐窝,以及咽鼓管咽口和咽鼓管隆突,轮廓边界包含左右侧的翼内肌、蝶窦与会厌位置等。在初步的自动选定区域轮廓基础上,采用距离正则化水平集方法进行自动分割,水平集方法实验经过30 次送代,得到包含咽隐窝区域及鼻咽癌肿瘤的3D鼻咽癌ROI轮廓如图4(a)下方红色轮廓框线所示,图4(b)绿色矩形框线为不同面中ROI轮廓的二维外接矩形区域,由3D鼻咽癌ROI轮廓外接矩体构造的3D鼻咽癌ROI裁剪区域如图4(c)蓝色矩形框线所示2.2基于优化3D
47、-ResNet18的鼻咽癌复发预测结果基于Nesterov加速梯度优化的3D-ResNet1859042卷中程报学医国学物(a)(b)图4距离正则化水平集演化过程(列项为同病例MRI连续影像)。(a)自动初始轮廓选定与自动分割(上下行的红色框线分别代表水平集演化曲线的初始状态和收敛状态,绿色框线代表片内外接矩形边界);(b)3D 鼻咽癌ROI裁剪区域(蓝色框线代表外接矩体边界)Fig.4 Process of distance regularized level set evolution(Each column is the continuous MRI image of the samep
48、atient).(a)Automatic initial contour selection and automatic segmentation(The red line represents initial andconvergence states of DRLSE curve,and the green line represents the bounding rectangle of each slice);(b)3D ROIcropping region of nasopharyngeal carcinoma(The blue line represents the boundin
49、g cube)网络模型,结合衰减率为0.97 的学习率指数衰减优化,经过多次送代训练,得到最终的鼻咽癌复发预测模型。模型训练过程的损失曲线与相关对比实验结果如图5所示,损失值随送代次数增加而收敛,当模型训练的送代次数达到30 0后,模型的损失均值趋于稳定。研究另外设计基于普通SGD优化与动量法Momentum优化下的模型训练损失得到如图5所示对比实验下的损失曲线,Nesterov加速梯度优化在相同实验组与模型参数下的收敛效率远高于普通SCD,整体收敛效果略优于Momentum。0.8MomentumNesterov0.7-SGD0.60.5-0.40.30.20.10.0+0501001502
50、00250300350400iterations图5训练集损失曲线Fig.5Lossvalue curve on training set研究所得到的训练模型在42 例样本的测试集上平均预测结果的敏感性、特异性、准确率分别为8 0.0%、6 4.6%、7 2.3%,其中预测结果可达到最高8 6.0%的敏感性与最高7 6.0%的特异性。利用实验结果绘制模型的ROC曲线可以计算获得其平均AUC值为0.7 5,最高AUC值可达到0.82,并得出如图6 所示ROC曲线及其对比实验结果。本研究设计了3个改进的网络模型结构,通过对比实验,得到的交叉验证平均测试结果如表2所示,结合NAG梯度优化算法的Res