1、Microcomputer Applications Vol.39,No.8,2023文章编号:10 0 7-7 57 X(2 0 2 3)0 8-0 142-0 4研究与设计融合多特征和IGWO-SVM的肺部肿瘤诊断研究微型电脑应用2 0 2 3年第39 卷第8 期胡艾苓,罗勇(泸州市人民医院,四川,泸州6 46 0 0 0)摘要:为了实现高精度的肺部肿瘤诊断,提出一种融合多特征和改进的灰狼算法(IGWO)优化支持向量机(SVM)的肺部肿瘤诊断模型。为了提高标准GWO算法的收敛速度、避免局部最优,将非线性收敛因子引入GWO,提出一种改进的灰狼优化算法(IGWO)。针对SVM模型性能受到惩罚因
2、子和核函数的核宽等参数选择的影响,运用IGWO算法优化选择SVM模型参数并应用于肺部肿瘤诊断。与GWO-SVM、PSO-SVM 和GA-SVM相比较,在分类准确率(ACC)、特异性(Specificity)、灵敏度(Sensitivity)和马修斯相关系数(MCC)4个性能评价指标上,IGWO-SVM模型的肺部肿瘤诊断具有更高的准确率、更快的收敛速度,且具有更高的稳定性,为肺部肿瘤诊断提供了新的方法。关键词:肺部肿瘤;肿瘤诊断;支持向量机;灰狼优化算法中图分类号:TP391;R318Abstract:In order to achieve high precision diagnosis of
3、 lung tumors,improved grey wolf optimization algorithm(IGWO)isused to optimize support vector machine(SVM),and a diagnosis model of lung tumors is proposed based on the IGWO-SVM.Firstly,in order to improve the convergence speed of standard GWO algorithm and avoid local optimum,nonlinear convergencef
4、actors are introduced into GWO,and an improved grey wolf optimization algorithm is proposed.Secondly,for the performanceof SVM model is affected by the selection of parameters such as penalty factor and kernel width of kernel function.IGWO algo-rithm is used to optimize the selection of parameters o
5、f SVM model,and it is used to diagnose lung tumors.Comparing withGWO-SVM,PSO-SVM and GA-SVM,in four performance evaluation indexes,i.e.,classification accuracy(ACC),specifici-ty,sensitivity and the atthews correlation coefficient(MCC),the IGWO-SVM model of lung cancer diagnosis is of higher accu-rac
6、y and faster convergence speed,and has higher stability,which provides a new method for lung cancer diagnosis.Key words:pulmonary neoplasm;tumor diagnosis;support vector machine;grey wolf optimization algorithm0引言癌症是影响全球人类健康的一大顽疾,其中由于肺癌导致的死亡最为常见,在临床上常常采用活检、X射线、核磁共振等方法对肺癌进行诊断。PET/CT技术的快速发展使得其在肿瘤诊断中得到
7、广泛的应用,为肿瘤诊断提供了新的方法和途径,然而大量图像主要通过人工方法进行诊断,存在费时、费力、效率低下和精度不高的缺点,这也增加了医生们的工作量 1。随着计算机技术的飞速发展,计算机辅助诊断(CAD)在医药上得到了越来越多的运用,在肺癌诊断中的应用是一种必然趋势。文献2 联合GA-ANN和GA-SVM模型提出了一种脑肿瘤CAD系统,在两类数据集上的最高精度分别为91.7%和94.9%。文献 3构建了基于支持向量机(SVM)的肺癌诊断模型,同时将构建的诊断模型应用于肺癌特征分类中,结果表明模型对肺癌特征分类的精度高达作者简介:胡艾苓(1990 一),女,本科,主治医师,研究方向为放射诊断;罗
8、勇(198 9一),男,本科,主治医师,研究方向为放射诊断。文献标志码:AStudy on the Diagnosis of Lung Tumors by Fusionof Multi-feature and IGWO-SVMHU Ailing,LUO Yong(Luzhou Peoples Hospital,Luzhou 646000,China)14278.08%。文献 4提出了一种遗传算法优化ANN和粗糙集(RS)的乳腺癌计算机辅助诊断模型,诊断精度达到98.1%。文献 5针对SVM肺癌诊断模型的参数分别采用遗传算法(GA)与粒子群算法(PSO)进行优化,获得了用于肺癌诊断的GA-SVM
9、模型和PSO-SVM模型,并将两个模型应用于肺癌的早期诊断中。研究结果表明,GA-SVM模型的分类精度为90.91%,PSO-SVM模型的分类精度为93.18%,高于GA-SVM模型。将肺癌特征进行融合,其不仅仅可以使重要信息得到保留,同时也提高了诊断准确率。针对SVM模型的性能受其参数选择的影响,为了提高肺部肿瘤诊断的精度,本文提出一种融合多特征和改进灰狼算法优化SVM参数的肺癌特征分类模型,从而达到提高肺癌诊断准确率的目的。1提取肺部肿瘤图像特征采用SVM模型对肺部肿瘤进行诊断的基础是科学提取Microcomputer Applications Vol.39,No.8,2023肿瘤图像的特
10、征,特征提取的准确性直接影响诊断精度。本文选择提取形状特征、灰度特征和纹理特征 6-8。肺部肿瘤CT图像特征详细描述如表1所示。为了提取肺部肿瘤图像的特征,首先获取CT图像的ROI区域并对图像进行预处理,如图1所示。CT图像PET图像PET/CT图像原始图像分模态图1ROI区域获取和预处理序号特征类别13Tamura纹理特征4角点特征511Hu矩特征1235小波特征3642统计特征4348几何特征49104灰度共生矩阵特征式(1)式(2)中,t为GWO算法的当前迭代次数,X为当前狼群的位置,D为狼群和猎物之间的距离,X为猎物位置。系数A和C的计算公式如下:A=2a.ri-aC=2 r2式(3)
11、式(4)中,r1和r分别为闭区间0,1上的随机向量,a为收敛因子,取值范围为 0,2。2.2狩猎阶段当灰狼对猎物形成包围圈之后,灰狼群体对猎物实施狩猎操作。狼为GWO算法全局最优、狼为全局次优解、狼为全局第三优解,即数学模型为D.=ICi:X-XIDp=I C2 Xp-XID=IC3 X-X式(5)式(7)中,D、D 和D。为狼、狼和狼与当前解X的距离,Ci、C2、C为随机向量,且处于 O,1之间,X。、X、X。为狼、狼和狼的位置。当前解X与更新解X(t 十1)的数学公式为(8)Xi=X。-A i:(D)X2=X-A2.(D)X=X-A.(D.)X(t+1)=Xi+X+X3式(8)式(11)中
12、,A1、A 和A:均为随机向量。研究与设计2改进的GWO算法GWO算法是一种群体智能优化算法,其将灰狼群体划分为4层,分别为狼(社会等级第一层)、狼(社会等级第二层)、狼(社会等级第三层)、狼(社会等级第四层)。社会等级第一层的狼为头狼,对整个狼群的捕食、栖息、作息等活动做出决策;社会等级第二层的狼服从并协助狼;CT图像ROI社会等级第三层的狼服从狼和狼,支配社会等级第四rgb2gray层的狼。GWO算法由包围猎物、狩猎和攻击猎物三个步转化为骤组成9。PET图像ROI灰度图像:PET/CT图像ROIROI区域获取、归一化表1CT图像特征描述表特征名称粗糙度、对比度、方度角点一阶矩七阶矩能量、范
13、数、标准差均值、方差、标准差、倾斜度、峰度、梯度能量、空间频域特征周长、面积、圆形度、矩形度、伸长度、欧拉数能量、熵、惯性矩、相关性、逆差矩、方差、和的均值、和嫡、差熵、和的方差、差分方差、信息测度I、信息测度II、最大相关系数(3)(4)(5)(6)(7)(9)(10)(11).143微型电脑应用2 0 2 3年第39 卷第8 期2.1包围猎物阶段包围猎物的更新公式如式(1)、式(2):D=IC.X,(t)-X(t)IX(t+1)=X,(t)-A.D2.3攻击猎物阶段灰狼攻击猎物是根据参数进行调节的,A的数值会随参数a的增大或者减小发生变化。如果A|1,那么灰狼群体和猎物(X*,Y*)接近,
14、灰狼开始攻击猎物;反之,整个狼群远离猎物,搜寻新的猎物对象。在标准GWO算法中,收敛因子a是线性下降的,导致在算法初期迭代次数较小,a的数值较大,GWO算法进行全局搜索;算法后期迭代次数较大,的数值减小,并用于局部寻优的GWO算法。为了增强全局最优化方法的搜索性能,本文提出一种基于一个非线性收敛性系数的修正方法 10:a(0)=2 ex(0.5 (-1og(1-)(12)式(12)中,Tmax和t分别为最大迭代次数和当前代次数。3融合多特征和IGWO-SVM的肺部肿瘤诊断模型基于IGWO-SVM模型的肺部肿瘤诊断模型流程如图2所示。首先,将提取的肺部肿瘤特征数据(形状特征、灰度特征和纹理特征)
15、10 折划分为训练数据和测试数据;之后,针对训练数据集运用IGWO优化SVM模型的参数组合(C,g)建立基于IGWO-SVM模型的肺部肿瘤诊断模型模型;最后,将由IGWO优化得到的(C,g)的参数组合替换到SVM模型中,对其进行实验。基于IGWO-SVM模型的肺部肿瘤诊断模型模型的算法流程具体描述如下。(1)(2)维数317247656Microcomputer Applications Vol.39,No.8,2023研究与设计微型电脑应用2 0 2 3年第39 卷第8 期肺部肿瘤特征数据(形状特征、灰度特征和纹理特征)!训练数据IGWO模型设定SVM模型的惩罚系数C和核宽值g的取值范,并初
16、始化IGWO算法参数初始化灰狼种群增加循环计数器Counter-Counter+1计算灰狼个体适应度更新所有个体极值和全局极值文是CounterACCbest,那么这个灰狼群的ACCnew将取代ACCbest,同时保持这个灰狼群的生存地点;如果没有,则保存当前最优ACC。Step8:对算法的终结条件进行判定:如果当前的迭代数t大于Tmax,那么这个算法就会被终结,并且在这个过程中会输出一个最优的位置,也就是与SVM模型相对应的最优参数组合(C*,g*);相反,从step4到step7的迭代式优化被返回。1SVM使用最优参数(C.g)对9折交叉训练数据进行训练,建立SVM模型运用SVM模型对测试
17、数据进行测试K-10?是输出最优惩罚10个独立测试集的平均值系数C和核宽值g作为最终评价结果Step9:利用支持向量机(SVM)优化参数组合(C*,g”),实现对肺癌的早期诊断。(13)4实验与结果分析4.1性能指标为了评估IGWO-SVM模型对肺部肿瘤的诊断效果,选择分类准确率(ACC)、特异性(Specificity)、灵敏度(Sensitivi-ty)和马修斯相关系数(MCC)作为性能指标,计算公式 1-12 1如式(15)式(18):ACC=TP+FP+FN+TNSpecificity=FP+TNTNSensitivity=TP+FNTPTP*TN-FP*FNMCC=(14)V(TP+
18、FP)(TP+FN)(TN+FP)(TN+FN)(18)式(15)式(18)中,TP、FP分别为正确分类和错误分类的恶性肿瘤个数,TN、FN分别为正确分类和错误分类的良性肿瘤个数。4.2结果分析为了验证IGWO-SVM对肺部肿诊断的有效性,本文采用泸州市人民医院30 0 个病例的肺部肿瘤图像数据,比较了IGWO支持向量机与GWO支持向量机、PO支持向量机及广义支持向量机的优劣,并给出了相应的参数设定。实验环境为MATLAB2015a,PC机上内存8 G,中央处理器主频为2.6GHz,CPU为Intel(R)C o r e(T M)i5-7 2 0 0 4-核心,操作系统为Windows7。10
19、折交叉划分30 0 组肺部肿瘤特征数据。首先,将肺部肿瘤特征数据作为SVM的输人向量,肿瘤类别(良性和恶.144!测试数据SVM模型TP+TN(15)(16)(17)Microcomputer Applications Vol.39,No.8,2023性)作为SVM的输出向量,建立肺部肿瘤SVM诊断模型;其次,运用IGWO优化SVM模型的惩罚因子C和核函数的核宽g,建立基于IGWO-SVM的肺部肿瘤诊断模型。不同算法的性能评估结果如图3所示。不同算法收敛速度比较结果如图4所示。表2 不同算法参数算法参数IGWO/GWO种群规模N=10、最大迭代次数Tmax=200种群规模N=10、最大选代次数
20、Tmax=200、PSO惯性权重w=0.2、学习因子c1=c2=2种群规模N=10、最大迭代次数Tmax=200、GA交叉概率P。=0.8、变异概率Pm=0.1SVMCE0.01,100gE0.01,101.00.80.40.20ACCSpecifidity SensitivityMCC0.18r0.160.140.120.100.080.060.040.020ACSpecifidity SensitivityMCC图3性能评估对比图由图3可知,与GWO-SVM、PSO-SV M 和GA-SVM相比较,在分类准确率(ACC)、特异性(Specificity)、灵敏度(Se n s itiv i
21、ty)和马修斯相关系数(MCC)4个性能评价指标上,IGWO-SVM模型获得的效果最好且标准偏差最小。说明该模型结果更加稳定、更优,从而证明了IGWO-SVM模型对肺部肿瘤诊断的有效性和可靠性。959493929190892040图4收敛速度对比图由图4可知,与GWO-SVM、PSO-SV M 和GA-SVM相比较,IGWO-SVM具有更快的收敛速度。送代次数为6 2时,IGWO-SVM模型就开始收敛,且具有更高的适应度,从而说明IGWO-SVM模型对肺部肿瘤诊断的评价精度高、收敛速度快、效果好,能够在相关领域中进行推广。研究与设计5总结本文拟采用改进的灰狼算法优化SVM模型的方法,对支持向量
22、机(IGWO-SVM)进行优化。本文的创新之处是在标准GWO算法中引入了非线性收敛因子,并对其进行了改进。与GWO-SVM、PSO-SV M 和GA-SVM相比较,在分类准确率(ACC)、特异性(Specificity)、灵敏度(Sensitivity)和马修斯相关系数(MCC)4个性能评价指标上,IGWO-SVM模型的肺部肿瘤诊断效果最好,为肺部肿瘤诊断提供了新的方法。然而,由于本文特征数量较多,一定程度上影响了计算速度,后续将对肺部肿瘤特征数据进行降维处理,以期提高计算速度,同时降低信息允余度。参考文献IGWO-SVMGWO-SVMPSO-SVMGA-SVM(a)平均值IGWO-SVMGW
23、O-SVMPSO-SVMGA-SVM(b)标准偏差*-IGWO-SVMGWO-SVMPSO-SVMGA-SVM80120160选代次数微型电脑应用2 0 2 3年第39 卷第8 期1张飞飞,周涛,陆惠玲,等.基于贝叶斯粗糙集的肺部肿瘤CT图像高维特征选择算法JI.生物医学工程研究,2 0 18,37(4):40 4-40 9.2 周天绮,朱超挺,石峰.影像组学在肺肿瘤良恶性分类预测中的应用研究J.中国医疗器械杂志,2 0 2 0,44(2):113-117.3 任海玲,周涛,霍兵强.基于集成DE-NRS的肺部肿瘤影像组学计算机辅助诊断模型J.计算机应用与软件,2 0 2 0,37(5):156
24、-16 3.4张飞飞,周涛,陆惠玲,等.基于集成VPRS-RUGGA支持向量机的多模态肺部肿瘤计算机辅助诊断模型J.生物医学工程研究,2 0 19,38(1):48-53.5王振青,王海波,刘海春.PET/CT联合检测肿瘤标志物在肺癌诊断中的应用J.宁夏医科大学学报,2015,37(3):338-340.6 田刚,张章,刘靳波,等.基于血清四项肿瘤标志物的模式识别技术对肺癌的鉴别诊断J.实用医学杂志,2020,36(5):655-660.7刘敬霞.基于随机森林的肺部肿瘤PET/CT图像计算机辅助诊断方法研究J.生物医学工程研究,2 0 2 0,39(2):151-155.8纪鹏慧,段书音,李尊
25、税,等,基于肿瘤标志群的支持向量机模型在肺癌辅助诊断中的价值.郑州大学学报(医学版),2 0 19,54(3):398-40 2.9 MIRJALILI S,MIRJALILI S M,LEWIS A.GreyWolf OptimizerJ.Advances in Engineering Soft-ware,2014,69(3):46-61.10王坚浩,张亮,史超,等.基于混沌搜索策略的鲸鱼优化算法J.控制与决策,2 0 19,34(9):18 93-190 0.20011王媛媛,周涛,陆惠玲,等.基于集成卷积神经网络的肺部肿瘤计算机辅助诊断模型J.生物医学工程学杂志,2 0 17,34(4):543-551.12冯斐斐,吴拥军,聂广金,等.基于“优化肿瘤标志群”建立的人工神经网络模型对肺癌辅助诊断的作用J.肿瘤防治研究,2 0 11,38(6):7 0 9-7 11.(收稿日期:2 0 2 1-0 9-17).145