1、第 48 卷 第 1 期燕山大学学报Vol.48 No.12024 年 1 月Journal of Yanshan UniversityJan.2024 文章编号:1007-791X(2024)01-0086-09基于超声图像评估甲状腺和乳腺病变的通用计算方法安俊达,李玉双(燕山大学 理学院,河北 秦皇岛 066004)收稿日期:2022-09-29 责任编辑:唐学庆基金项目:河北省自然科学基金资助项目(A2020203021);河北省引进留学人员资助项目(C20200365)作者简介:安俊达(1995-),男,河北张家口人,硕士研究生,主要研究方向为生物数学;通讯作者:李玉双(1980-),
2、女,河北平泉人,博士,教授,主要研究方向为生物数学,Email:yushuangli 。摘 要:甲状腺和乳腺病变是影响女性身心健康的两类常见疾病。为了深入挖掘两类病变在超声图像上的个性差异和共性特征,提出一种通用的计算方法识别甲状腺和乳腺病变。先利用小波包变换将超声图像分解为4 个子图;再借助灰度共生矩阵提取不含高频噪声的 3 个子图的纹理特征;最后利用最大相关最小冗余算法筛选特征,输入 4 种机器学习模型,完成甲状腺、乳腺结节良恶二分类和四分类。将方法应用于来自不同平台的甲状腺和乳腺超声图像,随机排列交叉验证二分类 AUC 达到 0.880.99,准确率 ACC 达到 0.840.98,均优
3、于已有研究结果;四分类 AUC 达到 0.950.97,ACC 达到 0.880.92,优于深度残差网络 ResNet50。基于甲状腺(乳腺)图像训练的四种模型在交叉识别乳腺(甲状腺)良恶结节方面也取得了理想的分类结果,进一步验证了所提方法的稳定性和通用性。同时,T 检验结果显示:甲状腺和乳腺恶性结节超声图像的近似子图存在非常显著的纹理差异,垂直细节子图展示出 6 个潜在的共性特征。关键词:甲状腺;乳腺;良性结节;恶性结节;机器学习;超声图像中图分类号:TP391 文献标识码:A DOI:10.3969/j.issn.1007-791X.2024.01.0100 引言乳腺癌和甲状腺癌是女性中最
4、常见的两种癌症。乳腺癌已取代肺癌成为全球第一大癌1,是45 岁以下女性癌症死亡的主要原因及最大威胁2-3,甲状腺癌的发病率也呈现出逐年上升的趋势4。超声影像因其无创、无辐射、成本低等优点被广泛用于筛查、诊断乳腺和甲状腺的病变5,其准确性很大程度上取决于医生对超声图像的正确解读6。人工智能辅助诊断技术可以帮助医生精准评估乳腺和甲状腺的病变风险,避免过度治疗7。最近,Qian 等人利用 10 815 张多模态多角度的乳腺超声图像训练了深度学习诊断系统,用以评估乳腺影像报告和数据系统分级,并成功应用于多家医院的前瞻性临床环境8。Ma 等人利用临床收集的 508 名患者的甲状腺超声图像,验证了深度神经
5、网络(Deep Neural Network,DNN)可以更好地辅助医生诊断甲状腺癌9。深度学习的诊断水平与图像的数量和质量密不可分。当数据量不足时,往往很难训练出理想的模型10,可解释性不强也是许多深度学习模型普遍存在的共性问题11。已有研究表明,一些超声特征与恶性肿瘤有关,一些则与良性有关12。如何采用计算工具用以揭示超声特征与肿瘤良恶性之间的关联,是目前智能诊断迫切需要解决的问题。超声图像的计算机分析,尤其是纹理分析,为医生提供了目视检查可能无法发现的有关图像模式的定量信息13。灰度共生矩阵(Gray-Level Co-occurrence Matrix,GLCM)是一种通过研究灰度的空
6、间相关特性来描述纹理的常用方法,能反映图像灰度在方向、相邻间隔、变化幅度等方面的综合信 息14。离 散 小 波 变 换(Discrete Wavelet Transform,DWT)是图像处理的常用技术之一15,第 1 期安俊达 等 基于超声图像评估甲状腺和乳腺病变的通用计算方法87 它使用由有限脉冲响应滤波器组成的滤波器组将信号分解为低频和高频信息16。Acharya 等人利用 3 个 GLCM 纹理特征和 2 个 DWT 高频信息特征,借助 AdaBoost 评估甲状腺结节的恶性风险,并综合这 5 个特征定义了甲状腺恶性肿瘤指数,该指标值在 10 例良性和 10 例恶性受试者中具有显著差异
7、17。这种方法为快速识别甲状腺病变提供了参考依据,但其使用的数据量过小,适用性和稳定性有待进一步验证。众所周知,超声采集会在信号中引入散斑噪声,从而影响超声图像细节特征的辨识18-19。小波变换虽然能够有效表征以低频(近似)信息为主的信号,但不能很好地分解和表示包含大量高频(细节)信息(如细小边缘或纹理)的 信 号,而 小 波 包 变 换(Wavelet Packet Transform,WPT)可以对高频信息提供更精细的分解,对包含大量中、高频信息的信号能够进行更好的时频局部化分析20。值得注意的是,当前研究多针对乳腺或甲状腺的超声图像建立仅适用于各自病变的智能诊断模型21-22。然而,甲状
8、腺和乳腺病变存在某些共同的病理生理诱因5,在超声扫描下具有一些共同特征,如结节的形状不规则、边界模糊等23。开发通用的诊断模型将大大简化两类病变的分类过程,具有广泛的临床参考价值。当其中一类病变的数据或标注不易获取时,这种通用模型可以发挥作用。Zhu 等人首次提出了一个通用的深度卷积神经网络架构来评估乳腺和甲状腺病变,该方案的可行性在临床实践收集的超声图像中得到充分验证24。受以上工作启发,本文提出了甲状腺和乳腺病变的通用识别方法,采用分步式融合 WPT 和GLCM,提取来自不同平台的甲状腺和乳腺结节超声图像的 WPT-GLCM 纹理特征,旨在解析基于该特征的经典机器学习模型(逻辑回归(Log
9、istic Regression,LR)、支 持 向 量 机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)和极端 梯 度 提 升 树(eXtreme Gradient Boosting,XGBoost)识别甲状腺和乳腺病变的能力,挖掘两类病变的个性纹理差异及共性纹理特征,验证所提方法的通用性。1 数据集介绍与研究框架甲状腺结节超声图像来自文献9,涵盖河北医科大学第三医院的 508 名患者(良性 415 名,恶性 93 名)。恶性结节图像尺寸介于 8481567340,良性介于 2520529529。乳腺结节超声图像涵盖了在 Baheya
10、医院接受治疗的 600 名女性患者25,包含 780 张图像(正常 133 张、良性 487 张、恶性 210 张),平均大小为 500500。文献26将这些原始图像统一调整为2828,并将正常和良性统记为良性,构建了数据集 BreastMNIST。为便于理解本文的研究流程,图 1 给出了整体研究框架。注:这里 T-model 指基于甲状腺结节超声图像训练的模型,B-model 指基于乳腺结节超声图像训练的模型。图 1 甲状腺和乳腺病变识别的研究框架 Fig.1 Research framework for identifying thyroid and breast nodules88 燕山
11、大学学报20242 超声图像的纹理特征提取方法2.1 GLCM 特征选取像素对的四个偏移方向(0,45,90,135)和长为 1 的空间距离生成 GLCM。基于GLCM 计算 4 个方向上的 7 个统计量,包括角二阶矩(ASM)、对 比 度(Contrast)、相 关 性(Correlation)、相 异 度(Dissimilarity)、熵(Entropy)、同质性(Homogeneity)和能量(Energy)(见公式(1)(7),得到 28 维 GLCM 特征。ASM=ijG(i,j)2,(1)Contrast=ij(i-j)2G(i,j),(2)Correlation=ij(i-x)(
12、j-y)G(i,j)xy,(3)Dissimilarity=ij|i-j|G(i,j),(4)Entropy=-ijG(i,j)log(G(i,j),(5)Homogeneity=ijG(i,j)1+|i-j|2,(6)Energy=ijG(i,j)2,(7)其中,G i,j()为 GLCM 的元素值,x=ijiG(i,j),y=ijjG(i,j),x=ij(i-x)2G(i,j),y=ij(j-y)2G(i,j)。2.2 WPT-GLCM 特征将超声图像进行一级 2 维 WPT 分解,得到 4个子图,包括近似子图 LL、水平细节子图 HL、垂直细节子图 LH 和高频噪声子图 HH。图 2(a
13、)和(b)分别展示了甲状腺和乳腺结节代表图像及其对应的 4 个分解子图。为避免超声图像中的散斑噪声对后续分类的影响,这里剔除高频噪声子图 HH,仅关注其余 3 个子图。分别提取这 3 个子图的 28 维GLCM 特征,整合得到 84 维 WPT-GLCM 特征。2.3 WMCM 特征为充分展示 WPT-GLCM 特征在识别甲状腺和乳腺病变方面的通用性和有效性,引入文献27提出的小波多子图共生矩阵(Wavelet Multi-subgraph Co-occurrence Matrix,WMCM)特征以做比较。将超声图像进行一级 2 维 WPT 分解后,构造整体细节子图LHL(i,j)=LH(i,
14、j)2+HL(i,j)2,并将 LL 和 LHL 量化到 16 个灰度级。定义 WMCM的元素 q(i,j)为 LL 和 LHL 中同时满足如下条件的像素(s,t)的个数:LL(s,t)=i,LHL(s,t)=j,进一步做归一化:q(i,j)=q(i,j)16i=116j=1q(i,j)。令 qx(i)=16j=1q(i,j),qy(j)=16i=1q(i,j),定义如下9 个特征,包括小灰度小细节优势 w1、小灰度大细节优势 w2、灰度均值 w3、细节均值 w4、灰度标准差w5、细节标准差 w6、对比度 w7、逆差分矩 w8和熵w9(见式(8)(16),得到 9 维 WMCM 特征。图 2
15、超声图像的一级 2 维 WPT 分解Fig.2 First-order 2D WPT decomposition of the ultrasound imagew1=16i=116j=1q(i,j)i2j2,(8)w2=16i=116j=1q(i,j)j2i2,(9)w3=16i=1iqx(i),(10)w4=16j=1jqy(j),(11)w5=16i=1(i-w3)2qx(i),(12)w6=16j=1(j-w4)2qy(j),(13)w7=16i=116j=1(i-j)2q(i,j),(14)第 1 期安俊达 等 基于超声图像评估甲状腺和乳腺病变的通用计算方法89 w8=16i=116j
16、=1q(i,j)(i-j)2+1,(15)w9=-16i=116j=1q(i,j)log(q(i,j)。(16)3 预测模型与评估指标LR、SVM、RF 和 XGBoost 是常用的分类模型28。LR 是一种广义线性回归模型,可以清楚地解释输入特征如何通过最终生成的方程来证明输出的合理性。SVM 是一种简单且有效的监督式学习方法,广泛应用于统计分类和回归分析。RF 通过构建和合并多个决策树来获得更准确和更稳定的预测,为不平衡分类提供平衡的数据集误差。XGBoost 是梯度提升决策树的高效实现,具有准确率高、运行效率高、泛化能力强等优点。为了全面评估模型的分类性能,引入 5 个统计量,包括 RO
17、C 曲线下的面积(AUC)、准确率(ACC)、精确率(precision)、召回率(recall)和 F1分数(F1_score)(见公式(17)(20)。ACC=TP+TNTP+TN+FP+FN,(17)precision=TPTP+FP,(18)recall=TPTP+FN,(19)F1_score=2 precision recallprecision+recall,(20)其中,TP(TN)表示预测标签为恶性(良性),而实际标签也为恶性(良性)的样本数;FP(FN)表示预测标签为恶性(良性),而实际标签为良性(恶性)的样本数。4 实验结果本章主要介绍上述 4 种模型在 WPT-GLCM
18、 特征下对于甲状腺、乳腺结节 6 个分类问题的预测结果,并与 GLCM 特征、WMCM 特征以及其他已发表的结果进行比较。由于 GLCM 特征和 WPT-GLCM特征的维数相对较高,故利用最大相关-最小冗余(Maximal Relevance and Minimal Redundancy,mRMR)算法进行特征筛选。为简化计算,选择前5 维作为起始特征,并以 5 为间隔增量依次进行特征选择,直至全部特征选择完毕结束。依据预测结果确定最优的特征维数。为避免过拟合,采用随机排列交叉验证方法(Shuffle Split)训练模型及评估预测性能。训练集和测试集比例为 9 1。以“AUC 最优”作为调参
19、依据。重复执行 5 次,取 5次预测结果的平均值作为最终预测结果。4.1 基于最优 T-model 的甲状腺结节良恶二分类结果 4 种最优 T-model 在三类特征下的甲状腺结节良恶二分类 AUC 如图 3(a)所示:显然,WPT-GLCM 取得了最理想的结果,WMCM 表现最差。表 1 汇总了基于 WPT-GLCM 的最优 T-model 的预测结果:T-SVM 以最少的特征取得了最好的结果,T-LR 略低于 T-SVM,而 T-RF 和 T-XGBoost 整体上逊色于 T-SVM 和 T-LR,特别是 recall 和 F1_score的结果不尽如人意。4 种模型的预测结果均优于文献9
20、的最好结果(DNN 的 ACC=0.87)。图 3 4 种最优模型的二分类 AUC 比较Fig.3 AUC comparison of binary classification between four optimal models表 1 基于 WPT-GLCM 的最优 T-model 的预测结果Tab.1 The prediction results of the optimal T-models based on WPT-GLCMT-model特征维数AUCACCprecision recallF1_scoreT-LR750.990.950.810.930.86T-SVM600.990.
21、980.910.950.93T-RF600.950.920.930.550.68T-XGBoost840.960.910.930.540.66 注:这里 T-LR 的最优参数 C=35,Classed weighted=balanced,90 燕山大学学报2024Penalty=L1;T-SVM 的最优参数 C=6 600,Probability=True;T-RF的最优参数 N_estimators=100,Min_samples_split=3,Max_features=60,Min_samples_leaf=6;T-XGBoost 的最优参数 N_estimators=11。4.2 基于
22、最优 B-model 的乳腺结节良恶二分类结果 4 种最优 B-model 在 3 类特征下的乳腺结节良恶二分类 AUC 如图 3(b)所示:显然,WPT-GLCM 依然表现最优,WMCM 依然表现最差。表 2汇总了基于 WPT-GLCM 的最优 B-model 的预测结果:B-RF 和 B-XGBoost 以明显的特征维数优势获得了优于 B-LR 和 B-SVM 的分类结果,完全可以与文献26 的最优结果(Google AutoML Vision,AUC=0.92、ACC=0.86)相媲美,且优于文献26的其他深度学习模型(如 ResNet50,AUC=0.87,ACC=0.84)。表 2
23、基于 WPT-GLCM 的最优 B-model 的预测结果Tab.2 The prediction results of the optimal B-models based on WPT-GLCMB-model特征维数AUCACCprecision recallF1_scoreB-LR840.880.840.870.920.89B-SVM700.890.860.880.950.91B-RF250.920.870.890.940.92B-XGBoost150.900.880.910.930.92 注:这里 B-LR 的最优参数 C=6 000,Penalty=L1;B-SVM 的最优参 数 C
24、=7 700,Probability=True;B-RF 的 最 优 参 数 N _estimators=54,Max_depth=16,Criterion=entropy;B-XGBoost 的最优参数 N_estimators=52,Gamma=0.7,Colsample_bytree=0.9,Subsample=0.7,Max_depth=4。4.3 基于最优 T-model 的乳腺结节良恶二分类结果 为验证所提方法的通用性,将乳腺结节超声图像的相应 WPT-GLCM 特征直接输入4.1 节中的最优 T-model,得到的测试结果如表 3 所示:基于甲状腺结节超声图像训练的 4 种最优
25、T-model 仍然 能 够 有 效 识 别 乳 腺 良 恶 结 节,T-RF 和T-XGBoost 整体优于 T-LR 和 T-SVM,但低于表 2中的 B-RF 和 B-XGBoost。4.4 基于最优 B-model 的甲状腺结节良恶二分类结果 为进一步验证方法的通用性,将甲状腺结节超声图像的相应 WPT-GLCM 特征直接输入4.2 节中的最优 B-model,得到的测试结果如表 4 所示:基于乳腺结节超声图像训练的 4 种最优 B-model仍然能够有效识别甲状腺良恶结节,且依然超越了文献9的最优结果;B-LR 和 B-SVM 整体优于B-RF 和 B-XGBoost,但低于表 1
26、中的 T-LR 和T-SVM。表 3 基于 WPT-GLCM 的最优 T-model的乳腺结节良恶二分类结果Tab.3 The binary classification results of benign and malignant breast nodules based on the optimal T-models with WPT-GLCMT-model特征维数AUCACCprecision recallF1_scoreT-LR750.820.720.890.700.78T-SVM600.810.810.840.920.88T-RF600.840.830.850.940.89T-XG
27、Boost840.840.830.870.920.89表 4 基于 WPT-GLCM 的最优 B-model的甲状腺结节良恶二分类结果Tab.4 The binary classification results of benign and malignant thyroid nodules based on the optimal B-models with WPT-GLCMB-model特征维数AUCACCprecision recallF1_scoreB-LR840.980.950.760.940.84B-SVM700.980.960.850.940.88B-RF250.910.890.
28、800.470.56B-XGBoost150.900.890.740.630.624.5 甲状腺乳腺结节二分类结果为了说明甲状腺和乳腺结节之间的差异性,将甲状腺和乳腺结节的超声图像放在一起构成混合数据集,将混合图像的每类特征分别输入 4 种模型进行甲状腺结节和乳腺结节的识别。实验结果显示:即使在默认参数下,基于不同维数的各类特征的 4 种模型均能获得理想的分类结果,AUC等于或接近 1,ACC0.95。4.6 甲状腺+乳腺结节良恶四分类结果为了说明甲状腺和乳腺良恶结节之间的差异性,并验证所提方法识别多分类任务的能力,将甲状腺和乳腺结节混合图像的每类特征分别输入 4种模型,进行甲状腺良、恶结节和
29、乳腺良、恶结节的四分类。4 种最优模型在三类特征下的四分类AUC 如图 4 所示:它们依然在 WPT-GLCM 特征下取得了最理想的结果,但相比 GLCM,其优势不像第 1 期安俊达 等 基于超声图像评估甲状腺和乳腺病变的通用计算方法91 前面二分类那样明显;WMCM 依然表现最差。表5 汇总了基于 WPT-GLCM 的最优模型的四分类预测结果:显然,整体预测比较理想,XGBoost 在 5 个指标上均优于其他三种模型,RF 只有 recall 略低于 LR 和 SVM。为了进一步展示本文所提方法的有效 性,将 混 合 图 像 直 接 输 入 ResNet50,以7 1 2 的比例将数据集随机
30、分为训练集、验证集和测试集,最优模型的四分类 AUC=0.72,ACC=0.90,均低于 4 种模型的预测结果(SVM 的 ACC除外)。图 4 4 种最优模型的四分类 AUC 比较Fig.4 AUC comparison of four-category classification between four optimal models表 5 基于 WPT-GLCM 的 4 种最优模型在甲状腺+乳腺结节良恶四分类中的预测结果Tab.5 The four-category classification results of benign and malignant thyroid and b
31、reast nodules based on the four optimal models with WPT-GLCM模型特征维数AUCACCprecision recallF1_scoreLR800.950.900.850.950.89SVM100.960.880.810.950.87RF150.970.910.870.930.90XGBoost300.970.920.870.960.91 注:这里 LR 的最优参数 C=80,Penalty=L1;SVM 的最优参数C=8 000,Probability=True,Gamma=0.19;RF 的最优参数 N_estimators=12,M
32、ax_depth=19;XGBoost 的最优参数 N_estimators=145,Colsample_bytree=0.6,Subsample=0.8,Learning_rate=0.08,Reg_alpha=0.06。5 讨论结合表 1表 4 不难发现,LR 和 SVM 更适用于识别甲状腺病变,RF 和 XGBoost 更适用于评估乳腺病变。尤其对于指标 recall 和 F1_score,LR和 SVM 对于甲状腺超声图像表现出了绝对优势,而 RF 和 XGBoost 却很不理想,出现大幅下降(见表 1 和表 4)。这种现象对于乳腺超声图像没有发生。在乳腺结节良恶识别中,尽管 RF 和
33、 XGBoost整体上更有优势,但是 LR 和 SVM 并没有在某个指标上表现出异常下降,特别是 SVM(见表 2 和表 3)。因此,当临床测试更加注重 recall 和 F1_score 时,不建议用 RF 和 XGBoost 来评估甲状腺病变。表 3 和表 4 理想的交叉测试结果表明,甲状腺和乳腺病变很可能会产生相似的 WPT-GLCM特征。因为甲状腺癌和乳腺癌是研究的重中之重,所以这里重点讨论甲状腺和乳腺恶性结节超声图像之间的特征关联及差异。分别计算 84 个WPT-GLCM 特征在甲状腺良、恶结节和乳腺良、恶结节中的取值。T 检验结果显示:6 个 LH 特征(ASM-0、ASM-90、
34、Contrast-0、Dissimility-0、Energy-90、Entropy-0)在两类恶性结节超声图像中没有显著差异(p 值均大于 0.05,见图 5),但在各自良恶结节超声图像中均展现出显著的差异(p值均小于 0.01,见图 5)。为进一步验证上述推断,一方面,计算了甲状腺恶性结节超声图像对应的 6 维 LH 特征向量(分量即为上述 6 个代表特征在所有甲状腺恶性结节超声图像取值的平均值),以及乳腺恶性结节超声图像对应的 6 维 LH 特征向量,两个向量的皮尔森相关系数等于 1。另一方面,将甲状腺和乳腺结节混合超声图像的这 6 个代表特征输入 4 种模型,识别良性结节和恶性结节,二
35、分类 AUC 范围为0.800.85。两个层面的计算结果再次证实了上述 6 个代表特征在挖掘甲状腺癌和乳腺癌共性纹理特征方面的潜力。两类恶性结节不仅存在共性 WPT-GLCM 纹理特征,还存在个性 WPT-GLCM 纹理差异。例如,28 个 LL 特征在两类恶性结节超声图像中的 T检验 p 值最大为 1.763 310-14,说明两类恶性结节超声图像的近似子图存在非常显著的纹理差异。4.5 节甲状腺和乳腺混合超声图像的精准二分类表明,甲状腺结节超声图像的 WPT-GLCM 特征与乳腺结节有很大不同。事实上,在 84 个WPT-GLCM 特征中,只有 3 个特征的 T 检验 p 值大于 0.05
36、。正是由于各类型结节之间既存在共性的纹理特征,又表现出个性的纹理差异,才使得基92 燕山大学学报2024于 WPT-GLCM 的 4 种模型在第 4.6 节的四分类任务中能够取得理想的预测结果,也从侧面解释了WMCM 特征在各种分类任务中表现差的部分原因,即整体细节子图 LHL 可能丢失了垂直细节子图 LH 和水平细节子图 HL 所蕴含的重要分类信息。图 5 6 个 LH 代表特征在各类超声图像中的分布Fig.5 The distribution of 6 LH representative features in various ultrasound images 文献17中用于分类的 5
37、个特征均在甲状腺良恶结节超声图像中展示出显著的差异,但是文中基于 mRMR 算法筛选的特征与其在相应分类图像中是否具有显著差异没有必然联系。例如,在最优 B-XGBoost 对应的 15 维 WPT-GLCM 特征中,有 7 个特征在乳腺良恶结节超声图像中没有显著差异(p0.05),但是它们与其他 8 个具有显著差异的特征一起输入模型却能产生很好的预测结果。四分类问题中 mRMR 筛选的前 10 维 WPT-GLCM 特征虽然在甲状腺和乳腺结节超声图像之间,以及在甲状腺和乳腺恶性结节超声图像之间,均具有非常显著的差异(p0.01),但其中 2 个特征在甲状腺良恶结节超声图像中差异不显著(p0.
38、05),5 个特征在乳腺良恶结节超声图像中差异不显著(p0.05)。以上事实说明,WPT-GLCM 特征的某些组合可能对甲状腺和乳腺结节的分类产生协同或抑制作用,该猜测值得后续进一步研究。最后需要指出,超声散斑虽然会影响图像质量、引起信号失真等,但散斑的变化能够反映温度和运动的信息,散斑跟踪技术已在评估心肌功能领域发挥作用29-30。文献17使用的 2 个特征也来自于高频噪声子图 HH。本文更加重视子图 HH对分类工作带来的不良影响,从而忽略了其潜在的应用价值,后续将对 HH 展开深入研究,多角度、多层面挖掘基于 WPT 的 4 个子图在甲状腺、乳腺结节良恶分类中的贡献。6 结语在良恶结节多种
39、分类任务中,基于 WPT-GLCM 纹理特征的 4 种机器学习模型对于来自两个不同平台的甲状腺和乳腺结节超声图像均表现出良好的分类性能,表明本文提出的方法通用性强、适用面广,有助于医生快速诊断甲状腺和乳腺病变。在超声图像特征挖掘方面,甲状腺和乳腺恶性结节的超声图像的近似子图均存在非常显著的纹理差异,垂直细节子图则蕴含了 6 个共性纹理特征,这一结论可能有助于医生区分第二原发甲状腺癌(乳腺癌)和由原发肿瘤转移而来的病灶。第 1 期安俊达 等 基于超声图像评估甲状腺和乳腺病变的通用计算方法93 参考文献 1 WILD C WEIDERPASS E STEWART B W.World cancer
40、report cancer research for cancer prevention M.Lyon IARC Press 2020.2 CHEN W ZHENG R BAADE P D et al.Cancer statistics in China J.CA A Cancer Journal for Clinicians 2016 66 2 115-132.3 SIEGEL R L MILLER K D JEMAL A.Cancer statistics J.CA A Cancer Journal for Clinicians 2019 69 1 7-34.4 EVERT F V V A
41、NGELA M L TIM I M.Korevaar diagnostic and treatment considerations for thyroid cancer in women of reproductive age and the perinatal period J.Endocrinology and Metabolism Clinics of North America 2022 51 2 403-416.5 姜欢 赵睿 戴绍春.乳腺癌合并甲状腺癌致病因素的研究进展 J.肿瘤防治研究 2021 48 5 530-536.JIANG H ZHAO R DAI S C.Resea
42、rch progress on the pathogenic factors of breast cancer combined with thyroid cancer J.Cancer Research on Prevention and Treatment 2021 48 5 530-536.6 HOANG J K MIDDLETON W D FARJAT A E et al.Interobserver variability of sonographic features used in the American college of radiology thyroid imaging
43、reporting and data system J.American Journal of Roentgenology 2018 211 1 162-167.7 YANASE J TRIANTAPHYLLOU E.A systematic survey of computer-aided diagnosis in medicine past and present developments J.Expert Systems with Applications 2019 138 112821.8 QIAN X PEI J ZHENG H et al.Prospective assessmen
44、t of breast cancer risk from multimodal multiview ultrasound images via clinically applicable deep learning J.Nature Biomedical Engineering 2021 5 6 522-532.9 MA X XI B ZHANG Y et al.A machine learning-based diagnosis of thyroid cancer using thyroid nodules ultrasound images J.Current Bioinformatics
45、 2020 15 4 349-358.10 ZHU Y C ALZOUBI A JASSIM S et al.A generic deep learning framework to classify thyroid and breast lesions in ultrasound images J.Ultrasonics 2021 110 106300.11 MA X ZHANG L.Diagnosis of thyroid nodules based on image enhancement and deep neural networks J.Computational Intellig
46、ence and Neuroscience 2022 2022 5582029.12 HAUGEN B R ALEXANDER E K BIBLE K C et al.2015 American thyroid association management guidelines for adult patients with thyroid nodules and differentiated thyroid cancer the american thyroid association guidelines task force on thyroid nodules and differen
47、tiated thyroid cancer J.Thyroid 2016 26 1 1-133.13 SOLLINI M COZZI L CHITI A et al.Texture analysis and machine learning to characterize suspected thyroid nodules and differentiated thyroid cancer where do we stand J.European Journal of Radiology 2018 99 1-8.14 GOMEZ W PEREIRA W C A INFANTOSI A F C.
48、Analysis of co-occurrence texture statistics as a function of gray-level quantization for classifying breast ultrasound J.IEEE Transactions on Medical Imaging 2012 31 10 1889-1899.15 顾广华 张凤.最优区域与离散小波变换结合的颜色恒常性计算算法 J.燕山大学学报 2014 38 3 226-232.GU G H ZHANG F.Color constancy algorithm combining optimal
49、region and discrete wavelet transform J.Journal of Yanshan University 2014 38 3 226-232.16 TAN J H NG E Y K ACHARYA U R.Study of normal ocular thermogram using textural parameters J.Infrared Physics&Technology 2009 53 120-126.17 ACHARYA U R FAUST O SREE S V et al.ThyroScreen system high resolution u
50、ltrasound thyroid image characterization into benign and malignant classes using novel combination of texture and discrete wavelet transform J.Computer Methods and Programs in Biomedicine 2012 107 2 233-241.18 LAMONT D PARKER L WHITE M et al.Risk of cardiovascular disease measured by carotid intima-