1、经典 YOLO 系列目标检测算法及其在乳腺癌检测中的应用孙歆,王晓燕,刘静,黄贺瑄(山东中医药大学智能与信息工程学院,济南250355)通信作者:王晓燕,E-mail:摘要:目前乳腺癌已取代肺癌成为年发病率最高的癌症,基于深度学习的目标检测技术可对乳腺 X 线、乳腺超声和乳腺核磁共振等非侵入式成像进行自动病变检测,已成为乳腺癌辅助诊断的首选途径.YOLO(youonlylookonce)系列算法是基于深度学习的目标检测算法,经典 YOLO 算法在速度和精准度具有优势,被广泛应用于计算机视觉各领域,最新 YOLO 算法是计算机视觉领域的 SOTA(stateoftheart)模型,如何利用 YO
2、LO 系列算法提高乳腺癌检测速度和准确率,已经成为研究者关注的焦点之一.基于此,本文介绍经典 YOLO 系列算法的原理,梳理经典 YOLO 系列算法在乳腺癌图像检测中的应用现状,并归纳总结现存问题,同时对 YOLO 系列算法在乳腺癌检测的进一步应用进行展望.关键词:目标检测;图像处理;乳腺癌;YOLO引用格式:孙歆,王晓燕,刘静,黄贺瑄.经典 YOLO 系列目标检测算法及其在乳腺癌检测中的应用.计算机系统应用,2023,32(12):5262.http:/www.c-s- YOLO Series Target Detection Algorithms and Their Application
3、 in Breast Cancer DetectionSUNXin,WANGXiao-Yan,LIUJing,HUANGHe-Xuan(CollegeofIntelligenceandInformationEngineering,ShandongUniversityofTraditionalChineseMedicine,Jinan250355,China)Abstract:Atpresent,breastcancer,withthehighestannualincidence,hasreplacedlungcancer,andthetargetdetectiontechnologybased
4、ondeeplearningcanautomaticallydetectlesionsonnon-invasiveimagingsuchasmammographyX-ray,breastultrasound,andbreastmagneticresonanceimaging(MRI),andithasbecomethepreferredwayforadjuvantdiagnosisofbreastcancer.Youonlylookonce(YOLO)seriesalgorithmsareobjectdetectionalgorithmsbasedondeeplearning,andclass
5、icalYOLOalgorithmshavecertainadvantagesinspeedandaccuracyandarewidelyusedincomputervisionfields.ThelatestYOLOalgorithmisthestateoftheart(SOTA)modelinthefieldofcomputervision,andhowtouseYOLOseriesalgorithmstoimprovethespeedandaccuracyofbreastcancerdetectionhasbecomeoneofthefocusofresearchers.Onthisba
6、sis,thisstudyintroducestheprincipleoftheclassicalYOLOseriesalgorithms,sortsouttheapplicationstatusoftheclassicalYOLOseriesalgorithmsinbreastcancerimagedetection,summarizestheexistingproblems,andlooksforwardtothefurtherapplicationoftheYOLOseriesalgorithmsinbreastcancerdetection.Key words:objectdetect
7、ion;imageprocessing;breastcancer;youonlylookonce(YOLO)1引言据世界卫生组织统计,2020 年全球女性乳腺癌新增病例 226.1 万,新超过肺癌新增病例1,其中,中国境内新增乳腺癌病例约 41.6 万,全年乳腺癌死亡病例约计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(12):5262doi:10.15888/ki.csa.009351http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041基金项目:
8、国家自然科学基金(82174528);山东省中医药科技项目(2021M146);山东省研究生教育质量提升计划(SDYKC19147)收稿时间:2023-06-18;修改时间:2023-07-19;采用时间:2023-08-11;csa 在线出版时间:2023-10-25CNKI 网络首发时间:2023-10-2652专论综述SpecialIssue11.7 万2.据全球疾病负担(globalburdenofdisease,GBD)数据库统计,19902019 年间,中国女性乳腺癌发病率近年来一直呈上升趋势3,尽早开展乳腺检查与治疗可有效降低乳腺癌的死亡率4.中国女性乳腺癌筛查与早诊早治指南建议
9、 45 岁以上的妇女定期参加乳腺癌筛查,高风险人群则应适当减小筛查年龄5.乳腺癌筛查时,为减少不必要活检,尽量降低筛查对患者的伤害,首选风险更小的医学成像技术,包括乳腺 X 线成像、乳腺超声成像和乳腺磁共振成像等作为筛查手段.为降低影像科医生工作量,提高筛查效率,减少主观因素造成的漏诊误诊,以人工智能为基础的计算机技术成为影像科医生重要的辅助诊断手段.目标检测技术因其可对乳腺影像中的病患区域进行定位并进行初步分类,辅助专业医师进行查阅和诊断而备受关注.目标检测技术是对目标图片上的各个物体定位并分类的技术6,包括选择目标区域、提取目标特征和分类3 部分.选择目标区域是对目标进行定位,在定位过程中
10、,目标的大部分属性均未知,故需大量多尺度滑动窗口,尽可能覆盖所有可能目标区域;提取目标特征是利用增强特征的抗形变和表达能力的方法进行特征提取,以便对目标进行分类;分类则通过事先准备好的分类器进行7.传统目标检测,如 VJ(ViolaJones)8、HOG(histogramoforientedgradients)9等,以手工设计为主,提取特征能力弱且不适用于复杂背景下的检测10,准确率差强人意.近年来,基于深度学习的目标检测技术发展迅猛,相较于传统目标检测技术,精准度高、速度快且在复杂环境下的鲁棒性高11,非常适合对乳腺癌进行检测.根据是否生成候选区域,可将深度学习目标检测分为二阶段目标检测算
11、法和一阶段目标检测算法:二阶段目标检测算法分为两个阶段,先框定候选区域,再进行检测,常见算法包括 R-CNN、SPPNet、FastR-CNN和 FasterR-CNN 等;一阶段目标检测算法只有检测过程,无需框定候选区域,常见算法包括 YOLO 系列、SSD和 RetinaNet 等.YOLO 算法作为首个且最成功的一阶段目标检测算法,对目标检测的发展至关重要.YOLO系列算法种类繁多,其中 YOLOv1YOLOv5 算法因具有代表性和权威性且应用范围较广被称为经典 YOLO系列算法.通过查阅截至 2023 年 4 月 1 日以来万方数据知识服务平台(Wanfang)、中国期刊全文数据库(C
12、NKI)、WebofScience 数据库和 EngineeringVillage数据库收录的“乳腺”“YOLO”相关 54 篇文献,重点对YOLOv1YOLOv5 算法及其在乳腺癌检测中的应用情况进行梳理,并根据算法特点分为 3 个部分论述.2YOLO 系列算法及其在乳腺癌图像检测的应用2.1 快速的目标检测算法YOLOv1 与 YOLOv22.1.1YOLOv1 算法概述2016 年,“YOLO 之父”Redmon 等人首次提出YOLO 算法12,后被称为 YOLOv1 算法,是 YOLO 系列目标检测算法的基础和重要理论依据.Redmon 等人12摒弃了二阶段目标检测算法利用滑动窗口寻找
13、候选区域的步骤,直接通过一个 24 层的卷积神经网络对整个图像进行检测.首先将图像分成 488488个网格,各网格单元负责监测物体中心落入该网格单元的物体,并预测物体边界框及其对应置信度分数和条件类别概率.一个边界框由横坐标、纵坐标、宽度、高度和置信度这 5 个元素组成,其中横纵坐标用来确定边界框位置,宽度和高度为整幅图片的宽高与边界框宽高的比值,置信度为边界框与真实框的交并比.YOLOv1 卷积神经网络结构简单,仅由 24 个卷积层(convolutionlayer,Conv.layer)以及 2 个全连接层(connectedlayer,Conn.layer)构成网络,结构如图 112所示
14、.YOLOv1 的网络骨架的两个全连接层位于网络骨架的最后,限制了 YOLOv1 图像输入的尺寸.输出为7730 的矩阵即为所得结果,将原图像分为 77 的网格,每个网格对应 30 个参数,其中 10 个参数代表在框中预测的两个框的位置坐标参数和置信度,其余 20 个参数对应所预测 20 个类的概率值,最终保留置信度高的框.YOLOv1 的损失函数如式(1)所示,由位置损失、长宽损失、置信度损失和条件类别概率损失这 5 部分组成:Loss=coordS2i=0Bj=01objij(xi xi)2+(yi yi)2+coordS2i=0Bj=01objij(wi wi)2+(hihi)2+S2i
15、=0Bj=01objij(CiCi)2+coordS2i=0Bj=01noobjij(CiCi)2+S2i=01objijcclasses(pi(c)pi(c)2(1)2023年第32卷第12期http:/www.c-s-计 算 机 系 统 应 用SpecialIssue专论综述53该损失函数对预测框位置(横纵坐标分别对应x 和 y)、预测框规格(长宽分别对应 w 和 h)、预测框所预测的类和除预测框所预测的类以外的其他类(对应 C)及预测概率(对应 p)进行方差求和运算.其中 表示参数,obj 即 object,表示所负责的目标,noobj 即noobject 表示不含所负责目标的其他目标,
16、其中 coord即 coordinate,表示坐标,S2表示网格个数,B 表示对应网格中包含预测框总个数,c 表示目标对应类别.44877112565628281414777777333333333311244831922565121 0241 0241 0244 09630Conv.layer7764-s-2Maxpool layer22-s-2Conv.layer33192Maxpool layer22-s-2Conv.layers11128332561125633512Maxpool layer22-s-2Conv.layers112563351211512331024Maxpool l
17、ayer22-s-2Conv.layers11512331024331024331024-s-2Conv.layers331024331024Conn.layerConn.layer42图 1YOLOv1算法的卷积神经网络结构YOLOv1 与同时代其他算法比最突出优点是速度快,但精准率较低,每个格子仅能预测一个框,所以对小目标及密集目标检测率低.2.1.2YOLOv2 算法概述2017 年,Redmon 等人针对检测精准度、检测速度及可分类数量对 YOLOv1 进行优化得到 YOLOv2算法13,主要改变:(1)将卷积神经网络在每一层的最后都增加了批归一化(batchnormalization
18、,BN)层14,增加目标图像收敛速度,以防过拟合;(2)可输入更高分辨率的图像,进一步匹配硬件环境,提高算法检测能力;(3)在卷积神经网络中引入锚框,并借助 FasterR-CNN方法15,计算坐标偏移量而非直接计算坐标,减少了运算量;(4)将整幅图分成 NN 个网格,以每个网格的左上顶点为基准点进行偏移量计算,确定锚框绝对位置,以预防检测时的不稳定性;(5)锚框比例非手动采取,而是利用 K 均值聚类分析得出 K 种不同比例的锚框进行适应性锚框采取;(6)设计了全新网络骨架 Darknet-19,结构如图 2 所示.416416333332333333333208208104522626131
19、31313131352641282565121 0241 00011104Conv.layer3332-s-1Maxpool layer22-s-2Conv.layer3364-s-1Maxpool layer22-s-2Conv.layer33128-s-11164-s-133128-s-1Maxpool layer22-s-2Conv.layer33256-s-111128-s-133256-s-1Maxpool layer22-s-2Conv.layer33512-s-111256-s-133512-s-1Maxpool layer22-s-2Conv.layers331024-s-11
20、1512-s-1331024-s-1Conv.layer111000-s-122图 2YOLOv2的网络骨架Darknet-19Darknet-19 由 19 个卷积层及 5 个最大池化层(max-poollayer)组成,与 YOLOv1 算法网络骨架相比其主要特点:(1)无全连接层,故对输入图像尺寸无限制;(2)每个卷积层后均进行批归一化处理,整体结构短小精悍;(3)采用全局平均池化进行锚框预测,并增加细粒度特征识别;(4)借鉴了 SSD 算法的多尺度检测方计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第12期54专论综述SpecialIssue法,在其最大值池化
21、层之后设计直通(passthrough)层,可将低分辨率特征图与高分辨率特征图关联后再预测.其损失函数基本与 YOLOv1 相同.YOLOv2 算法通过多尺度训练增强对不同尺度目标的识别程度,在 VOC2007 数据集上进行的 YOLOv1与 YOLOv2 的对比实验表明,后者比前者的mAP 值提高了 15.1%.YOLOv2 算法虽在速度和性能上有突破,对小目标不敏感问题也做了处理,但准确率依然偏低.2.1.3YOLOv1 与 YOLOv2 在乳腺癌检测的应用YOLOv1 和 YOLOv2 算法速度均可达到实时检测速度要求,可被应用于视频和实时检测中,在乳腺癌检测中也有应用.Al-Masni
22、 等人16利用乳腺钼靶筛查的数字数据库(thedigitaldatabaseforscreeningmammography,DDSM)中数据设计一基于 YOLOv1 检测乳腺 X 线图像的计算机辅助系统,第 1 次将乳腺肿块检测与分类合为一体,既可检测图像中乳房肿块位置,又可对肿块的良恶性进行初步分类,这是 YOLO 系列算法在乳腺肿块识别中的初次应用,定位和分类的总体准确率分别为 99.7%和 97%,与传统卷积神经网络相比,该算法使得图像中靠近胸肌周围的肿块更易识别,定位和分类的总体准确率均有提高.同年,Al-Antari 等人17设计了一种检测分割分类乳腺 X 线图像的计算机辅助系统,仅
23、在定位时使用 YOLOv1,在公共数据集 INbreast中实验整体精度为 99.7%,F1 分数(F1score)为 99.24%,在分割时使用全分辨率卷积网络(fullresolutioncon-volutionalnetwork,FrCN),在分类时使用深度卷积神经网络,在相同数据集中总体精度为 97%.Al-Masni等人18在 INbreast 数据集中使用 YOLOv1 算法单独检测乳腺肿块是否存在,再分别用卷积神经网络、ResNet-50网络和 InceptionResNet-V88 网络进行分类,基于 YOLO的检测准确率为 97.27%,F1 分数为 98.02%,比检测和分
24、类均用 YOLOv1 算法时性能确有提高.Baccouche等人19用 YOLOv1 在 413 例私人乳腺 X 线图像数据进行实验,按照正常乳腺、乳腺结构病变、乳腺钙化、乳腺肿块进行分类,分类精度分别为 94%、95%、88%和 94%,召回率分别为 94%、95%、88%和 94%,最大速度为每张 0.62s,在速度上具有一定优势.明显可见,YOLOv1 算法多用于乳腺位置信息检测,在病灶定位中具有一定优势,对病灶分类时多采用其他算法或融合其他算法.在搜索上文所提数据库时并未查找到基于 YOLOv2的乳腺癌图像检测研究结果,推断原因有二:(1)YOLO系列算法更迭快,YOLOv2 尚未取得
25、较好乳腺癌图像相关研究成果即被更优秀的 YOLOv3 及后续算法取代;(2)乳腺癌图像病灶种类繁多,背景复杂,目标受设备与环境影响较大20,YOLOv2 算法的卷积神经网络骨架深度浅且结构简单,易被检测背景误导,导致准确率不高且鲁棒性较差,并不符合乳腺癌图像检测等高精准度分类需求.总体来讲,YOLO前期算法对速度过分侧重,YOLOv1的每秒显示帧数(framepersecond,FPS)达 45Hz,YOLOv2 的 FPS 达 67Hz,它们的轻量化模型的 FPS更高,而保持动作流畅的 FPS 最低是 30Hz,所以在实际应用中会出现速度溢出,即运算速度远超当时实时监测速度,造成不必要浪费,
26、但对于乳腺癌图像检测等应用,为避免造成误诊事故,精准度才是首要要求,YOLOv1 和 YOLOv2 并不非常适合对乳腺癌进行检测.2.2 多尺度的 YOLO 算法YOLOv32.2.1YOLOv3 算法概述YOLOv3 算法由 Redmon 等人21于 2018 年提出,其中基于 Darknet-19 和 ResNet 网络22提出的有 53 个卷积层的卷积神经网络骨架 Darknet-53 最具特色,结构如图 3 所示.同时,为解决对小型目标不敏感的问题,YOLOv3 融合了特征金字塔结构23,利用正向传播和反向传播,进行上下采样,将深层特征与浅层特征相结合,同时保留图像的语义特征与图形特征
27、,能更精准地提供 3 种不同尺度目标的输出选项,分别对应检测的大、中、小型目标.网络过深易出现网络退化现象,为此 Darknet-53引入用于校准的残差层,将相同的输入数据输入上下两个通道,上通道数据保持不变,下通道数据进行卷积计算,最后进行比对再输出,有效防止了梯度爆炸或梯度消失.此外,YOLOv3 算法对检测头也有优化,使用多标签分类的 Logistic 分类器取代 YOLOv2 单标签分类器Softmax,增加了算法的灵活性;此外还采用 LeakyReLU函数作为激活函数,增强整体的特征表达能力;损失函数如式(2)所示,不仅用均方差,而是利用均方差函数对坐标信息和宽高信息进行损失计算,并
28、利用交叉熵函数对置信度和分类信息进行损失计算,最后求和得到最终损失函数.2023年第32卷第12期http:/www.c-s-计 算 机 系 统 应 用SpecialIssue专论综述55416416208208104522613132652Output 1Output 2Output 3333333334164163333264128256512102433Conv.layer3332-s-1Conv.layer3364-s-2Residual layerConv.layer33128-s-2Residual layer2Conv.layer33256-s-2Residual layer8C
29、onv.layer33512-s-2Residual layer8Conv.layer331024-s-2Residual layer4图 3YOLOv3的网络骨架DarkNet-53Loss=coordS2i=0Bj=0Iobjij(xi xji)2+(yi yji)2+coordS2i=0Bj=01objij(wji2+wji2)2+(hji2+hji2)2S2i=0Bj=01objijCjilog(Cji)+(1Cji)log(1Cji)noobjS2i=0Bj=01noobjijCjilog(Cji)+(1Cji)log(1Cji)S2i=0IobjijcclassesPjilog(P
30、ji)+(1Pji)log(1Pji)(2)YOLOv3 损失函数中变量意义与式(1)相同.YOLOv3 算法在保持速度优势的同时,精准度有小幅提高,对小目标物体的识别率也有提升,同时,YOLOv3 算法在应用中较为轻量化,灵活性更好,算法也更易于理解与改进.2.2.2YOLOv3 在乳腺癌检测中的应用YOLOv3 与 YOLOv4 算法可被应用于图像、视频和实时检测中,在乳腺癌图像检测分类应用中多位研究人员提出了创新性算法改进.蒋慧琴等人24提出一种基于 YOLOv3 的乳腺肿块自动检测算法,利用互相关法自动搜索感兴趣区域,筛选标注假阳性区域,在类别损失函数中加入聚焦参数,在 DDSM 和迷
31、你乳腺X 线摄影数据库(minimammographicdatabase,MIAS)公开数据集中实验,结果比原模型的检测精准率提高了 9.62%,并可以降低假阳性率.徐立芳等人25将融合了压缩和激励(squeezeandexcitation,SE)模块的Res2Net 取代 YOLOv3 算法的 Darknet-53,搭建新的下采样模块并构建 Res-DenseNet 网络替换原始模型的残差连接方式网络,结果表明比原始 YOLOv3 算法 mAP提高了 4.56%,作者的实验数据来自专业医生从相关医院数据库选取 20152019 年不同年龄层次、地区和人种的 2011 例原始病例共 13586
32、 张图像.Baccouche等人26选择 YOLOv3 算法对 DDSM、INbreast 和私人数据集的 X 线乳腺图像分别进行检测,并将乳腺 X 线图像进行数据增强和大小调整后重新训练为新的融合模型,结果显示最佳结果对肿块的检测准确率分别为95.7%、98.1%和 98%,对钙化的检测准确率分别为74.4%、71.8%和 73.2%,优于 YOLOv3 原始模型.Aly 等人27对比了 YOLOv1、YOLOv2 和 YOLOv3算法应用于 INbreast 数据集中乳腺 X 线质谱检测的分类结果,发现 YOLOv3 算法结果最优,同时发现在利用 K 均值聚类选取锚框时效果最佳,分类准确率
33、达89.4%,在分别用 ResNet 和 InceptionV3 取代 YOLOv3算法原有多标签 Logistic 分类器时,分类准确率分别提升为 91.0%和 95.5%.王杉等人28收集来自南昌市第三医院 1460 个女性患者的 4 个标准角度的乳腺钼靶X 线摄影图片,针对乳腺钼靶图像中小肿块和互相遮挡肿块漏诊问题,提出一种改进的 YOLOv3 算法,为识别小型肿块加入自下而上的路径,并采用级联和跨层的连接方式,为识别互相遮挡肿块在 Soft-NMS(软非极大值抑制)算法中引入了 DIOU,结果表明新算法在检测小型肿块和互相遮挡肿块时速度与精准度都有提升,mAP 达 96.1%,较 YO
34、LOv3 提高 1.8%.综上,YOLOv3 乳腺病灶定位时仍较准确,还可准确对乳腺病灶进行分类,在处理小型的病灶以及重叠病灶具有优势.总体来说,在对乳腺癌检测中 YOLOv3算法虽优于 YOLO 系列初期算法,但增强图像数据、更改分类器、增加新模块后结果更好,检测准确率仍有待提升.计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第12期56专论综述SpecialIssue2.3 综合性目标检测算法YOLOv4 和 YOLOv52.3.1YOLOv4 算法概述Bochkovskiy 等人29于 2020 年提出 YOLOv4 算法,采用基于 Darknet-53 和 C
35、SPNet30改进的 CSPDarknet-53网络骨架,并得到“YOLO 之父”Redmon 的认可,主要改进包括:(1)对输入数据利用马赛克数据增强、自对抗训练等技术进行数据增强,增加了跨阶段部分(crossstagepartial,CSP)模块,并将 ReLU 激活函数替换为Mish 激活函数;(2)除了特征金字塔结构,还增加一个自下而上的反向金字塔结构,称之为双向融合结构31,增大感受野的同时还可增强网络骨架的表征能力,进一步提高算法的特征提取能力.YOLOv4 算法计算位置损失时使用 CIOU 损失函数,不仅考虑两点间距离,还考虑长宽比和交并比重叠面积,因此更加精密准确.此外,YOL
36、Ov4 算法将衰减学习率替换为余弦学习率,最优化损失函数结果.具体如式(3)所示:Loss=1IOU(A,B)+2(Actr,Bctr)c2+.v(3)其中,IOU(A,B)为预测框 A 与真实框 B 的交并比,详情见图 4,表示两点间的欧氏距离,Actr和 Bctr表示A 和 B 的中心点,c 表示 A 与 B 最小外接矩形对角线长度,v 和 含义分别见式(4)和式(5).v=42(arctanwgthgtarctanwh)2(4)其中,wgt和 hgt分别表示真实框的宽和高,w 和 h 表示预测框的宽和高.=v(1IOU(A,B)+v(5)YOLOv4 的网络骨架更深更复杂,检测颈和检测头
37、应用的新技术更多、损失函数也更精细,速度与精度也更优.YOLOv4 算法整体性能优于 YOLOv3 算法,小目标检测的实验结果也优于 YOLOv3,对不同尺度的目标识别率也有进步.2.3.2YOLOv5 算法概述以 YOLOv4 算法为蓝本的 YOLOv5 算法也发表于 2020 年,主要优化:(1)采用马赛克增强技术进行数据增强;(2)为统一图像大小进行图像缩放时,采用计算最小填充方式减少计算量,提高计算速度;(3)在网络骨架中增加 Focus(聚焦)模块,对特征图像进行分堆重组构建新的特征图,在特征图像损失较小时即可完成采样,加入快速空间金字塔池化(spatialpyramidpoolin
38、g-fast,SPPF)模块,继承 YOLOv4 的 CSP 模块,并将其应用到包括网络骨架在内的多个结构中,加强网络的整体特征融合能力.此外,YOLOv5 算法的损失函数将 CIOU 损失更改为如式(6)所示的 GIOU 损失,可减小预测值与真实值间差距.LossGIOU=1IOU(A,B)+|CAB|C(6)其中,如图 4 所示 A 与 B 分别代表预测框和真实框,C 代表 A 与 B 的最小共存框,C 与阴影部分的比值即为损失函数的后半部分|CAB|/C,同时使用非极大值抑制(non-maximumsuppression,NMS)筛选生成的多个目标框时,剔除低于设定 IOU 阈值与置信度
39、阈值的预测框及重复预测框,保留唯一最优预测框.ABC图 4预测框与真实框的交并比YOLOv5 综合性能较强,比 YOLOv4 更加灵活,比 YOLOv3 鲁棒性更强,且有适应不同场景实际应用的多个子版本,代码由 UltralyticsLLC 公司提出,并持续更新和维护.2.3.3YOLOv4 和 YOLOv5 算法在乳腺癌图像上的应用YOLOv4 算法本身性能较优,兼之速度较快,在乳腺癌图像检测领域应用较多.Hamed 等人32提出一个基于 YOLOv4 算法的计算机辅助检测系统,将 INbreast数据集乳腺 X 图像分为完整路径与裁剪后路径两个路径,用以二次测试检测的正确性,算法定位准确率
40、为98%,分类准确率为 95%,该算法还克服了需将乳腺X 线图像调整为更小尺寸方能适应卷积神经网络进行癌症定位的问题.王杉等人33将递归特征金字塔作为特征融合模块,利用深度可分离卷积替代 YOLOv4 算法中的普通卷积,与 YOLOv4 原算法在乳腺 X 线图像私人数据集上进行对比试验,改进后的算法 mAP 为95.48%,比原算法提升了 1.38%,每张图像检测时长为0.031s,比原算法缩短 0.012s.Kim 等人34为解决高分2023年第32卷第12期http:/www.c-s-计 算 机 系 统 应 用SpecialIssue专论综述57辨率图像与低性能设备不匹配导致的准确率偏低问
41、题,通过对图像通道进行拓展同时对视觉模式进行标准化对 YOLOv4 进行改进,用以检测超声通道下的乳腺肿瘤,作者合并了两个小型乳腺超声数据集得到了 1080张乳腺超声图像数据进行实验,在相同条件下用改进算法与原始 YOLOv4、R-CNN、VGG、AlexNet 和GoogLeNet 这 5 种算法进行对比试验,其中改进算法准确率最高,达 94.9%,YOLOv4 原算法次之,达 89.4%,说明 YOLOv4 比其他几种目标检测算法更适用于乳腺超声图像检测.YOLOv4 算法在乳腺 X 线图像检测中具有较好适应性,在调整图像尺寸和更换算法模块等问题进行处理能进一步提升算法性能.YOLOv4
42、在乳腺超声检测中也优于大部分算法,进行适当改进后检测性能更有提高,存在一定改进空间.YOLOv5 被应用于包括乳腺癌检测的多个领域.Su 等人35基于 YOLOv5 算法和 LOGO 架构设计了一款目标检测算法 YOLO-LOGO,对 CBIS-DDSM 和INBreast 数据集中乳腺 X 线图像进行乳腺癌检测和分割,该算法先采用 YOLOv5 算法定位并裁剪乳腺 X 线图像中的肿块,再用修改 LOGO 架构分别在全局和局部转换器上训练整个图像并裁剪图像,最后二者合并形成最终算法,真阳性率达 95.7%,mAP 为 65.0%.Zhang 等人36利用 YOLOv5 算法开发了多中心全容积乳
43、腺超声图像数据算法,收集 20162020 年来自 7 家医院 741 例全容积乳腺超声检查病例的 2538 张图像,用马赛克数据增强技术和混合数据增强技术进行图像处理,再采用加权框融合(weightedboxesfusion,WBF)37进行模型融合,增加变压器编码器模块,并用3DResNet38检测、验证和比较内外部图像数据,该算法对所有病变都具有较高的敏感性,其中内部和外部验证集的整体准确率分别为 78.1%和 71.2%,且检出率随着乳腺影像报告和数据系统(BI-RADS,breastimagingreportinganddatasystem)等级的提高而提高.李珊珊等人39基于 YO
44、LOv5 算法提出 YOLOv5-EA算法,添加更高效的注意力机制,引入非对称卷积,并使用 OneCycle 学习率调整策略改进 CBIS-DDSM数据集乳腺 X 线图像数据样本少、肿块类别差异不明显、乳腺肿块背景复杂和组织对比度低等特征导致的检测准确率低的问题,检测乳腺 X 线的良、恶性肿块及钙化灶的准确率分别达到了 93.0%,88.4%和 88.1%,并用改进算法与 Faster-RCNN、SSD、YOLOv3、YOLOv3-Tiny、YOLOv4 和 YOLOv5 进行对比实验,其中 YOLOv5-EA 的 mAP 最高,达 89.8%.Meng 等人40针对乳腺动态增强磁共振图像对乳
45、腺癌进行检测分类,收集了 20172020 年间 310 例患者的乳腺磁共振图像,并对 YOLOv5s,YOLOv5m,YOLOv5l 和YOLOv5x 这 4 个 YOLOv5 子算法进行对比实验,发现 YOLOv5s 的 mAP 最高,达 89.4%,召回率最高,达91.65%,检测速度最快,每张 1.1ms,具有更高的临床应用价值.综上,YOLOv5 应用于乳腺 X 线、乳腺超声和乳腺 MRI 这 3 种常规乳腺图像检测中,速度和精准度均占优,综合性较强,适合多种乳腺图像的检测.YOLOv5的 4 个子算法中 YOLOv5s 表现最佳,比 YOLOv5 原始算法更优.在算法改进方面,除改
46、变数据增强方式和改进或增加算法模块外,还采用融合框架对算法进行融合,调整学习率等方法,以解决乳腺图像质量差和乳腺病灶观察难等问题.与 YOLOv4 相比,YOLOv5 更加灵活,改进成本低,更适合多种复杂环境的多种乳腺图像综合检测.2.4 YOLO 系列其他算法及应用近两年 YOLO 系列算法发展迅猛,YOLOX41、YOLOR42、PP-YOLO 系列4345、YOLOv646、YOLOv747和 YOLOv8 均为其中佼佼者.YOLOX 算法最鲜明标志是采用解耦头结构,将分类和定位两者放到两个分支进行运算,一定程度上提升了目标检测任务的精度;YOLOR 算法构建了一个多任务网络,从不同角度
47、处理图像,并注重隐式知识学习,在速度与精度上都有较大提升;PP-YOLOv1 算法和 PP-YOLOv2算法是在 YOLOv3 的基础上优化而得,可在计算量与模型参数几乎不变的情况最大化提升精度;PP-YOLOE算法则意味着更轻量化且准确率更高,可进一步满足工业生产需求;YOLOv6 算法加入了 RepVGG 结构48,并使用 SIOU 损失函数49,在测试数据集上表现良好;YOLOv7 算法在 YOLOv5 算法的基础上加入了 E-ELEN结构50,进一步降低参数量及计算量,并提高了运算速度与精度;YOLOv8 算法是最新 YOLO 算法,是目前的 SOTA 算法,采用解耦头结构并使用基于
48、YOLOv5最新版本中 CBS 模块(又称 C3 模块,由卷积层、BN层及激活函数组成)和 ELEN 模块设计的 C2F 模块(由两个 CBS 模块、Split 层以及 Bottleneck 模块组组成),如图 5 所示.计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第12期58专论综述SpecialIssueCBSSplitlayerBottleneckmodulesCBSmodulemodule图 5C2F 模块示意图图 5 中 CBS 模块的卷积核为 33 步长为 1,Split层由 Transformer51修改而得,一个 Bottleneck 模块中的卷积核
49、为 11,步长为 1.YOLOv8 算法目前有适合不同应用场景的 5 个版本.因 YOLOv5 以后的其他算法推出时间短,目前应用较少,虽在自动驾驶、农作物检测、卫星遥感监测、航空航拍识别、人脸动作识别等视觉领域已有涉猎,但在乳腺癌检测中的应用尚待开展.3总结与展望随着经典 YOLO 算法的发展,其系列算法性能也在不断提升.经典 YOLO 系列算法在运算速度方面一直保持较高水平.初期算法 YOLOv1 与 YOLOv2 缺点较多,准确率较低的同时对小目标及并列目标检测效果差,在对乳腺癌图像进行检测时会漏检小型病灶,如钙化点等.YOLOv3 准确率提升,也针对检测小目标效果差这一问题进行处理,但
50、结果提升并不明显,其结构相比 YOLOv4 与 YOLOv5 更轻量化,较为贴合未来算法发展方向.YOLOv4 与 YOLOv5 算法检测准确率高,鲁棒性高,增加了多尺度以应对小目标检测问题,较为适合检测乳腺癌图像.如表 1 所示52,53.以文献 33以及文献 54中 YOLOv3、YOLOv4、改进的 YOLOv4 和 YOLOv5 的乳腺和钙化病灶定位分类图可以看出在利用 YOLO 系列原始算法对乳腺癌病灶检测分类过程中,除需用优秀数据集进行算法模型训练,还需从数据预处理、解耦头、网络骨架、损失函数、激活函数、融合增加模块这 6 方面对算法进行针对性改进以得到适合检测乳腺图像模型.对乳腺