收藏 分销(赏)

基于多实例学习及阈值伪标签提取的CT影像颅内出血分割.pdf

上传人:自信****多点 文档编号:2414622 上传时间:2024-05-29 格式:PDF 页数:10 大小:5.39MB
下载 相关 举报
基于多实例学习及阈值伪标签提取的CT影像颅内出血分割.pdf_第1页
第1页 / 共10页
基于多实例学习及阈值伪标签提取的CT影像颅内出血分割.pdf_第2页
第2页 / 共10页
基于多实例学习及阈值伪标签提取的CT影像颅内出血分割.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Chinese Journal of Biomedical Engineering2023年12 月December2023中医国生报程学学物No.6Vol.4242卷6 期基于多实例学习及阈值伪标签提取的CT影像颅内出血分割张童禹李恩慧李振宇崔鹏程张唯唯*(中国医学科学院基础医学研究所,北京协和医学院基础学院,北京100005)摘要:颅内出血由颅内血管破裂引起,出血体积对治疗决策和预后分析具有重要的临床意义,而基于CT影像的血肿分割是体积测量的基础。全监督方法依赖于人工勾画的标签,十分耗时和繁琐,现有弱监督分割方法的鲁棒性差,容易受伪影干扰。为此,本研究提出了基于多实例学习的弱监督颅内出血分

2、割网络MIL-ICH,由双分支结构组成。首先,由多实例学习解码器生成热图定位出血区域;然后,在热图基础上使用CT值阈值和像素自适应优化模块提取并优化伪标签,训练分割解码器;最后,两个分支同时训练,提高训练效率并且利用多分支协同作用进一步提升分割性能。在来自RSNA颅内出血数据集的2 0 0 例CT扫描上的测试结果表明,MIL-ICH网络的Dice相似性系数和体积相似度分别达到了0.8 2 2 和0.8 96,本网络测量的出血量与实际出血量的相关性优于临床常用的多田公式估测法。所提出的方法能够提高颅内出血弱监督分割性能,有助于为临床提供出血体积测量和预后评价的依据。关键词:颅内出血;CT;弱监督

3、分割;多实例学习;阈值中图分类号:R318文献标志码:A文章编号:0 2 58-8 0 2 1(2 0 2 3)0 6-0 6 7 7-10Segmentation of Intracranial Hemorrhage in CT Images Based on Multi-InstanceLearning and Thresholding Pseudo-Labels ExtractionZhang TongyuLi EnhuiLi ZhenyuCui PengchengZhangWeiwei(Institute of Basic Medical Sciences,Chinese Academ

4、y of Medical Sciences,School of Basic Medicine,Peking Union Medical College,Beijing 100005,China)Abstract:Intracranial hemorrhage is the bleeding caused by the rupture of intracranial blood vessels,and thevolume of the hematoma is clinically important for treatment decision and prognosis analysis.Th

5、e segmentationof the hematoma based on CT images is the basis of the volume measurement.Fully supervised methods rely onmanually outlined labels,which are time-consuming and laborious,while existing weakly supervisedsegmentation methods have poor robustness and are prone to be affected by artifacts.

6、To this end,this studyproposed MIL-ICH,a multi-instance learning based weakly supervised network for intracranial hemorrhagesegmentation.The network is composed of a two-branch structure.First,the multi-instance learning decodergenerated heatmap to locate the hemorrhage area.Then,based on the heatma

7、p,the pseudo-labels wereextracted and optimized by CT value thresholding and pixel-adaptive refinement module to train the segmentationdecoder.Finally,the two branches were trained simultaneously to improve training efficiency and leverage themulti-branch collaboration to further improve segmentatio

8、n performance.The test results on 200 CT scans fromthe RSNA intracranial hemorrhage dataset showed that the Dice similarity coefficient and volume similarity ofMIL-ICH reached 0.822 and 0.896,respectively.The correlation of the hematoma volume measured by thisnetwork with the actual hematoma volume

9、is better than the ABC/2 estimation method commonly used in clinicalpractice.In conclusion,the method proposed in this work can improve the performance of weakly supervisedsegmentation of intracranial hemorrhage and benefit the volume measurement and prognostic evaluation forclinical purposes.doi:10

10、.3969/j.issn.0258-8021.2023.06.005收稿日期:2 0 2 3-0 4-2 8,录用日期:2 0 2 3-0 6-2 1*通信作者(Corresponding author),E-ma i l:w e i w e i.z h a n g i b ms.p u mc.e d u.c n中67842卷生医国程报学学物Keywords:intracranialhemorrhage;CT;weaklysupervisedsegmentation;multi-instancelearning;thresholding引言颅内出血(intracranial hemorrhag

11、e,ICH)是指颅内血管破裂所引起的脑实质或周围脑膜间隙内的出血,全球ICH发病率约为2 4.6/10 万人年1,其病因包括高血压等原发性因素或动脉瘤、外伤等继发性原因2 。头部CT平扫由于其成像快速、对出血敏感度高的特点被广泛应用于颅内出血的早期诊断,急性出血在影像上表现为CT值位于40,100区间(单位:Hounsfield,H U)的高密度影3。出血的体积对患者的治疗决策和预后评价具有重要意义4,例如,出血量大于40 mL是外科手术的关键指征5。目前临床上采用多田公式(ABC/2)法将出血统一假设为椭球形估测体积,但该方法对于形状不规则或分叶型血肿的误差较大6 。准确计算出血量需要在CT

12、影像上进行血肿分割,但由医生进行手动勾画则非常耗时。因此,本研究旨在基于深度学习方法实现快速和自动化的颅内出血分割。早期研究使用阈值法7 、FuzzyC-Means(8、区域生长9 等图像处理算法实现颅内出血分割,但出血形状不规则、边缘处灰度对比不明显,传统算法无法很好地辩别真正的出血与其他高密度体素导致的假阳性7 。随着深度学习方法在医学图像分割方面的广泛应用10-1,有研究将卷积神经网络(c o n v o l u t i o n a l n e u r a l n e t w o r k,CNN)应用于颅内出血分割。例如,Patel 等12 和Zhao等13 分别基于U-Net14和nn

13、U-Net15开发了血肿自动分割算法,取得了接近专家人工标注的性能。Arab等4 和Kyung等16 分别提出了基于深监督训练和迁移学习的改进U-Net,改善了网络的分割性能和鲁棒性。该领域的以往研究集中在全监督分割算法上,依赖于专家手动勾画的体素水平标签,非常耗时和繁。弱监督语义分割(weakly-supervised semanticsegmentation,W SSS)算法无需依赖手动标签,仅需图像的类别标签训练,显著减少了对人工标注的依赖。现有方法主要是基于训练分类网络生成的类激活图(class activation mapping,CA M)17 确定出血的位置和粗略轮廓,然后经过全

14、连接密集条件随机场(fully connected dense conditional random fields,DenseCRF)等方法提取和优化伪标签(pseudo-label)再训练分割网络。该方法存在一些局限性:首先,CAM反映了受分类网络关注程度最高的区域18 ,伪标签容易缺失部分出血体素,导致假阴性,也可能关注到疑似出血的其他高密度区域;其次,伪标签提取与分割网络训练相互独立,这种级联训练过程增加了算法的复杂度,训练效率低。图像分割的本质是实现像素水平的分类,在本研究的背景中则对应CT扫描中每个体素是否属于颅内出血。因此还有研究实现了基于多实例学习(mu l t i p l e

15、i n s t a n c e l e a r n i n g,M IL)的弱监督分割算法19-2 1。该方法的思路是将每个体素作为一个实例,将图像整体定义为一个“包(bag)”,通过建立体素特征与bag水平标签的映射关系,计算每个体素属于分割目标的概率,从而产生热图(heatmap)。MIL热图相比CAM能够减少伪标签的假阴性,但也容易导致假阳性增多,因此,真正发挥MIL热图的高敏感度优势并提高分割精度,还需对热图提取的血肿轮廓边界进行优化。除上述问题外,现有算法的共有问题是对伪影的抑制能力较差。头部CT平扫较大的扫描层厚造成在邻近骨位置容易出现部分容积平均效应(partial volume

16、 averaging effect,PVAE)2。此外,扫描设备缺少预硬化步骤时也会产生杯状伪影(c u p p i n g a r t i f a c t)【7】,上述因素均会导致邻近颅骨区域的脑实质的CT值升高(见图1),与出血的密度和形态类似。这些伪影易被分割算法误识别为出血,如何增强算法对假阳性的抑制能力是提高分割精度的关键。综上,为了解决现有弱监督分割算法的问题,提高颅内出血分割的性能,本研究提出了基于多实(a)(b)图1是否存在伪影图像的对比(箭头所指为存在明显伪影的区域)。(a)存在伪影的图像;(b)正常图像Fig.1Comparison of the images with a

17、nd withoutartifacts(The arrows point to the area with significantartifacts).(a)I m a g e s w it h a r t if a c t s;(b)No r m a limages679张童禹,等:基于多实例学习及阈值伪标签提取的CT影像颅内出血分割6期例学习的弱监督颅内出血分割网络(multi-instancelearning-basedweakly-supervisedintracranialhemorrhage segmentation network,M IL-ICH),针对伪影干扰的问题,相比现有

18、的弱监督分割算法进行了多项改进设计,有效增强了算法对伪影的抑制能力和鲁棒性,主要贡献包括:1提出了基于MIL生成多尺度融合热图的方法,相比CAM具有更高的敏感性,并减少了伪影干扰;2)基于阈值和像素自适应优化(pixel-adaptiverefinement,PAR)模块提取并优化了伪标签,有效抑制了假阳性;3)采用了双分支同时训练方法,提高了训练效率,利用多分支协同作用提升了网络的分割性能。1材料和方法1.1实验数据1.1.1数据来源所使用的数据来自北美放射学会(RadiologicalSociety of North America,RSNA)公开的2 0 19 RSNA颅内出血挑战赛数据

19、集【2 3,该数据集包含了从斯坦福大学、圣保罗联邦大学和托马斯杰斐逊大学医院采集的多中心CT扫描。原始数据为512 像素512像素的2 D切片图像,并经过了匿名化处理,删除了患者信息以及具体的扫描参数。首先使用dcm2nix工具(https:/ 0 0例不含颅内出血的阴性扫描。实验数据的分布见表1,内出血共包含脑实质出血(i n t r a p a r e n c h y ma l,IPH)、脑室出血(intraventricular,IVH)、蛛网膜下腔出血(subarachnoid,SA H)、硬膜外出血(epidural,ED H)和硬膜下出血(subdural,SDH)等5种亚型,一例

20、CT扫描中可能同时存在多表1数据分布Tab.1Data distribution亚型IPHIVHSAHSDHEDH训练与验证集68140542144028测试集1378188876个亚型的出血,因此各亚型相加大于样本总数。1.1.2图像预处理为了减少颅骨及其他颅内非脑组织对出血分割的影响,首先对CT扫描进行了去骨(包括阈值、连通域检测等步骤)并设置为脑窗(窗位50 HU,窗宽10 0 HU)。其次,统一裁剪至32 0 38 432 体素,去除余区域并减少计算资源占用,最后将图像灰度值归一化至0,1 区间。预处理过程基于MatlabR2019a与Python3.8.5实现。1.2MIL-ICH网

21、络结构MIL-ICH网络具有双分支结构(见图2),网络中的共享编码器和MIL解码器构成了热图生成分支,分割分支则由共享编码器和分割解码器组成。编码器共有5层,逐层提取影像特征。然后,结合阈值和PAR模块从热图中提取并优化伪标签,作为分割分支的监督信息。该网络的两个分支同时训练,在测试推理阶段仅需使用分割分支。1.2.1热图生成MIL解码器在编码器输出的特征图基础上计算每个体素存在出血的概率,即生成热图。热图生成分支的训练同时使用了有/无出血的扫描,由于部分阴性扫描中同样存在伪影,通过构建二分类的学习过程,能够增强热图对伪影与真正出血的辨别能力。热图对出血的定位并非仅依赖CT值,还会根据图像语义

22、特征综合判断。为了适应不同大小的出血,更加准确地定位出血区域,减少伪影干扰,MIL解码器还融合了具有不同感受野的多尺度热图。首先,分别在原图1/4、1/8、1/16 这3个尺度上经过卷积、上采样和Sigmoid激活函数,生成归一化后的热图。然后,采用自适应加权的方式进行多尺度融合,在网络训练过程中自适应修改各尺度的权重。MIL解码器基于CT扫描水平上(scan-level)是否存在出血的二分类任务训练,因此需要将全部体素的出血概率值融合映射为一个全局预测值。按照多实例学习的定义,将体素作为实例,一例CT扫描作为一个包(bag),当至少有一个体素存在出血时,该扫描即存在颅内出血,对应最大池化(m

23、ax-pooling)计算。然而,如果使用最大池化,热图仅能关注到出血概率最高的少部分体素,因此使用广义平均池化(generalized mean pooling,G M P)2 4 完成体素水平预测值到扫描水平预测标签的映射,从而综合考虑全局体素,提高对热图峰值周围区域内出血的敏感性,使高响应区域尽可能覆盖全部出血。680中生42卷医国报学程学物跳跃连接分割解码器PAR模块DicePAClossdilation=1SoftmaxPAC分割伪标签dilation=24共享编码器PAR模块协同训练阅值伪标签提取编码器层MIL解码器FFA模块(Conv+IN+ReLU+Maxpool)X2W3Ma

24、xPool分割解码器层W2GeneralizedAvgPoolUpsample+Conv+IN+ReLUMean PoolingConvW1MIL解码器层SigmoidBCElossConv+Upsample+Sigmoid多尺度融合结构MaxPool多尺度融合热图分类标签AvgPoolFFA模块0/1图2基于多实例学习的弱监督颅内出血分割网络结构(FFA:特征反馈注意力模块;PAR:像素自适应优化模块)Fig.2The structure of the proposed multi-instance learning based weakly supervised intracranial

25、hemorrhagesegmentation network(FFA:feature feedback attention module;PAR:pixel-adaptive refinement module)对于输人图像x,G M P将热图中每个体素的出血概率(i,j,k)映射为扫描水平是否存在出血的预测标签(式1)。当r8时,GMP等价于最大池化,MIL-ICH冈网络中r设置为4。Z(i,j,k)(1)1.2.2闵值伪标签提取将热图中出血概率值 0.5且图像CT值位于40,10 0 H U 3 的体素作为初始伪标签。热图来源于编码器提取的特征图,对出血定位相对准确,但无法确定出血边界,为

26、了减少假阴性,其高响应区域会大于实际出血轮廓。而阈值分割能够相对准确地提取边界,但无法排除PVAE导致的假阳性体素。单独使用热图或阈值均不能准确分割出血,因此采用了二者的结合。在出血与伪影相邻近时,初始伪标签仍会存在较多假阳性,因此还需要进一步优化。1.2.3自适应伪标签优化以往的弱监督分割方法使用DenseCRF优化伪标签,采用级联训练方式,伪标签提取和分割训练相互独立,限制了训练效率。针对该问题,本研究使用PAR模块2 5 代替了CRF,提高了计算效率,同时也保证了网络的两个分支可以同时训练。PAR模块主要由扩张率(dilationrate)=1,2,4,8,16,2 4的一组不同尺寸的像

27、素自适应卷积(pixel-adaptiveconvolution,PA C)组成,PAC能够根据局部特征自适应调整卷积核权重。加人该模块目的是减少初始伪标签中的假阳性,抑制伪影干扰,在本网络中具有重要作用。PAR模块结合不同距离邻域体素间的相似性修正体素出血概率值,根据血肿边缘的灰度梯度变化优化初始伪标签的轮廓边界。最后,当热图中体素概率值大于0.5时,即认为该体素存在出血,得到二值化的分割伪标签。对优化后的伪标签还采用了一个卷积核尺寸为55的平均池化层起到平滑的作用。1.2.4双分支协同训练MIL-ICH网络相比现有弱监督方法的一个显著优势是在一个网络中同时整合了热图生成、伪标签提取和分割网

28、络训练等3个步骤,提高了算法训练效率。分割解码器由多级的上采样和卷积等操作组成,在每一级还通过跳跃连接与编码器的特征图相融合,综合浅层特征的细节信息和高阶语义信息。网络的两个分支同时训练可以起到协同作用:MIL解码器为分割解码器提供了监督伪标签,同时分割解码器通过梯度反向传播优化共享的编码器,进而在训练过程中可以不断改善热图和伪标签质量。由于分割训练和PAR模块的主要作用都是减少分割标签的假阳性,网络会倾向于仅提高精确率,这种不平衡的情况会导致对出血体积的低估,无法有效提升整体的分割性能。因此,为了在MIL-ICH网络中平衡召回率与精确率,在两个分支间还增加了特征反馈注意力(feature f

29、eedbackattentionmodule,FFA)模块。该模块在CBAM空间注意力机制2 6 的基础上进行了改进,融合了两个分支的信息,来自分割解码器和编码器的同尺度特征图分别经过最大池化和平均池化操作后拼接为4通道特征图,再经过卷积层和Sigmoid激活函数后得到归一681张童禹,等:基于多实例学习及阈值伪标签提取的CT影像颅内出血分割6期化注意力权重对输入特征图进行空间加权,还加入了残差结构以防止梯度消失。加入FFA模块后,增加了分割解码器到MIL解码器的特征传递,热图生成分支的损失(loss)也可以作用于分割解码器,有助于提高分割分支对出血的敏感度,减少假阴性,使体积测量更加准确。1

30、.3实验设置将实验数据随机划分为训练集(18 0 0 例)和验证集(2 0 0 例),在2 0 0 例独立测试集上评价模型结果。选用自适应矩估计(adaptivemomentestimation,Adam)作为网络训练的优化器,初始学习率设置为110-4,迭代训练40 轮次,并采用了数据增强(dataaugmentation)。所提出的网络基于Pytorchv1.8.0框架实现,实验环境为NVIDIATeslaA100GPU。热图生成分支基于颅内出血检测的二分类任务训练,采用二元交叉熵(binarycross entropyloss,BCE)作为损失函数。分割分支仅使用存在出血的阳性扫描训练,

31、采用Dice相似性系数(Dice similaritycoefficient,DSC)损失。DSC反映了网络预测分割标签点集S与人工勾画标签点集R的重叠程度,Dice损失的定义为1-DSC。总损失函数Liotal=LBcE+LDiceOLgcE=yln()+(1-y)ln(1-)(2)2I SnRILpie=1-DSC=1-(3)I SI+I RI1.4评价指标分割性能的评价共使用了4项指标,除DSC外,还分别计算了召回率(Recall)、精确率(Pr e c i s i o n)和体积相似度(volume similarity,VS)。相关指标的计算公式如下,式中TP、T N、FP、FN分别

32、表示真阳性、真阴性、假阳性、假阴性体素数量。TPRecall=(4)TP+FNTPPrecision(5)TP+FPFN-FPIVS=1(6)2TP+FP+FN在对算法的评价中,使用上述指标分别验证了MIL-ICH网络、其他对比方法和消融实验中不同伪标签或网络结构在测试集中的分割性能,并以测试集整体的平均值与标准差作为最终的评价结果。2结果2.1与其他方法的比较为了比较不同方法提取的伪标签,首先对比了3种基于CAM的方法,分别是原始CAM27、G r a d-CAM28以及Liu等17 提出的多尺度CAM。在采用与MIL-ICH网络中相同的初始伪标签提取方法后,使用DenseCRF对伪标签进行

33、了优化。其次,与FCN-MIL29和DWS-MIL19两种MIL方法的伪标签(采用相同的热图结合阈值的方法提取)进行了比较,两种网络均采用全卷积解码器生成热图,后者在前者基础上增加了深监督损失。为了进行公平的比较,对于MIL-ICH网络分别计算了初始伪标签和经PAR模块优化后的伪标签,其他方法伪标签在比较时也经过了平滑。表2 展示了不同方法伪标签的分割结果,3种CAM方法中,原始CAM和多尺度CAM伪标签的DSC值较低,Grad-CAM伪标签的DSC最高,达到了0.721。尽管3种CAM伪标签都具有很高的精确率(0.8),但共有问题是召回率较低,即假阴性体素偏多,限制了整体DSC和VS的提高。

34、而两种基于MIL的对比方法的优势是召回率很高,但由于缺乏对假阳性的抑制,损失了精确率,DSC仅达到了0.644和0.7 2 2。MIL-ICH网络初始伪标签的DSC达到了0.7 6 8,优于其他对比方法,但其精确率低于CAM伪标签,这是由于初始热图为了提高对出血的敏感度,提取的初始出血轮廓会偏大,尽管采用了阈值,但仍存在一些假阳性,因此需要与PAR模块相结合。经过PAR模块优化后,有效减少了假阳性,精确率提升了约10%。基于热图、阈值与PAR模块的伪标签提取和优化过程保证了伪标签在减少假阴性的同时具有与CAM伪标签相一致的精确率,DSC进一步提高至0.8 0 9,显著优于其他伪标签(P0.00

35、1)。在现有弱监督分割框架中,还会使用伪标签再次训练U-Net等分割网络,表2 还对比了MIL-ICH网络的最终分割结果与其他方法的分割网络输出。尽管几种伪标签经过分割训练后均有不同程度的提升,但最终分割性能仍主要取决于伪标签质量。级联训练方式的提升作用有限,特别是当伪标签的DSC已经较优时,训练分割网络后仅能产生微弱的提升,例如Grad-CAM与DWS-MIL。M IL-ICH 网络不仅具有最优的伪标签,并且经过双分支协同训练还能进一步提升分割性能,网络最终输出的DSC和体积相似度分别达到了0.8 2 2 和0.8 96,相比优化后的伪标签分别提升了1.3%和1.5%,显著优于其他方法(P0

36、.001),在召回率和精确率之间更加平衡。相比其他方法,MIL-ICH网络的DSC指标的分中68242卷生国医报学程学物表2与其他方法的比较(均值标准差)Tab.2The comparison with other methods(mean std)伪标签分割网络输出类别方法DSCRecallPrecisionVSDSCRecallPrecisionVSCAM(270.5940.1760.4990.1620.8440.2450.6780.1660.621 0.1770.5250.1600.8580.2360.6950.161CAM多尺度CAM170.6060.1750.5130.1610.84

37、70.2430.6870.1610.641 0.1640.5380.1430.8710.2250.7100.143Grad-CAM28 0.7210.1920.6730.1800.8460.2400.7910.1670.7300.1970.6870.1760.8440.2460.803 0.166FCN-MIL 290.644 0.2460.9420.0730.5450.2700.6860.2650.6510.2470.935 0.0700.5590.2760.6980.269DWS-MIL190.7220.1870.8910.1120.6500.2340.7970.1960.7340.178

38、0.8900.1040.667 0.2280.8100.189MILMIL-ICH初始伪标签0.7680.1730.8450.1550.7480.2160.8550.157MIL-ICH优化伪标签0.8090.1390.8050.1490.8500.1780.8810.1140.8220.124 0.8330.1180.8420.1740.8960.104注粗体表示最优指标。NoteThe bold represents the optimal indicator.布也更加集中(见图3)。图4展示了上述方法的网络输出分割结果,示例图像均具有不同程度的伪影。CAM方法的主要问题是假阴性体素较多,

39、倾向于仅分割出密度最高出血区域,而缺失了密度相对较低的部分,此外容易忽略小体积的出血。而两种MIL方法则更容易受到伪影的干扰,分别在脑镰、IPH附近和颅骨附近的伪影叠加区域产生了大量的假阳性分割结果,这也与表2 中定量指标反映的情况相一致。MIL-ICH网络相比基于MIL伪标签的弱监督分割方法具有更好的伪影抑制能力,减少了假阳性,同时相比几种基于CAM的弱监督分割方法,还兼顾了对较低密度出血的敏感性,能够准确勾画血肿轮廓。总体来说,现有方法对伪影的抑制能力较差,MIL-ICH的网络设计则具有较强的鲁棒性,分割结果更接近人工勾画的手动标签。2.2复杂特例的分割结果分析上述结果表明,MIL-ICH

40、在大多数情况下,包括存在伪影时也能够定位并分割出血,但在少数复杂情况下的分割结果与手动标签仍存在一些差异,主要包括4种情况,图5展示了各类典型特例的热图与网络1.00.90.80.70.60.50.40.30.2伪标签0.1网络输出0.0CAM多尺度CAMGrad-CAMFCN-MILDWS-MILMIL-ICH分割方法图3不同方法的DSC箱型图比较Fig.3Comparison of DSC box plots of different methods分割结果,第二列为仅使用40,10 0 CT值阈值分割的结果,反映了伪影导致的CT值升高,已与出血范围相重叠。上述差异的具体包括:图(a)为边

41、界模糊的小出血与伪影叠加:网络分割结果在邻近颅骨的脑实质边缘出现了一些假阳性;图(b)为幕下弥散性出血:幕下为PVAE的高发区域,并且此类出血缺乏清晰边界,导致出血轮廓分割不准确;图(c)为极细SDH:SD H 成细长型,分割结果中缺少了长轴两端极细且模糊的部分;图(d)为亚急性/混合密度出血:由于CT值偏低,同时伪影的叠加又导致其他区域CT值普遍升高,分割结果中缺少了部分低密度的出血,并且在脑镰处产生了少量假阳性。对上述情况的分析表明,当受多种干扰因素的叠加作用时,分割结果在出血轮廓与边界的确定上可能会出现一定误差,但即使对于这些复杂的特例,MIL-ICH的初始热图仍能够准确定位出血,未出现

42、整体上的定位偏差,并能通过网络后续部分减少假阳性,优化分割结果。2.3消融实验结果为了验证MIL-ICH网络中各部分的作用,通过消融实验比较不同的伪标签和网络结构(见表3)。消融实验共分为3组,为了进行公平的比较,实验中的伪标签均经过了平滑。第一组中,伪标1和伪标2分别基于阈值和热图获得,均无法准确分割血肿,DSC未超过0.3,但当二者结合时(伪标3),DSC提升至0.7 33,证明了两种方法结合的优势。第二组为采用伪标签级联训练U-Net的分割结果,级联1的结构未使用多尺度融合热图和其他优化模块,DSC仅达到了0.7 47。级联2 相比级联1证明了多尺度融合可以有效提升精确度,减少假阳性,D

43、SC提升了2.6%。在此基础上,级联4增加了PAR模块,DSC达到了0.8 0 7。6836期张童禹,等:基于多实例学习及阈值伪标签提取的CT影像颅内出血分割(a)(b)(c)(d)(e)CTCAM多尺度CAMGrad-CAMFCN-MIILDWS-MILMIL-ICH手动标签图4分割结果比较(红色区域为网络分割结果,黄色区域为手动标签)。(a)IPH;(b)IPH;(c)IPH 与IVH;(d)SAH;(e)SDHFig.4 The comparison of segmentation results(The red regions are network segmentation resu

44、lts,yellow regionsare manual labels).(a)IPH;(b)IPH;(c)IPH and IVH;(d)SAH;(e)SDH(a)(b)(c)(d)CT值分割初始热图PAR热图MIL-ICH手动标签CT阅值分割初始热图PAR热图MIL-ICH手动标签图5复杂特例的热图与网络分割结果(红色区域为网络分割结果,黄色区域为手动标签,热图的颜色表示出血概率)Fig.5Heatmap and network segmentation results of complex specific cases(The red regions are networksegmenta

45、tion results,yellow regions are manual labels.The color of heatmap shows the probability of hemorrhage).第三组采用了双分支协同训练的方式,MIL1与级联2、MIL2与级联4的比较都证明了协同训练相比级联训练的优势,DSC分别提高了0.8%和1.1%。在组内进行比较时,MIL2相比MIL1的Precision提高了8.1%,DSC提高了3.7%,证明了PAR模块的作用。MIL2的DSC值达到了0.8 18,但召回率有所损失,加人FFA模块后召回率提高了2.8%,体积相似度提高了1%,分割性能更

46、加均衡。FFA模块通过增加两个分支间的信息传递,在保证网络框架伪影抑制能力的同时,还能够兼顾出血中CT值较低的区域,减少对体积的低估。在不使用阈值时,级联训练和协同训练结构的DSC最高仅能达到0.52 6(级联3)和0.538(MIL3结构),但当MIL-ICH网络建立在阈值伪标签基础上时,最终的DSC达到了0.8 2 22.4与多田公式的比较根据分割结果和体素的空间分辨率计算出血量是分割算法最终目的,为此,本研究还比较了临床常用的多田公式与MIL-ICH网络测量出血量的准确性,实际出血量根据手动标签计算。684中42卷生国医报学程物学表3消融实验结果(均值土标准差)Tab.3Ablation

47、 study results(mean std)方法阅值热图多尺度PAR级联训练协同训练FFADSCRecallPrecisionVS伪标1V0.2890.2040.9850.0320.1890.1610.2930.205伪标20.2420.1270.8910.1440.1490.0920.2810.157伪标3V0.7330.1870.8770.1410.6730.2320.8110.182级联1VV0.7470.1730.8770.1330.6940.2240.8240.170级联20.7730.1650.8380.1550.7600.2090.8620.147级联30.5260.1720

48、.8560.1610.4200.1890.6300.231级联4V0.8070.1390.7880.1480.8630.1750.8770.112MIL1V0.7810.1560.822 0.1600.7860.1970.8690.133MIL2V0.8180.1350.8050.1350.8670.1710.8860.118MIL3VV0.5380.1490.8410.1620.4280.1650.6550.206MIL-ICHVVV0.8220.1240.8330.1180.8420.1740.8960.104注粗体表示最优指标。NoteThe bold represents the op

49、timal indicator.多田公式估算的出血量为(ABC)/2,其中A为最大血肿面积层面的血肿最长径,B为该层面内与最长径垂直方向上的最长径,C为存在出血的层数,当存在多个出血病灶时需要分别计算并相加。根据图6 可知,网络分割结果计算的出血量与实际出血量的相关性更强,皮尔森相关系数(Pearsoncorrelation coefficient)达到了0.95。多田公式在出血量小于7 0 mL时相对较为准确,但当出血量较大18016014012010080604020r-0.920020406080100 120140160180实际出血量/mL(a)1801601401201008060

50、4020r-0.950020 406080100120140160180实际出血量/mL(b)图6 计算出血量与实际出血量的比较。(a)多田公式;(b)MIL-ICH网络Fig.6Comparison of the calculated hematomavolume with actual volume.(a)ABC/2 formula;(b)MIL-ICHnetwork时误差增大并且容易出现显著的高估。MIL-ICH网络在出血量较大时出现了轻微的低估趋势,但在总体上仍优于多田公式,测量值与实际出血量的分布更加一致。3讨论弱监督分割方法需要的原始监督信息仅为CT扫描水平的类别标签,然后再使用不

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服