图书馆在架图书书脊与标签实例分割方法研究.pdf

资源描述

1、新疆农业大学学报 2 0 2 3,4 6(2):1 3 91 4 5 J o u r n a l o f X i n j i a n g A g r i c u l t u r a l U n i v e r s i t yD O I:1 0.2 0 0 8 8/j.c n k i.j x a u.2 0 2 3.0 2.0 0 8图书馆在架图书书脊与标签实例分割方法研究尤永鹏1,董峦1,尹书林1,李佳航1,艾里亚尔阿不都克里木2(1.新疆农业大学计算机与信息工程学院,乌鲁木齐 8 3 0 0 5 2;2.新疆农业大学图书馆,乌鲁木齐 8 3 0 0 5 2)摘要:准确获

2、取图书信息是智能化管理图书的关键,为实现在架图书书脊和书脊底部标签的精确分割,本研究在S p a r s e I n s t基础上提出增强编码器实例分割模型E E-S p a r s e I n s t。该模型使用特征选择对齐模块将特征图对齐并融合,以减少边界信息损失,使用边界解析模块增强相邻书脊边缘处的语义表示,提高掩码的分割质量。建立在架图书图像数据集,数据集包含2 2 5 3张图像和标注信息。结果表明,E E-S p a r s e I n s t平均精确率达到8 0.8 1%,相较于C e n t e r M a s k、S O L O v 2、P o l a r M a s k和S

3、p a r s e I n s t 4种主流锚框自由式实例分割方法分别提高了7.5 7%、2 0.0 7%、1 0.5 0%、0.7 4%。关键词:实例分割;图书分割;特征对齐;边界增强中图分类号:T P 3 9 1.4 1 文献标识码:A R e s e a r c h o n I n s t a n c e S e g m e n t a t i o n M e t h o d b e t w e e n S p i n e a n d L a b e l o f L i b r a r y B o o k s o n S h e l fYOU Y o n g-p

4、 e n g1,D ON G L u a n1,Y I N S h u-l i n1,L I J i a-h a n g1,A i l i y a e r A b u d u k e l i m u2(1.C o l l e g e o f C o m p u t e r a n d I n f o r m a t i o n E n g i n e e r i n g,X i n j i a n g A g r i c u l t u r a l U n i v e r s i t y,U r u m q i 8 3 0 0 5 2,C h i n a;2.L i b r a r y o f

5、 X i n j i a n g A g r i c u l t u r a l U n i v e r s i t y,U r u m q i 8 3 0 0 5 2,C h i n a)A b s t r a c t:O b t a i n i n g t h e i n f o r m a t i o n o f b o o k s a c c u r a t e l y i s t h e k e y o f i n t e l l i g e n t m a n a g e m e n t o f b o o k s,s o i n o r d e r t o a c h i e v

6、 e t h e a c c u r a t e d i v i s i o n o f t h e s p i n e a n d t h e b o t t o m o f t h e s p i n e l a b e l o f t h e s h e l f b o o k,t h i s p a p e r p r o p o s e d t h e E n h a n c e d E n c o d e r i n s t a n c e s e g m e n t a t i o n m o d e l E E-S p a r s e I n s t b a s e d o n

7、 S p a r s e I n s t.T h e f e a t u r e s e l e c t i o n a l i g n m e n t m o d u l e w a s u s e d t o a l i g n a n d f u s e f e a t u r e m a p s t o r e d u c e b o u n d a r y i n f o r-m a t i o n l o s s a n d t h e b o u n d a r y r e s o l u t i o n m o d u l e w a s a p p l i e d t o e

8、 n h a n c e t h e s e m a n t i c r e p r e s e n t a t i o n a t t h e a d j a c e n t s p i n e e d g e s,t h u s i m p r o v i n g t h e s e g m e n t a t i o n q u a l i t y o f t h e m a s k.I n a d d i t i o n,a n o n-s h e l f b o o k i m a g e d a t a s e t w a s c o n s t r u c t e d,w h i

9、 c h c o n t a i n e d 2 2 5 5 i m a g e s a n d a n n o t a t i o n i n f o r m a t i o n.T h e e x p e r i m e n-t a l r e s u l t s s h o w e d t h a t t h e a v e r a g e p r e c i s i o n o f E E-S p a r s e I n s t r e a c h e d 8 0.8 1%,w h i c h i m p r o v e d 7.5 7,2 0.0 7,1 0.5 0,a n d 0.

10、7 4 p e r c e n t a g e p o i n t s c o m p a r e d w i t h t h e f o u r m a i n s t r e a m a n c h o r f r a m e f r e e-f o r m i n-s t a n c e s e g m e n t a t i o n m e t h o d s:C e n t e r M a s k,S O L O v 2,P o l a r M a s k,a n d S p a r s e I n s t,r e s p e c t i v e l y.K e y w o r d

11、s:i n s t a n c e s e g m e n t a t i o n;b o o k s e g m e n t a t i o n;f e a t u r e a l i g n m e n t;b o u n d a r y e n h a n c e m e n t 随着图书馆藏书数量和学生阅览人数的增加,书籍的管理变得更加困难。只有书脊部分可以被观察到,书脊上的标签是鉴别每本图书身份的依据;相同书籍的不同副本经常摆放在一起,纹理和颜色相似;不同图书薄厚高低不同、倾斜角度不一、密集排列。基于图像处理的图书自动定位方法已经成为研究热点1。近年来由于深度学习的兴起,计算机视觉获

12、得了跨越式发展。实例分割作为计算机视觉中的基本任务之一,可以更准确地检测出图像中的物体,主要分为两阶段法和单阶段法2。两阶段法首收稿日期:2 0 2 3-0 2-2 2通讯作者:董峦,E-m a i l:d l x j a u.e d u.c n新疆农业大学学报2 0 2 3年先对图像进行候选区的筛选,然后对候选区域进行分割3。单阶段法同时执行检测和分割任务。目前,主流的单阶段法又分为基于锚框和锚框自由两类4。基于锚框的方法,需要预先根据数据集定义锚框大小,这在调参过程中消耗时间,而且针对不同的任务需要,模型的迁移能力也受到影响5。锚框自由的方法实现简单,且具有较强的泛化性。

13、C e n-t e r M a s k6在F C O S7的基础上,提出了空间注意力引导掩码分支(S AG-M a s k),在每个检测框上预测一个掩码。S O L O v 28提出动态分割实例掩码的思路,将对象掩码生成解耦为掩码核预测和掩码特征学习,分别负责生成卷积核和要卷积的特征图,然后对掩码特征用生成的掩码核进行卷积操作,得到实例掩码。P o l a r M a s k9将实例分割问题建模为在极坐标下通过实例中心分类和稠密距离回归来预测实例的轮廓,为实例分割提供了新的建模方式和研究思路。S p a r s e I n s t1 0生成一个稀疏的实例激活图集合,通过实例激活图探索了一种新颖

14、的对象表示方法,以突出每个前景对象的信息区域。然后根据突出显示的区域聚合特征,得到实例级特征,用于识别和分割。S OT R1 1在不使用目标检测器的情况下,动态预测每个实例的分割掩码,是一种新的基于C NN1 2和t r a n s f o r m e r1 3的直接实例分割方法。虽然上述锚框自由的方法具有执行简单、易于实现且运行速度快的特点,但这些方法存在尺度不对齐、区域不对齐和任务不对齐1 4,尤其对于图书这种排列密集、相邻书脊宽度差异大、纹理差异小的特殊数据集,更容易造成分割精度低、掩码质量差的问题。针对上述问题,提出一种锚框自由的高效分割图书书脊与标签的方法,即增强编码

15、器实例分割算法(E E-S p a r s e I n s t)。使用特征选择对齐模块(F S AM),将自顶向下和自底向上融合时的特征图进行对齐,减少书脊边缘信息的丢失;使用边界解析模块(B DM),对融合后的特征图,增强密集图书边界处的语义信息表示,提高掩码的分割质量。同时构建在架图书书脊与标签数据集,并与主流锚框自由式方法C e n t e r M a s k、S O L O v 2、P o l a r M a s k和S p a r s e I n s t进行对比,以验证E E-S p a r s e I n s t能否提高图书书脊与标签的分割精度和掩码的分割质

16、量。1 材料与方法1.1 数据集使用自建私有数据集进行训练与测试,数据集中图像拍摄于新疆农业大学图书馆在架图书,使用两部手机从书架正前方和上下左右与书架夹角为2 0 以内的方向拍摄,原始图像4 9 1张,格式为J P G,像素在1 2 7 91 7 0 6到3 4 5 64 6 0 8之间,使用l a b e l m e标注工具对书脊和标签手工标注,图像标注信息在数据集中分别用b o o k 和t a g 指代。此外,为了增加样本的数量,使用数据增强方法扩充之后共计2 2 5 3张,其中竖直摆放、宽高不同且有俯拍角度和倾斜摆放的书脊分别为7 0 0、6 9 6和8 5 7张,随机划分训练

17、集1 8 9 5张、验证集2 6 0张、测试集9 8张。使用的数据增强方法是随机变换图像亮度、对比度以及给图像增加噪声。图1为3种形式下的在架图书图像。?图1 在架图书图像F i g.1 I m a g e s o f b o o k s o n t h e s h e l f1.2 方法1.2.1 图书分割算法结构在S p a r s e I n s t1 0算法的基础上,提出了E E-S p a r s e I n s t图书书脊与标签实例分割算法,由一个实例上下文增强编码器和一个基于实例激活图1 0的解码器组成(图2)。实例上下文增强编码器附着在R e s

18、 N e t1 5主干网络后,主要改进有特征选择对齐模块和边界解析模块,目的是融合多尺度特征以便加强上下文信息,实现精确的图书分割。在架图书图像首先经过R e s N e t1 5主干网络提041 第2期尤永鹏,等:图书馆在架图书书脊与标签实例分割方法研究取多尺度特征,该特征利用改进的编码器进行融合,使上下文信息得到加强,其中金字塔池化(P PM)1 6的作用是通过最大池化来扩大书脊与标签的感受野,保持速度的同时提升小目标分割的精度;特征选择对齐模块(F S AM)利用图像插值(上采样)把输入特征图放大到合适尺寸使其与目标特征图对齐,减少边缘特征损失;在融合3个尺度的特征图后,使用边界解析模块

19、(B DM)加强边界语义信息的表示1 7。经过增强编码器融合的单尺度特征图输入到基于实例激活图(I AM)的解码器中,生成实例激活图和掩码特征图,用于生成分割结果。为了区分图2中不同位置的特征选择对齐模块,将卷积层之前的特征选择对齐模块称为F S AM1,将卷积层之后的特征选择对齐模块称为F S AM2。ResNet?图2 E E-S p a r s e I n s t算法流程图F i g.2 E E-S p a r s e I n s t f l o w c h a r t1.2.2 特征选择对齐模块编码器对多尺度特征进行融合,加强不同特征图的信息交互,增强上下文信息的表示能力。在多尺度特征

20、融合时,采用自上而下和自下而上两种路径1 8。自下而上是将低分辨率特征图和使用图像插值后的高分辨率特征图进行融合,自上而下是将高分辨率特征图和使用图像抽取(下采样)后的低分辨率特征图进行求和1 9。为了保留当前特征图的特征,在多尺度特征融合时,将当前特征图的特征也进行融合。在架图书紧挨着排列,书籍多个通常都摆放在一起,存在密集、粘连问题,在特征融合阶段,使用图像插值和图像抽取之后的特征图如果没有对齐就与当前特征图相加,会损失边界信息,对图书书脊的分割造成一定干扰,如相邻的图书分割结果粘连或边界处产生放大的现象。在特征融合前,将图像插值后的特征图与目标特征图使用特征选择对齐模块(F S AM)对

21、齐之后再相加,减少边界信息的损失,提高图书书脊边界的分割效果。F S AM由特征对齐(F AM)2 0和特征选择(F S M)2 0协同实现特征对齐,本研究使用两种形式的F S AM,第一种形式2 0对应F S AM1用来将高分辨率特征图和低分辨率特征图融合对齐,第二种形式见图3,对应F S AM2,与第一种形式2 0不同,首先将高、低两种分辨率的特征图对齐,然后将中、低两种分辨率的特征图对齐,最后将高分辨率的特征图和上述融合后的特征图拼接得到融合特征图。使用F S AM之后,减少了书脊边界的信息损失,分割的精度和掩码质量也得到了提升。1.2.3 边界解析模块使用边界解析模块(B DM)进一步

22、加强特征图的边界语义信息表示1 7,使模型在训练时更关注相邻图书书脊边界处的上下文信息。F S AM和B DM相比,前者将图像插值后的特征图与目标特征图对齐,减少边界信息的损失,后者关注相邻书脊边界处的上下文信息,减少分割时的粘连现象。B DM1 7由两部分组成。在第一部分,原始特征图经最大池化和平均池化后,利用卷积层调整通道数,经S i g m o i d激活函数处理后与原始特征图逐元素相乘。在第二部分,将阈值过滤产生的结果与第一部分的结果进行拼接,然后经过S i g m o i d激活函数处理后与原始特征图逐元素相乘。接着,将第一部分和第二部分的结果再次拼接,并与原始特征图进行残差连接,从

23、而得到增强边界语义信息后的特征图。使用B DM之后,模型更加关注相邻书脊边141新疆农业大学学报2 0 2 3年界处的语义信息表示,可以增强边缘处的分割效果。?图3 特征选择对齐模块流程图F i g.3 F e a t u r e s e l e c t i o n a l i g n m e n t m o d u l e f l o w c h a r t1.3 评价指标使用平均精确率(A P)评估模型,该指标衡量模型在不同I o U(预测掩码与真实掩码的交并比)阈值下的检测性能2 1。分别计算b o o k 和t a g 两个类别的平均精确率(A Pc l a s s),

24、I o U阈值为0.5 0、0.7 5以及所有阈值下的平均精确率。A Pc l a s s=1nc l a s snc l a s si=0T Pi+FNiT Pi+FNi+F Pi(1)A P=1nni=0T Pi+FNiT Pi+FNi+F Pi(2)其中:c l a s s为b o o k 和t a g 两个类别;T Pi为预测正确的样本个数;F Pi为预测错误的样本个数;FNi为未预测到的样本个数;n为样本类别总数;nc l a s s为类别为c l a s s的样本总数;i为样本类别。1.4 试验设置基于深度学习框架P y T o r c h 1.1 2.1,训练环境为I n t e

25、 l(R)5 1 8 8+T e s l a V 1 0 0,使用单个G P U进行训练。本研究采集的图书数据集数量有限,采用在C O C O数据集上的预训练权重对R e s N e t主干网络的权重初始化后再在图书数据集上开始训练,并对原始模型S p a r s e I n s t1 0的训练迭代次数进行修改,由原始的2 7 0 0 0 0改为1 0 0 0 0 0次,在4 0 0 0 0和8 0 0 0 0次之后,学习率衰减原来的十分之一,批次大小为8,其他参数保持不变。1.5 对比算法采用C e n t e r M a s k6、S O L O v 28、P o l a r M a s

26、k9及S p a r s e I n s t1 0 4种实例分割算法为基线算法与E E-S p a r s e I n s t算法进行对比及消融试验。对比试验通过实例分割常用的评价指标A P、A P5 0(I o U=0.5 0)、A P7 5(I o U=0.7 5),来综合评测E E-S p a r-s e I n s t算法是否较基线算法优,平均精确率值越高分割越准确,消融试验增加每个类别的A P(b o o k)和A P(t a g),评测不同改进模块能否提高E E-S p a r-s e I n s t算法的分割精度和掩码分割质量。2 结果与分析2.1 对比试验针对几个锚框自由的网络

27、模型C e n t e r M a s k6、S O L O v 28、P o l a r M a s k9和S p a r s e I n s t1 0以及本研究的改进算法E E-S p a r s e I n s t进行对比,以R e s-N e t 5 0为主干网络,在图书验证集上定量比较不同模型的分割精度并可视化不同算法对书脊与标签的分割效果。定量比较结果见表1,分割效果的比较见图4、图5、图6、图7、图8。表1 不同算法在图书验证集上的对比结果T a b l e 1 C o m p a r i s o n r e s u l t s o f d i f f e r e n

28、 t a l g o r i t h m s o n t h e b o o k v a l i d a t i o n s e t%模型A PA P5 0A P7 5C e n t e r M a s k7 3.2 48 2.6 38 0.5 0S O L O v 25 6.7 46 8.3 76 3.6 6P o l a r M a s k7 0.3 18 0.5 18 1.6 3S p a r s e I n s t8 0.0 79 8.8 69 6.3 6E E-S p a r s e I n s t8 0.8 19 8.9 89 6.5 7由表1知,E E-S p a r s e I

29、 n s t方法相比其他4种算法在图书数据集上达到了较高的分割精度,平均A P为8 0.8 1%,A P5 0(阈值I o U=0.5 0时)为9 8.9 8%,A P7 5(I o U=0.7 5时)为9 6.5 7%,比其他4种方法中分割精度最高的S p a r s e I n s t分别提高了0.7 4,0.1 2,0.2 1个百分点,表明E E-S p a r s e I n s t在图书数据集上具有较好的分割性能。4种锚框自由的实例分割算法和E E-S p a r-s e I n s t分割方法在测试集上的分割结果见图4、图5、图6、图7、图8。选取竖直摆放

30、、宽高不一且有一定俯拍角度及倾斜摆放的图书3种形式,对应各个图中的第一列至第三列,图片都是经过裁剪后只保留有效分割区域后的结果。由图4、图5、图6知,C e n t e r M a s k、S O L O v 2和P o l a r M a s k对第一列的图书具有较好的分割效果,但对第二列和第三列的分割效果较差。由图7知,S p a r s e I n s t虽然相比于前3种方法在分割效果上有很大的提升,但S p a r s e I n s t在竖直摆放书脊的分割中存在边界分割不全以及在241 第2期尤永鹏,等:图书馆在架图书书脊与标签实例分割方法研究宽高不同且有俯拍角度书脊的分割中存在相邻

31、边界粘连等情况。由图8知,比起前4种分割方法,E E-S p a r s e I n s t图书分割方法在上述3种形式的图书上都呈现出较好的分割效果,同时E E-S p a r s e I n s t算法在图书边界处也具有更好的分割性能。根据定量比较和不同算法的分割效果比较结果,E E-S p a r s e I n s t图书分割方法不止在分割精度上达到了较优,而且对密集的图书分割效果较稳定,尤其对于相邻图书的掩码具有很好的分割效果,不会出现相互干扰,分割困难的情况。?图4 C e n t e r M a s k分割结果F i g.4 C e n t e r M a s k s e g m

32、e n t a t i o n r e s u l t?图5 S O L O v 2分割结果F i g.5 S O L O v 2 s e g m e n t a t i o n r e s u l t?图6 P o l a r M a s k分割结果F i g.6 P o l a r M a s k s e g m e n t a t i o n r e s u l t?图7 S p a r s e I n s t分割结果F i g.7 S p a r s e I n s t s e g m e n t a t i o n r e s u l t341新疆农业大学学报2 0 2

33、 3年?图8 E E-S p a r s e I n s t分割结果F i g.8 E E-S p a r s e I n s t s e g m e n t a t i o n r e s u l t2.2 消融试验为验证所提模型各模块的有效性,进行消融试验。以S p a r s e I n s t1 0作为基准模型,对F S AM1、F S AM2和B DM进行验证,比较随着改进模块的融入,在图书验证集上分割精度是否得到提升,并定量比较平均精确率值。E E-S p a r s e I n s t算法即S p a r-s e I n s t+F S AM1+F S AM2+B DM

34、,分别使用R e s-N e t 5 0和R e s N e t 1 0 1来验证改进模块在不同主干网络下的性能(表2)。由表2知,随着改进模块的加入,图书分割精度也逐渐得到提升,R e s N e t 5 0平均精确率由初始8 0.0 7%逐渐上升到8 0.8 1%,R e s N e t 1 0 1平均精确率由最初7 8.9 8%提升到8 0.4 1%。由表2知,以R e s N e t 5 0为主干网络,初始平均精确率为8 0.0 7%,加入F S AM1将图2中卷积层之前的特征融合对齐,平均精确率上升到8 0.0 9%,加

35、入F S AM2将图2中卷积层之后的特征融合对齐,平均精确率上升到8 0.6 2%,加入F S AM1和F S AM2同时对这两个位置的特征融合对齐,由于减少了两个位置特征融合时图书边界信息的损失,网络对边界的鉴别能力被增强,平均精确率上升至8 0.6 3%。在加入B DM后,加强了相邻图书边界处的语义信息表示,使网络在分割时更加关注是否存在粘连,增强了掩码的分割质量,平均精确率上升到8 0.8 1%。值得注意的是,主干网络为R e s N e t 1 0 1的分割精度却不及R e s N e t 5 0,原因是数据集样本数量有限,R e s N e t 1 0 1特征提取能

36、力没有发挥到最佳性能。从试验结果可以看出,F S AM1、F S AM2和B DM都能使图书分割精度得到提升,但只有同时发挥作用,才能达到较高的分割精度。表2 不同模块在图书验证集上的试验结果T a b l e 2 E x p e r i m e n t a l r e s u l t s o f d i f f e r e n t m o d u l e s o n t h e b o o k v a l i d a t i o n s e t%模型主干网络A PA P5 0A P7 5A P(b o o k)A P(t a g)S p a r s e I n s tR e

37、s N e t 5 08 0.0 79 8.8 69 6.3 68 2.8 27 7.3 1R e s N e t 1 0 17 8.9 89 8.8 09 4.7 78 1.2 17 6.7 4 +F S AM1R e s N e t 5 08 0.0 99 8.9 59 5.9 28 3.5 27 6.6 7R e s N e t 1 0 17 9.9 59 8.9 49 5.9 18 3.3 67 6.5 4 +F S AM2R e s N e t 5 08 0.6 29 8.9 69 6.5 48 3.7 87 6.4 6R e s N e t 1 0 17 9.9 59 8.9 19

38、 5.8 28 2.2 87 6.6 2 +F S AM1+F S AM2R e s N e t 5 08 0.6 39 8.9 79 6.3 18 3.9 67 7.3 0R e s N e t 1 0 17 9.9 69 8.9 59 5.8 98 2.9 87 6.5 4 +F S AM1+F S AM2+B DMR e s N e t 5 08 0.8 19 8.9 89 6.5 78 4.1 67 7.4 7R e s N e t 1 0 18 0.4 19 8.9 69 6.0 58 3.7 77 7.0 53 讨论锚框自由的实例分割算法具有结构简单且无需预先定义锚框大小的特点,

39、减少了计算量,然而它们缺少R o I A l i g n对齐2 2操作,使得特征图间存在未对齐的情况,对于在架图书这种密集排列的数据集由于相邻图书的干扰出现分割精度差、边界分割不全的现象。C e n t e r M a s k6、S O L O v 28和P o l a r M a s k9通常在目标宽高比例相近且呈水平分布的数据集上表441 第2期尤永鹏,等:图书馆在架图书书脊与标签实例分割方法研究现良好。C e n t e r M a s k6每个对象生成检测框并预测掩码,对于竖直摆放的图书分割效果良好,但对倾斜且密集排列图书预测的检测框出现偏移导致掩码分割效果较差。S O L O v 2

40、8通过对掩码特征用生成的掩码核进行卷积操作得到实例掩码,但对于密集且宽度较小的图书会出现掩码粘连现象。P o l a r-M a s k9用一个中心和从中心向轮廓发射的射线在极坐标下对轮廓进行建模,但对于图书这种密集数据集,存在相邻书脊干扰使得建模的掩码出现缺失。S p a r s e I n s t1 0为每个实例生成一个激活图,以该激活图为前提对目标进行分割,既考虑了实时性又提高了分割精度,虽能在一定程度上提升图书书脊和标签的分割精度,但对边界处的分割效果不佳。E E-S p a r s e I n s t是基于S p a r s e I n s t1 0算法

41、的改进,考虑了相邻图书边界处的语义信息以及对特征图对齐之后再融合,减少了边界信息的损失,从而提高书脊与标签的分割精度和掩码的分割质量,比起上述4种算法,在验证集上达到了较优的分割结果。4 结论提出了一种增强编码器的在架图书书脊与标签实例分割方法,在自建图书数据集上,E E-S p a r-s e I n s t算法的平均准确率高于C e n t e r M a s k、S O L O v 2、P o l a r M a s k及S p a r s e I n s t 4种主流锚框自由式算法,证明E E-S p a r s e I n s t算法可以提

42、高图书书脊与标签的分割精度和掩码的分割质量。参考文献:1 姬晓飞,张可心,唐李荣.改进D e e p l a b v 3 p l u s网络的图书书脊分割算法J.计算机应用,2 0 2 3,1 5(5):1-7.2 苏丽,孙雨鑫,苑守正.基于深度学习的实例分割研究综述J.智能系统学报,2 0 2 2,1 7(1):1 6-3 1.3 S h a r m a R,S a q i b M,L i n C T,e t a l.A S u r v e y o n O b j e c t I n s t a n c e S e g m e n t a t i o nJ.S N C o m p u t e

43、 r S c i e n c e,2 0 2 2,3(6):4-9.4 胡伏原,万新军,沈鸣飞.深度卷积神经网络图像实例分割方法研究进展J.计算机科学,2 0 2 2,4 9(5):1 0-2 4.5 屈露,苍岩.基于卷积神经网络的群猪图像实例分割方法J.应用科技,2 0 2 3,1 5(5):1-8.6 高鹏威,高远,杨建华.中密度纤维板表面缺陷实时检测系统J.林业和草原机械,2 0 2 0,1(1):4 7-5 0.7 原瑜蔓,白宏阳,郭宏伟,等.H o u r g l a s s N e t:一种用于遥感目标检测的改进F C O S算法J.南京理工大学学报,2 0 2 2,4 6(6):

44、7 1 9-7 2 7.8 吴忧,袁雪.基于改进S O L O v 2的复杂场景下智能机器人巡检识别算法J.北京交通大学学报,2 0 2 2,4 6(5):9 5-1 0 6.9 曾文雯,杨阳,钟小品.基于改进M a s k R-C NN的在架图书书脊图像实例分割方法J.计算机应用研究,2 0 2 1,3 8(1 1):3 4 5 6-3 4 5 9.1 0 马子彤.基于卷积神经网络的人体实例分割D.青岛:青岛大学,2 0 2 2.1 1 苏丽,孙雨鑫,苑守正.基于深度学习的实例分割研究综述J.智能系统学报,2 0 2 2,1 7(1):1 6-3 1.1 2 L e C u n Y,B

45、 o t t o u L,B e n g i o Y,e t a l.G r a d i e n t-b a s e d l e a r n i n g a p p l i e d t o d o c u m e n t r e c o g n i t i o nJ.I E E E,1 9 9 8,8 6(1 1):2 2 7 8-2 3 2 4.1 3 刘瑾莱.基于深层神经网络推理的图像问答技术研究和应用D.北京:北京邮电大学,2 0 1 9.1 4 刘腾,刘宏哲,李学伟,等.基于无锚框分割网络改进的实例分割方法J.计算机工程,2 0 2 2,4 8(9):2 3 9-2 4 7.1 5 卞

46、月楼,陆振宇,葛泉波,等.基于注意力机制和特征金字塔的孪生卷积神经网络目标跟踪算法J.计算机应用与软件,2 0 2 3,4 0(2):1 7 8-1 8 5.1 6 马吉权,赵淑敏,孔凡辉.多尺度条形池化与通道注意力的图像语义分割J.中国图象图形学报,2 0 2 2,2 7(1 2):3 5 3 0-3 5 4 1.1 7 K a n g Y,L i H,Wu Z,e t a l.B o o s t i n g B o u n d a r y R e p r e-s e n t a t i o n f o r G l a n d I n s t a n c e S e g m e n t a

47、t i o nJ.I E E E,2 0 2 1,2 1(1 0):1 7 4 9-1 7 5 6.1 8 熊超,周海峰,郑东强.结合空洞编码器和特征金字塔的中心点船舶检测J.船舶工程,2 0 2 3,4 5(2):1 5 4-1 6 1.1 9 陈锋军,张新伟,朱学岩,等.基于改进E f f i c i e n t D e t的油橄榄果实成熟度检测J.农业工程学报,2 0 2 2,3 8(1 3):1 5 8-1 6 6.2 0 钟豪,张自力,彭涛,等.FMN e t:基于特征对齐的多方位注意力机制服装图像分割网络J.中国科技论文,2 0 2 3,1 8(3):2 7 5-2 8 2.2 1 董高君,许乐乐,马忠松.基于密集特征金字塔的细胞图像实例分割网络J.载人航天,2 0 2 1,2 7(2):1 6 9-1 7 4.2 2 朱新龙,崔国华,陈赛旋.基于改进M a s k R-C NN算法对堆叠汽车零件的实例分割方法J.上海工程技术大学学报,2 0 2 2,3 6(2):1 6 8-1 7 5.541

展开阅读全文