面向复杂场景的伪装目标检测算法研究.pdf
摘要
摘要
伪装是指在干扰物密集、对比度低以及背景杂乱等复杂场景中,前景目标与
背景在颜色、纹理等视觉特征上高度相似。伪装目标检测(CamouflagedObject
Detection,COD)的目标是发现隐藏在复杂环境中的物体。这一技术在医学影像
处理、工业质量检测、军事侦察和搜救等领域具有重要的应用价值和广阔的发展
前景。然而,面对复杂场景时,一些统方法主要依赖于人工提取目标的外观特
征,如颜色、纹理、梯度等,以检测伪装目标。针对统方法在处理复杂场景时
泛化能力不足的问题,本文采用基于深度学习的方法进行优化,解决了现有算法
在多层特征聚合和模型可靠性方面存在的问题,本文的主要研究内容如下:
(1)针对伪装目标与复杂环境的视觉特征相似度极高,导致现有的COD算
法无法精确的从复杂背景中对伪装目标进行有效分割。因此,提出了一种基于跨
层级特征融合的伪装目标检测算法。首先,针对伪装目标定位不准确的问题,设
计了三分支结构自适应注意力组件使模型对不同尺度的特征具有很强的适应性,
有效地捕捉和利用不同尺度下的关键信息;其次,针对在复杂场景中单一层级的
特征可能对干扰和噪声的抵抗能力较弱,设计了跨层级特征聚合模块,有效利用
了低层次的细节信息和高层次的语义信息提高了模型对目标的检测能力。最后,
为了提高伪装目标与复杂背景的语义关联性,设计了三分支上下文模块使模型对
目标不局限于局部区域,减少了误检和漏检的情况,从而提升了伪装目标检测性
能。
(2)为了使网络更加稳健地处理复杂场景和噪声数据,根据置信度信息对伪
装目标检测网络的预测结果不确定性进行有效监督。本文提出了一种基于置信度
感知学习的伪装目标检测算法。首先,替换了参数量更小、模型复杂度更低的主
干网络,以实现最大限度增加计算效率。其次,设计了边缘感知提取模块,实现
更准确的边缘预测;接着,重新设计了多尺度特征融合模块,最大化提取足够丰
富的特征信息;最后,设计了置信度估计网络,对预测结果的不确定性进行监督,
帮助伪装目标检测网络判断预测结果中哪些区域可能存在错误的区域,使其更准
确地区分目标和背景,从而提高了检测的准确性。
关键词:伪装目标检测;跨层上下文融合;边缘提取;置信度估计
I
面向复杂场景的伪装目标检测算法研究
Abstract
Camouflagereferstoacomplexscenesuchasdenseinterferingobjects,lowcontrast
andclutteredbackground,wheretheforegroundobjectishighlysimilartothebackground
intermsofcolor,textureandothervisualfeatures.ThegoalofCamouflagedObject
Detection(COD)istodiscoverobjectshiddenincomplexenvironments.Thistechnology
hasimportantapplicationvalueandbroaddevelopmentprospectinthefieldsofmedical
imageprocessing,industrialqualityinspection,militaryreconnaissanceandsearchand
rescue.However,whenfacingcomplexscenes,sometraditionalmethodsmainlyrelyon
manuallyextractingtheobject’sappearancefeatures,suchascolor,texture,gradient,etc