基于多尺度特征的目标检测算法研究.pdf
摘要
目标检测是计算机视觉领域的基本任务之一,而设计高效的目标检测算法
一直是研究者们所追求的。本文从深度学习中的多尺度特征角度出发研究特征
多层融合方法,同时将高阶特征和位置敏感的权重网络相结合。
本文首先从多层特征融合角度出发,分别研究基于Faster-RCNN的多层特
征融合方法和基于特征金字塔网络(FPN)的多层特征融合方法。在这两类方法
中,基于Faster-RCNN的方法只有一个预测组件,而基于特征金字塔网络的方
法有多个预测组件,所以研究它们各自的多层特征融合策略是必要的。针对这
两类方法,本文提出了两种多层特征融合策略,并在PASCALVOC数据集上进
行了验证,有效地提升了目标检测精度。
除了多层特征融合策略的研究之外,本文提出了多尺度的位置敏感的核函
数特征表达方法(MLKP)。MLKP提出了一种高阶特征在目标检测领域的应用
方法,同时设计了位置权重网络,并将二者结合在一起。高阶特征的使用是一
种特征增强方法,可以提升模型对小目标的检测能力。通过利用目标位置的统
计学信息,位置权重网络可以对特征图进行加权操作。在特征图中,并不是所
有区域都会有目标出现,位置权重网络可以对存在目标的区域进行增强,同时
对不存在目标的区域进行削弱,达到提升目标检测效果的目的。与此同时,我
们也对多尺度的位置权重网络进行研究,并分析其优劣。最后,MLKP算法在
两类公开的数据集(PASCALVOC和MSCOCO)上进行了验证,都取得了当
前最好的结果。
关键词:目标检测;多尺度特征;多层特征融合;高阶特征;位置权重网络
Abstract
Objectdetectionisoneofthebasictasksincomputervision,andtheefficient
targetdetectionalgorithmhasalwaysbeenpursuedbyresearchers.Fromthe
perspectiveofmulti-scalefeaturesindeeplearning,westudiesmulti-featurefusion
methodsandcombinesthehigh-orderfeatureswithlocationawareweightednetworks.
Firstly,westudythemulti-featurefusionmethodbasedonFaster-RCNNand
featurepyramidnetwork(FPN),respectively.Itisnecessarytostudythesetwo
methodsbecausetheFaster-RCNNbasedmethodhasonlyonepredictioncomponent
whiletheFPNbasedmethodhasmultiplecomponents.Twomulti-layerfeaturefusion
strategiesareproposedinthispaperandverifiedonthePASCALVOCdataset,and
effectivelyimprovetheaccuracyofobjectdetection.
Inadditiontothestudyonmulti-layerfeaturefusionstrategy,wefurtherpropose
amulti-scalelocation-awarekernelrepresentationmethod(MLKP).MLKPproposes
anapplicationmethodofhigh-orderfeaturesinthefiledofobjectdetectionand
designsalocationawareweigh