基于视觉认知机理的交通场景目标检测算法研究.pdf
摘要
目标检测是生物视觉和计算机视觉的核心任务之一。视觉目标在场景中的位
置和大小分布与场景结构之间存在着较强的规律性,充分利用场景结构信息有望
显著提高复杂场景中目标检测的性能。同时,在视觉神经科学领域,一些研究已经
证明了场景结构与目标之间的关联性,能够加速视觉搜索并提高搜索的准确性。鉴
于交通场景具有更稳定的空间结构分布特性,并基于目标分布与场景结构的关联
性,本文面向交通场景下的目标检测任务,探索场景结构信息对目标检测的引导或
约束机制,以建立更有效的交通场景的目标检测模型。因此,本文首先基于交通场
景空间结构信息,设计了基于场景结构的候选区域生成算法,验证了交通场景结构
引导目标检测的有效性。此外,本文基于语义分割结果建立交通场景结构信息编码
(如消失点、道路边界等结构信息),并将其融入到目标检测的神经网络中,以提升
网络模型对不同类别和不同尺度的目标的检测性能。主要研究内容包含以下两个
部分:
(1)本文首先利用消失点检测算法等提取了交通场景的主要结构信息,并利用
场景结构与目标分布关系作为先验信息,设计了自适应的目标候选框选取方法。结
合典型的候选区域生成算法(如EdgeBoxes算法),本文建立了基于场景结构的目
标候选区域筛选方法。实验结果表明,在交通场景结构的引导下,基于场景结构候
选区域选择方法能够基于更少的候选框,实现更准确的潜在目标区域选择,证明了
场景结构信息促进目标检测的重要作用。
(2)此外,本文进一步结合深度学习技术,首先利用语义分割网络获取交通场
景主要元素(如路面)的分割结果,并建立场景空间结构表征。然后,本文基于目
标检测网络,建立了融合目标与场景结构关系的多任务网络模型,通过预测目标与
场景关系提升网络模型的目标特征表达能力。实验结果表明,融合场景结构信息的
目标检测网络能够提升不同类别、不同尺度的目标检测性能。
关键词:视觉认知机理,场景结构,目标检测,交通场景
ABSTRACT
Objectdetectionisoneofthecoretasksofbiologicalvisionandcomputervision.
Thereisastrongregularitybetweenobjectsandthescenestructure,e.g.,thelocationor
sizedistributionofobjectsinscenes.Makingfulluseofthescenestructureinformation
isexpectedtosignificantlyimprovetheperformanceofobjectdetectionincomplex
scenes.Atthesametime,inthefieldofvisualneuroscience,somestudieshaveproved
thecorrelationbetweenscenestructureandobjects,whichcanacceleratevisualsearch
andimprovetheaccuracyofobjectsearch.Consideringthestablespatialstructure
characteristicsoftrafficscenes,andbasedonthecorrelationbetweenobjectdistribution
andscenestructure,thisstudyexplorestheguidanceorconstraintofscenestructure
informationonobjectdetectionfortheobjectdetectiontaskintrafficscenesand
establishesamoreeffectiveobjectdetectionmodeloftrafficscenes.T