文档详情

基于视觉认知机理的交通场景目标检测算法研究.pdf

发布:2025-06-13约6.77万字共60页下载文档
文本预览下载声明

摘要

目标检测是生物视觉和计算机视觉的核心任务之一。视觉目标在场景中的位

置和大小分布与场景结构之间存在着较强的规律性,充分利用场景结构信息有望

显著提高复杂场景中目标检测的性能。同时,在视觉神经科学领域,一些研究已经

证明了场景结构与目标之间的关联性,能够加速视觉搜索并提高搜索的准确性。鉴

于交通场景具有更稳定的空间结构分布特性,并基于目标分布与场景结构的关联

性,本文面向交通场景下的目标检测任务,探索场景结构信息对目标检测的引导或

约束机制,以建立更有效的交通场景的目标检测模型。因此,本文首先基于交通场

景空间结构信息,设计了基于场景结构的候选区域生成算法,验证了交通场景结构

引导目标检测的有效性。此外,本文基于语义分割结果建立交通场景结构信息编码

(如消失点、道路边界等结构信息),并将其融入到目标检测的神经网络中,以提升

网络模型对不同类别和不同尺度的目标的检测性能。主要研究内容包含以下两个

部分:

(1)本文首先利用消失点检测算法等提取了交通场景的主要结构信息,并利用

场景结构与目标分布关系作为先验信息,设计了自适应的目标候选框选取方法。结

合典型的候选区域生成算法(如EdgeBoxes算法),本文建立了基于场景结构的目

标候选区域筛选方法。实验结果表明,在交通场景结构的引导下,基于场景结构候

选区域选择方法能够基于更少的候选框,实现更准确的潜在目标区域选择,证明了

场景结构信息促进目标检测的重要作用。

(2)此外,本文进一步结合深度学习技术,首先利用语义分割网络获取交通场

景主要元素(如路面)的分割结果,并建立场景空间结构表征。然后,本文基于目

标检测网络,建立了融合目标与场景结构关系的多任务网络模型,通过预测目标与

场景关系提升网络模型的目标特征表达能力。实验结果表明,融合场景结构信息的

目标检测网络能够提升不同类别、不同尺度的目标检测性能。

关键词:视觉认知机理,场景结构,目标检测,交通场景

ABSTRACT

Objectdetectionisoneofthecoretasksofbiologicalvisionandcomputervision.

Thereisastrongregularitybetweenobjectsandthescenestructure,e.g.,thelocationor

sizedistributionofobjectsinscenes.Makingfulluseofthescenestructureinformation

isexpectedtosignificantlyimprovetheperformanceofobjectdetectionincomplex

scenes.Atthesametime,inthefieldofvisualneuroscience,somestudieshaveproved

thecorrelationbetweenscenestructureandobjects,whichcanacceleratevisualsearch

andimprovetheaccuracyofobjectsearch.Consideringthestablespatialstructure

characteristicsoftrafficscenes,andbasedonthecorrelationbetweenobjectdistribution

andscenestructure,thisstudyexplorestheguidanceorconstraintofscenestructure

informationonobjectdetectionfortheobjectdetectiontaskintrafficscenesand

establishesamoreeffectiveobjectdetectionmodeloftrafficscenes.T

显示全部
相似文档