文档详情

基于视觉认知机理的交通场景目标检测算法研究.pdf

发布：2025-06-13约6.77万字共60页下载文档

文本预览下载声明

摘要

目标检测是生物视觉和计算机视觉的核心任务之一。视觉目标在场景中的位

置和大小分布与场景结构之间存在着较强的规律性，充分利用场景结构信息有望

显著提高复杂场景中目标检测的性能。同时，在视觉神经科学领域，一些研究已经

证明了场景结构与目标之间的关联性，能够加速视觉搜索并提高搜索的准确性。鉴

于交通场景具有更稳定的空间结构分布特性，并基于目标分布与场景结构的关联

性，本文面向交通场景下的目标检测任务，探索场景结构信息对目标检测的引导或

约束机制，以建立更有效的交通场景的目标检测模型。因此，本文首先基于交通场

景空间结构信息，设计了基于场景结构的候选区域生成算法，验证了交通场景结构

引导目标检测的有效性。此外，本文基于语义分割结果建立交通场景结构信息编码

（如消失点、道路边界等结构信息），并将其融入到目标检测的神经网络中，以提升

网络模型对不同类别和不同尺度的目标的检测性能。主要研究内容包含以下两个

部分：

(1)本文首先利用消失点检测算法等提取了交通场景的主要结构信息，并利用

场景结构与目标分布关系作为先验信息，设计了自适应的目标候选框选取方法。结

合典型的候选区域生成算法（如EdgeBoxes算法），本文建立了基于场景结构的目

标候选区域筛选方法。实验结果表明，在交通场景结构的引导下，基于场景结构候

选区域选择方法能够基于更少的候选框，实现更准确的潜在目标区域选择，证明了

场景结构信息促进目标检测的重要作用。

(2)此外，本文进一步结合深度学习技术，首先利用语义分割网络获取交通场

景主要元素（如路面）的分割结果，并建立场景空间结构表征。然后，本文基于目

标检测网络，建立了融合目标与场景结构关系的多任务网络模型，通过预测目标与

场景关系提升网络模型的目标特征表达能力。实验结果表明，融合场景结构信息的

目标检测网络能够提升不同类别、不同尺度的目标检测性能。

关键词：视觉认知机理，场景结构，目标检测，交通场景

ABSTRACT

Objectdetectionisoneofthecoretasksofbiologicalvisionandcomputervision.

Thereisastrongregularitybetweenobjectsandthescenestructure,e.g.,thelocationor

sizedistributionofobjectsinscenes.Makingfulluseofthescenestructureinformation

isexpectedtosignificantlyimprovetheperformanceofobjectdetectionincomplex

scenes.Atthesametime,inthefieldofvisualneuroscience,somestudieshaveproved

thecorrelationbetweenscenestructureandobjects,whichcanacceleratevisualsearch

andimprovetheaccuracyofobjectsearch.Consideringthestablespatialstructure

characteristicsoftrafficscenes,andbasedonthecorrelationbetweenobjectdistribution

andscenestructure,thisstudyexplorestheguidanceorconstraintofscenestructure

informationonobjectdetectionfortheobjectdetectiontaskintrafficscenesand

establishesamoreeffectiveobjectdetectionmodeloftrafficscenes.T

显示全部

相似文档