文档详情

基于改进YOLOv5的密集行人检测方法研究.pdf

发布:2025-05-18约11.48万字共73页下载文档
文本预览下载声明

基于改进YOLOv5的密集行人检测方法研究

摘要

随着计算机视觉技术的飞速发展,行人检测作为其中一项重要研究内容,不仅具有

极高的学术价值,更因其推动安全监控、辅助驾驶、智能机器人等应用的兴起而愈发受

到关注。但是在密集行人场景下,受限于行人尺度差异大以及相互遮挡严重等因素,现

有的行人检测方法存在精度低、漏检率高的问题。因此,本文基于YOLOv5算法,对密

集行人检测方法展开研究,涉及到网络改进、损失函数优化以及后处理算法设计三个方

面。主要研究工作如下:

针对密集场景下行人尺度差异大,导致小尺度行人漏检率高的问题,本文提出一种

密集多尺度行人检测方法DP-YOLOv5。为了提高骨干网络在提取不同尺度行人特征方

面的能力,并增强其对于小尺度行人的关注度,首先基于重参数化思想,采用改进的

RepVGG模块替换卷积模块,在少量增加测试时间开销的情况下,提升了检测精度。

33

其次,又在C3模块中添加高效注意力ECA,提高特征提取阶段对于小尺度行人的权重

分配。最后,为了增强模型对于不同尺度特征的利用率,提出一种加权的跨层连接路径

聚合网络,通过对不同尺度特征进行线性加权,使融合后的特征兼具浅层的位置信息和

深层的语义信息。

针对密集场景下行人类内遮挡,导致被遮挡行人定位准确性差以及边界框在后处理

阶段容易被抑制的问题,本文对损失函数和后处理算法分别进行了优化和设计。首先,

改进了边界框损失函数的回归损失,并添加了排斥损失项,优化后的损失函数不仅可以

提高预测框在尺寸回归和定位回归方面的精度,还可以降低附近真实框和预测框所带来

的干扰。其次,考虑到密集场景下行人密度大,高度重叠的预测框可能会被非极大值抑

制算法暴力删除,本文设计了一种两阈值后处理算法,采用距离交并比作为目标相似度

的评判标准,并通过两个阈值对于边界框置信度进行分段处理。最后,结合DP-YOLOv5,

得到本文最终的密集行人检测方法。

最后,在CityPersons和CrowdHuman数据集上进行一系列实验验证,实验结果表

明,与原始YOLOv5相比,本文所提出的方法可有效解决上述问题。

关键词:密集行人检测;YOLOv5;多尺度行人;遮挡行人

基于改进YOLOv5的密集行人检测方法研究

ABSTRACT

Withtherapiddevelopmentofcomputervisiontechnology,pedestriandetection,asone

oftheimportantresearchcontentsinthisfield,notonlyhashighacademicvalue,butalso

attractsmoreattentionduetoitscontributiontotheemergenceofapplicationssuchassafety

monitoring,assisteddriving,andintelligentrobots.However,inthedensepedestrianscene,due

tofactorssuchaslargedifferencesinpedestrianscalesandseveremutualocclusion,theexisting

pedestriandetectionmethodshavetheproblemsoflowaccuracyandhighmissedrates.

Therefore,basedonYOLOv5,thisthesisstudiesthedensepedestriandetectionmethod,which

involvesthreeaspects:networkimprovement,lossfunctionoptimizationandpost-processing

algorithmdesign.Themainresearchworkisasfollows:

显示全部
相似文档