基于改进YOLOv5的密集行人检测方法研究.pdf
基于改进YOLOv5的密集行人检测方法研究
摘要
随着计算机视觉技术的飞速发展,行人检测作为其中一项重要研究内容,不仅具有
极高的学术价值,更因其推动安全监控、辅助驾驶、智能机器人等应用的兴起而愈发受
到关注。但是在密集行人场景下,受限于行人尺度差异大以及相互遮挡严重等因素,现
有的行人检测方法存在精度低、漏检率高的问题。因此,本文基于YOLOv5算法,对密
集行人检测方法展开研究,涉及到网络改进、损失函数优化以及后处理算法设计三个方
面。主要研究工作如下:
针对密集场景下行人尺度差异大,导致小尺度行人漏检率高的问题,本文提出一种
密集多尺度行人检测方法DP-YOLOv5。为了提高骨干网络在提取不同尺度行人特征方
面的能力,并增强其对于小尺度行人的关注度,首先基于重参数化思想,采用改进的
RepVGG模块替换卷积模块,在少量增加测试时间开销的情况下,提升了检测精度。
33
其次,又在C3模块中添加高效注意力ECA,提高特征提取阶段对于小尺度行人的权重
分配。最后,为了增强模型对于不同尺度特征的利用率,提出一种加权的跨层连接路径
聚合网络,通过对不同尺度特征进行线性加权,使融合后的特征兼具浅层的位置信息和
深层的语义信息。
针对密集场景下行人类内遮挡,导致被遮挡行人定位准确性差以及边界框在后处理
阶段容易被抑制的问题,本文对损失函数和后处理算法分别进行了优化和设计。首先,
改进了边界框损失函数的回归损失,并添加了排斥损失项,优化后的损失函数不仅可以
提高预测框在尺寸回归和定位回归方面的精度,还可以降低附近真实框和预测框所带来
的干扰。其次,考虑到密集场景下行人密度大,高度重叠的预测框可能会被非极大值抑
制算法暴力删除,本文设计了一种两阈值后处理算法,采用距离交并比作为目标相似度
的评判标准,并通过两个阈值对于边界框置信度进行分段处理。最后,结合DP-YOLOv5,
得到本文最终的密集行人检测方法。
最后,在CityPersons和CrowdHuman数据集上进行一系列实验验证,实验结果表
明,与原始YOLOv5相比,本文所提出的方法可有效解决上述问题。
关键词:密集行人检测;YOLOv5;多尺度行人;遮挡行人
基于改进YOLOv5的密集行人检测方法研究
ABSTRACT
Withtherapiddevelopmentofcomputervisiontechnology,pedestriandetection,asone
oftheimportantresearchcontentsinthisfield,notonlyhashighacademicvalue,butalso
attractsmoreattentionduetoitscontributiontotheemergenceofapplicationssuchassafety
monitoring,assisteddriving,andintelligentrobots.However,inthedensepedestrianscene,due
tofactorssuchaslargedifferencesinpedestrianscalesandseveremutualocclusion,theexisting
pedestriandetectionmethodshavetheproblemsoflowaccuracyandhighmissedrates.
Therefore,basedonYOLOv5,thisthesisstudiesthedensepedestriandetectionmethod,which
involvesthreeaspects:networkimprovement,lossfunctionoptimizationandpost-processing
algorithmdesign.Themainresearchworkisasfollows: