复杂场景下的行人检测方法研究.pdf
摘要
行人检测作为目标检测任务中的一个分支,在自动驾驶、智慧交通、人机交互
等领域都有着广泛的应用,其研究成果对其他目标检测方法的发展起到了重要的
推动作用。同时,深度学习的快速发展也推动了行人检测技术的进步。但是,行人
检测器在复杂场景中的检测性能并不佳,比如在雾霾等不良天气场景下,特殊天气
信息使得图像中的行人变得模糊,对行人检测算法造成了干扰;在人群密集场景下,
由于行人之间存在高度重叠,导致检测器产生大量的漏检。针对以上问题,本文从
以下两个方面来进行复杂场景下的行人检测研究:
(1)不良天气场景下的行人检测方法研究。首先基于雾天成像模型,分析了不
良天气条件对行人检测方法所造成的影响。本文构建了一个由白平衡、去雾、锐化
等滤波器组成的图像处理滤波器模块,以降低图像中不良天气信息的干扰从而恢
复出目标更多的潜在信息。卷积神经网络使模型能够从输入图像中提取出高阶特
征,基于此,本文构建了一个参数预测器来预测滤波器模块中的参数。采用检测速
度较快的YOLOv3网络作为检测模块,对滤波器模块处理后的图像进行检测,并
对其骨干网络和特征输出网络进行了改进,进一步提高了网络提取特征的能力。整
个行人检测模型采用端到端的训练方式,本文所构建的模型能够自适应地处理正
常图像和不良天气条件下的图像。
(2)人群密集场景下的行人检测方法研究。首先分析了人群密集场景对行人检
测算法的影响和采用单实例预测的行人检测算法在密集场景中的局限性。本文以
FPN-Res50网络作为基线,并采用多实例预测机制,构建了一个在密集场景中检测
性能表现较好的行人检测器。在网络的检测头部中增加了一个额外的预测分支,使
得一个候选框能够同时预测多个行人,结合陆地移动距离损失函数与集合非极大
值抑制算法,提升了检测器在密集场景中的检测性能。本文将骨干网络ResNet50
替换为SE-ResNeXt-50,更好地融合了特征。针对多实例预测方法可能产生的错误
预测,引入了一个细化模块来对预测结果进行第二轮的预测,进一步提升了网络性
能。本文对行人检测器的跨数据集检测能力进行了分析,并采用渐进式的训练方式
提升了行人检测模型的泛化能力。
关键词:行人检测,YOLOv3,卷积神经网络,特征金字塔网络,多实例预测
ABSTRACT
Asabranchofobjectdetectiontasks,pedestriandetectioniswidelyusedinthefields
ofautomaticdriving,intelligenttransportation,human-computerinteractionandsoon.
Itsresearchresultshaveplayedanimportantroleinpromotingthedevelopmentofother
objectdetectionmethods.Atthesametime,therapiddevelopmentofdeeplearningalso
promotestheprogressofpedestriandetectiontechnology.However,thedetection
performanceofpedestriandetectorincomplexscenesisnotgood.Forexample,in
adverseweatherscenessuchashaze,thespecificweatherinformationmakesthe
pedestriansintheimageblurredandinterfereswiththepedestriandetectionalgorithm;
Inthecrowdedscene,thereisahighdegreeofoverlapbetweenpedestrians,resultingin
alargenumberofmisseddetectionbythedetector.Tosolvetheaboveproblems,this