基于YOLOv5的增强小目标检测.pdf
摘要
随着卷积神经网络在图像识别领域的广泛应用,通用场景下的目标
检测技术因其简单、快速、易于移植等特点而备受关注。小目标检测
(SmallObjectDetection,SOD)作为目标检测任务的子类,在智能交
通、地面侦察和海上救援等方面具有极为广阔的应用前景。相较于大中
目标的检测,小目标表现出极其有限的外观信息,目标与背景比例的不
平衡性再加上背景的干扰因素,这些特点都增加了特征识别的学习难度。
因此,本文利用YOLOv5(YouOnlyLookOnceversion5)对无人机航拍
数据集Visdrone2019中的小目标检测展开相关了研究,主要工作如下:
(1)针对大量聚集小目标互相遮挡的问题,提出了采用注意力机制的方
法来提高小目标的识别准确率。利用注意力机制提高目标特征图通道上的联系,
加强提取目标的特征信息。在YOLOv5网络结构中分别加入SE(Squeezeand
ExcitationNetworksCACoordinateAttentionECAEfficientChannel
)、()和(
Attetion)注意力机制模块进行对比实验。结果表明,注意力机制模块的加入在
YOLOv5ECA
一定程度上改善了小目标的检测能力;另外,+网络的检测效果具
有明显的优势,在网络收敛速度提升的同时,精确率、召回率和平均精度均值
meanAveragePrecisionmAP7821513
(,)分别提高了%、.%和.%,单张
960*540的图片推理时间降低了47%。在小目标互相遮挡情况下,也得到了良好
的检测效果。
(2)针对小目标特征提取不充分问题,提出了一种基于YOLOv5的增强
YOLOv5ESODYOLOv5EnhancedSmallObject
型小目标检测网络-(-
Detection)。该网络通过特征金字塔(FeaturePyramidNetwork,FPN)将深层
Path
的语义特征传递到浅层来加强多尺度的语义表达;引用路径聚合网络(
AggregationNetwork,PANet)将浅层的位置信息传递到深层的方式来加强网络
KMeans
定位能力。同时分析了数据集锚框聚类的方式,改进了-聚类算法。结
果表明,使用IOU(IntersectionofUnion)聚类的YOLOv5-ESOD增强网络比
YOLOv5mAP119816141806
网络的精确率、召回率和分别提升了.%、.%和.%。
(3)针对YOLOv5-ESOD网络提高检测精度的同时导致模型的体积增大,
检测速度降低的问题,进一步提出了通过改变网络模型宽度并融合注意力机制
的方法来轻量化网络结构。结果发现,在轻量化后的模型加入ECA注意力机制
可在提高精度,并大幅减少模型体积。接着使用NVIDIATensorRT加速推理小
目标检测网络,单张960*540的图片推理速度提高了大约10倍,实现了对模型
I
的加速推理。在此基础上,利用Web、Flask搭建网页版人机交互界面实现了对
小