基于YOLO模型实时目标检测与计数系统设计及实现.pdf
基于YOLO模型实时目标检测与计数系统设计及实现
摘要
随着科技的不断进步发展,计算机视觉应用于社会各领域。图像处理、目标检测、
目标跟踪、人脸识别、密集人群计数等研究方向引起高校科研人员和社会公司的广泛关
注,其中目标检测任务是其它任务的基础,并且在计算机视觉中极具挑战性。而密集人
群计数任务能帮助人类避免各种危险事件的发生,具有重要意义。
目标检测任务是检测出图像或者视频中实际物体的类别,并且用一个轴对称的边框
标注出物体的大致位置以及置信度,但是当图片或视频中目标数量众、遮挡严重或者目
标多尺度变化的时候,一般目标检测算法会出现误检、漏检、检测精度不高和模型收敛
速度慢等情况。而在密集人群计数任务中由于密度图中密集区域和稀疏区域具有不同的
密度模式,导致预测密集区域准确性降低。针对以上问题,本文提出具有混合空洞卷积
的目标检测算法和基于改进YOLO的密集人群计数网络,并实现了一个实时目标检测
和密集人群计数系统。本文主要工作如下:
(1)针对目标多尺度变化、小目标和目标受遮挡时检测精度不高、误检、漏检、模
型收敛速度慢的问题,对YOLOv3算法改进,首先设计空洞卷积混合感受野模块HRFM
(HollowconvolutionReceptivefieldmodel)优化网络特征提取过程,提升特征点感受野,
在此基础上优化网络结构,提出混合空洞路径聚合金字塔网络HAPN(Hybridhollowpath
aggregationpyramidnetwork),解决目标多尺度变化问题。其次设计解耦检测头DH
(DecoupledHead)和改进正负样本匹配机制,提高小目标检测精度和模型收敛速度,然后
通过拍摄校园和社会上的图片对pascalvoc数据集进行扩充,并进行数据增强改进处理,
组成voc2023数据集。最后将改进后的算法和其他目标检测算法在数据和检测效果上进
行对比。
(2)针对在密集人群的图片或视频中计数精度不高,密度图中密度模式的变化导
致预测密集区域准确率低的问题,在第三章改进算法的基础上生成不同尺度的特征图,
并对特征图进行回归操作生成高斯密度图,然后对密度图中大密度区域进行缩放,使其
密度图整体具有相似的密度和像素点趋于一致,提升密度图质量和网络计数精度。并对
设计的网络进行结构效率试验、消融实验、可转移性实验。
(3)将本文提出的YOLO-SPP-HPAN-DH目标检测算法与YOLO-FPDM-DNM密
集人群计数网络结构集成到平台,让理论应用落地。该系统主要分为4个模块:系统入
口模块,提供登录、注册、找回密码功能;算法选择模块,用户可根据现实需要选择目
哈尔滨工程大学硕士学位论文
标检测模式与计数模式;检测与计数模块,提供图片导入、视频导入、实时摄像头开启
三种方式;结果输出模块,当选择目标检测模块时,系统主界面显示检测时间、所有目
标数目、目标类别、目标置信度、目标具体位置和用于选定某一具体目标的按键。当选
择计数模式时,系统检测与计数界面输出预估密集人群计数数值、预测密度图、预测密
度点、预测人头框四方图。
关键词:目标检测;密集人群计数;空洞卷积;YOLOv3算法
基于YOLO模型实时目标检测与计数系统设计及实现
Abstract
Withthecontinuousprogressanddevelopmentofscienceandtechnology,computer
visionisappliedinvariousfieldsofsociety.Researchdirectionssuchasimageprocessing,
targetdetection,targettracking,facerecognition,anddensecrowdcountinghaveattracted
widespreadattentionfromuniversityresearch