行人检测相关技术研究.docx
文本预览下载声明
行人检测相关技术研究在本章节中,我们重点介绍行人检测中的候选区域的确定,如何进行特征提取,分类模块将在模型搭建过程中,结合训练测试过程进行详细介绍,如图 3-1所示。随着行人检测技术的不断发展,每部分相应的技术也在不断的丰富,下面对各部分中一些相关技术进行详细介绍。图3-1 行人检测模块图 行人候选区域确定 滑动窗口法Papageorgiou等人首先提出利用多尺度Haar小波特征和支持向量机(Support Vector Machine,SVM)组合[42],进行人脸、人体和车辆等目标检测[43]。其中多尺度是利用滑动窗口法实现,主要目的是将目标检测问题转化为简单的二值分类问题。视频或图片中的行人由于身高或拍摄距离等因素的影响,大小变化不一。针对该问题,滑动窗口法采取“以不变应万变”的方法。其实滑动窗口法的窗口滑动方式有两种:1)窗口尺寸大小不变,输入图像进行尺度缩放[44]。首先对检测图像按不同比例进行缩放,缩放图和原图像组成一个图像集合,然后对集合中个每幅测试图像进行从左到右、从上到下依次滑动窗口,最后通过分类器对每一个滑动窗口进行判别是否为行人。如图3-2所示。2)窗口本身进行多尺度的缩放(特征提取方式要做相应的调整),测试图像保持大小不变。首先根据实际情况需要选定不同尺度的窗口,然后利用每个不同尺度的窗口同样按照从左到右、从上到下依次滑动遍历图像。如图3-3所示,是行人检测[45]中常用的种候选窗口,分别是三种面积(,,)以及三种比例(;;),每个窗口将会扫描图像所有区域。图3-2 滑动窗口法示意图图3-3 9种候选窗口示意图其中,窗口本身进行多尺度的缩放法规避了图像进行多尺度特征计算,降低了计算量,提高了图像检测速率。另外也可以训练不同尺度下的分类器[46],减轻特征计算的负担。实际情况中,应该根据自身的行人特征提取方法来确定使用哪种滑动窗口法[47]。本文中,接下来的LDCF模型搭建过程中便是采用第一种方式,滑动窗口大小为84×28,大小保持不变,测试图像采用,,,,……, 共27中尺度缩放。 非极大值抑制如图3-4所示,检测结果中,目标会被多个检测窗口包围,需合并选择其中最优窗口,即非极大值抑制算法(Non-Maximum Suppression,NMS)[48] [49]。假设目标图像检测结果如下: (3-1)其中,表示第个检测窗口;表示该窗口的左上角点的坐标值;和分别表示该检测窗口对应的宽和高;表示该窗口判断否为行人的权重。其中权重有很多求解方法,但大多数是根据窗口重叠程度进行非极大窗口抑制处理[50]。窗口之间的重叠可根据公式(3-2)求解: (3-2) (3-3) (3-4) (3-5) (3-6)其中表示窗口的面积;表示窗口和窗口的重叠面积即两个窗口的交集,可根据公式(3-3)求得,可根据公式(3-6)求得。NMS效果如图3-4所示,NMS简单来说就是将检测不是最优的窗口过滤掉,只保留最佳检测窗口,减少窗口重复。基于窗口重叠的非极大值抑制算法[51] [52]如表3-1所示。图 3-4 检测窗口非极大值抑制示例特征提取前文中我们已经就叙述了行人候选区域确定的方法,接下来在这一小节中我们根据前人的研究,介绍本文检测模型搭建中用到的几种经典的行人特征描述子,如梯度方向直方图特征(HOG)[53] [54]、积分通道特征(ICF)[47] [55]、聚合通道特征(ACF)[56]等。表 3-1 基于窗口重叠的非极大值抑制算法梯度方向直方图特征梯度方向直方图(Histogram of Oriented Gradient,HOG)[14]的核心思想是:使用梯度或边缘的方向密度分布将一幅图像中的目标区域的形状等特征表示出来[53] [54]。HOG描述子是目前最常用于行人特征提取的特征之一,拥有保持几何和光学转化不变性等优点,因此在本文接下来的LDCF模型中的10通道中同样选取HOG特征作为特征表述之一。如图3-5 所示,HOG特征的运算流程具体如图3-5:具体运算步骤如下:(1)图像归一化为了减少光照造成的影响,需要将图像归一化,通过变换将图像标准化处理,其目的是为了调节像素的对比度,减少输入图像局部的阴影、光照变化以及噪音干扰所造成的影响[57]。为了减少计算量,可以先将图像转为灰度图[57] [58]。图3-5 HOG特征运算流程图标准化公式: (3-7)其中为为灰度图像的像素值,为经过标准化处理后的像素。在图3-6中展示出效果图,根据Dalal的研究,我们选取时,对后续HOG特征提取效果最佳。图3-6 (a)为视频某一帧图像的原图,(b)为灰度变换后的图像,(c)为Gamma=1/2.2时的变换图像,(c)为Gamma=2时的变换图像(2)图像梯度计算计算图像梯度的目的是:可以得到行人的轮廓和一
显示全部