基于视频的人体动作识别分析-计算机应用技术专业论文.docx
文本预览下载声明
重庆大
重庆大学硕士学位论文
英文摘要
PAGE
PAGE IV
Key words: human action recognition, spatio-temporal interest point, K-means clustering, bag-of-words model, support vector machine
重庆大学硕
重庆大学硕士学位论文
目
录
目 录
中文摘要I
英文摘要 II
1 绪 论 1
1.1 课题研究背景与意义 1
1.2 国内外研究现状 2
1.2.1 序列图像法 3
1.2.2 时空整体法 5
1.2.3 现有识别方法的不足 6
1.3 本文研究内容与章节安排 7
2 时空兴趣点检测 9
2.1 常用时空兴趣点检测算法 9
HYPERLINK \l _TOC_250005 Cuboid 检测器 9
HYPERLINK \l _TOC_250004 Hessian 检测器 10
2.1.3 密集采样检测器 10
HYPERLINK \l _TOC_250003 2.1.4 3-D Harris 角点检测器 10
HYPERLINK \l _TOC_250002 2.2 二维 Harris 角点检测 11
HYPERLINK \l _TOC_250001 2.3 三维时空 Harris 角点检测 13
2.4 多尺度角点检测 15
HYPERLINK \l _TOC_250000 2.5 三维 Harris 角点检测实验结果 15
2.6 本章小结 17
3 局部特征描述子提取 18
3.1 常用局部特征描述子 18
Cuboid 描述子 18
HOG/HOF 描述子 18
三维 SIFT 描述子 19
3-D HOG 描述子 19
3.2 3-D HOG 描述子建立 19
3.2.1 时空梯度计算 21
3.2.2 梯度方向量化 21
3.2.3 直方图建立 22
3.2.4 描述子建立实验结果 22
3.3 人体动作表征 25
3.3.1 视觉词袋模型 26
3.3.2 K-means 聚类算法 27
3.3.3 初始聚类中心选择的改进 27
3.3.4 动作表征实验结果 31
3.4 本章小结 34
4 人体动作分类识别 35
4.1 k 近邻分类器 35
4.2 支持向量机 36
4.2.1 最优分类超平面 36
4.2.2 核函数 39
4.2.3 SVM 之多类分类 41
4.3 本章小结 42
5 实验结果与分析 43
5.1 视频库介绍 43
5.2 人体动作识别实验结果 44
5.2.1 基于 Weizmann 视频库的实验结果 44
5.2.2 基于 KTH 视频库的实验结果 47
5.2.3 实验结果比较 50
5.3 本章小结 52
6 总结与展望 53
6.1 全文总结 53
6.2 工作展望 54
致 谢 55
参考文献 56
重庆大学
重庆大学硕士学位论文
1 绪 论
PAGE
PAGE 10
1 绪 论
1.1 课题研究背景与意义
在科学技术飞速发展的今天,各种前沿的科学研究和面向现实需求的技术应用 层出不穷,特别是在现代生活信息化、自动化、智能化的时代背景下,计算机视 觉成为了科学界研究热点领域之一,而人体动作识别又是近年来具有挑战性又极 其重要的研究课题。视频中人体动作识别主要涉及计算机视觉、图像处理、模式 识别、计算机图形学、数据挖掘等多学科领域,是一个以计算机视觉技术为核心、 学科交叉、相互融合的研究方向[1]。而视觉是人类认知外界、获取信息的主要来源, 人体通过视觉获取的信息占人类通过眼睛、耳朵、鼻子等感官器官获取的总信息 量的 60%之多,视觉除了对光信号具有感知能力外,也包括对信息的获取、传输、 处理、存储和理解的整个过程,由此可见,视觉是人类认知世界的一个重要的渠 道。
研究人员依据动作的复杂程度将与人体相关的待识别的动作模式分为四个层 次:人体姿态、单人动作、双人交互、群体行为。目前大部分的研究工作仍主要 集中于前两个层次,而较为复杂的后两个层次的研究是以人体基本动作的识别为 基础的,单个人体动作的稳定、准确识别是人体复杂行为理解需要解决的核心问 题,是现代智能视觉系统能否有效处理现实生活中多种多样的人类活动的前提。 所以,针对人体简单、基本动作的识别成为了近年来的研究热点。
人体动作识别在智能监控、人机交互、视频检索以及行为分析等领域有广泛的 应用[2]。例如医院常常采用的看护系统,使用摄像头对看护现场采集视频信息,计 算机通过分析识别出观察到的人体动作,判断出看护对象的潜在意图,在紧急情 况下可以及时通
显示全部