采用自适应聚类的教学视频关键帧研究.doc
文本预览下载声明
采用自适应聚类的教学视频关键帧研究
摘 要: 视频镜头分割和关键帧提取是当前数字视频系统发展的关键步骤。在AP聚类算法之上做了两点改进:一是在初始相关系数矩阵中增加权重,提高聚类精度;二是自适应调整阻尼系数,提高收敛速度。先利用颜色信息加权和相邻帧间差方法把视频分割成镜头,再利用改进的AP聚类算法对镜头提取关键帧。实验结果表明,所提出的方法有效地解决了关键帧提取方法中耗时高和视觉信息低效的问题。
关键词: 数字视频; 镜头分割; 关键帧提取; AP聚类
中图分类号:TP391.41 文献标志码:A 文章编号:1006-8228(2016)12-90-05
Abstract: Video shot segmentation and key frame extraction is the critical step in the current digital video system development. In this paper, the AP (affinity propagation) clustering algorithm is improved in the two points: first, the weight is increased in the initial correlation coefficient matrix to improve the clustering accuracy; second, the damping coefficient is adjusted adaptively to improve the convergence rate. Use the weighted color information and adjacent frame difference method to divide the video into shots, and then use the improved AP clustering algorithm to extract the key frames from the shots. The experimental results show that the method proposed can effectively solve the problems of high time consuming and low efficiency of capturing visual information in the key frame extraction methods.
Key words: digital video; shot segmentation; key frame extraction; affinity propagation clustering
0 引言
随着视频采集、存储与分布技术上的进步,教学视频在学生日常生活中的访问次数呈现指数级增长。如何帮助学生有效地浏览及检索其感兴趣的视频,将具有重要的理论意义和实用价值。作为基于内容的视频检索[1-2]基础,如何把视频数据组织成为更加紧凑的关键帧则是本文要探讨的问题。
多年来,各种聚类算法被应用于关键帧提取。通常来说,当聚类完成后,在每个类别中选择一幅图像作为关键帧。这种聚类算法的性能在很大程度上依赖于用户输入值的大小或设置阈值参数值高低(例如,簇的数目)。此外,用于测量帧之间的相似度的标准也显著地影响了关键帧设置。并且,许多现有的视频检索方法在预处理阶段使用均匀采样方法会导致一些信息帧的排斥。
本文描述了一种新型的有效利用改进的AP聚类提取视频关键帧的方法。该方法按照图像帧颜色信息分布不均匀特征对AP聚类的输入矩阵(也称为相似度矩阵)增加权重且自适应调整阻尼系数,避免了提取关键帧的不可靠和用户手动设置阻尼系数的随机性的影响,提高了关键帧的准确性和有效性。
1 镜头分割
视频根据其自身的结构特征,被划分为场景、镜头和视频帧三个层次,镜头边缘检测(也称为镜头分割)是视频检索和视频摘要的第一步,主要是将视频进行有效地分割[3]。其基本流程如图1所示。
先把视频转化为m个帧,然后将m个帧分为
B(3×3)个区域,接着计算每一个区域的灰度直方图,最后通过对B个区域中进行加权得到最后的相似度。根据m个帧之间的相似度和高低阈值系数可以对镜头进行突变检测和渐变检测。
1.1 相邻帧帧差值计算
YUV颜色空间是一种颜色编码方法,该方法经常被用于电视系统,其特点是可以隔离亮度信号Y和色度信号U、V[4]。它可以不通过解压缩而直接通过压缩视频获取。其中信号Y表示明亮度,信号U和V表示色
显示全部