基于内容的图像检索系统的设计与实现开题报告.doc
文本预览下载声明
开题报告
基于内容的图像检索系统的设计与实现
一、选题的背景、意义
1.1图像检索技术的产生和发展
随着多媒体技术和Internet网络的迅速的发展,数字图像的容量正以惊人的速度增长.
无论是军用还是民用,无论是静态的还是动态的,每天都会产生海量的图像信息.近年来大规模图像库的出现,管理、组织和利用图像成为一项亟待解决的技术难题.于是图像检索技术这种能够快速而且准确查找访问图像的技术应运而生[1].
基于内容的图像检索(Content-BasedImageRetrieval,简写为CBIR)是20世纪90年代兴起的新技术,其实质是图像特征相似性匹配检索.因其直观(示例描述)、高效(相似性匹配检索)、通用(与领域知识无关)等特点,近年来在国际国内均是一个热门研究课题.
图像检索技术发展到现在大致经历了两个阶段基于:文本的检索和基于内容的检索.早期的图像检索是基于文本注释的(Text.BasedImageRetrieval),该方法的实质是把图像检索转换为与该图像对应的文本检索.基于内容的图像检索即CBIR),即对图像的视觉内容,如图像的颜色、纹理、形状等进行分析和检索[2].
基于内容的图像检索系统的体系结构如图(一)所示[3]
图(一)
90年代后,在快速发展的数据库技术和计算机视觉技术的大力推动下,CBIR得到国内外计算机界研究人员的广泛重视,迅速成为国内外研究的热点之一。不仅各大著名国际杂志纷纷设立专刊介绍该领域的研究现状与科研成果,国内外各高校和科研机构也积极展开了对CBIR的研究,发表了大量相关理论和技术应用的论文[4-5].此外,鉴于人们对CBIR的重要性、
有效性和优越性有了更深的认识,近年来国内外已纷纷投入人力物力研制成一些系统,既有各科研机构的演示软件,也有商业应用软件。其中,较具有商业价值的有IBM公司的QBIC(QueryByImageContent)系统,Virage公司开发的Virage系统以及MIT多媒体实验室开发的Photobook系统。实验原型系统中比较具有代表性的有清华大学计算机系结合863高技术研究发展项目研制的“Web上基于内容的图像检索系统,Excalibur公司开发的RetrievalWaret
[6]系统,哥伦比亚大学开发的WebSEEK系统,UCSB大学开发的Netra系统原型以及美国伊利诺斯大学Urbana-Champian分校开发的MARS(MultimediaAnalysisandRetrievalSystem)系统。
就目前研究现状而言,CBIR技术己经研究了十多年,有了很大发展,也有了不少成形的算法,不过其中很多关键问题还是远远没有得到解决,总体效果不能令人满意。目前基于内容的图像检索技术仍然主要集中在颜色、纹理、形状、轮廓等底层视觉特征提取的基础上,但是由于图像特征描述和特征提取及相似性度量的复杂性,其技术仍不是很成熟,理论上有许多问题还有待解决。而且,由于计算机视觉以及人工智能发展的不成熟,及目前的关系型数据库不同于理论上的图像数据库,故还有许多问题需要进行研究。主要如下:1.图像特征描述与提取;2.相关反馈技术;3.结合多种检索手段[7];4.对专业图像的检索;5.数
据模型问题;6.多种检索手段相结合的问题
[7];7.高效存储及检索技术;8.如何评价和衡量一个检索系统的优劣还没有一个统一的标准。
1.2发展现状--图像检索算法的研究
基于图像内容的检索技术主要依据图像的颜色、纹理、形状特征以及图像中子图像(对象)的特征进行检索.常见的检索内容主要包括:
(1)颜色:图像颜色分布、相互关系、组成等:(2)纹理:图像的纹理结构、方向、组合及对称关系等:(3)形状:图像轮廓组成、形状、大小等:(4)对象:图像中子对象的关系、数量、属性、旋转等.
(一)颜色
颜色是图像检索中最先被采用的特征,通常采用RGB三色表示.为使表示法更符合人眼视觉特性,比较时一般要把RGB空间转换成其他颜色空间.Munsell,HIS,HSV,HSB都是面向视觉感知的颜色模型.颜色特征的表达主要有统计直方图、累积直方图和颜色布局3种.其中,MPEG-7在统计直方图中推荐了可伸缩颜色和帧组/图组颜色两种描述符,在颜色布局中推荐了颜色布局描述符.简单直方图匹配算法主要有颜色直方图、颜色一致性矢量、颜色有关图、颜色矩等.颜色直方图的比较是最基本的方法,但缺乏图像的空间信息:颜色一致性矢量方法不仅统计了整幅图像中各颜色的像素值,还统计了图像中各颜色最大区域的像素值,效果较好,但它并没有强调各颜色最大区域的形状以及与背景的关系:颜色有关图法强调同一颜色在图像中的空间距离有关性,其检索效果比上述几个方法都要好,但计算量比较大;颜
显示全部