基于图模型的图像分析研究-计算机应用技术专业论文.docx
文本预览下载声明
图 3-20 固定阶场景目标识别模型学习出的部分分布 36
图 3-21 固定阶图模型下基于 TDP 的多目标识别 36
图 3-22 基于部分和 TDP 的场景目标表达 37
图 3-23 基于 TDP 的“中国式餐馆”模型[28] 38
图 3-24 非固定阶场景目标识别模型学习出的部分分布 40
图 3-25 非固定阶图模型下基于 TDP 的多目标识别 41
图 4-1 词汇概率分布示例 43
图 4-2 不同场景类别的相似度矩阵 43
图 4-3 融入全局上下文信息的场景分析图模型 43
图 4-4 (a)目标类别的分布情况;(b)视觉词汇分布情况 44
图 4-5 图像所属场景类别概率示意 45
图 4-6 场景共生矩阵示例 45
图 4-7 所有类别场景下目标类别间的共生矩阵 46
图 4-8 融入局部上下文信息的场景分析图模型 46
图 4-9 局部上下文知识解决目标视觉歧义问题的实例 47
图 4-10 HDP 下融入全局和局部上下文信息的场景分析图模型 47
图 4-11 融入知识的场景分析过程 48
图 4-12 场景分析指导目标识别 49
图 4-13 目标识别反馈作用场景,解决场景视觉歧义问题的实例 50
图 4-14 目标识别结果反馈作用于场景分析 50
独 创 性 声 明
本 人声明 所呈 交的学 位论 文是本 人在 导师指 导下 进行的 研究 工作及 取得 的研究 成果。 据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已经发表或撰
写 过的研 究成 果 ,也 不 包 含为获 得 合肥 工业大 学
或其 他教育 机构 的学位 或证 书而 使
用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示谢意。
学位论文作者签字:朱士蓉 签字日期: 2011 年 04 月 16 日
学位论文版权使用授权书
本学位论文 作者完全了 解 合肥工 业大学
有关保留、使用学位论文的规定,有权
保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅或借阅。本人
授权 合肥工业大学
可以将学位 论文的全部 或部分论文 内容编入有 关数据库进行 检
索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。
(保密的学位论文在解密后适用本授权书)
学位论文者签名:朱士蓉 导师签名:高隽
签字日期: 2011 年 04 月 16 日 签字日期: 2011 年 04 月 16 日 学位论文作者毕业后去向:
工作单位:杭州淘宝 电话:通讯地址:杭州市华星路 99 号 邮编: 310099
PAGE
PAGE 10
第一章 绪 论
1.1 研究背景及意义
真实世界的场景具有复杂、多变等特性,这使得图像分析成为一项颇具挑 战的任务。目标识别和场景分析是图像分析领域的两大核心任务。目标识别和 图像区域的特征描述紧密相关,区域特征分割为目标识别提供了输入数据。根 据认知科学不完全统计,真实世界场景中存在约一万至三万种目标类别描述, 如何区别这些描述,如何体现各种目标的认知特性,是场景中目标识别的研究 关键。由此我们可以归纳出,目标识别的主要问题可归结为以下两个方面:目 标建模和计算。目标建模是指如何去学习 /定义一般多变模式 /目标的统计学 问 题;计算是指根据建模结果处理概率推理的问题。场景分析是一个知识密集型 过程。只有融入这种类似人类知识的计算机才可以认为具有智能的“视觉”。目 标建模和场景解释需要大量的先验知识,因此,仅仅通过计算机的学习,建立 相应类别目标和场景的区分信息是远远不够的。只有在计算机形成有效的数据 表示结构和学习分析策略后,将这些内容转换成类似人类语义知识描述,同时 将前端获取的图像数据信息转换为模型可识别的信息,才能让计算机实现近似 人类视觉感知和分析过程。
在非特定环境、非限定约束条件下,让计算机直接对图像信息进行分析, 准确判断出场景图像中有什么、在哪儿以及目标间的相互关系,是非常困难的 事情。为此,需要借助一种有效的知识表达结构,使目标识别过程融入必须的 先验信息。图模型即是一种有效知识表达系统,它作为图论和概率论的融合, 由概念及概念间的若干关系构成。概念往往用图模型的节点来表示,可以理解 为系统的动作、原因、结果、倾向及趋势等,它反映系统的属性、性能与品质, 如果赋予每个节点很强的语义信息,那么整个图模型的语义信息就很强;概念 间的关系常用图模型中的边来表示,它是有效的表达工具并支持基于先验知识 的自适应行为。在计算机视觉分析中,图模型由语义信息和视觉特征的基本单 元结构化组合构成,具有高效的知识表达存储和概率分
显示全部