涉及数字图像处理,摄像机标定,立体视觉的计算机视觉PPT.ppt
文本预览下载声明
计算机视觉 孙明竹 课程信息 主讲人:孙明竹 实验室:伯苓楼机器人所 602室 课程成绩:平时作业(10%)+期末考试(40%) 答疑:当面、电话、邮件 主要参考书 马颂德,张正友《计算机视觉——一种理论与算法基础》,科学出版社,1998 David Forsyth,Jean Ponce 《计算机视觉——一种现代的方法》,清华大学出版社,2004 Rafael Gonzales et al《数字图像处理(MATLAB版)》,电子工业出版社,2005 Milan Sonka et al《图像处理、分析与机器视觉》,人民邮电出版社,2002 期刊、会议论文…… 善于使用网络:官网、论坛、主页、博客、Wikipedia、google、百度…… 绪论Introduction 主要内容 第1章 绪论 1.1. 计算机视觉(Computer Vision)的概念 1.2. 计算机视觉的发展 1.3. Marr的计算视觉理论框架 1.4. 课程主要内容 补充:matlab程序设计 1.1. 计算机视觉的概念 Why Vision? 视觉是人类最重要的感觉,人类认识外界信息80%来自视觉 计算机视觉的概念 利用各种成像系统代替人类的视觉器官作为输入手段,由计算机来代替大脑完成处理和解释 计算机视觉的最终目标 使计算机像人那样,通过视觉观察和理解世界,具有自主适应环境的能力 1.1. 计算机视觉的概念 计算机视觉当前的研究目标 使计算机具有通过二维图像认知三维环境的能力: 感知三维环境中物体的几何信息,包括形状、位置、姿态、运动等 对它们进行描述、存储、识别与理解 计算机视觉与相关学科的关系 图像处理(Image Processing) 图像处理,人是最终的解释者 计算机视觉,计算机是图像的解释者 模式识别(Pattern Recognition) 根据从图像中抽取的统计特性或结构信息,把图像分成设定的类别 计算机视觉与相关学科的关系 计算机图形学(Computer Graphics) 计算机图形学是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学 计算机图形学:从三维描述到二维图像显示 计算机视觉:从二维图像数据到三维描述 计算机视觉与机器视觉(Machine vision) 基本理论框架、底层理论、算法相似 研究的最终目不同 1.2. 计算机视觉的发展 发展概况 20世纪50年代:统计模式识别 二维图像分析和识别,如光学字符识别、工件表面、显微图片和航空图片的分析和解释等 20世纪60年代:Roberts的三维积木世界 通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述 开创了以理解三维场景为目的的三维视觉研究 后人解决了由线段解释景物和处理阴影等问题 1.2. 计算机视觉的发展 三维积木世界 1.2. 计算机视觉的发展 发展概况(续) 20世纪70年代:Marr为代表的计算理论 核心是从图像恢复物体的三维形状 提出要从不同层次去研究信息处理的问题 对计算理论和算法实现,特别强调计算理论的重要性 20世纪80年代:主动视觉(Active Vision) 主动视觉的四个特征:主动性(Active) 、选择性(Selective) 、目的性(Purposive) 、定性性(Qualitative) 对计算机视觉新的理解:根据任务,调整成像参数,选择感兴趣的区域,获取相关的图像信息 计算机视觉的困难与问题 计算机视觉是一个逆问题 输入:二维灰度图像 输出:三维物体的几何特征、位置 视觉信息多种多样,视觉知识的表达很困难 图像数据量巨大,信息存储与检索困难 对生理学、神经生物学等的研究有待深入 计算机视觉的应用 自主车导航 目标跟踪 工业应用:产品检验、柔性装配、海洋石油开采、海底勘察 医疗和军事应用:医疗外科手术 …… 计算机视觉的应用 Video from ICRA/IROS 自主车导航 高速动态场景中的运动障碍物检测 显著区域检测 外科手术机器人 其他视频 1 2 1.3 Marr的计算视觉理论框架 视觉系统研究的三个层次 计算理论层次:回答系统各个部分的计算目的与计算策略(各部分的输入输出,之间的关系变换,之间的约束) 表达与算法层次:视觉系统的研究应给出各部分(各模块)的输入、输出和内部的信息表达,以及实现计算理论所规定的目标的算法 硬件实现层次:如何用硬件实现以上算法 1.3 Marr的计算视觉理论框架 视觉信息处理的三个阶段 1)低层视觉(Low-level vision) 构成要素图(primal sketch),要素图由二维图像中的边缘点、直线段、曲线、顶点、纹理等基本几何元素或特征
显示全部