《计算机视觉》 课件 1、绪论.pptx
计算机视觉主编胡永利副主编段福庆王爽参编王少帆权豆姜华杰郭岩河战略性新兴领域“十四五”高等教育系列教材机械工业出版社
1、绪论人类视觉计算机视觉计算机视觉的发展经典计算机视觉理论计算机视觉的应用和挑战课程内容及要求
人类视觉人类约有80%的信息是通过视觉系统获取的人类视觉的生理基础:周围环境中的物体在可见光的照射下,在人眼的视网膜上形成图像,由感光细胞转换成神经脉冲信号,经神经纤维传入大脑皮层进行处理与理解。
人类视觉电信号首先通过视神经传递到大脑的初级视觉皮层(V1区),位于枕叶。随后,这些信号被传递到次级视觉皮层(如V2、V3),在这些区域中,信号被用来解析更复杂的图像属性。进一步的视觉信息传递到视觉联合区域,如V4和V5,分别处理更细致的颜色和运动信息。大脑的颞叶和顶叶参与信息整合,颞叶处理面孔和物体识别,而顶叶处理空间定位和物体运动。
1、绪论人类视觉计算机视觉机器视觉的发展经典机器视觉理论机器视觉的应用和挑战课程内容及要求
计算机视觉计算机视觉是是一门致力于使计算机能够从图像或视频中“看”和“理解”现实世界的科学。计算机视觉试图实现人类视觉的信息获取和处理的全过程,通过对图像和视频的分析处理,实现类似人类视觉感知功能。输入:图像(images)或视频(video)输出:对象的恢复以及对对象信息的使用图1-3计算机处理图像的基本过程
计算机视觉通过对图像和视频信号进行描述、存储、识别与理解,感知三维环境中物体的几何信息,包括形状、位置、姿态、运动等。视觉机理视觉信息获取(图像获取)采样、量化、表示视觉信息处理(图像处理)图像预处理、滤波、变换、分割、特征表示和检测视觉信息理解(图像理解)三维信息恢复和重建、运动信息提取研究目标:使机器像人那样,通过视觉观察和理解世界,具有自主适应环境的能力。
1、绪论人类视觉计算机视觉计算机视觉的发展经典机器视觉理论机器视觉的应用和挑战课程内容及要求
计算机视觉的发展启蒙阶段(1960s-1980s):
计算机视觉基础理论探索与建立的阶段LarryRoberts的博士论文标志性地提出了从二维图像中提取三维形状的方法。重构主义阶段(1980s-2000s):
传统计算机视觉算法快速发展的阶段建立专家系统来存储先验知识,然后与实际项目中提取的特征进行规则匹配。开创了以理解三维场景为目的的三维视觉研究DavidG.Lowe提出了基于知识的视觉(Knowledge-basedVision)的概念ChrisHarris和MikeStephens提出Harris角点检测算法DavidLowe在1999年提出的SIFT(尺度不变特征变换)算法
计算机视觉的发展分类主义阶段(2000s-2010s):
计算机视觉技术的成熟与应用探索阶段一系列关键技术的成熟以及新应用的探索PaulViola和MichaelJones提出的Viola-Jones人脸检测算法成为了第一个能够在实时环境中进行人脸检测的算法支持向量机(SVM)和随机森林等机器学习算法特征提取技术如HOG(方向梯度直方图)和LBP(局部二值模式)大数据、大模型和大算力阶段(2010s-至今):
大数据和大算力支撑下的深度学习技术迅猛发展并出现大模型的阶段随着计算机运算能力的指数级增长和ImageNet、PASCAL等超大型图片数据库的出现,深度学习技术带领计算机视觉开启了一个新阶段FasterR-CNN、YOLO、GANBERT、GPT等大型预训练模型的适配和优化,如OpenAI提出的CLIP模型[17],展示了跨模态学习的巨大潜力。
1、绪论人类视觉计算机视觉计算机视觉的发展经典机器视觉理论机器视觉的应用和挑战课程内容及要求
Marr计算视觉理论DavidMarr(1945-1980)是英国心理学家。他将心理学、人工智能和神经生理学的结果结合起来,对视觉的研究做出了重要贡献。他是计算视觉的奠基人。1982年马尔(DavidMarr)《视觉》一书的问世,首次提出了视觉计算理论,是第一个系统的计算机视觉理论框架。
Marr视觉理论(1) 计算理论:视觉系统的主要任务是从视网膜捕获的二维图像中重构出物体的三维表面形态,这一过程通常被称为“三维重建”。Marr将计算视觉分为三个层次:计算理论、表达与算法以及算法实现。(2) 表达与算法(2) 算法实现低层视觉中层视觉高层视觉图像特征“要素图”2.5D描述3D描述假定视觉系统是对视觉环境的被动响应假定视觉计算是由局部信息到整体信息的单向过程马尔视觉计算理论认为,物体的表达形式为该物体的三维几何形状。(不完全正确)软件和硬件
Marr视觉理论信息处理的三个阶段低层视觉(Low-levelvision)