论移动机器人的视觉导航.docx
文本预览下载声明
论移动机器人的视觉导航
1 地下控制系统
导航技术是移动机器的一项关键技术,其难度远远超过人们最初的想法。主要原因如下:首先,环境的动态变化无法预测;其次,机器人感知设备的不完整。即在大多数情况下,传感器提供的数据是不完整的、连续的和可靠的。这些原因使得机器人系统在复杂度、成本和可靠性方面很难满足要求。
目前广泛应用的一种导航方式是“跟随路径导引”,即机器人通过对能敏感到的某些外部的连续路径参照线作出相应反应来进行导航。这种方法和传统的“硬”自动化相比大大增加了系统的灵活性,其具有代表性的系统有:Control Engineering公司安装的导线引导系统,它是通过检测埋在地下的引导导线来控制行进方向,其线路分岔则通过在导线上加载不同频率的电流来实现;Egemin Automation公司生产的Mailmobile机器人则安装有主动式紫外光源,并通过3个光电探头来跟随由受激化学物质构成的发光引导路径;Macome公司为自动驾驶车辆则开发了一种磁引导单元,它是通过磁通门传感器检测磁带来进行车辆导航。从导航的观点来讲,这些引导方法的优点在于不会迷路,但是最大的缺点是功能单一,无法在行进的同时完成目标识别、绕过障碍等其他行为,而且,在安装维护成本、灵活性、抗干扰能力等方面与用户的期望尚有距离,从而限制了机器人产品的推广使用。
视觉方法是近年发展起来的一种先进导航方法,其和非视觉类传感器相比,视觉传感器具无噪声、无有害影响、信息量大等特点。在实际应用中,只需在路面上画出路径引导线,机器人就可以通过视觉导航系统来控制自身行走。相对于埋设导线、磁条,安装发光带等方法而言,这种方法进一步增强了系统的灵活性,并且降低了成本。为识别引导路径,Ishikawa采用了一种状态转移算法,并利用了系统中事先存储的110种不同的场景模式;Beccari还采用了一组特定的模板来检测不同的转弯路口。但是这些方法都有以下共同的缺陷:其一是为了提高视觉处理速度,检测方法不同程度依赖于确定的场景模式或模板,这样当机器人在运动过程中出现较大的偏差时,几乎不可能再回到正确路径上来;二是在检测目标时,仅考虑了当前帧场景图像,而没有充分利用以前目标识别的信息,从而在实时性和准确性两方面都会受到影响。
笔者研制开发了一个视觉导航系统,它是通过识别路径引导线和标志信息来为移动机器人提供视觉导航。由于只采用了单目视觉传感器,因此系统的成本和复杂度都得到了降低。为了使之真正做到稳健快速,在图像预处理、路径识别和路径跟踪等各个环节都充分考虑到算法的实时性与鲁棒性(见主要算法描述)。
2 路径识别模块
视觉导航系统软件由图像预处理、路径识别和路径跟踪3个主要模块组成,其工作流程如图1所示。
机器人视觉系统的原始输入图像是经图像采集卡A/D(模拟量/数字量)转换之后得到的连续数字图像。系统工作时,首先,图像预处理模块对原始输入图像以合适的分辨率和分割阈值挑选出对机器人有用的各类目标点(包括路径中的引导线、转弯标志、目的地标志等),并剔除其中的噪声点,而这些点的集合则构成目标的支持点集(support);然后,路径识别模块根据目标支持点集来检测场景中的引导线和各类标志,而引导线和标志综合起来就可以得到所需的路径信息;最后,路径跟踪模块根据路径识别模块所提供的路径信息,分直行和转弯两类情况调用不同的计算模块来为移动平台的运动控制系统提供输入参数。
3 基于路径的改进算法
快速、稳定、准确是移动机器人视觉导航的目标,为实现该目标,本文充分利用了图像序列信息,并且摒弃了过于复杂的处理算法,提出了一种基于路径的改进算法。改进后的算法在准确理解道路图像的前提下,每帧图像的处理时间不超过40ms,可以满足系统实时性的要求(25帧/s)。
3.1 图像预处理
3.1.1 目标选取采样点
对彩色图像进行二值化处理,不仅可以减少目标识别的计算量,还可以降低识别复杂度。本系统中原始输入图像为(384×288)像素的YUV格式图像,显然,如果对所有110 592个像素点都进行二值化处理,在运算时间上是一笔不小的开销。为此,笔者采用了如下一种基于变分辨率的智能采样方法:
(1)在初始化阶段,即不具备目标的先验知识时,以一种较低的分辨率对整幅图像中的像素点进行采样,并首先选出N×M个像素点作为目标候选采样点;
(2)进入目标稳定跟踪阶段后,再根据目标上一时刻在图像中的位置和大小设置搜索子窗口。由于窗口内采样的分辨率可以随窗口尺寸自动变化,因此可以在不至于丢失目标的前提下选择足够低的分辨率,以减少处理时间;
(3)当目标或者机器人的运动发生突然变化时,则有可能在搜索窗口内丢失目标,这时可以返回步骤1重新进行全局搜索。
上述步骤3虽会降低图像处理的效率,但是由于这种情形出现的概率很小,因此这种采样方法仍然节约了大量
显示全部