文档详情

8第八章 机器人的学习控制.pptx

发布:2025-03-05约6.75千字共36页下载文档
文本预览下载声明

第8章机器人的学习控制

8.1学习控制的前提条件学习的前提条件:一次运动在短时间内(t0)结束;有限时间区间t∈[0,T]内的理想运动轨迹事先根据经验给定;初始化常常是一定的,从初始化以后所试行的回数称为第k回,这时候的初始状态xk(0)在运动开始时,常常按照下面的情况进行初始化:在重复练习中,对象系统的动力学特性保持不变;输出轨迹yd(t)是可测定的。所以,任意第k回试行的误差通常可以按式(8-2)计算下个时间段内的伺服器输入uk+1(t)在记忆中尽可能以简单的递归形式表达,即:

8.1学习控制的前提条件D型学习控制法则P型学习控制法则每一步迭代的约束条件:

8.1学习控制的前提条件针对工业机器人:3初始化误差在容许的范围内,即存在ε10,满足下面的条件:4允许对象系统的动力学稍稍有些波动,即对某一ηk(t),存在ε20,使下式成立:5测量误差ξk:这时,若存在ε30,测量误差ξk满足式(8-11)所示的条件:

8.2D型学习控制(线性系统)电压控制型直流伺服马达满足:电压控制型直流伺服马达直流伺服马达的速度控制问题闭环系统的动力学:考虑下式:可以得到:一般解:

8.2D型学习控制(线性系统)电压控制型直流伺服马达直流伺服马达的速度控制问题给定理想的角速度yd(t),若给定第k次试行的控制输入vk(t),输出的角速度yk(t)应该为:第k+1次的试行的控制输入:可以得到:然后有:

8.2D型学习控制(线性系统)直流伺服马达的速度控制问题引入下面的函数范数:两边同乘以eλt,并取最大值,得取合适的γ,就有:?这意味着:D型学习控制的收敛性

8.2D型学习控制(线性系统)多输入/输出系统:理想轨道的初始条件为:学习的过递推程为:一般的D型学习控制法则

8.2D型学习控制(线性系统)以1个自由度的线性系统作为例子来说明学习控制的收敛性。这时,系统:a1=a2=1.0,b=1.0,Γ=1.0

对应一个自由度系统D型

学习控制方式的收敛性对应一个自由度系统D型

学习控制方式的收敛情形

a1=a2=1.0,b=1.0,Γ=0.5

8.2D型学习控制(线性系统)Γ=1.0时,收敛条件如下Γ=0.5时,有下式成立,也满足收敛条件,只是这时的收敛速度比Γ=1.0时的收敛速度慢一些。a1=a2=1.0,b=1.0,Γ=1.0

对应一个自由度系统D型

学习控制方式的收敛性对应一个自由度系统D型

学习控制方式的收敛情形

a1=a2=1.0,b=1.0,Γ=0.5

8.3机器人臂中的D型学习控制PD反馈控制下的机器人动力学方程 采用D型学习控制方法,其法则的递归形式机器人D型学习控制系统初始条件总是一定的常数,并满足下式和收敛性定理:[D型学习控制的收敛性定理(机器人臂)]

8.3机器人臂中的D型学习控制证明上述的定理,设:在区间[0,T]内,n维矢量函数e(t)的λ范数为:第k+1与第k次运动的差:假定在各自的的附近。这时下式成立运动的差乘以,并取范数e-λtλ将代入上式的右边,得到下式

8.3机器人臂中的D型学习控制采用状态变量可得写成简洁形式,得局部地满足Lyapunov条件,非线性函数h也局部地满足Lyapunov条件,即:然后,可得:对时间取积分,并且乘以e-λt,有:取范数,可以得到:应用Bellman-Gronwall推论,就有:

8.3机器人臂中的D型学习控制下式成立R(qk)满足全局Lyapunov条件,所以有:?这表明:Γ可以从下面的范围中取值:

8.4P型学习控制法P型学习控制中机器人的运动:定义理想的输入:可以得到:令:Δu=uk-ud

8.4P型学习控制法fk用泰勒公式展开为:对fk用指数函数取输入输出间的内积为:定义V和U分别为:输入的2次形式积分:

8.4P型学习控制法?PI型学习控制系统法则

8.5带有忘却因子的学习控制引入忘却因子的两种方法,如下。带有忘却因子的PI型学习控制系统法则具有长期记忆单元的带有忘却因子的PI型学习控制系统法则

8.5带有忘却因子的学习控制机器人的动力学、测量过程及学习法则如下:求于的控制公式为:求的多重内积,即:可以得到:

8.5带有忘却因子的学习控制?考虑动力学的扰动ηi(t)与测量误差ζi(t),有下式

8.5带有忘

显示全部
相似文档