文档详情

复杂环境下六足机器人人机协同决策方法研究.pdf

发布:2025-06-06约27.18万字共页下载文档
文本预览下载声明

摘要

复杂环境下六足机器人人机协同决策方法研究

摘要

六足机器人具有稳定性好、负载能力强、地形适应性高等优点,是复杂环

境中优先考虑的移动平台。由于六足机器人通常需要承担物资输送、抢险救灾

等任务,其移动与作业任务一般较为复杂性,导致机器人的行为决策和驾驶操

作目前仍主要依赖于人类驾驶员。然而,随着六足机器人所在环境的复杂度以

及任务难度的升级,人机分别负责顶层决策和底层运控的串行协作模式具有较

大弊端。尤其是当驾驶员需要承担所有决策与操作驾驶任务时,驾驶员的操作

负担重且机器人的运动性能指标也将受到不利影响。因此,如何融合人机各自

在行为决策方面的优势,研究一种适用于复杂环境的六足机器人人机协同决策

方法具有重要意义。

然而,采用数据驱动为内核的传统机器学习方法形成自主决策模型时,忽

略了驾驶员决策的逻辑特点,难以满足人机在决策层协作时的需求。并且,对

于人机在决策层发生决策结果冲突的情况,目前缺乏有效方法对二者进行合理

仲裁。此外,人机在决策层形成统一结果后,仍面临决策结果不能高效转化为

最优人机指令组合的问题。

针对上述三方面问题,本文首先通过建立基于分步训练神经网络的六足机

器人驾驶员模型,使机器人能形成符合驾驶员决策习惯的自主决策模型。其次,

提出面向人机决策结果冲突的协商策略,综合考量人-机-环境因素对人机决策

结果冲突进行仲裁。同时,建立基于多目标约束的人机指令组合优选方法,将

决策结果高效转化为可执行的最优人机指令。

为了高效形成符合驾驶员决策逻辑特点的六足机器人自主决策模型。本文

第二章以驾驶员决策逻辑流程设计神经网络结构,将网络划分为多个判断层和

指令层,以逐层精准寻优的方式得到驾驶员的决策模型。在此基础上,开展机

器自主强化学习,通过不断优化更新驾驶员决策模型中的参数,使机器人决策

智能在几种典型非结构环境下初步具备一定的泛化能力。

为了在人机协同决策过程中,对可能出现的人机决策冲突进行合理仲裁,

本文第三章首先基于人类驾驶员的决策逻辑特点建立人机协同决策流程框架,

从而减小人机在行为决策认知上的差异。此外,聚集决策过程的人-机-环境特

征,将驾驶员观察视角、地形参数、机器人性能评价指标建立量化模型,从而

减小人机双方在接触环境状态感知上的差异。在此基础上,借助经济学中博弈

-I-

哈尔滨理工大学工学博士学位论文

协商理论,建立人机各自的决策收益函数,提出一种人机协商策略使人机可以

形成一致的决策结果。

为了进一步将人机决策结果高效转化为可执行的最优人机指令,本文第四

章首先将人机状态约束具体为机器人运动几何约束条件和驾驶员疲劳约束条

件。其中机器人运动几何约束主要包括机器人在障碍、沟壑和上坡地形下的运

动指令约束条件;驾驶员疲劳约束主要包括上肢疲劳、操作失误和轨迹偏移量

三方面因素。此外,依据人机状态约束和人机指令优化目标,在决策目标对应

的人机指令可行集进行优化筛选,并将最优人机指令推荐给驾驶员,辅助其对

机器人进行运动控制。

为满足对本文所提出的上述方法进行实验验证的需求,本文首先利用小型

六足机器人在室外地形环境中开展实验,验证基于分步训练神经网络的驾驶员

模型有效性,结果表明六足机器人已初步具备在多个典型非结构地形下的自主

决策能力。其次,利用模拟驾驶平台开展实验,验证基于多目标约束的人机指

令优选方法的有效性。最后,利用大型六足机器人实物样机开展综合性的验证

实验,结果表明采用本文提出的人机协同决策方法在稳定性、能量消耗及碰撞

次数三个方面的性能指标,优于驾驶员和机器人单独决策。

本文提出了一种适用于复杂环境下的六足机器人人机协同决策方法,并成

功应用于坡地、沟壑以及障碍等多种典型复杂地形环境,为人机在六足机器人

行为决策层的协同合作提供了解决方案。

关键词:六足机器人;行为决策;人机协同;协商博弈;指令优选

-II-

Abstract

ResearchonHuman-RobotCollaborativeDecision

显示全部
相似文档