多移动机器人编队领航跟随方法研究进展

2019-12-24 01:05:20周乐来李贻斌路广林
无人系统技术 2019年5期
关键词:领航者领航队形

王 帅,周乐来,李贻斌,路广林

(1.山东大学控制科学与工程学院,济南250061;2.山东大学机器人研究中心,济南250061)

1 引 言

在机器人领域中,移动机器人占主导地位。移动机器人能够感知环境、获取自身行为状态,对所执行的任务进行决策、控制和执行,并实现自主移动。作为集合决策规划、感知、行为和执行控制等技术于一体的载体,移动机器人在物流搬运、服务、便民协作等研究中均取得了巨大进展[1],如图1-4所示。

伴随着机器人技术的不断发展,机器人在性能方面也得到很大提高,其应用领域渗入各行各业。随着对机器人工作环境和操作技术的难度需求增加,使得单个机器人不再适合去承担一些特殊的任务。为了更好完成任务,人们将研究重点聚焦于多移动机器人之间的协调与合作。

由单移动机器人转向多移动机器人的研究与应用,机器人系统在完成复杂任务时的效率得到提升。在复杂环境以及系统发生某些故障时,多移动机器人之间仍可通过协调规划与协同控制技术完成既定任务[2]。近年来,随着通信技术、计算能力、环境感知、硬件执行机构的发展,多移动机器人的研究与应用突飞猛进,并逐渐成为机器人研究领域的热点之一[3]。

如图5、6所示,目前,多移动机器人系统已得到大量的应用:①共同搬运:多机器人合作搬运大型货物;②灾难救援:在地震等灾难环境下感知探索,救援受灾人员;③巡检安防:可安置在一些场景进行巡视和监控,如核电站、电网、生化工厂等;④海洋探索:替代人员进行深海探索、捕捞以及洋流漂流研究等;⑤工厂生产:在流水线代替工人完成协作生产;⑥军事领域:多移动机器人可在前线复杂环境机动侦察,也可完成物资补给等。

图1 工厂中搬运机器人 Fig.1 Handling robot in factory

图2 展柜前的服务机器人 Fig.2 Service robot in front of the exhibition

图3 物流分拣机器人Fig.3 Logistics sorting robot

图4 北京大兴机场停车机器人Fig.4 Parking robot in Beijing Daxing International Airport

图5 流水线上多移动机器人协作Fig.5 Multi mobile robot collaboration on pipeline

图6 电网巡检多移动机器人Fig.6 Multi mobile robot for power grid inspection

多移动机器人系统可以展现出复杂的协调配合和智能的协作行为,因此,协同控制技术是研究多移动机器人协作行为的重要技术之一。协同控制是多机器人系统为了实现复杂协同目标而对各个子模块进行功能、通信以及任务进行划分的技术。如图7所示,根据控制目的划分,可将多移动机器人系统的协同控制问题分为:一致性控制、协同通信、编队控制、协调控制和合作决策等。本文主要聚焦于多移动机器人系统编队控制问题的研究。

编队控制研究来源于人们对自然界群体动物行为的探索。如图8所示,人们发现无论是天空中飞行的鸟类、还是地面上爬行的蚂蚁,亦是深海中游弋的鱼,它们经常会形成某种集群队形,完成迁徙或抵抗敌人。借鉴之下,机器人组成群编队的概念被引入[4]。

编队研究的实体对象主要包括自主水下机器人(AUV)、陆地移动机器人(UGV)和自主无人飞行器(UAV)三大类,以及水陆空机器人的组合编队或抽象的多机器人系统。因此根据任务执行环境的不同,编队控制可应用在无人机编队、机器鱼编队、多移动机器人编队和组合编队等场景中。

图7 协同控制问题划分Fig.7 Classification of collaborative control

图8 自然界中动物的编队行为:鱼群和鸟群Fig.8 Formation behavior of animals in nature:fish and birds

作为多移动机器人协作与协调的重要研究内容,在实现多移动机器人协作任务时,编队控制技术具有重要作用[5]。编队控制在各领域如交通、环保、安防等都有应用价值,如图9-12所示。

图9 自行式模块车编队运输Fig.9 Module car formation transportation

图10 环卫智慧机器人编队Fig.10 Sanitation robot formation

图11 百度无人车编队行驶Fig.11 Unmanned vehicle formation designed by Baidu

图12 深圳车站战警编队机器人Fig.12 Station police formation robot in Shenzhen

2 编队控制问题的研究

2.1 编队控制问题的描述

对编队控制的研究是多机器人领域的重要方向。它指多移动机器人在完成任务运动的过程中,相互之间既要保持几何约束(队形),同时又要适应环境约束(如避开障碍)的控制问题[6]。

围绕多移动机器人的编队控制问题,国内外许多高校和研究机构展开了研究,如美国宾夕法尼亚大学、澳大利亚悉尼大学以及中国的哈尔滨工业大学和浙江大学等。根据众多学者的研究成果,可以将编队控制问题的主要研究内容总结为:编队生成、编队稳定、切换编队、系统避障、编队自适应,如图13所示。

图13 编队控制问题划分Fig.13 Classification of formation control

2.2 编队控制方法

在编队控制策略领域,形成了多种成熟、稳定的编队控制方法,并广泛应用于巡检监控、灾难营救、协作运输等各种实际应用中[7]。

(1)领航跟随法

领航跟随法是指在多移动机器人编队中,设定一个或多个机器人作为编队的领航者,其它机器人作为跟随者。领航者可以获取整个编队系统的任务信息并完成整体决策;而跟随机器人通过获取领航者的位姿信息来不断调整自身的位姿。通过机器人之间的主从关系实现编队控制。

(2)基于行为法

这种方法基于多移动机器人系统的底层运动控制,上层决策系统对多机器人的行为进行设计,如解脱障碍、巡航、导航和变换队形等,并通过这些基本行为进行组合来实现编队控制。

(3)虚拟结构法

这种控制方法,是将编队的形状虚拟为多个移动机器人组成的“刚体”。“刚体”中每个对应点作为机器人跟随的期望目标点,通过完成跟踪来实现编队控制。

(4)基于图论法

这种方法利用图论的理论对机器人系统编队进行建模,将机器人的动力学或运动学特性,以及机器人之间或机器人与环境之间的约束,表示为图模型中的节点、边等属性。编队的队形可以用图来表示。

(5)其它方法

还有许多方法可以应用到编队控制中,如人工势场法是将机器人的运动抽象成在虚拟力场中的运动。在目标引力以及障碍等环境约束的斥力的共同作用下机器人进行运动,这种方法可以解决机器人避障问题;解决实际编队问题时,PID控制也是最容易实现的控制方法等。这些方法一般不单独使用,而是与上述的几种经典编队控制方法相结合,来解决系统整体的编队问题。对编队控制方法进行比较,结果如表1所示。

表1 多机器人编队方法的比较Table1 Comparison of multi robot formation methods

领航跟随法具有建模论证简单、稳定编队容易、与其它方法结合效果好等优点,被广泛应用于多机器人系统编队,如野外作战侦察、无人机巡检和海洋探索等诸多应用领域。

3 编队领航跟随控制方法的研究

基于领航跟随法实现多移动机器人编队的研究,可以视为对编队控制相关问题(如图13所示)的研究探索。许多学者对该领域进行了研究。

3.1 编队生成与稳定

美国宾夕法尼亚大学的机器人,自动化,探侧和感知(Generate Robotics,Automation,Sensing &Perception,GRASP)实验室对跟随领航法在多移动机器人领域的应用做了大量理论奠基工作,并提出了两种编队方式[8],分别为控制机器人相对距离和偏航角不变的L-φ方式和只控制相对距离不变的L-L控制方式。

如图14(a)所示,在参考坐标系中,领航机器人R1的前行速度为V1,转向角速度为ω1,自身相对参考坐标系的偏航角为θL;跟随机器人R2的前行速度为V2,转向角速度为ω2,自身相对参考坐标系的偏航角为θF;在L-φ编队控制方式中,领航机器人R1与跟随机器人R2之间保持距离L以及偏转角φ稳定来实现编队。

图14 领航跟随控制Fig.14 Leader-following control

图14(b)描述的是领航跟随L-L编队模式。这种控制方式要求编队系统至少具有三台机器人:两台领航机器人R1和R2以及跟随机器人R3。两台领航机器人的速度和角速度分别为V1、V2和ω1、ω2,跟随机器人的速度和角速度为V3和ω3,三台机器人相对参考坐标系的偏航角分别为θL1、θL2、θF,每台领航者与跟随机器人之间的偏转角为φL1F、φL2F,机器人中心的相对距离分别为LL1F和LL2F。编队系统控制跟随机器人与另外两台领航机器人的距离LL1F与LL2F稳定来实现编队。

如表1所示,领航跟随法的优点是,只控制领航者即可控制编队。但当领航机器人运动过快,会使跟随者机器人难以及时跟踪,队形难以稳定;当领航机器人出现故障,整个编队系统也会直接崩溃。针对上述领航跟随法存在的问题,研究者们也提出了相应的解决方法。

难以及时跟踪的缺点可以通过引入队形反馈来解决。Desai等对多移动机器人进行建模,提出反馈线性化方法,并设计了编队领航跟随控制器,同时基于现代控制理论证明了控制算法的渐近稳定性,克服编队系统没有队形反馈的缺点,使多移动机器人编队稳定性增强,灵活度提高[8]。此外,Ahmed 等在反馈线性化控制策略的基础上,提出全状态线性化的动态反馈策略来实现领航者与跟随者之间的姿态稳定,对于跟随者机器人则由输入输出静态反馈线性化控制策略来实现运动跟踪控制。对于系统所给定的期望轨迹,领航者机器人的全状态反馈线性化策略和跟随者机器人的输入输出反馈线性化策略能有效地稳定多移动机器人领航跟随队形[9]。Gamage 等则提出一种基于动态反馈线性化的多移动机器人编队控制策略,并设计了一种基于行为的底层运动控制器来实现多移动机器人领航跟随编队反馈[10]。众多学者的研究,有效解决了领航跟随法的编队反馈问题。

而针对领航机器人失效导致编队系统崩溃的问题,如图15所示,学者们的主流改进方式有两种:多算法结合和优化领航者。

图15 领航失效的解决方案Fig.15 Solutions for leader failure

Pereira 等提出了多移动机器人领航跟随协作控制方法,对每个机器人设计了势场控制器,编队系统能够根据各个机器人的运动实时修改控制参数,以适应编队中其他机器人产生的运动约束,使得跟随机器人的运动不仅由领航者决定,还受其他机器人(如自身的跟随者)的影响[11]。曹志强等研究了领航机器人故障时的编队控制问题,提出了领航者更换原则。跟随机器人虽然受到领航者的控制约束,但是当其可能与障碍发生碰撞,就会令编队系统仲裁出新的最合适的领航者,确保编队任务的继续进行[12]。Dang 等研究了领航跟随方法与人工势场法的结合,提出了多移动机器人在动态环境中的编队控制新方法:根据虚拟节点与目标之间的相对位置,设计了一种虚拟节点间距离恒定的线性期望编队,并选择距离目标位置最近的机器人为领航者机器人。在特殊情况下,如领航者机器人损坏失效或被困在障碍(比如U 型障碍)之中,系统会决策出新的领航者取而代之,继续领导群体朝着目标前进[13]。Li 等针对多移动机器人编队控制中没有非常合适的动态领导者选择模型的问题,提出了一种基于情感的动态领导者选择策略。他们设计了基于两种虚拟情感(disappointment 和abashment)控制的领导者选择模块,机器人系统对所处环境的认知会影响虚拟情感,从而使系统进行自主切换领航者机器人。在糟糕的环境下(如编队环境中存在多个障碍物),跟随机器人的disappointment 会随着时间的增加而增加,当它超过某个阈值时,编队机器人之间将传播不满意信号,领航机器人的abashment 会根据跟随机器人那里收到的不满意的信号而产生变化,同时自己的领航身份也会受到不同程度的影响。当abashment 超过阈值时,将触发系统重新选择领航机器人。他们的仿真结果表明,采用这种基于情感动态领导者选择策略的多移动机器人系统在面对危险环境如避障时,能够自主选择另外一个合适的领航机器人继续编队任务[14]。Wei 等则提出了虚拟领航者的概念,并应用到编队领航跟随中。在多移动机器人运动过程中,虚拟领航机器人虽然并不真实存在,但是运动与行为方式上与真实领航机器人相同,以此来辅助完成编队任务。仿真实验也验证了虚拟领导者能够很好地消除真实领航机器人故障和系统失控的隐患,大大提高了系统的稳定性[15]。众多学者基于领航跟随法的深入研究,为解决编队生成与稳定问题提供了解决方案。

3.2 切换编队、系统避障和自适应问题

切换编队问题上,有许多学者进行了深入研究。Ostrowski 等将图论法与领航跟随法相结合,建立了基于领航跟随的编队控制图,论证了切换编队理论[16];同时他们还研究了多移动机器人通过改变队形来适应复杂环境问题,并实现了多移动机器人任意编队队形的切换[17]。Graovac 等研究了基于领航跟随法的多移动机器人编队组合控制结构,根据不同的编队功能设计了轨迹跟踪、车辆冲突和组合控制等几种控制器,实现了多移动机器人根据编队所处环境来协调转换编队队形[18]。Zhang等在研究多移动机器人编队领航跟随方法时,引入多智能体理论,对编队轨迹、编队队形以及移动机器人进行数学建模,设计了传感器层、运动控制层以及决策层的控制结构,并定义了编队队形矩阵。在编队队形由线型切换到三角型时,编队队形矩阵元素产生相应变化,根据期望的领航者机器人轨迹和编队队形矩阵,决策层规划出跟随者机器人的轨迹,实现队形的切换[19]。Buraiki 等提出了一种根据区域切换队形的多移动机器人编队策略,通过将机器人运动环境细分为不同的任务区域,来对应不同的编队队形。当多机器人系统进入一个新区域时,系统决策出最能响应新区域任务要求的领航者机器人,然后调整新队形完成任务[20]。

在编队的系统避障问题上,学者们也取得了较为成熟的研究成果。编队的系统避障一般分为两种:内部机器人之间的碰撞冲突;环境与机器人的碰撞冲突。仅凭借领航跟随法的思想难以解决编队避障问题,因此学者们的研究多以多种方法相结合、优势互补的方式来实现系统避障。

Zhang 等将人工势场法和领航跟随法结合,研究了复杂环境下编队的系统避障问题。在环境中,领航机器人在避障势场和引导势场的共同作用下进行运动,跟随机器人则实时跟踪领航机器人,同时也会受到障碍物的斥力作用,并按照“参数L固定,参数φ改变”的原则主动避开障碍物;还定义了φ选取原则,解决了多移动机器人系统与环境之间的避障问题;设计了机器人间的斥力势场来解决机器人之间的运动碰撞冲突[21]。Soorki等同样在领航跟随法与人工势场法结合的基础上,针对编队避障的问题,提出将障碍物视为虚拟领导者,通过机器人与动态障碍物(视为虚拟领航者)保持固定距离L2和偏转角φ2,避免编队与之发生碰撞,如图16所示[22]。

图16 把动态障碍物视为虚拟领航机器人Fig.16 Treat dynamic obstacle as virtual leader robot

Yang 等研究了基于行为与领航跟随法相结合的编队混合控制方法。对跟随者机器人定义了编队、系统避障两种运动行为,并设计了模糊逻辑控制器来实现行为切换,避免了在未知环境下的碰撞[23]。Wu等提出通过调整领航者与跟随者之间的偏差角来避障,相对于传统编队切换的方法既减少了避障时间,又缩短了机器人所调整的距离[24]。

学者们在领航跟随法的自适应研究上同样取得一定的研究成果。Garrido 等提出在不确定条件下的一种控制多移动机器人编队的新方法。该方法基于编队领航跟随控制结构,将Fast Marching Square 方法应用于移动机器人编队,允许机器人根据不同的目标设置相应的自适应运动行为,从而提高对动态环境的适应[25]。Paz 等为了消除建模误差和系统外部扰动,在多移动机器人领航跟随控制系统中引入自适应元素,通过前馈神经网络设计了自适应控制器,其权值实时更新以应对外部扰动和建模误差,最终实现了自适应编队控制[26]。Kang等提出了一种自适应方法来估计期望的运动速度。当多机器人编队运行时,领航机器人可以获得期望的速度信息,而跟随机器人基于图论和非线性控制理论,采用自适应方法估计期望速度来完成轨迹跟踪,从而实现多移动机器人编队[27]。

3.3 其他研究

还有许多研究者也对跟随领航者法进行了探索研究,并引入大量控制方法。Hogg等研究了比例积分微分(PID)控制算法在领航跟随编队控制上的应用,并在设计控制器实现了该算法[28]。Bae 等在领航跟随法的基础上,引入PID和模糊逻辑控制,并设计了混合算法控制器实现多移动机器人编队控制[29]。Xiao等将模型预测控制(MPC)方法引入编队领航跟随控制中[30]。随着数据集规模和算力的提升,人工智能技术迅速发展,其在领航跟随法上的应用也得到了学者们的关注。Knopp等提出一种基于GQ(λ)的强化学习算法来实现多移动机器人编队的领航跟随控制。他们将编队控制问题建模为马尔可夫决策过程,给定任意领航机器人的轨迹,4个E-puck 跟随者机器人基于感知数据自主学习如何跟随前面的机器人,并基于Greedy -Q(λ)强化学习算法来优化控制模型,最终E-puck机器人自主学习出类似蠕虫的队形行走结果[31]。Sui 等同样将基于学习的策略扩展到编队控制领域,并通过学习来实现一项多移动机器人的综合性编队任务。他们在训练过程中将模仿学习和强化学习相结合,并提出一种融合奖赏函数来引导训练,设计了编队领航跟随控制结构和长短时记忆(LSTM)的环境感知网络结构,实现了多移动机器人系统自主适应动态环境并完成编队任务[32]。

4 未来发展趋势

目前领航跟随法在多移动机器人编队控制问题的研究成果丰硕,编队的形成、保持、切换等问题有许多新突破,但仍然存在一些尚未解决的问题,需要学者们进一步深入研究。主要有以下几个方面:

(1)可以对多智能算法混合控制进行深入研究,优势互补,以减少多移动机器人物理硬件和理论相比所存在的误差,提升领航跟随法编队控制效果。

(2)目前基于领航跟随法的编队控制技术的理论已经十分成熟,但是停留在理论研究阶段的居多。探索如何将已有的大量理论研究成果应用在真实的多移动机器人编队控制中是值得学者们深入研究的方向之一。

(3)基于领航跟随法的编队控制大多依赖多移动机器人系统的模型设计方法,且需要深层次的数学论证和实验验证。因此,发展不依赖精确的理论模型的领航跟随编队控制技术是值得关注的研究重点。

(4)随着人工智能技术的迅速发展,已有学者将其应用到编队控制,并取得一定研究成果,但是停留在仿真理论研究上居多,可以继续探索其在领航跟随编队控制中的更多应用。

猜你喜欢
领航者领航队形
渔船的“领航者”和“安全卫士”
智慧少年(2022年8期)2022-05-30 10:48:04
领航
心声歌刊(2021年5期)2021-12-21 06:33:22
“益源庆”打造中国高品质食醋领航者
今日农业(2021年5期)2021-05-22 01:32:50
领航
草原歌声(2020年3期)2021-01-18 06:52:02
队列队形体育教案
领航海外
能源(2019年9期)2019-12-06 09:33:04
诗歌的奇怪队形(一)
领航海外
能源(2019年12期)2019-02-11 07:11:46
IC访谈:“智慧政府”领航者——新华三集团
智能城市(2018年8期)2018-07-06 01:11:00
做纯棉数码印花领航者