更全的杂志信息网

基于目标信息估计的分布式局部协调任务分配方法

更新时间:2009-03-28

1 引言(Introduction)

组网协同技术是人工智能、自主控制、运筹学领域的热点问题[1–3].群体自主决策是组网协同技术的关键分支.根据研究现状[1,4–9]可知,群体自主决策主要包括集中式决策和分布式决策两种.相比于集中式决策,分布式决策具有以下优势:1)能快速响应任务变化;2)可提高规划算法的快速性;3)可避免决策过程单点失效;4)可降低对通信链路带宽的要求.所以,分布式决策是当前的热点研究问题[1–2,6,8–12].

根据研究现状可知,分布式决策包括两个关键技术:1)信息一致协调技术;2)分布式协同任务分配技术.信息一致协调技术通过各规划单元采集局部态势信息完成全局信息的一致协调,再基于一致的态势信息完成分布式决策;协同分布式任务分配技术的实质为:面向任务空间内的所有任务集,基于某种决策机制,在保证分配结果不冲突的前提下,完成任务的最优/较优分配.

信息一致协调方法可用于动态任务空间的分布式决策[13–15],但信息一致协调过程需要具有高带宽、高可靠性的通信链路来保证各单元间的数据传输,且随着任务复杂度的不断增加,需要大量的运算时间才能得到可行解.

基于市场机制的分布式任务分配是常用的协同任务分配方法[9],通过对决策信息的共享,弱化各规划单元由于局部感知信息不一致带来的运算消耗,采用拍卖机制完成任务集的冲突消解,但规划单元间的决策信息共享仍需要大量的数据通信,且由于各单元获取的信息不一致,无法保证决策结果的最优性.

基于此,Choi H.L等人[16]结合拍卖算法与信息一致协调方法的优势,提出了基于一致性的拍卖算法,基于一套均等规则完成决策,避免了大量的数据通信,试验表明该算法对于分布式决策具有较好的适用性,但其任务空间假设相对理想,未考虑任务空间的动态性和不确定性.

Ponda,Johnson,Bertuccelli等人[17–19]均对文献[16]中的算法进行了改进,考虑任务空间的动态性和任务约束,如任务收益值为动态变化的、任务有执行时间窗口约束等,且考虑了任务空间的不确定性,采用高斯估计完成信息更新,但涉及的不确定参数均为连续变量,而不能用高斯估计方法表示的离散变量(如目标类别等)并未考虑.

在文献[16–18]中,分布式决策过程通常假设各任务的执行是相对独立的,即前序任务的完成情况不会影响后续任务的收益值;而实际决策过程需要考虑任务间的相互影响.Beipeng Mu等人[20]提出一种离线协同策略,可首先利用侦查飞行器对不确定目标进行搜索和测量,然后再基于更新后的态势信息完成攻击类飞行器的任务分配,该策略有效地降低了任务空间的不确定度,但任务空间通常是动态变化的,所以该策略无法及时响应任务的快速变化,且算例中设计的通信链路较为理想.Johnson等人[21]提出基于局部态势信息可靠的一致协调方法,该方法能够完成在通信链路局部可靠情况下的任务分配,但弱化了对规划单元本体的约束,分配结果无法直接作为飞行器的制导信息输入,算法的实用性和可行性不足.

综合分析国内外研究现状可知:

1)一致协调理论和协同任务分配理论是实现分布式决策的核心技术,如何将两项理论进行结合,完成优势互补,是分布式决策研究的热点问题;

3)分布式决策需要适用于动态不确定任务空间的快速决策,且任务空间的动态性需要考虑任务本身以及执行任务实体的各种约束条件,任务的不确定性需要考虑更加全面.

可见,随着任务规划问题规模增大,备选解空间成指数增长.除此之外,目标状态的不确定性也会增加问题求解的难度,所以,带目标状态估计的多协同任务规划的复杂程度随问题规模的增大,呈现出指数爆炸的趋势.

在线开放课程可以为学生提供区别化学习的平台。课前,教师利用课程平台推送相关的学习资源(如课件、微课),通过发布任务组织学生做好课前预习;学生在领取任务之后,可以依据自身现有的学习水平进行自主的、探索的学习;教师再依据学生自主预习的情况完成学情分析,为课堂的教学做出具有针对性的计划。

2)决定决策结果优劣的关键因素为决策过程时间和决策过程的通信消耗,现有的分布式决策方法均致力于缩短决策时间和减轻通信消耗;

任务自身约束主要包括以下3项:

2 问题描述(Problem statement)

2.1 分布式任务分配问题建模(Modeling for distributed task assignment)

给定一个包含Nt个子任务的任务集和Nu个可分配飞行器(后文均用UAV代替),任务规划的目标为:在满足任务本身约束和外部约束条件的前提下,寻求一种最优的分配方案,使系统的效用最大;本问题的可行解包含连续的规划路径和离散的决策变量,是一个典型的组合优化问题.不失一般性,任务规划问题可描述如下:

温度和森林火险等级呈正相关,温度越高,可燃物水分蒸发量就越大,含水率降低,可燃性增加,对应的火险等级升高。反之,可燃物可燃性降低,对应的火险等级降低[4]。在祁连山东端的青海云杉林从单日来看,林区早上6∶00~7∶00 温度最低,死体可燃物可燃性最低,对应的火险等级也最低。此后温度逐渐升高,到下午 14∶00~15∶00温度最高,可燃性最高,对应的火险等级也最高,此后逐渐降低。在祁连山东端的青海云杉林中,温度在-8℃以下时,不易燃物,一般不易引发森林火灾,当温度在2.6℃以上时,易引发森林火灾。

 

式(1)中:Rj表示执行任务j获得的收益值,它是由p,d,t决定的,p为所有UAV的轨迹集,d为决策变量集.若dij=1,表示第j个任务被分配给第i个UAV(后文将第i个UAV简写为“UAV(i)”),i∈I={1,···,Nu};若dij=0,表示第j个任务未被分配给第i个UAV;t表示各UAV执行各任务的时刻,若dij=0,则tij为缺省量;P(d,t)为满足任务自身约束和UAV本体约束的所有UAV飞行轨迹集;D为满足所有任务约束和环境约束的可行任务分配决策变量集;T为满足任务时序约束的所有任务执行的时刻集.

由式(1)可知,任务规划问题可用p,d,t完整描述,但其求解难度较大[1],现对该问题进行简化.

假设1 任务间的相互独立性,即完成每个任务产生的收益值不依赖于其他任务的状态以及其他UAV的状态.则式(1)可简化为

 

式(2)中:dj={d1j,···,dNuj},tj={t1j,···,tNuj}.

假设2 通过分层解耦处理,将任务分配问题与航迹规划问题解耦,任务分配可直接简化为求解DT中的最优解.

在上述假设1–2的基础上,为了限定UAV的能力,令Li表示UAV(i)可执行任务的最大个数,任务分配模型可简化为

 

式(3)中:

 

现对其求解复杂性进行分析:

UAV性能约束主要包括以下4项:

对多任务规划问题组合优化模型的求解过程是在问题的解空间中进行搜索的过程,解空间的大小与决策变量的数量和维度紧密相关.

定理1 式(3)的任务分配问题的备选解空间上界为

式中:u1是文化业综合值,u2是旅游业综合值;xij是二级指标的极差标准化值,wj则是依据熵值赋权法测算的该指标权重。

 

证 各任务的不同排列对应不用的解,即共有Nt!种排列,在确定式(3)组合优化问题的解空间大小的上界时,可忽略该问题的相关约束条件.显然,对于任意任务序列,记C为分配方式的总数量,当Nu=1时,C=1;当Nu=2时,一般地,

 

证毕.

式(3)虽然将任务分配与航迹规划进行了解耦简化,但任务分配可行解的最优性取决于执行所有任务UAV飞过的航迹总长度,航迹规划的解搜索空间即为战场环境中的可飞空域,是一类连续空间的优化问题,而由于所得的飞行航迹需要满足相关约束条件,所以其有效解空间呈现出离散特性.航迹规划问题的本质即多个采样时刻依次选择多个离散点,设需要采样的次数为N,采样点i可选择的离散点数量为Ki,则航迹规划备选解空间上界为其具有显著的组合爆炸特性.

男女双方自建立婚姻关系后即刻产生民事权利和义务,比如说夫妻之间的共同生活,相互忠实、相互扶助等。正是这些权利和义务是我国婚姻法所要调整的对象。国家制定婚姻法,不仅是为了保障繁衍后代的良好环境和条件,也是规范男女之间的性需求、建立性秩序,使人类的性需求在合理的范围内进行。一夫一妻的制度,就是为了人的性权利受到相应的限制。

zi={zi1,···,zi|zi|},zi中包含两类信息:

UAV(i)可执行的最大任务数量为Li,约束的表示可如式(3)所示.

2)zi中任务序号的排列次序,表示任务被执行的先后次序.

1.2.6 RT-qPCR Trizol法提取细胞总RNA并测定RNA浓度和纯度,调整样品浓度后按照RT Mix试剂说明书反转录合成cDNA,PCR反应体系为5 μL SYBR、3.6 μL DEPC水、0.4 μL引物与1 μL cDNA。内参GAPDH引物序列为5′-AGAAGGCTGGGGC-TCATTTG-3′和5′-AGGGGCCATCCACAGTCTT-C-3′;Atg5引物序列为5′-GCTTCGAGATGTGTGG-TTTG-3′和5′-CAGTGGTGTGCCTTCATATT-3′,其相对表达量用2-ΔΔCt表示。

目标函数为q(t),其中qij表示编号为i的UAV在t时刻执行任务j产生的收益值.

后件扩展模型PTCE指的是正扩展词和负扩展词来自正负关联规则模式的后件,正扩展词中去除负扩展词后余下的正扩展词即为最终扩展词,其模型形式化为式(11)和(12)所示.

式(3)可写为

企业也可以只针对一种产品进行调查,考察顾客满意度的变化指数,这就是顾客满意度。利用让渡价值公式计算顾客满意度;当顾客满意度小于0时,表明顾客不满意;顾客满意度大于0时,表明顾客满意;如果两者的差值太大,就表示顾客非常满意。企业可以根据上述的公式,定期做一些市场推广和调查问卷,通过对顾客的满意度调查调整公司的服务。在市场营销时可以根据顾客对购买商品的要求,提供相应的服务。如果顾客买到满意的产品,就会表现与购买前不一样的状态。企业也可以从不同的角度去观察顾客在购买产品的服务过程是否达到预期的效果,分析出他们所需要的产品和服务[4]。

 

2.2 任务空间的不确定性表示(Modeling for uncertainty in mission space)

在实际的军事行动中,指挥控制中心获取到的全局态势感知信息往往是不完整或不确定的,敌方会通过释放诱饵、设置干扰源等方式对抗攻方.

所以,任务分配过程需要考虑任务空间的动态不确定性因素.任务空间的不确定性可量化为两种类型:1)连续不确定量,如目标/任务的位置、速度、目标/任务的收益值等;2)离散不确定量,如目标/任务的优先级、目标/任务的类型等;这些不确定因素都会增加任务决策过程的难度.对于式(5)描述的典型任务分配问题,不确定因素往往会带来任务的收益值的不确定:即q(t)的不确定.

令estm(t)表示各目标/任务在t时刻的估计收益值,令estm(t)=F(q(t)),F(·)对应不同类型的不确定量,有不同的函数形式[20].

加入不确定量后,式(5)可改写为

 

针对异构UAV执行侦查、攻击灰色目标/任务区域的任务背景,执行任务的异构UAV种类包括侦查类UAV(后文简写为USAV)和弹药类UAV(后文简写为UCAV),可通过USAV完成目标不确定信息的测量.由贝叶斯定理[22]可知

 

式(7)中meas(t)表示目标/任务收益值的测量值.

 

式(9)中P(meas(t)|q(t))表示USAV对目标的测量模型[23],表示在确定信息q(t)的前提下,测量信息与实际值相等的概率.例如,当测量过程存在高斯噪声时,有P(meas(t)|q(t))vN(q(t)2).

“三年以来,公司已经投入了三千多万元用于改造企业的环保设施。一方面,可以使企业生产更加绿色,另一方面,改造后的车间,对于工人来说也拥有了一个更舒适的工作环境。”公司副总裁唐正军自豪地说。

由式(7)–(9)可知,USAV对目标的探测可将其收益值从估计值F(q(t))增加到G(q(t)),所以异构协同策略可提高决策结果的最优性,若优先将USAV分配至不确定目标,USAV执行搜索任务的收益值可量化为G(q(t))−F(q(t)).

进而式(6)可写为

 

式(10)中:us,ij为USAV的决策变量;uc,ij为UCAV的决策变量;Ns为USAV的数量;Nc为UCAV的数量;Lsi为USAV可执行的最大任务数;Lci为UCAV可执行的最大任务数;G(q(t))为USAV侦查后的目标收益值;F(q(t))为不确定信息的估计值;对于连续不确定量,F(q(t))取为高斯随机数N((t)2),离散不确定量主要为目标类型不确定.

令rewardd={Catgo1,···,CatgoNtype}表示Ntype种不同目标类型对应的真实收益值;令measd=为收益测量值.令Kd(06Kd 61),表示USAV完成对某目标探测后确认收益值为真实值的概率,即

 

上述过程完成了任务空间的不确定性表示,下面给出该任务分配问题的相关约束条件.

2.3 约束条件(Constraints)

任务分配过程的约束条件主要包括:1)任务自身约束;2)UAV性能约束;3)分布式通信链路约束.

1)任务自身约束.

基于国内外研究现状,以异构飞行器执行搜索、攻击灰色目标区域为背景,考虑任务约束(任务执行时间、执行窗口)、飞行器约束(速度约束、燃油约束、避碰约束)、任务动态性(任务收益值时变)、任务空间不确定等约束条件,基于分布式在线协同策略,在局部链式通信环境下完成对任务空间不确定信息的估计,然后通过一致协调理论实现任务分配信息的冲突调解,完成分布式决策过程.最后通过数学仿真验证了该方法的可行性和优越性.

① 任务执行时间窗口约束.

对于UAV(i),任务j,若dij=1,则有

 

式(13)中:qi,j(t)为UAV(i)执行任务j得到的收益值;表示任务的时间窗口起始时刻,表示任务的时间窗口结束时刻;q表示在约定的时间窗口内执行任务得到的收益值.

② 任务耗时约束.

对于UAV(i),任务j,若dij=1,需要Tduration(ij)完成任务执行.

③ 任务收益值时变.

首先给出目标和对应任务间的映射关系,令i∈ta={1,···,Ntarget}为任务空间的目标集,则

针对新课改下对于语文教学的改革与创新,要求教师在课堂教学中充分运用各种资源和活动形式,激发学生的学习兴趣。在学习不同题材的语文知识时,教师不能一味进行枯燥的文字解说,或仅是单纯地自我讲述,不与学生进行交流和互动。例如,在学习诗歌散文类的文章时,教师习惯于使用传统的教学方式,对文章内容进行分析和解说。这个过程就限制了学生的思维,使学生无法与老师思想同步。应当进行角色扮演或者举办诗歌朗诵的赏析会,让学生真正地融入课堂内容中,品读作者当时的心境与语境。

 

式(14)中:Ntarget为目标总数;ni为每个目标对应的任务数.

围绕主题遣词造句,积章成篇是保证文章言之有物的前提。在表现主题的过程中,作者抒发感情,则是通过文辞的抑扬婉转所形成的节奏和韵律来实现的。要体悟作者在诗文中蕴含的情感,就要理解诗文外在的体例以及内在的节奏和韵律。刘彦和以时代为线索,将二言到七言诗歌进行了详细的梳理,得出了由于情势趋向于复杂,表达要求得更周详。随着时代的发展,复杂长句的运用逐渐代替简单断句的结论。

对于确定目标,其任务在未被执行时的收益值为时变的,通常呈指数下降形式;对于不确定目标,其对应任务收益值为离散不确定的.考虑到侦查、攻击任务的特殊性,随着任务的执行,目标对应任务的收益值可按如下形式变化:

 

式(15)中:q0(t)为任务未被执行时的初始收益值;k为目标对应任务的完成次数.

2)UAV性能约束.

这是上午。下午的医茶机关三项,奇怪的是,三人只领到了两项考试。来到三星望月第二石针上的赏星居,孙老神仙还在午睡,他的大徒弟裴元替师父考较三人的点穴术,奇经八脉是万花谷的看家本领,去谷行医最是用得着,修习上乘武功,也是津渡,百花拂穴手、太素九针、点穴截脉,这些三人都下过苦工夫,只是裴师兄一边让他们点穴,一边又盘问去年长安城中种种情形,河坊街的豆腐是如何好吃,听月楼的羊肉是如何娇嫰,百花谷的名妓果真是来自万国的花魁?一会又将话题转移到甲人,我万花谷的机甲如何,他唐门的机甲又如何,不厌其烦,琐碎唠叨,其实是干扰了考生们的心神的。

1.现实的社会危害。“两童”群体的存在具有现实的社会危害,会导致以下令人担忧的严重问题出现:(1)未成年人成为黑恶势力等犯罪的工具或受害者。由于监护缺位,未成年人极易被黑恶势力或其他犯罪分子所利用。实践中,未成年人成为黑恶势力犯罪、毒品犯罪、涉财犯罪、强迫组织卖淫犯罪的工具或受害者,这已成为一个相当严重的问题;(2)被邪教势力所侵蚀。未成年人缺乏独立判断是非的能力,在某些利益诱惑下,很容易被洗脑;(3)被暴力恐怖犯罪分子、民族分裂犯罪势力所利用。在某些地区,这些敌对势力已经开始在未成年人中培养恐怖分子和分裂势力。

① UAV飞行速度约束.

限定UAV的飞行速度最大值为vmax,对于UAV(i),有

 

式(16)中:ti,k,ti,j为UAV(i)执行任务k,j的起始时间;poskposj为两个任务目标间的欧几里得距离.Tduration(ij)为UAV(i)执行任务j需要消耗的时间.

② UAV油耗约束.

令UAV的油耗阈值为lomin,油耗秒耗量为losec,则对于UAV(i):

 

式中:looriginal(i),lomin(i),losec(i)分别为UAV(i)的初始燃油量、油耗阈值、油耗秒耗量;ti,|zi|为UAV(i)执行最后一个任务的时刻;Tduration(i,|zi|)执行最后一个任务需要消耗的时间.

③ UAV最大可执行任务数约束.

1)编号为i的UAV将执行哪些编号的任务,即相关的决策变量信息;

④ UAV间避碰约束.

采用不相交路径法[23],令UAV(i)的飞行路径与UAV(j)的飞行路径,当且仅当UAV同时到达相交点时,才会发生碰撞,给出避碰约束如下:

《招投标法》中明确指出,对于投标人所提出的问题,招标单位有义务为投标人进行解惑,不过哪些内容不需要回答,哪些问题必须得回答还没有一个明确的标准,而这问题的存在严重影响评标的效率。

 

式(18)中:si,ℓ,sj,ℓ 分别为UAV(i),UAV(j)路径初始点与相交点间的距离;disℓ,i,j为距离差值;Ri,Rj分别为UAV(i),UAV(j)的安全圆半径;i,ℓ,j,ℓ分别为UAV(i),UAV(j)在该航段的平均速度.

3)分布式通信链路约束.

采用局部链式通信模式,有效减少分配过程中的传输数据量.局部链式通信可定义如下:

令UAV(i)仅能与邻近的Ni个UAV完成双端数据通信,而不能获取其他UAV的信息,Ni的取值由UAV的性能决定;同时,需要限制UAV(i)与邻近Ni个UAV完成双端数据通信的频率,令Tcom表示通信链路的通信周期,它主要由通信链路的性能决定.局部链式通信的拓扑示意如图1所示.

∀i∈I,∀k∈Ii,若comik=1,表示UAV(i),UAV(k)间可通信;反之不能.

  

图1 局部链式通信Fig.1 Distributed communication based on local awareness

3 求解算法(Algorithm for section 2)

3.1 一致协调任务分配算法(Consensus based algorithm)

设定局部链式通信网络,限制各单元的数据传输范围,结合异构飞行器的在线协同策略,说明约束条件,算法主要包括任务遴选和任务一致协调两个不断迭代的过程.首先定义算法的相关参数:

ai=bi∪zi,包含UAV(i)当前的任务分配信息.

UAV(i)的任务集:bi={bi1,···,bi|bi|},bin∈J,n∈{1,···,|bi|},|bi|6Li.

zi的定义可参见第2节,|bi|=|zi|,zi中的任务排列顺序为UAV(i)的执行顺序.

ci=ei∪yi∪ti,表示UAV(i)获取的全局分配信息.

ei={ei1,···,eiNt},表示UAV(i)获得的全局任务分配结果,eij表示UAV(i)认为当前被分配给任务j的UAV编号,eij=0表示UAV(i)认为当前任务j还未被分配.

yi={yi1,···,yiNt},表示对应于ei,执行各项任务得到的收益值.

ti={ti1,···,tiNa},表示所有与UAV(i)发生最新信息交互的时戳,tik表示UAV(i)与UAV(k)发生最新信息交互的时戳.

算法包括两个阶段:

① 任务遴选建立任务集阶段;

② 任务一致协调阶段.

1)任务遴选建立任务集阶段.

在该阶段,每个UAV的初始分配状态可表示为ai={bi,zi},ci={ei,yi,ti},由式(4)可知,对应UAV(i)的任务集zi,产生的收益值为

 

对于未分配给UAV(i)的任务,dij=0.为了决策出下一步将要更新至任务集的任务编号,每一个UAV将自身未被分配到的任务执行一遍;此时,j/∈zi;首先,需要将第j项任务插入任务序列z的第nj项,而nj项及之后的所有任务执行次序均往后顺延一位,新的任务序列集可表示为(zinjj),易知,nj表示任务j插入了任务序列中的第nj项,上述过程可表述如下:

需要找到一个最优的任务编号使得最大.

通过插入第j项任务,使得UAV(i)得到的收益值增量为

所有可能出现的次序产生的收益值增量需要与yi进行比较,以寻求最优的任务包组合.为了使算法便于求解,令hij为01决策变量,可表示为

 

任务集建立过程可等效如下:

寻求j,使

 

此时,UAV的任务状态空间更新为

 

满足以下任意条件时,终止任务集建立过程:

① 未找到收益值增量大于零的分配结果;

② 分配到的任务总数超过Li.

2)任务一致协调阶段.

任务一致协调阶段通过各UAV间的数据通信,将各UAV的分配信息ci={ei,yi,ti}进行比较和冲突调解[17],一致协调完成后根据协调结果更新各UAV的任务集.表1以信息发送者UAV(k)与信息接收者UAV(i)就任务j的分配为例,给出一致协调阶段的冲突调解规则.

 

表1 一致协调阶段的冲突调解规则Table 1 The decision rules for conflict resolution

  

eij=iykj>yij,则eij=k eij=k eij=k ekj=ktkm>timykj>yij,m/∈{k,i}eij=k 0 eij=k ekj=i eij=i eij=i eij=k eij=0 m/∈{k,i}tkm>tim,则eij=0 0 eij=0若ykj>yijtkm>tim,eij=ieij=mtkm>tim,eij=m;eij=k 反之,eij=0 m/∈{k,i}tkm>tim,则eij=m m/∈{k,i}n/∈{k,i,m}tkm>timtkn>tin,则eij=m;若tkm>timykj>yij,则eij=m;若tkn>tintim>tkm,则eij=0 0 若tkm>tim,则eij=m 0 eij=i eij=i eij=k eij=0 m/∈{k,i}tkm>tim,则eij=0 0 eij=0

由表1可知,信息接收者UAV(i)需要与信息发送者UAV(k)进行分配信息比对,然后对自身任务集进行更新.当UAV(k)和UAV(i)对同一任务j的分配结果出现不一致时,冲突协调准则可概括为如下两点:

① 当ekj,eij∈{k,i}时,以完成任务j得到的任务收益值高者为准更新UAV(i)的任务分配信息eij;

②当ekj=m/∈{k,i},eij=n/∈{k,i,m}时,以最新的信息交互时间戳为准更新UAV(i)的任务分配信息eij.

3.2 在线协同策略(Cooperative method on-line)

离线协同策略[20]将USAV和UCAV的任务分配过程分开进行,首先将USAV分配至不确定性较高的任务/目标,然后基于更新后的全局任务信息,完成UCAV的决策.考虑到任务空间的高动态性和不确定性,需要USAV和UCAV进行在线协同分配,在保证任务收益值的前提下,尽量降低任务空间的不确定度.

基于在线协同分配策略,式(10)可写为

 

基于在线协同策略和一致协调的分布式任务分配求解算法流程如图2所示.

  

图2 分布式任务分配算法流程图Fig.2 The flowchart of task assignment algorithm

算法的输入为任务参数、UAV参数以及相关约束条件参数,输出为任务分配相关结果,包括决策变量集d,任务执行时刻集t,各UAV对应的任务分配结果z,所有UAV的任务分配结果c.

基于在线协同策略,将USAV和UCAV进行在线分配,分配的过程主要包括两个阶段:任务遴选阶段和任务一致协调阶段.

在任务遴选阶段,USAV与UCAV同时建立每个UAV可用的任务集,考虑到UAV的性能约束(UCAV:Lic,USAV:Lis)、任务约束(Nc,Ns),优先将不确定度较高的目标分配至USAV,以G(q)−F(q)作为优化目标,完成USAV的任务分配;同时,以F(q)作为优化目标,完成UCAV的任务分配,完成将得到的分配结果ac,as进行整合,以建立完成的所有UAV的任务集a作为输入,基于一致协调的冲突调解规则,在局部链式通信模式下,完成各UAV间的信息交互与任务冲突在线调解,得到更新后的任务分配结果c.

给出基于在线协同策略和一致协调的分布式任务分配求解算法伪代码如下:

算法1 分布式任务分配求解算法.

 
 

4 算法验证与分析(Verification and analysis for algorithm)

给出3个仿真算例,算例1用于验证本文算法对任务空间存在不确定性、分布式链式局部通信条件下的规划问题的可行性;算例2用于验证规划策略和算法在不确定任务规划空间下的优越性和实用性;算例3用于验证本文算法在不确定任务规划空间下运算的快速性和实时性.

4.1 仿真算例1(Simulation test 1)

任务空间基本参数设置如表1–2所示,不确定类型目标4个,对应的收益值qd(t)rewardd={100,50,150,200},Kd=0.8,确定类型目标6个,对应收益估计值满足高斯分布,由式(24)得出,通信周期设为Tcom=1 s:

 

式(24)中:N(·)表示正态分布,c(t)为高斯分布均值,σ为高斯分布标准差,qc(t)为对应的任务收益值.

 

式(25)中:q0为确定目标对应的任务收益初值,λ为收益值下降指数.

 

限定任务空间范围为UAV的初始位置、目标初始位置由随机数形式给出:

 

式(26)中:posUAV为UAV的初始坐标;posTarget为目标的初始坐标;ε为满足0–1正态分布的随机数;xmax为任务空间x方向最大值,ymax为任务空间y方向最大值,zmax为任务空间z方向最大值.

各UAV的分配任务序列,飞行参数分别如表4所示,各UAV的任务时序如图3所示.

 

表2 UAV仿真参数设定Table 2 Simulation parameters for UAV

  

燃油秒耗量 可执行最大 容许飞行的 通信可达UAV 数量 初始燃油量 (飞行/悬停) 任务数/Li 速度/(m·s1)UAV数量USAV 2 200 1/0.8 2 [0,8] 2 UCAV 4 200 1.5/0.8 3 [0,12] 2

 

表3 任务空间仿真参数设定Table 3 Simulation parameters for mission scenario

  

目标编号 目标类型 对应任务数 初始收益值 收益值下降指数/λ任务耗时/s任务时间窗口/s 1 类型确定,收益值连续变化 2 100 0.01 2 T1:[0,100]T2:[10,100]2 类型确定,收益值连续变化 1 100 0.01 2 T:[10,90]3 类型确定,收益值连续变化 1 100 0.01 2 T:[10,80]4 类型确定,收益值连续变化 1 100 0.01 2 T:[10,80]5 类型确定,收益值连续变化 2 100 0.01 2 T:[10,110]T:[10,120]6 类型确定,收益值连续变化 1 100 0.01 2 T:[10,90]7类型不确定 2 — — {10,2} T:[0,60]8类型不确定 2 — — {10,2} T:[0,70]9类型不确定 2 — — {10,2} T:[0,80]10 类型不确定 2 — — {10,2} T:[20,70]

 

表4 任务执行结果Table 4 Result of task execution

  

UAV编号 UAV类型 任务次序zi 任务起始时间ti/s 收益值qi 平均飞行速度/(m·s1)燃油消耗1 USAV {7,10} {35.7681,67.4537} {22.12,16.76} 5.23 92.5877 2 USAV {9,8} {45.367,62.529} {17.06,12.33} 6.31 84.733 3 UCAV {1,6,4} {20.83,37.841,56.478} {67.439,45.65,32.809} 8.78 134.6742 4 UCAV {3,9,10} {17.761,60.17,79.841}{72.136,45.619,38.176} 9.54 170.4574 5 UCAV {5,1,7} {15.03,30.597,50.663}{79.315,22.208,61.207} 7.42 114.7508 6 UCAV {2,5,8} {10.546,19.378,77.301}{88.31,35.006,40.332} 9.15 161.4116

 
 
  

图3 任务执行的时间序列Fig.3 temporal sequence of the task assignment

由仿真结果可知,规划结果满足任务的时间窗口约束,任务耗时约束,UAV的飞行速度约束,UAV燃油约束;USAV1完成对不确定目标7,10的侦查确认,通过局部信息传递完成对确认信息的在线共享,然后通过UCAV5,UCAV4实现对确认后目标的快速打击;USAV2完成对不确定目标8,9的侦查确认,然后通过UCAV4,UCAV6实现对确认后目标的快速打击,规划结果可行.

4.2 仿真算例2(Simulation test 2)

UAV的仿真参数不变(见表2),设置3种不同的任务场景,相应的任务参数设置如表5,不确定类型目标对应任务数为2,确定类型目标对应任务数均为1,其他任务参数同表3.

 

表5 3种场景任务参数设定Table 5 Simulation parameters for 3 different scenarios

  

不确定类型场景编号 目标数量 UAV数量 目标数量1 10 {USAV:2,UCAV:4} 3 2 10 {USAV:3,UCAV:3} 5 3 10 {USAV:4,UCAV:4} 7

由表5可知,场景1至场景3中的不确定目标数依次增加,即任务空间的不确定度依次增加;对比实验设置如表6.

 

表6 对比试验设定Table 6 Comparison test setting

  

1 Prim[24] 离线协同2 Prim[24] 在线协同3 一致协调 离线协同4 一致协调 在线协同

设置蒙特卡洛模拟方法次数为50,分别记录不同策略和算法得出的规划结果对应的目标函数平均值,对比结果如图4.

  

图4 对比试验结果Fig.4 Result of comparison test

由图3的对比结果可知,随着不确定目标数量的不断增加,各算法对应解的最优性降低;通过对比prim算法和任务一致协调算法可知,任务一致协调算法能得到更优的解;对比在线协同策略和离线协同策略可知,在线协同策略能够更快地完成任务决策,对应的解的最优性较好;当任务空间中不确定目标数由5增加至7时,在线任务一致协调算法对应解的目标函数值降幅约为14%,离线任务一致协调算法对应解的目标函数值降幅约为28%.

所以,随着任务空间不确定度的不断增加,在线协同策略对应解的最优性降幅较小.综上分析可知,任务一致协调算法在任务空间不确定时,其对应的解更优,且该算法不需要高带宽通信链路;在线协同策略能够及时响应探测信息的更新,更适用于动态未知的任务空间.

4.3 仿真算例3(Simulation test 3)

对于协同任务规划问题,解的优劣一方面由解对应的目标函数值判定(最优性),另一方面还需要考虑算法的运行时间(实时性).下面给出算法的评估准则:

 

式(27)中:Index表示算法经过NMC次蒙特卡洛试验的分数;Indexi表示算法单次试验的分数;Jbest表示蒙特卡洛试验过程得到的目标函数值最大值;tbest表示算法在蒙特卡洛过程的最短单次运行时间;Ji,ti分别表示某次试验对应的代价函数值和算法运行时间;α,β分别表示评估解最优性和算法实时性的权重系数.为了消除算法运行环境对其运行速度的影响,采用实时操作系统RTX64作为算法运行环境,并采用同一台计算机.

需要进行对比分析的算法包括本文方法(consensus)、Prim算法、蚁群优化算法(ant colony optimization,ACO),算法的运行场景与表2–3一致,设定蒙特卡洛试验次数为NMC=50,并设置3种权重系数组合,分别为

 

记录每次的算法Indexi,进而得到不同工况下3种算法的Index,得出结果如图5所示.

  

图5 算法性能对比试验结果Fig.5 Result of three algorithms based on equation(27)

由上述结果可知,基于一致性算法的任务分配求解算法(本文方法:consensus)的总体性能优于常用的普利姆算法(Prim)和蚁群算法(ACO).当算法运算实时性权重由0.4增加至0.6时,本文方法相对后两种算法的得分差值分别由5%提高至近13.5%,当算法实时性权重与解最优性权重相同时,本文方法相对后两种算法的得分差值分别为4.5%和4.6%;由此可知,在保证算法最优性的前提下,本文方法相对于其他两种常用优化算法实时性较好.

5 结论(Conclusions)

1)在通信链路存在带宽限制、任务空间中的目标类型不确定的情况下,任务一致协调算法可通过局部链式通信方式,在有效减少各任务实体间数据通信的前提下,结合一致性理论和在线协同策略的优势,可实现动态未知空间的分布式决策;

2)针对任务空间的未知性,通过贝叶斯法则建立了未知目标的估计模型,充分利用异构飞行器的特性,采用在线协同策略,以“边搜边打”的策略执行任务,仿真结果表明,该策略可实现对任务空间更新信息的及时响应,可有效提高规划结果的最优性;

3)在考虑任务窗口约束、任务耗时约束、UAV飞行速度约束、UAV燃油约束、避碰约束、通信链路约束等条件下,基于在线协同策略的任务一致协调算法可完成任务的快速决策,该方法具有一定的实用价值.

6 后期工作与展望(Future work)

虽然在一些仿真算例上已经完成算法的可行性和合理性分析,但验证环境为计算机软件平台,算法运行的可靠性和实时性需要在硬件平台上加以验证,同时,研究还存在许多不足,亦是后期需要完善的工作:

1)算法的使用对象为旋翼机,它通常被用来用作室内演示验证或算法验证的平台,但由于其自身存在飞行速度低、可靠性较差等不足,难以用于实际的复杂任务执行,所以除了考虑本文的相关约束条件外,还需要考虑UAV的其他飞行约束,如飞行过载、飞行姿态、最短直飞距离等;后续将完成算法改进并采用机器人操作系统(robot operating system,ROS)完成算法的验证;

2)虽然已经考虑到任务空间通信链路带宽限制等条件,但并未考虑通信链路出现故障等情况,且任务空间的离散不确定参数仅考虑了目标类型,后续将继续优化算法,对通信故障、任务空间的其他不确定参数存在情况下的分配问题进一步研究.

参考文献(References):

[1]PONDA S S,JOHNSON L B,GERAMIFARD A,et al.Cooperative missionplanningformulti-UAVteams[M]//HandbookofUnmanned Aerial Vehicles.Netherlands:Springer,2015:1447–1490.

[2]WHITTEN A.Decentralized planning for autonomous agents cooperating in complex missions MA[D].Cambridge:Massachusetts Institute of Technology,2010.

[3]MAZA I,CABALLERO F,CAPITN J,et al.Experimental results in multi-UAV coordination for disaster management and civil security applications[J].Journal of Intelligent&Robotic Systems,2011,61(1):563–585.

[4]BEARD R W,MCLAIN T W,GOODRICH M A,et al.Coordinated target assignment and intercept for unmanned air vehicles[J].IEEE Transactions on Robotics and Automation,2002,18(6):911–922.

[5]CASTANON D A,WOHLETZ J M.Model predictive control for stochastic resource allocation[J].IEEE Transactions on Automatic Control,2009,54(8):1739–1750.

[6]LEARY S,DEITTERT M,BOOKLESS J.Constrained UAV mission planning:a comparison of approaches[C]//Proceedings of the 2011 IEEE International Conference.Barcelona:IEEE,2011:2002–2009.

[7]SHEN Lincheng,CHEN Jing,WANG Nan.A survey on task planing technology for aircraft[J].Acta Aeronautica et Astronautica Sinica,2014,35(3):593–606.(沈林成,陈璟,王楠.飞行器任务规划技术综述[J].航空学报,2014,35(3):593–606.)

[8]CAO Y,YU W,REN W,et al.An overview of recent progress in the study of distributed multi-agent coordination[J].IEEE Transactions on Industrial Informatics,2013,9(1):427–438.

[9]DIAS M B,ZLOT R,KALRA N,et al.Market-based multirobot coordination:a survey and analysis[J].Proceedings of the IEEE,2006,94(7):1257–1270.

[10]ALIDAEE B,WANG H,LANDRAM F.On the flexible demand assignment problems:case of unmanned aerial vehicles[J].IEEE Transactions on Automation Science and Engineering,2011,8(4):865–868.

[11]CHAPMAN A C,MICILLO R A,KOTA R,et al.Decentralized dynamic task allocation using overlapping potential games[J].The Computer Journal,2010,53(9):1462–1477.

[12]BERTUCCELLI L F,HOW J P.Active exploration in robust unmanned vehicle task assignment[J].Journal of Aerospace Computing,Information,and Communication,2011,8(8):250–268.

[13]ZHANG Qingjie.Distributed cooperative control and statement estimation for networked multiple UAVs based on consensus theory[D].Changsha:National University of Defense Technology,2011.(张庆杰.基于一致性理论的多UAV分布式协同控制与状态估计方法[D].长沙:国防科学技术大学,2011)

[14]REN W,BEARD R W,ATKINS E M.Information consensus in multivehicle cooperative control[J].IEEE Control Systems,2007,27(2):71–82.

[15]MEI J,REN W,MA G.Distributed containment control for Lagrangian networks with parametric uncertainties under a directed graph[J].Automatica,2012,48(4):653–659.

[16]CHOI H L,BRUNET L,HOW J P.Consensus-based decentralized auctions for robust task allocation[J].IEEE Transactions on Robotics,2009,25(4):912–926.

[17]PONDA SAMEERA S.Robust distributed planning strate-gies for autonomous multi-agent teams[D].Cambridge:Massachusetts Institute of Technology,2012.

[18]JOHNSON L B.Decentralized task allocation for dynamic environments[D].Cambridge:Massachusetts Institute of Technology,2012.

[19]BERTUCCELLI L,CHOI H L,CHO P,et al.Real-time multi-UAV task assignment in dynamic and uncertain environments[C]//AIAA Guidance,Navigation,and Control Conference.Chicago:AIAA SciTech,2009:5776.

[20]MU B,CHOWDHARY G,HOW J P.Value-of information aware active task assignment[C]//AIAA Guidance,Navigation,and Control(GNC)Conference.Boston:AIAA SciTech,2013:4997.

[21]JOHNSON L B,CHOI HAN-LIM,PONDA SAMEERA S,et al.Decentralized task allocation using local information consistency assumptions[J].Journal of Aerospace Information Systems,2017,14(2):103–122.

[22]GELMAN A,CARLIN J B,STERN H S,et al.Bayesian Data Analysis[M].Boca Raton,FL,USA:Chapman&Hall/CRC,2014.

[23]TSOURDOS A,WHITE B,SHANMUGAVEL M.Cooperative Path Planning of Unmanned Aerial Vehicles[M].Hoboken:John Wiley&Sons,2010.

[24]LAGOUDAKIS M G,BERHAULT M,KOENIG S,et al.Simple auctions with performance guarantees for multi-robot task allocation[C]//Proceedings of the 2004 IEEE/RSJ International Conference.Sendai:IEEE,2004,1:698–705.

 
吴蔚楠,崔乃刚,郭继峰
《控制理论与应用》 2018年第04期
《控制理论与应用》2018年第04期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号