追逃定性微分对策中界栅的确定
0 引言
无人机与无人车是信息化装备体系的重要组成部分,在军事中投入使用可显著提高军事作战能力,此外,可以在核、生物和化学战争环境中执行物资运输、目标识别以及环境勘测等任务。微分对策理论为军事对抗问题提供了较为完善的模型[1-4],定性微分对策中界栅的确定是研究热点之一[5-8]。应用追逃微分对策分析时,对局环境中的障碍物的影响会被考虑[9-10]。文献[11]为了解决固定翼无人机追踪地面移动车辆的问题,运用微分对策理论进行定量分析,得到防止目标丢失的最优策略。本文在无人机、无人车的追捕对抗过程中,考虑对局环境中障碍物的影响,定性分析追逃微分对策,确定其分界界栅。无人机配有固定摄像头装置,可以提供足够的视觉分辨率,在野外作战现场自动跟踪地面的无人车,使其始终处于观测范围之内;无人车则根据自身运动特性以及周围环境来躲避无人机的追踪。对局双方为单一的追捕者和躲避者,无人机希望最大化延长无人车在其有效可视范围之内的时间,无人车希望尽快逃避追捕。
作为最小构造模型和正向试错模拟的中间步骤,人们可以利用续至震相进行层析成像反演。然而,其应用由于需要精确识别震相而受到限制。当特定震相与特定模型层或界面不相关时就会引入较大的误差。为了克服这些限制,一些学者提倡在射线追踪模拟之前识别震相(如 Majdański et al,2006),但是与向前一步跳过试错模拟的多层层析成像这一想法存在某种矛盾。现有的多层层析成像软件包(Hobro et al,2003;Trinks et al,2005)因为正向解相当慢,所以效率不高,然而,正如Malinowski等(2009)指出,它们可用于大型三维广角反射/折射测量的模拟。
1 建模与分析
设定P代表追捕方无人机,E代表躲避方无人车。假设P和 E分别以速度vp,ve在平面上匀速运动。P的目的是迫使局中人E进入目标集D,并捕捉E,从而结束对策,而E的目标正好相反,试图阻止或者拖延对策结束,如图1所示。
P可以以速度vp在平面内任意活动,滚转角、俯仰角保持不变,偏航角控制为v;躲避E以速度ve运动,转向控制记为u;P和E均可以完成瞬时的转向。博弈具有一个完美的状态反馈信息结构,因此,当参与者在进行博弈时,能够不受干扰地知晓整个过程中的状态变化,从而确定下一个动作。
图1 对局示意图 Fig.1 Game diagram
对局环境中存在树木形成的障碍,这会对双方产生影响。追捕者希望在尽可能长的时间内将躲避者保持在可视区域,躲避者希望在最短的时间内打破视线。某一时刻,如果躲避者不在捕获者的视线之内,此时对局终止。
这是一项庞大的系统工程,项目层次和结构复杂,信息采集点众多,数据量巨大,要实现业务协同和信息共享,统一规范和标准尤为重要,这也是项目实施方案中确定的一项重要内容。对于监测、计量产品生产供应商及软件开发商等相关企业来说,国家水资源监控能力建设项目也是一个巨大的市场。即将完善的标准和规范不仅是项目顺利实施和运行的重要基础,也是为参与项目建设的企业设置的一道“入围门槛”。
每个社团的成立都有它规定的一些制度,这些制度是自发形成的一种约束力。社团成员会自觉将这种意识规范来制约自己的各项行为,这种特定的理念和价值取向在学生的心灵深处形成一种心理定势。同时,还能够形成一种对各个成员进行监督的社团舆论,使学生能够提高自身自律性,更好的对自己的行为负责。久而久之,这种深入人心的制度能使学生增强自律意识,提高对课堂学习的尊重,认识专业学习的重要性,带动良好的学习气氛。
(1)
由于无人车可以瞬时转向,因此其方向控制:当u=+1时,向右运动;当u=-1时,则向左运动。
在设定的场景中,对局双方视为点运动物体,除了有界速度之外,它们的运动没有任何限制。与经典情况一致,这里无人机与无人车的速度之比k=vp/ve>1。对局环境中仅包含限制追捕者和躲避者运动的障碍,对局双方都有独立决策权,他们根据实际情况采取决策,控制局势朝着有利于自己的方向发展。
很多建筑工程项目中的施工管理存在疏漏,急需在第一时间内解决。例如,很多工程建设项目中的管理人员和施工人员不服从管理,违规施工问题屡见不鲜,从而对工程进度产生了极大影响。还有一些施工人员没有对安全防范意识提高重视程度,即使佩戴安全防护装置,也容易在工作中出现意外,再加上企业安全管理制度的内容不明确,无法实现施工现场安全问题的有效排除。当工程建设工作结束之后,部分施工企业的竣工检查工作流于形式,竣工质量无法把握,让建筑物在后续使用时暴露出质量问题。
在最优路径上,有即vp(-λ1sin v+λ2cos v)=0,解之,得
情况2中P在机动性能上占绝对优势,所以总能捕获到E;情况3中E在机动性能上占绝对优势,所以总能逃脱P的追捕。这两种情况对局结果是确定的,没有深入研究的意义,下面将对情况1和情况4这种双方互有优、劣势的对局结果进行探讨。情况4中vp>ve,v<u,在这种情形下,关心的是为达到各自的目的,P和E应分别采取什么样的控制策略。情况1与情况4的问题相似,只需相互对称建立坐标系即可,所以针对最后一种情况进行分析。
表1 运动性能与结局的关系
Table 1 Relationship between maneuverability and outcome
情况PvpvEveu结局1大快小慢待定2大慢小快P总能捕获E3小快大慢P总捕获不到E4小慢大快待定
定义d=(xe-xp,ye-yp,ze-zp)为追捕者的瞬时位置到躲避者的瞬时位置的指向向量,ve(t)和vp(t)分别为t时刻躲避者与追捕者的速度向量,于是有‖ve(t)‖=ve<‖vp(t)‖=vp。
定理1 在任一时刻t0,如果追捕者的速度向量vp(t0)与相对位置向量d(t0)的内积非正,即如果
d(t0),vp(t0)≤0
(2)
满足的所有点,称为目标集的部分可用边界(BUP)。由BUP为起点所形成的界栅D与UP围成的区域构成捕获区,其余区域为躲避区。
证明 不失一般性,设t0=0。为了证明这个定理,只需找到一个E成功逃脱的例子。假设在t≥0的任意时刻,P都不改变其速度方向,相对位置向量d满足
(3)
式中,d0=d(0)。定义有
(4)
当t≥0时,已知‖vp‖=vp,且vp>ve,则有证明完成。
假设飞行高度不变,无人机和无人车的运动状态方程用来表示,其中X=(xp,yp,zp,xe,ye,ze)。
假设无人机的飞行高度固定,并且无人车只在x轴上运动,为了方便处理条件1),令考虑在xoy平面的对局环境,本文把树木的形状建模成一个三角形,其中,(xT,yT),(xt,yt)为三角形底边上两个顶点的坐标。那么在xoz平面,条件1)可以表示为
2 对局策略
如表1所示,在情况1和情况4下, P和E各有优势,对策空间可以划分为 2 部分。一部分为捕获区,另一部分为躲避区,其分界面为界栅,记作D。
设是目标集D的边界集合∂D上指向对策空间的法线向量,记哈密尔顿函数为
外墙防漏技术是要从施工前期就开始,在前期施工中必须要检验好墙面的平整度,这样做的原因是避免墙体挤压变形出现裂缝,裂缝是墙体渗漏问题的源头,所以出现不平整的地方一定要找明原因然后进行处理,其次是,在进行上灰时,必须要对整个墙面进行彻底的清理,这么做的目的是清除掉长期施工掉落的粉尘等,提高墙面的附着度,从而提高墙体的防渗透能力。
H(x,y,u,v,λ)=λ1vpcos v+λ2vpsin v+λ3veu
(5)
为任意向量,为了便于分析,得
Hp(v)=vp(λ1cos v+λ2sin v)
(6)
He(v)=λ3veu
(7)
在λ1,λ2均为0的情况下,v可以取任何值,P可以遵循任何控制策略。 类似地,如果λ3=0,那么u可以取任何值,并且E可以遵循任何控制策略。这些条件代表了哈密尔顿算子的奇异点。
H(x,y,u,v,λ)表示状态的变化率。如果轨迹X在∂D上或者充分接近∂D,并且H(x,y,u,v,λ)>0,那么轨迹X不能穿过∂D;反之,即H(x,y,u,v,λ)<0则轨迹X穿过∂D,此时对局结束。因此,从P与E各自的目的出发,P欲使H<0,而E欲使H>0。哈密尔顿函数H(x,y,u,v,λ)中含有控制变量u,v,因此P应该选择最优策略v,使H(x,y,u,v,λ)∂D在目标边界集合∂D上取得尽可能小的负值以保证对局结束,而E应选择最优策略u使H(x,y,u,v,λ)∂D取得尽可能大正值以实现逃脱,即
(8)
在目标边界∂D上满足的所有点,称为目标集的不可用部分(NUP)。在NUP上,无论P采取何种策略,E总能躲避捕获,从而对局结束。满足的所有点,称为目标集的可用部分(UP)。在UP上,不管E采用何种策略,P总能捕获E,从而结束对局。
则t≥t0时P不能捕获到E,E成功逃脱。
在线模拟导线数据采集模块如图2所示。图2中,模拟导线是输电导线上截取的一小段,在输电导线相同环境下,可以精确模拟输电导线的覆冰过程。模拟导线的整体重量为模拟导线重量和覆冰重量之和,通过拉力传感器采集连接杆的受力,将受力减去模拟导线和连接杆的重量,可以算出输电导线覆冰重量。
P和E都可以控制各自的方向,且各自转向控制分别为v,u。当P与E之间的距离小于L时,则认为被捕获,此时对局结束。作简单的分析不难得到表1中的4种结局。
(9)
显然,有故由该式确定的v*是无人机的最优策略。要使He(v)取得极大值,地面无人车应该选取的策略为
(10)
化合物6,淡黄色粉末,ESI-MS m/z 197 [M-H]-1, 1H NMR (600 MHz, MeOD) δ∶7. 33 (2H, s, H-2, 6), 3. 88 (6H, s, H-8, 9); 13C NMR (150 MHz, MeOD) δ∶122. 7 (C-1), 108. 3 (C-2, 6), 148. 8 (C-3, 5), 141. 5 (C-4), 170. 5 (-COOH), 56. 8 (2 × -OCH3)。以上数据与文献[14]报道的丁香酸基本一致,故确定化合物6为丁香酸。
分析表9可得,在对多样性指标间的内生性问题进行分析时,进口中间产品多样性指标的系数值不断提升,说明进口中间产品多样性对创新能力具有促进效应,但是最终结果却未产生明显的波动,说明该模型的结果具有较高的稳定性。
(11)
3 界栅的确定
树木覆盖会对无人机和无人车的视线造成影响,进而影响对局结果。本文把树木作为对局环境中的障碍,对树木的影响进行建模分析。追捕者成功追捕到目标,或者目标丢失都会导致对局结束。
按照设定场景,给出了树木障碍物存在的情况下对局终止的两个充分条件:1) 当无人车处于无人机的有效观测距离之外时,认为目标丢失;2) 虽然无人车在无人机的有效观测距离之内,但是两者视线被障碍物阻挡,相互不可见。以上两种情况分别对应图2a和图2b。
图2 对局情况分析 Fig.2 Game situation analysis
鉴于P的约束性,定理1的证明说明,只有P的速度向量的分量指向E时捕获才会发生,这种情况下P的最优策略是尽快增大指向E的速度分量,如果这个分量增加得较慢,捕获将可能无法完成。另一方面,如果P一直没有指向E的速度分量,则E可凭借其机动性优势成功逃避追捕。
从中国刑警学院回来后,王敬凯继续深入梳理案情,以取得更多的证据。 在那封匿名信及3张纸条中,多次出现“瓶装”这个常人颇感生疏的特殊词组。
(xe-xp)2+(ye-yp)2-L2≤0
(12)
同样,选取三角形底边顶点为(xT,yT),将条件2)向xoz面投影,条件2)可以表示为
(13)
上述两个条件得到满足时,对局终止,可得终端集
F=(xe-xp)2+(ye-yp)2-L2+(xp-xT)· (ye-yT)-(yp-yT)(xe-xT)=0
(14)
由终端集可得参数方程
式中:u=+1,说明沿x轴的正方向运动;u=-1,意味着朝相反方向运动。所以可得
(15)
式中,s=(s1 s2 s3)T。
古希腊哲学对宇宙本体存在的形而上沉思,与人的道德生存方式关联。哲学家们力图在跌宕起伏、变幻莫测的现象世界中,把握恒久常在的东西,以构建道德形而上学之根基。苏格拉底的“美德即知识”,表达了道德行为的普遍法则与宇宙的根本法则的合二为一。在柏拉图金字塔式的概念结构中,最高理念是真与善一体的至上境界,这一质朴的亲和状态绵延至近代,在培根“知识就是力量”的号角声中,理性身败名裂,其价值意义与工具意义分道扬镳。
在界栅D上的法线向量λ满足
(16)
因为法线向量的长度是任意的,故可取λ为单位法线向量,在∂D上同样有λT·λ∂D=1,联立式(10)可以求出确定目标边界集∂D上的单位法线向量λ。
征诸文献,西周“国人”因资料限制,难言其详,春秋“国人”(下文所言“国人”,均指春秋 “国人”)则具有明确的历史内涵。所谓“国人”,指春秋伦理秩序中的卿、大夫、士。其中,士是“国人”的主体。春秋时期,庶人、工、商不当列于“国人”范畴。以下对这一问题依次予以考证。
在∂D上,若令则有
(17)
代入式(9),可以得到最优策略u*,v*。
令以BUP的点作为界栅的初始点,倒向积分状态微分方程组,状态微分方程组的初始值为对应于BUP的状态变量值。积分出来的(轨迹)状态X*就是所求的界栅D。倒向积分状态微分方程组及初始条件为
(18)
积分可得
(19)
设置P的初始化坐标为(0 m,0 m,29 m),E的初始坐标为(3 m,5 m,0 m),速度比为 k=1.14,捕获半径L=200 m。当障碍点在(5 m,5 m,5 m)时,得到图3a所示三维空间界栅。
图3 界栅 Fig.3 The barrier
界栅D对应的是穿过BUP的半透曲面,为方便观察将图3a朝xoy平面投影得到图3b。图3b中圆和双曲圆弧代表目标集在xoy平面的投影,蓝色阴影部分是由界栅D和目标集围成的捕获区,在捕获区内运动,轨迹将到达目标集的边界并穿过。在此区域内,只要P使得E进入该区,则无论E采取何种策略,在P选择适当的策略下,E再也不能逃出该区,即捕获E。捕获区之外为躲避区,在此区域上,只要E初始位置在该区中,不管P采用何种策略,E总能采取适当的策略躲避P的捕获。
4 总结与展望
分析对局环境中存在障碍物约束的追逃定性微分对策,建立了无人机、无人车的运动模型,通过分析确定了躲避区与捕获区的分界界栅。不同的障碍物对界栅的形状会有不同的影响,分析界栅的形状、对策空间的划分对于作战能力评价、指导指挥训练、作战等都有一定的意义。未来,对局双方更复杂的运动模型,以及其他形状的障碍物将会进一步讨论。
参 考 文 献
[1] 原鑫,李擎,苏中.基于微分对策理论的两车碰撞问题[J].北京信息科技大学学报:自然科学版,2016,31(5):68-72.
[2] 龚华军,杨长锋,王彪,等.无人机的追逃对抗仿真研究[J].控制理论与应用,2009,26(9):1019-1022.
[3] 车竞,郑凤麒.基于微分对策的追逃对抗仿真[J].飞行力学,2014,32(4):372-375.
[4] 车竞,钱炜祺,和争春.基于矩阵博弈的两机攻防对抗空战仿真[J].飞行力学,2015,33(2):173-177.
[5] 佟明安,王立新.三维空间双机格斗的捕捉区和危险区[J].航空学报,1989,10(11):536-544.
[6] 张秋华,孙毅,黄明明,等.近地共面轨道上两飞行器在径向连续小推力下的追逃界栅[J].控制与决策,2007,22(5):530-534.
[7] 黄银春.导弹拦截飞机末端制导制导律和界栅的研究[D].哈尔滨:哈尔滨工业大学,2014.
[8] 王发坤,秦艳琳.三维空间中追逃对抗定性微分对策模型研究[J].舰船电子工程,2008,28(7):14-16,181.
[9] BHATTACHARYA S,HUTCHINSON S,BASAR T.Game-theoretic analysis of a visibility based pursuit-evasion game in the presence of obstacles[C]//American Control Conference,2009:373-378.
[10] OYLER D W,KABAMBA P T,GIRARD A R.Pursuit-evasion games in the presence of obstacles[J].Automatica,2016,65(C):1-11.
[11] QUINTERO S A P,HESPANHA J P.Vision-based target tracking with a small UAV:optimization-based control strategies[J].Control Engineering Practice,2014(32):28-42.
下一篇:基于操稳特性的飞行器包线划分方法