更全的杂志信息网

随机分组策略下的分布式多智能体一致性

更新时间:2009-03-28

1 引言(Introduction)

近年来,随着机器人技术、互联网技术、传感和通讯技术的发展,多智能体系统(multi-agent systems,MAS)逐渐成为当今自动控制领域一个重要的研究方向,并对社会生产和生活起到巨大的影响.一致性问题是分布式多智能体研究中最基本的一个问题,也是最为典型、应用最为广泛的问题.一致性可以理解为群体中的成员通过与其他成员的信息交流及共同约定的简单相互作用,使群体达到一种共同的状态或者意向.该研究被广泛应用在分布式能源系统[1]、分布式平行计算[2]、队形控制[3]、小世界网络、传感器网络估计[4]及聚合控制等各种应用当中.

一致性问题的研究起源于20世纪80年代[5–6],而该问题直到21世纪初才由Olfati-Saber和Jadbabaie等人[7–8]从理论的角度给出分析和证明.在绝大多数研究中,智能体之间通过局部的通信来交换彼此的状态信息,从而更新自身的状态量.因此,早期的研究主要集中在探索怎样的拓扑结构才能保证系统的收敛以及提升收敛速度.大量的文献表明,对固定结构拓扑系统,其收敛的条件为系统的强连通性;对于变结构拓扑系统,其收敛的条件为在每个有限的时间段内系统都为强连通.此后该领域得到快速发展,并吸引了大量研究者的关注,分别在高阶系统[9]、非线性系统、量化[10]、存在时延[11]、通信噪音、网络丢包等方面进行了深入研究.

然而,在一致性问题的一些实际应用中,既无法估计出各智能体的绝对状态量,也无法得到智能体间相对的状态差值.在这类应用中,上述所提的一致性算法便不再适用.例如,在多天线协同发射信号的过程中,状态量(每个发射信号的相位)以及智能体间相对的状态差值(两个发射信号之间的相位差)均无法获取.然而通过一些辅助手段,可以利用一个接收器来获得两个小组内所有发射天线之间的相位差并反馈回发射端以调节发射端的控制输入,从而达到波束形成[12].再例如,在PageRank算法中通过赋予每个网页一个权重值来表征该网页的重要性大小,而该权重值可以通过分布式随机算法得到.由于网络节点数量的巨大从而不能保证节点间的强连通通讯,于是将节点进行分组并通过组间的通讯可以大大减少系统的运算量[2].

综上所述,随着尿素价格的持续冲高,经销商的心态在逐渐转变,但这改变不了当前市场诸多利好并存的局面。考虑当前价格水平,涨势放缓理所当然,短暂的盘整也能够让市场行情更加稳固。在诸多利好支撑之下,后市仍有小幅上升空间,以目前价格水平为基准,后市主流出厂价重回2000元/吨问题应该不大。

本文讨论离散情况下,无智能体间相对状态差值的分布式一致性问题.每次迭代时,各智能体都以一定概率被划分为两组或多组,且同一组内的智能体具有相同的控制输入.为了分析的简单,假设每个组的状态均为组内所有智能体状态的凸组合,且满足一定的联合分布要求.本文给出结论,对于划分为两组或多组的情况系统均可达到期望一致.当仅有两个随机分组时,每个智能体都以这两组间的状态差值进行状态更新,从而该系统达到期望一致的充要条件为所给出的状态更新参数大于1.当存在多个随机分组时,每次迭代通过Gossip算法随机选取两个更新组并得到这两组间的状态差值,对组内智能体进行状态更新.当分组概率相等,且状态更新参数大于1时,该系统也达到期望一致.

注2为一种满足定义的系数条件.

本文中:R|∗|表示维矢量,为1时表示标量;i,j指代智能体,h,l,r表示分组,E[·]为期望.

2 问题描述(Problem formulation)

G=(V,E,W)为一个由n个节点有向网络构成的加权图,其中:V={v1,···,vn}为该图n个节点的集合,它的边集E⊆V×V;邻接矩阵W=[wij],其中矩阵元素wij表示节点i到节点j的连接权重.如果节点i可以得到节点j的信息则wij̸=0,否则wij=0.

考虑n个智能体的离散时间模型

 

其中xi(k)R和ui(k)R分别表示智能体i的状态量和控制输入量.n个智能体的初始状态为x(0)=[x1(0) ···xn(0)]T.

本文假设智能体间无信息交换,从而无法得到智能体间的状态差值xi−xj.于是通过将智能体随机划分为m(6n)组,并将组间的状态差值作为控制变量来进行智能体状态更新.在k时刻,每个智能体i都以一定概率被划分到组Gh(k)中,且各组所对应的智能体数目分别为可以看出,当m=n时,系统就退化为一般的多智能体一致性问题.

当弄清了带电粒子在电磁场中运动的运动状态后,对带电粒子的运动过程进行分析才是解决问题的关键,并列出能够求解相关问题的方程并求解。比如在回旋加速器(如图3)和速度选择器(如图4)问题中。回旋加速器是巧妙的运用了电场和磁场的性质,来实现粒子加速。速度选择器是只让具有特定速度 的带电粒子通过,与带点粒子的电荷量和质量无关。

现在给出每个组状态信息的定义,该状态为满足一定联合分布的组内所有智能体状态的凸组合.

定义1fGh(k):R|Gh(k)|R表示组Gh中所有智能体状态的凸组合,即

 

其中为非负随机系数,满足另外,本文要求

 

k时刻Gh中智能体状态的平均值,h=1,···,m.

注1 当仅考虑为随机系数时,由于多随机变量的联合分布及其非独立性,证明较为复杂.为了简化分析,本文对系数及其所构成的凸组合进行严格限制.

据作者所知,在已有的一致性问题研究当中有考虑分组的情况[13–15],然而依旧是利用智能体间的状态差值来进行状态更新,并无考虑组间的状态差.另外,本文所提出的控制策略中允许负权重的存在,从而无法借用随机矩阵已有的经典结论[8,16],也增加了论证的难度.本文可以作为一致性问题的一个新的分支进行研究和讨论.

为了使用方便,本文以后统称fGh(k)为组Gh的状态,fGh(k)−fGl(k)GhGl两组之间的状态差值,h,l=1,···,m.

[11]LIU Dejin,LIU Chenglin.Consensus problem of discrete-time second-order multi-agent network with communication delay[J].Control Theory&Applications,2010,27(8):1108–1112.(刘德进,刘成林.具有通信时延的离散时间二阶多个体网络的一致性问题[J].控制理论与应用,2010,27(8):1108–1112.)

定义2 期望一致[17].如果对任意的初始状态x(0),都有

1.1 一般资料 2015年6月-2017年6月,共有357例冠心病患者在本院行经皮冠状动脉介入治疗。纳入及排除标准:⑴符合冠心病诊断标准;⑵均采用经皮冠状动脉介入治疗,且所有患者均具备适应症,无禁忌症;⑶经皮冠状动脉介入治疗后均给予常规治疗,且患者依从性良好;⑷排除手术操作相关不良心血管事件、病历资料不完整患者。

 

i,j=1,···,n,称系统达到期望一致.

通过试验示范,云天化复合肥14-8-20受到当地棉花种植户的一致认可。在试验示范田的跟踪过程中观察发现使用云天化复合肥的棉花植株茎秆粗壮、根系发达,分枝较和花蕾较多,叶片较厚且颜色较深;同时实现了棉花的增产增收,给农户带来很大的经济效益,在当地赢得了很好的口碑。

3 划分组m=2(Partition number m=2)

这一节考虑智能体仅被划分为两组的情况,每个智能体都基于组间的状态差值fG1(k)−fG2(k)进行状态更新.给出控制策略为当|G1(k)||G2(k)|=0时,ui(k)=0,否则

 

其中γ>0为状态更新参数.

根据上述控制策略,整个系统可以写作

 

如果|G1(k)||G2(k)|=0,W(k)=0;否则W(k)的第ij个输入为

 

注3 wij中,下标j决定数值的大小,而i仅影响数值的符号.下同.

下面给出本文的第1个主要结论:

定理1 当智能体被随机划分为两组时,通过控制策略(4),系统(1)达到期望一致的充要条件为γ>1.

为证明该定理,首先给出下列正定函数:

 

由上可知该函数非负,当且仅当对所有ij,xi=xj时其值为零.另外,当|G1(k)||G2(k)|=0时,

 

|G1(k)||G2(k)|0时,

 
 

由此可知,式(6)的符号取决于γ是否大于1.具体证明过程详见附录.

注4 对于不同的智能体ij,其分组概率qiqj可以不同;对于同一智能体i,其不同时刻的分组概率也可能不一样.

4 多个分组(Multiple group)

这一节考虑多个分组情况下的一致性问题.在k时刻,每个智能体通过一定概率被划分到m(>3)组中,且仅通过Gossip算法选取的组Gh(k)和Gl(k)内智能体进行状态更新,其余智能体状态保持不变.则其控制策略为当|Gh(k)||Gl(k)|=0时,ui(k)=0,否则

按照“平战一体、精干高效”的原则要求,合理协调联合作战指挥和装备保障的思路与计划,是新时代装备保障能力生成的关键。因此,新体制下的装备保障机构,应根据一体化联合作战要求,将装备保障计划纳入整体作战指挥计划当中。这样,装备保障的计划思路就会与作战指挥的计划思路保持一致,以确保装备保障始终能灵活、机动、准确地满足一体化联合作战的需要。

 

类似于上一节两个分组情况的分析,可以得到控制系统

 

如果|Gh(k)||Gl(k)|=0,W(k)=0;否则W(k)的第ij个输入为

 

对任意智能体i,

 

[8]JADBABAIE A,LIN J,MORSE A S.Coordination of groups of mobile autonomous agents using nearest neighbor rules[J].IEEE Transactions on Automatic Control,2003,48(6):988–1001.

由于独特的语言个性,中文宣传文本多使用主观评论性的词语和句子,这一点在旅游宣传中尤为凸显;即便是在严谨的政府外宣文本中,也能不时看到一些形象、夸张的形容词或副词。在对应的英译文本中,译者要根据宣传文本的正式程度,适当增减主观信息的内容。

当每个智能体划分到各组的概率相等,即

USDA11月报告将2018/2019年度阿根廷大豆产量预测值调整至5550万吨,低于上月预测的5700万吨,但仍比上年因为干旱而严重减产的3780万吨产量高出47%。预计出口量维持800万吨,高于2016/2017年度703万吨及2017/2018年度的211万吨。

 

那么等式(9)可以写作

 

定理2 当智能体被随机划分为m(>3)组时,通过Gossip算法进行选组并利用(7)进行控制.若各分组概率相等,且γ>1,则系统(1)达到期望一致.

具体证明过程详见附录.

5 仿真实验(Simulation)

本节分别对定理1和定理2进行仿真实验,以验证所得结论的正确性.考虑智能体数目n=40,每个智能体的初始状态都为1到1000之间的随机数.采用作为系统收敛与否的指标函数.

实验1 令各智能体每个时刻划分到组G1的概率为0.6.具有不同状态更新参数γ的仿真结果如图1和图2所示.从仿真结果可以看出,系统在γ=1.3>1时指标函数由2.5×108经2000次迭代逐渐收敛到27.7,而在γ=0.8<1时发散.从而再次验证了系统收敛的充要条件为γ>1.

  

图1 系统状态收敛(γ=1.3>1)Fig.1 Convergence of the system(γ=1.3>1)

  

图2 系统状态发散(γ=0.8<1)Fig.2 Divergence of the system(γ=0.8<1)

实验2 令各智能体每个时刻划分到组G1的概率都为一个0到1之间的随机数.当状态更新参数γ=1.3>1时系统的仿真结果如图3所示.可以得到,当分组数目为2时系统的收敛性与分组概率无关.

  

图3 系统状态收敛(γ=1.3>1)Fig.3 Convergence of the system(γ=1.3>1)

实验3 取分组数目m=6=1.3>1,各组分配概率均为1/6.那么每个时刻各组划分到的智能体期望数目一样,满足定理2的条件.指标函数由2.2×108经3000次迭代逐渐收敛到18.7,系统最终达到均值一致,如图4.

  

图4 系统状态收敛γ=1.3>1)Fig.4 Convergence of the system(γ=1.3>1)

6 结论(Conclusions)

本文研究了基于智能体分组信息的一致性问题.传统的一致性算法需要通过各智能体间的状态差值xi−xj来进行状态更新.当该信息无法得到时,本文通过对智能体进行随机分组,采取组间的状态差值作为变量进行控制.针对随机划分为两组和多组的情况,本文分别给出系统达到期望一致的充要条件和充分条件.最后,通过对多智能体系统的一致性问题进行数值仿真,验证了所得结论的正确性.

致谢 本文作者感谢中国电机工程学会青年人才托举工程(项目名称:面向建筑群分布式能源系统的协同优化调度)对本研究工作的资金支持.

参考文献(References):

[1]SUN Q,HAN R,ZHANG H,et al.A Multiagent based consensus algorithm for distributed coordinated control of distributed generators in the energy internet[J].IEEE Transactions on Smart Grid,2015,6(6):3006–3019.

[2]ISHII H,TEMPO R,BAI E.A web aggregation approach for distributed randomized PageRank algorithms[J].IEEE Transactions on Automatic Control,2012,57(11):2703–2717.

[3]RICCARDO F,LORENZO S,CRISTIAN S,et al.Edge-weighted consensus-based formation control strategy with collision avoidance[J].Robotica,2015,33(2):332–347.

[4]ZHU S,CHEN C,MA X.Consensus based estimation over relay assisted sensor networks for situation monitoring[J].IEEE Journal of Selected Topics in Signal Processing,2015,9(2):278–291.

[5]BORKAR V,VARAIYA P.Asymptotic agreement in distributed estimation[J].IEEE Transactions on Automatic Control,1982,27(3):650–655.

冰雪产业的发展已经不是黑龙江省“一枝独秀”了,但是在抓住机遇的同时,也面临着强劲的压力,所以黑龙江省应充分发挥政府职能,从宏观的角度进行科学统筹,合理规划产业布局,政府的规制对冰雪产业来说不仅是对它的约束,更是对冰雪产业的扶持和引导,从明确职能定位、强化市场监管、培育高素质人才、鼓励社会组织发展、加快基础设施建设等方面采取措施,促进经济发展等策略来提升黑龙江省冰雪产业的竞争力。加快黑龙江省冰雪产业的聚集,能够提高黑龙江省冰雪产业的核心竞争力。

[7]OLFATI-SABER R,MURRAY R M.Consensus protocols for networks of dynamic agents[C]//Proceedings of 2003 American Control Conference.Denver:IEEE,2003,6:951–956.

其中:Gr表示既不属于组Gh又不属于组Gl.Ave(Gr(k))为除在组Gh(k)和Gl(k)之外所有智能体的均值,那么|Gr(k)|=n−|Gh(k)|−|Gl(k)|.

[9]PAN Huan,NIAN Xiaohong,GUO Ling.Consensus control of higher-order multi-agent systems with delays[J].Control Theory&Applications,2013,30(7):229–232.(潘欢,年晓红,郭凌.高阶时滞多智能体系统一致性控制[J].控制理论与应用,2013,30(7):229–232.)

[10]CHEN W,LI X,JIAO L.Quantized consensus of second-order continuous-time multi-agent systems with a directed topology via sampled data[J].Automatica,2013,49(7):2236–2242.

“神化”后的陶瓷张力笼罩在臣民身上,如皇帝亲临般时刻提醒烙尽职守与忠心不二,帝王的权力用陶瓷及其权力象征渗透控制旁人,这正是封建社会统治美学的特征。然后,当清廷大厦倾倒,最后一任皇帝溥仪被赶下龙椅,官窑(御窑乃其最高级别)随之终结,但曾经附着在陶瓷身上的权力并未消失,依然拥有无限的空间占有力。比如那件在2005年拍出2亿多元的《鬼谷子下山》、南京博物馆镇馆之宝《萧何月下追韩信》,当它们摆在面前,相信没有人会端起它瞧个底朝天。它们所透露的张力和威慑力,依然独一无二,尽管其中掺杂了今天人们同样在乎的金钱成分,尽管不是所有人都有机会接近它们。

翠姨听了许多别人家的评论。大概她心里边也有些不平,她就问我不读书是不是很坏的,我自然说是很坏的。而且她看了我们家里男孩子,女孩子通通到学堂去念书的。而且我们亲戚家的孩子也都是读书的。

[12]HOU J,YAN G,LIN Z,et al.Distributed transmit beamforming via feedback-based inter-cluster synchronization[C]//Proceedings of 2012 Conference on Decision and Control.Hawaii:IEEE,2012,12:1392–1397.

[13]CHEN Y,LU J,HAN F,et al.On the cluster consensus of discretetime multi-agent systems[J].Systems&Control Letters,2011,60(7):517–523.

2) 抗DPPH自由基。准确吸取维生素C和纯化液各2 mL(二者浓度均为0.012 mg/mL)分别置于不同试管中,常温下每个试管中快速加入2 mL DPPH溶液振荡摇匀、密封、避光静止反应30 min,在517 nm处测其吸光度A1。3次重复。以溶解该样品的溶剂2 mL无水乙醇+2 mL DPPH溶液在相同条件下反应得到的溶液作为空白对照,测其吸光度A0,然后计算清除率。

[14]HAN Y,LU W,CHEN T.Achieving cluster consensus in continuoustime networks of multi-agents with inter-cluster non-identical inputs[J].IEEETransactionsonAutomaticControl,2015,60(3):793–798.

[15]WU J,ZHANG L,BAI Y,et al.Cluster-based consensus time synchronization for wireless sensor networks[J].IEEE Sensors Journal,2015,15(3):1404–1413.

[16]BLONDELVD,HENDRICKXJM,OLSHEVSKYA,etal.Convergence in multiagent coordination,consensus,and flocking[C]//Proceedings of 2005 Conference on Decision and Control,and European Control Conference.Seville,Spain:IEEE,2005,12:2996–3000.

[17]YOU C.On the convergence of uncertain sequences[J].Mathematical and Computer Modelling,2009,49(3):482–487.

试验用零件为我公司某型号制动器压盘(结构见图1),技术要求:材料为QT500-7,铸件,毛坯正火处理;6个锥窝内表面淬火硬度45~50HRC,淬硬层深度不小于1.5 mm,且硬化层要求沿锥窝内表面均匀分布;无过烧、裂纹现象发生。

附录 定理证明(Appendix Proof of theorem)

由于定理1和定理2具有相似的充分性证明思路,这里仅给出多分组情况下的充分性证明.此外,还给出划分组为2时的必要性证明.

充分性证明.γ>1.当|Gh(k)||Gl(k)|=0时,V(x(k+1))=V(x(k));当|Gh(k)||Gl(k)|0时,由式(10)可知

 

由于分组概率不会永远维持|Gh(k)||Gl(k)|=0.于是,存在极限c,并且

 

综合考虑式(10)–(A1),可得对∀l,h,

 

通过若干步数学运算,可以得到

 

E[xi(k)]存在有界极限i,或发散到无穷,i=1,···,n.

1)既存在有界极限,又有无穷极限;或同时存在正负极限.不妨令xixj具有不同极限类型,则

[6]TSITSIKLISJ,ATHANSM.Convergenceandasymptoticagreement in distributed decision problems[J].IEEE Transactions on Automatic Control,1984,29(1):42–50.

 
 

这与上述已知存在有界极限c矛盾.

2)仅存在正(负)无穷极限.假设系统未达到期望一致,那么可以得到这就意味着对于任意足够大的K,针对k>K,总存在智能体ikjk,

 

由于每个智能体i均以一定概率分组,那么在任意时刻K之后,总会发生Gl中所有数据均比Gh大的分组(或都比Gh小).此时,

从式(6)、式(7)、式(8)以及图3、图4 可知:根据最大主应力准则,当采掘工作距离包裹体一定距离时,不同采动影响下的含应力包裹体煤体会在上覆岩层、包裹体、瓦斯的耦合作用下沿着最大主应力的方向发生破坏,且最大主应力所在角度θmax随半径的变化趋势都相同,都是随距离的增大逐渐减小,最终形成口大腔小的楔形或唇形结构断面。当采掘靠近应力包裹体时,楔形或唇形断面间的破碎煤体会失去有效束缚,抛向采掘空间,从而产生煤与瓦斯压出或喷出现象。破碎煤体抛出后,孔洞断面皆呈楔形或唇形,这与现场煤与瓦斯压出后经常出现的口大腔小的楔形或唇形孔洞相吻合。

 

这与之前得到的结论矛盾.

3)只存在有界极限.通过反证法,假设系统未达到期望一致,那么必存在至少两个智能体,其期望值的极限并不相等.不妨设令集合I从而IJ均非空.

由极限的定义可知,对于δ/4>0,存在K>0,对于任意k>K,E[x(k)]∥<δ/4.于是,有

 

另一方面,由于每个智能体均以一定概率分组,那么在任意时刻K之后,总会发生Gh∈I,Gl∈J的分组(分组为2时为G1=I,G2=J).此时,由式(A3)可以得到

 

这与之前得到的结论矛盾.于是,系统达到期望一致.

分组为2时的必要性证明. 假设γ61,根据式(6),对任意的xi(0) ̸=xj(0)都有

 

然而当系统期望一致时,根据V(x(k))的定义,E[V(x(k))]收敛到零,这与假设条件矛盾,于是假设不成立.

 
侯健,,,,郑荣濠,,
《控制理论与应用》 2018年第04期
《控制理论与应用》2018年第04期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号