快捷分类

分享机制作用下的自我质疑动力学演化博弈

更新时间：2009-03-28

0 引言

演化博弈理论(Evolutionary Game Theory)摒弃“理性人”和“完全信息”的假设,强调多次重复博弈过程中,有限理性的博弈个体,依据局部信息,通过自适应学习选择尽可能占优的策略[1-2]. 在传统的囚徒博弈中,由于背叛的诱惑大于合作的收益,理性个体将会采用背叛策略.然后,现实生活告诉我们,合作存在于我们生活的各个角落,如助人为乐,尊老爱幼,多种多样的慈善义举等.为了解释这些合作行为,研究者提出了空间演化博弈理论,它将多个个体放置在空间网络上进行重复博弈,通过不同的演化规则在自私个体中实现最终的合作状态[1-6].

空间演化博弈的研究集中在网络结构和策略更新规则两个方面[1].研究最为广泛的策略更新规则是通过模仿周围邻居本局的策略来决定自己下一局的策略[5,7-11].本文采用的自我质疑策略更新规则强调:博弈个体通过对比自身备选策略所得收益,选出最优策略[12-17].该更新规则的动力学过程与统计物理中单自旋翻转蒙特卡罗模拟方法十分类似,前期研究发现:存在与自我质疑动力学演化博弈模型等价的Ising模型[18-19].

分享是人与社会产生联系的一种方式,是一种互利行为,是构成社会的要素之一.日常生活中分享广泛存在,人们会跟朋友家人甚至陌生人分享自己的食物,知识和经历等.本文采用的分享机制是,在博弈过程中,每个个体会拿出自己收益的一部分跟自己的最近邻邻居分享,假定个体愿意拿出自己收益的比率为β,剩下的1-β留给自己,这部分收益将会在最近邻个体中平分[20].

本文研究分享机制下依据自我质疑更新规则演化的空间博弈模型:理论分析方面,推导获得相应的等价Ising模型并运用相变理论进行分析预测;计算机模拟方面,任选一条演化路径,分析演化过程中伴随的相变和临界现象并与理论分析进行比对.

本文内容安排如下: 第1部分引入模型; 第2部分找到与自我质疑演化博弈模型等价的Ising模型并分析演化博弈模型的相变和临界现象; 第3部分得出结论.

小说家又说：“日本童话大师安房直子有一篇童话《狐狸的窗户》，讲述了一个小狐狸开了一家印染店的故事。如果小狐狸不狡猾，它能开成印染店吗？”女孩似乎听明白一些，点点头，而富翁却像听傻了一般，双眼直勾勾地盯着小说家。

1 模型

在两策略空间演化博弈模型中,假设任意个体i有两种策略Si=±1可供选择,其中Si=+1 表示合作,Si=-1表示背叛.两个博弈个体同时决定采用何种策略.本文以弱囚徒困境为例:相互合作获得收益a;相互背叛收益为零;混合选择中,背叛者获得收益1-a,合作者收益为零.为满足囚徒困境和重复博弈的条件还需满足1/3<a<1/2[21].

本文采用周期边界条件下的Metropolis算法,对二维正方格子上的自我质疑动力学演化博弈模型进行计算机模拟[23,24].正方格子的大小为N=100×100, 随机生成初始构型后依据自我质疑更新进行演化.首先,任选博弈个体i;然后,对比当前收益和虚拟收益决定是否改变当前策略;重复进行,直至系统趋于稳定为止.为确保计算的准确性,舍弃前10000个蒙特卡罗步(保证系统达到平衡状态),收集接下来2×105个蒙特卡罗步的数据进行分析.此外,为降低初始条件对系统演化的影响, 还选取了100 个不同的初始构型进行系综平均.

综合自身博弈所得收益和邻居分享收益,个体i的总收益改变整理写成

(1)

其中:j是i的最近邻,Ui,Uj分别表示个体i, j跟自身所有最近邻进行一轮囚徒博弈获得的收益总和;kj表示个体j的最近邻个体总数.

在重复博弈过程中,首先,任选博弈个体i,采用当前策略与周围邻居分别两两博弈获得当前收益Gi;然后,采用当前策略的反策略进行一次虚拟博弈,获得虚拟收益最后,比较Gi和以概率Wi决定是否改变当前策略,其表达式为

(2)

其中：表示噪声强度.

2 结果与讨论

2.1 分享机制下博弈模型的等价Ising模型

首先,推导个体i通过自身博弈而带来的收益差.假设初始状态Si=+1,则通过与最近邻博弈,个体i获得的收益为:gi=(1-β)ani+,其中ni+表示i的最近邻中采用合作策略的个体数量.如果i反转当前策略,即取Si=-1,则获得的虚拟收益为:通过简单计算可以得到反转带来的收益差:同理可得,Si=-1反转为Si=+1所带来的收益差,在前面所得收益差中加负号即可.综合两种情况收益差可以写成

Δgi=Si(1-β)(1-2a)ni+,

(3)

其中将ni+代入式(3)整理可以获得自身博弈所得收益差Δgi的最终形式

(4)

其中ki是个体i的邻居总数.

个体i除了通过自身博弈获取收益以外,还将获得邻居给它分享的收益.接下来计算i的邻居j分享给它的收益.假如j的策略为Sj=+1,i由合作翻转为背叛带来的收益差为Δgij=aβ(nj+-1)/kj-aβnj+/kj =-aβ/kj,可以综合写成Δgij =-Siaβ/kj;相同的道理,当Sj=-1时,Δgij=-Si(1-a)β/kj.综合上面的推导,记个体i通过分享所得的收益差为

小麦是非常重要的粮食作物之一，全球有35%～40%的人口以小麦为主要粮食，也是我国北方地区的主食之一。因此，小麦种植技术直接关系到百姓生活和农业发展，同时提高小麦种植技术，做好病虫害的防治工作，也是目前小麦种植工作中的重中之重。为提高我国小麦种植水平，阐述了目前我国小麦种植存在的问题及注意事项，并提出了小麦病虫害的防治措施。

(5)

其中:且ni++ni-=ki.代入式(5)整理可得

(6)

分享机制是指,在博弈过程中博弈个体会拿出自己的一部分收益跟自己的最近邻邻居分享,假定个体愿意拿出自己收益的比率为β,剩下的1-β留给自己[20].在这样的机制下,任意博弈个体i的收益有两部分来源,一部分是自己博弈所得,另一部分是对手分享给自己的收益

(7)

有效能量差ΔEi=ΔGi写为

(8)

从式(11)和式(12)可以明显看出:耦合强度和外场都与博弈参数a和分享比例β有关;当不存在分享时(β=0),则耦合强度和外场变为:即只有合作收益大于背叛的诱惑时才存在合作(传统的囚徒困境).

(9)

(10)

从式(9)和式(10)可以看出:①hi和Jij都由两部分构成,第一部分显含(1-β),可解释为自身博弈所得收益;第二部分显含(β),可解释为邻居分享所有收益.②耦合强度与邻居的邻居kj密切相关,kj越大耦合强度越小,个体与邻居的联系越松散.③外场由两部分竞争决定,个体邻居ki表现为负向作用,邻居的邻居kj表现为正向作用,即自身邻居数量诱导背叛,邻居的邻居数量诱导合作.④一般而言,ki≠kj,则Jij≠Jji,即如果个体i和个体j的博弈人数不对等,相互间的作用强度也是不对等的.⑤邻居越多的个体越容易选择背叛策略,邻居的邻居数量越少越能促进合作的产生.为了讨论的简单,我们先在二维格点上进行讨论,此时ki=kj=4,外场和相互作用强度为

二维格点上的具有分享特性的演化博弈模型可以转化成耦合强度和外场协调变化的类Ising模型,体系存在两个相,完全合作相和合作背叛交替出现的混合相.在下面的模拟过程中,固定合作者获得的收益a=0.45,固定温度为T=0.01,沿着分享比率β从大到小的演化路径,分析其中伴随的相变和临界现象.

2.讨论形成方案。将学生分为10个小组，以小组为单位进行讨论，研究制订相关方案，方案内容包括了解雾霾的严重性、成因、解决措施以及对应的英语词汇。

(11)

(12)

Ising模型的局部能量差ΔEi=2Si∑jJijSj+2hiSi,比较上面的表达式可以得到耦合强度Jij和外场强度hi的表达式

图1 完全理性状况下的参数划分

在临界点pc附近,磁化强度、交错磁化强度、磁化率和四阶累积量存在下列有限尺度标度关系

2.2 分享机制下博弈模型的相变特性

系统的热力学量在临界点时,会出现奇异性和发散,如比热和磁化率在临界点处发散为无穷大,这种发散现象出现在系统尺度为无穷大时.但在实际的蒙特卡罗模拟过程中,我们只能在有限的系统尺寸下进行,而系统在不同构型下演化也需要很长时间,计算机的运算速率和内存都受到限制.科学家们注意到,在临界点附近,随着系统尺寸的不断增大,关联长度不断变大,热力学量的发散程度也不断增加,针对这一特性可以将有限尺寸系统的模拟结果外推到无穷大.这就是由Fisher提出的有限系统临界现象的有限尺度标度律[22-25].

上述规则也是按照JSON 格式来定义，一级属性字段描述了对应的API 接口，其值为策略对象，内部属性为用户角色和对应的权限数组。上图中，events 资源可以被系统管理员生成和查看，安全保密管理员仅可以查看，审计员可以查看和删除；针对某一具体event 资源，该资源创建者具有查看，更新以及删除权限，系统管理员和安全保密员具有查询权限，审计管理员具有查看和删除权限，而未授权者没有任何权限。

序参量(order parameter)是描述相变的重要参量,在Ising模型中,铁磁Ising模型的序参量为磁化强度(magnetization),而反铁磁Ising模型的序参量为交错磁化强度(staggered magnetization).交错磁化强度的定义是将二维格子分为两套子格子,两套子格子交替出现,类似于反铁磁Ising中自旋的排列,自旋向上的所有格子组成其中一套子格子,而完全向下的自旋格子组成另外一套子格子[26-27].两套子格子各自的磁化强度为m1=2∑iSi/N和m2=2∑jSj/N,Si和Sj分别属于不同的子格子,铁磁系统的磁化强度定义为mt=(m1+m2)/2,反铁磁Ising的交错磁化强度定义为ms=|m1-m2|/2.

磁化率定义为χ(m)=N(〈m2〉-〈m〉2),四阶Binder累积量为

(13)

在完全理性的零温状态下,可对参数空间进行区域划分.分界线通过J =0,h =0, h=4|J|[18,19]. J=0三个方程确定,其解为a=0.5或者β=4/3(舍去);h=0的解为a=(5β-4)/(8β-8);h=4J时,解得β=0或者a=1(舍去);h=-4J时解得a= (4β-4)/(7β-8).如图1所示,耦合强度恒小于零,a=(5β-4)/(8β-8)为正负外场分界线,曲线以上为正向外场,曲线以下为负向外场;a=(4β-4)/(7β-8)为临界外场分界线,曲线以上表现为铁磁相互作用,曲线以下为反铁磁相互作用.如图1所示,其中四个向上的箭头表示完全合作的铁磁状态,向上和向下的四个交错出现的箭头表示合作背叛交替出现的反铁磁相.

mL(p)=L-β/vm0(L1/vε),χL(p)=L-γ/vχ0(L1/vε),UL(p)=U0(L1/vε) ,

(14)

其中:约化偏好参数ε=(p-pc)/pc,pc是p的临界值.此外,四阶Binder累积量UL(p)的导数可以写成

(15)

在临界点处,ε=0,对mL,χL和等式两边同时取对数,所得直线的斜率分别为临界指数-β/υ,γ/v和1/v,再通过超标度关系即可获得其他临界指数.注意区分此处的参数β是临界指数而非分享参数.

近几年，蛋白质前处理新技术不断出现。如二维液相色谱分离前处理技术和过滤器辅助样品前处理技术。二维液相色谱分离是将酶解蛋白质肽段进行二次液相色谱分离，进而达到预期的分离效果，该技术可以加大蛋白质鉴定的种类及数量[7]。过滤器辅助样品前处理技术是利用SDS将膜蛋白进行溶解，进而通过过滤器将SDS从样品中移除，解决了凝胶电泳前处理方法对膜蛋白分离的局限性。另外，过滤器辅助样品前处理方法还减少了一维电泳中过多的操作步骤，大大降低了实验误差，可以用于蛋白质质谱定量分析[8]。

图2 磁化强度随分享参数的变化曲线图3 磁化率随分享参数变化曲线

孕妇入组后即接受常规产前检查；定期接受营养门诊指导，制订科学、合理的膳食食谱；每周三08:30～10:00参加孕妇学校的孕期健康教育课程学习，内容包括孕期、分娩期、产褥期知识3大方面。

图4 四阶累积量随温度的变化

图2和图3分别是不同系统尺度下,磁化强度和磁化率随分享参数β变化的曲线,从曲线中可以看到显著的有限尺度效应,磁化强度曲线随尺寸的不断增加而变得越来越陡峭,当系统尺寸为无穷大时,在临界点处,磁化强度曲线的一阶导数不连续.磁化率在系统尺度无穷大时发散,当系统尺度有限时,系统的磁化率连续,从图中可以看到有限的尖峰,随着系统尺寸的不断增加,尖峰的高度越来越大,曲线也变得越来越陡峭.

通常可以利用四阶累积量确定临界点的位置,如图4所示.可以看到不同尺度下的曲线相交于一点,交点即为临界点,βc=0.4547±0.00067.

有了临界点的值以后,我们可以获得临界点处的磁化强度,磁化率及四阶累积量的导数,分别作它们的双对数曲线,并对曲线进行拟合,所得斜率即为相关的临界指数.图5中,左图为临界点处磁化强度随尺度变化的双对数图,拟合直线的斜率β/υ=0.1059±0.0016,中间图为磁化率对应的双对数曲线,斜率为γ/υ=1.7024±0.0087,右图为四阶累积量导数的双对数图,斜率为1/v=0.901±0.0265.

图5 博弈模型的临界指数

图6 磁化强度的数据坍塌图7 磁化率的数据坍塌

为了比较演化博弈模型临界指数与二维Ising模型之间的关系,图6和图7采用二维Ising模型相关临界指数的理论值与博弈模型所得的模拟数据进行数据坍塌.结果显示,不同尺度下的曲线,基本坍塌在一起,从而说明,该博弈模型与二维Ising模型具有相同的临界指数属于相同的普适类.

POD数据后处理应用程序包由数据输入模块、POD数据处理核心模块和数据输出模块等3个功能模块组成(见图1)。

采用SPSS17.0软件,计数资料以(%)表示,行χ2检验。计量资料以(±s)表示,行t检验。对不同数据进行对比,若P<0.05,则表示差异有统计学意义。

3 结论

分享策略的引入,促进了合作的涌现,加强了博弈个体间的联系.类似于公共物品博弈,此过程不仅涉及最近邻的个体,还与最近邻的邻居有关系,相互作用范围显著扩大[19].计算局域收益差,并与Ising模型对比可以获得类Ising模型的有效哈密顿量,分析有效哈密顿量可以对完全理性条件下的博弈模型进行基态划分,系统仅包括完全合作相和混合相(合作背叛交替出现),二者间的转变为二级相变.在研究过程中,固定收益参数a=0.45和温度T=0.01,研究以分享参数β的变化为路径的相变和临界现象.结果显示:由完全合作态到混合态的相变为连续相变,具有和二维Ising相同的临界指数和普适类.

参考文献:

[1]SZAB G,BORSOS I.Evolutionary potential games on lattices[J].Physics Reports,2016,624(4):1-60.

[2]SZAB G,FATH G.Evolutionary games on graphs[J].Physics Reports,2007,446(4): 97-216.

[3]何大韧,刘宗华,汪秉宏.复杂系统与复杂网络[M].北京:高等教育出版社,2009.

[4]NOWAK M A,MAY R M.Evolutionary games and spatial chaos[J].Nature,1992,359(6398): 826-829.

[5]NOWAK M A.Five rules for the evolution of cooperation[J].Science,2006,314(5805): 1560-1563.

[6]诺瓦克.进化动力学-探索生命的方程[M].北京:高等教育出版社,2010.

[7]SANTOS F C,SANTOS M D,PACHECO J M.Social diversity promotes the emergence of cooperation in public goods games[J].Nature,2008,454(7201): 213-216.

[8]HAUERT C,DOEBELI M.Spatial structure often inhibits the evolution of cooperation in the snowdrift game[J].Nature,2004,428(6983): 643-646.

[9]SZAB G,HAUERT C.Phase transitions and volunteering in spatial public goods games[J].Physical Review Letters,2002,89(11): 118101.

[10]SZAB G,TÖKE C.Evolutionary prisoner’s dilemma game on a square lattice[J].Physical Review E,1998,58(1): 69.

[11]SZAB G,VUKOV J,SZOLNOKI A.Phase diagrams for an evolutionary prisoner’s dilemma game on two-dimensional lattices[J].Physical Review E,2005,72(4): 047107.

[12]GAO K,WANG W X,WANG B H.Self-questioning games and ping-pong effect in the BA network[J].Physica A: Statistical Mechanics and its Applications,2007,380(7): 528-538.

[13]WANG W X,REN J,CHEN G,et al.Memory-based snowdrift game on networks[J].Physical Review E,2006,74(5): 056113.

[14]刘永奎,李智,陈小杰,等.Evolutionary Self-Questioning Games with Local Contribution[J].中国物理快报(英文版),2009,26(8): 377-380.

[15]贺京同.行为经济学与中国经济行为[M].北京:中国财政经济出版社,2006.

[16]MCKELVEY R D,PALFREY T R.Quantal response equilibria for normal form games[J].Games and economic behavior,1995,10(1): 6-38.

[17]ZHUANG Q,DI Z,WU J.Stability of mixed-strategy-based iterative Logit Quantal Response dynamics in game theory[J].Plos one,2014,9(8): e105391.

[18]YANG B,LI X T,CHEN W,et al.Critical Behavior of Spatial Evolutionary Game with Altruistic to Spiteful Preferences on Two-Dimensional Lattices[J].Communications in Theoretical Physics,2016,66(4): 439.

[19]杨波,范敏,刘文奇,陈晓松.自我质疑机制下公共物品博弈模型的相变特性[J].物理学报,2017,66(19): 196401-196401.

[20]WU Z X,YANG H X.Social dilemma alleviated by sharing the gains with immediate neighbors[J].Physical Review E,2014,89(1): 012109.

[21]侯冠平,何晓爽.从囚徒困境看高校现代师生关系构建[J].海南热带海洋学院学报,2015,22(6):116-120.

[22]FISHER M E.The theory of equilibrium critical phenomena[J].Reports on progress in physics.1967,30(2): 615.

[23]M.E.J.纽曼,G.T.巴克马.统计物理学中的蒙特卡罗方法[M].北京:世界图书出版公司,2013.

[24]LANDAU D P,BINDER K.A guide to Monte Carlo simulations in statistical physics[M].Cambridge：Cambridge university press,2014.

[25]CHRISTENSEN K,MOLONEY N R.Complexity and criticality[M].London:Imperial College Press,2005.

[26]GODOY M,FIGUEIREDO W.Critical behavior of the mixed-spin Ising model with two competing dynamics[J].Physical Review E,2002,65(2): 026111.

[27]NEIROTTI J P,DE OLIVEIRA M J.Spontaneous staggered magnetization in antiferromagnetic Heisenberg-Ising chains[J].Physical Review B,1996,54(9): 6351.

作者

杨波

出处

《海南热带海洋学院学报》 2018年第02期

上一篇：一种优化的代理多重数字签名方案

下一篇：一种使用离散余弦变换图像去噪算法

《海南热带海洋学院学报》2018年第02期文献

三亚卵形鲳鲹微卫星遗传多态性及性状关联分析作者：李耀国，孙彤，张雅剑，杨超杰

五种脂肪源对点带石斑鱼(Epinephelus coioides)生长和三种免疫指标的影响作者：杨宁，姜芳燕，黄海，巫火连

雄激素诱导泰国斗鱼雄性化研究作者：袁洁怡，贺超，洪广，黄志鹏，林星桦，陈华谱，李水生，李广丽，陈燕

干露对缀锦蛤、文蛤、美女蛤和织锦巴非蛤耗氧率的影响作者：邱清波，李由明，吴丽云，符丽，刘亦涵，贺霄

新银合欢对水分的生态适应性研究作者：赵怀宝，雷莉丽，羊金殿，李红，范梓君，陈菁菁

琼南地区稻菜轮作土壤氮素含量的动态变化作者：周娜娜，王刚，丁文慈，史云峰

关于n长路的(a,b;n)-优美标号的研究作者：王颂，周霞，张庆成

一类无穷区间上分数阶非局部边值问题正解的唯一性作者：廖秀，韦煜明，冯春华

基于主动学习的滚动轴承故障诊断作者：李志伟，闵帆，吕涛，汪敏，刘丽萍

基于边缘检测的内容自适应三进制隐藏研究与实现作者：莫佳，谭素琴

一种优化的代理多重数字签名方案作者：郑建国，张彩娟

分享机制作用下的自我质疑动力学演化博弈作者：杨波

一种使用离散余弦变换图像去噪算法作者：乔付

基于改进粒子群的云计算任务调度方法作者：蹇旭

基于D-loop序列的吉富罗非鱼遗传变异分析作者：陈增祥，刘丽，袁吉贵，张艳苹，黄亮天

三亚托鲁巴姆茄子嫁接苗病株病原菌分子鉴定及室内药效测定作者：罗宏伟，张英樊，戴耀，马华彬，陈乾松，王沛政

椰子油酸三羟甲基丙烷酯的合成作者：钟小雪，孙乙超，符梅爱，何节玉

三角梅红色素的超高压提取及其稳定性研究作者：吴环，杭瑜瑜，张翔

HPLC法初步建立忧遁草中黄酮类化合物指纹图谱作者：黄朝晖，裴志胜，付蕊

城市出租车资源供求匹配程度的数据分析作者：李富荣，高卓

海南高校学生孤独感现状及其与气质类型的关系研究作者：贾晓霖，高娟

基于CiteSpace的移动学习文献计量分析作者：付玉萍，张宗杰

杂志信息网