快捷分类

基于复制动态博弈的大学生上课选座位博弈分析

更新时间：2009-03-28

0 引言

大学教室里经常出现这样一种现象，代课老师在讲台上激情蓬勃地讲课，但学生却尽可能地远离老师的视线，例如，教室里一共有八排座位，座位的数量大于来上课的学生数量，上课时学生坐满了后六排座位，最前面的两排却没人坐，尤其是最后一排的座位“一票难求”，抢不到后排座位的学生，才会无奈的坐在靠前一些的座位。这样的例子在如今的大学校园里比比皆是，无不让人痛心。这种现象的出现与中小学生托关系坐到前排形成鲜明的对比，折射出老师和学校乃至大学教育的无奈[1]。

国内社会对大学生选择坐后排的现象进行过一系列讨论，讨论的结果都是基于教育学和社会学的角度而对如今大学生的学习态度和人生观进行批评，并没有从演化博弈论的角度出发而去论证这种现象产生的必然性。

演化博弈论以博弈方具有有限理性为基础，研究博弈方组成的群体成员采用特定策略比例的变化趋势和稳定性，它对分析预测经济关系的长期趋势和解释各种普遍性社会现象有重要的作用[2]。谢识予对进化博弈论的思想、方法、意义和发展前景进行了讨论[3]，王先甲等探讨了演化博弈论中的各种学习模型，提出了有限理性的实质是怎么去学习[4]，吴昊等探讨了合作竞争博弈的演化模型，用“进化稳定策略”来描述合作竞争博弈的长期演化趋势[5]，孙庆文等基于不完全信息假设，借鉴生物进化过程中“复制动态”的思想，对非对称2×2演化博弈均衡进行渐近稳定性分析，完整地给出了其定性行为的拓扑等价分类[6]，刘德海等运用演化博弈理论建立了重大突发事件的疫情传播方程[7]，王玉燕等采用演化博弈方法研究逆向供应链在企业供应链中的推广应用[8]。

本文运用演化博弈论，建立坐后排者和坐前排者的有限理性群体复制动态博弈模型，分析出均衡结果，给出一系列的结论。

1 有限理性和复制动态模型

1.1 有限理性

静态博弈和动态博弈基本上是以博弈方的完全理性为基础，但在现实中对决策者的完全理性假设是很难满足的[9]。如果博弈的参与人不满足完全理性假设，称为“有限理性博弈方”，这时博弈可称之为“有限理性博弈”[10]。有限理性意味着博弈方往往不会一开始就找到最优策略，会在博弈过程中学习博弈，通过试错寻找较好的策略。

1.2 演化博弈和复制动态模型

微分方程（2）的相位图如图1所示。

当x=0时，变化速度为0。即初始时刻没有选择坐前排的学生，那么选择坐前排的学生就不会出现。

表1 签协议博弈支付矩阵

参与人B同意不同意参与人A 同意 1，1 0，0不同意 0，0 0，0

③坐在后排比较有安全感。很多同学认为，不管怎样，有人坐在自己前排会让自己觉得更有安全感，有一种被保护的感觉，所以他们希望更多的人坐在自己前排，而自己坐在后排。

选择“后排”学生的期望收益为：

群体成员的平均收益为：

（78）指叶苔 Lepidozia reptans（L.）Dumort.刘胜祥等（1999）；熊源新等（2006）；杨志平（2006）；余夏君等（2018）

只要“不同意”类型的参与人有基本的直觉和判断能力，迟早会发现改变策略对自己是有利的，即x和1-x是随时间变化的。博奔方策略类型比例动态变化是有限理性博奔分析的核心，动态变化的速度取决于两个因素，一是模仿对象的数量大小，二是模仿对象的成功程度（可用模仿对象策略收益超过平均收益的幅度表示）。

2011年，在立足博爱竹林资源现状的基础上提出的博爱竹林发展目标、总体布局和保护利用等重点工程，通过了我国首个国家级专家评审的县级产业规划——《博爱县竹林资源保护利用总体规划》，对于保护利用竹林稀缺资源、弘扬竹产业文化具有重要意义[29]。

以“同意”类型参与人比例为例，其动态变化速度可用微分方程（1）表示：

上述动态微分方程与生物进化中描述特定性状个体频数自然变化选择过程的“复制动态”方程是一致的，所以把它称作“复制动态方程”。

当x=0时，即初始时刻没有参与人采用“同意”策略，变化速率为0，所有参与人都不会改变策略；

当0＜x＜1时，即初始时刻有参与人采用“同意”策略，变化速率为正，采用“同意”策略的参与人不断增多。

当x=1时，变化速率为0，参与人全部采用“同意”策略。

根据微分方程（2）和相位图1可知，除了x=0以外，该博弈从其他初始情况出发的复制动态过程，最终都会使所有博弈方趋向于选择坐后排，即x=1。x*=0和x*=1是上述复制动态的两个稳定状态，x*=1是现实中出现的稳定状态。

基于建筑材料检测试验数据采集与管理系统的设计探索……………………………………………………… 郭荣华（10-275）

4) 由于气缸体积巨大，并且工艺要求开关时间在10 s左右，因而阀门动作时的瞬时耗气量很大，另外渣锁斗阀属于高频开关阀，这就对仪表空气系统的设计带来挑战，如果设计考虑不周，渣锁斗阀动作时可能会发生“抢气”现象，导致周围的气动阀得不到足够的仪表空气量而工作不正常，形成安全隐患。

2 大学生上课选座位的演化博弈分析

2.1 问题描述

研一的时候要上英语课，上课的教室一共有八排座位，来上课的学生一共只能坐满六排座位，老师为了保证课堂教学质量，鼓励大家尽量坐在教室的前排，结果却事与愿违，前两周上课时还有学生坐在前两排，后来大家就心照不宣的从第三排开始往后坐，前两排彻底无人坐。老师发现了这种现象后对全班学生进行了批评，并且强制大家坐满前两排座位，但随着时间推移，大家又一次心照不宣的从第三排开始往后坐，一直到课程结束，前两排座位都处于闲置状态。

根据本人的切身体会以及与同学之间的交流，发现大家不愿意坐前排有以下几个原因：

以用户末端温度需求为主机功率输出依据。用户末端所需温度设定后，室内末端会因人流量增减而产生热源变化、出/回水管线长短、水管保温是否良好、水的流速和室外天气温度变化等因素，均会导致出现多种变量而造成负荷的不同。智能节电管理系统根据各种变量的变化，实时动态调节主机负载，以满足末端负荷的需求。使主机的能耗可以快速、准确、合理、适度加减载，直接与末端需求相适应。通过对中央空调系统末端的动态监测，并参考室外温湿度，室内环境温度需求，实现空调主机负载率跟随末端负荷需求而同步变化。从单纯生产变成以需定产实现节能目的。智能节电管理系统平台管理模式如图1所示。

①避免被老师提问。老师一般会让前排的同学来回答课堂问题，但大多数同学都不想被老师提问，所以选择坐后排。

伊利诺伊州芝加哥大学的神经生物学家魏巍正使用GEVIs研究不同的电输入信号是如何在小鼠视网膜神经元内被整合的。魏巍的研究兴趣涉及一类能够对一定方向运动的视觉刺激产生强烈反应的神经元。通过观测这些神经元不同部位膜电位的变化，她希望可以理解细胞如何处理输入信号，以探测刺激的运动方向。

②方便做自己的事情。很多同学上课不认真听讲却在做其他的事情，例如：玩手机、看小说等等，他们认为坐在后排不容易被老师发现。

帕累托最优的纳什均衡是（同意，同意）。

2.2 模型建立与分析

我们假设教室里只有两名学生：学生A和学生B，对他们之间的博弈做出如下假设：

胃肠手术会导致患者术后阶段性禁食,导致患者身体各项指标趋于下降趋势,不仅增加了患者的身心痛苦,也极易引发其他并发症。肠瘘则是胃肠手术的并发症之一,但发病较少,一旦出现肠瘘,影响患者术后康复。与此同时,肠瘘症状发生会造成患者脏器功能衰竭,造成感染症状,严重者会威胁患者生命安全。因此,针对胃肠手术后并发肠瘘症状要及时采取治疗措施,传统的治疗方法只是针对患者的饮食进行严格控制,减轻患者的肠胃负担,但效果缓慢。而手术治疗对肠瘘引发的粘连和感染进行处理和治疗,同时予以相应的护理措施,可有效的改善术后各项指标,提高患者生活质量。本文针对胃肠手术后并发肠瘘50例患者临床观察,做出以下分析[1]。

①如果A和B都坐在教室的前排，两人的收益都是1。这时两人都认真听课，但很可能会被老师提问，并且不能在上课时做其他的事情。

②如果A坐在教室前排，B坐在教室后排，A只能选择认真听课，不能做其他事情，而B可以认真听课，还可以做自己喜欢的其他事情，这时A的收益为0，B的收益为2。反之如果B坐在教室前排，A坐在教室后排，A的收益为2，B的收益为0。

③如果A和B都坐在教室的后排，两人虽然都可以选择听课或者做其他的事情，但没有人坐到前排，两人都会遭到老师的批评，这时两人的收益都为1。

在博弈中，A、B两人的支付矩阵如表2所示。

表2 选座位博弈支付矩阵

参与人B前排后排参与人A 前排 1，1 0，2后排 2，0 1，1

根据该博奔的支付矩阵不难看出，它的纯策略纳什均衡是（后排，后排）。如果是在两个满足完全理性假设的博弈方之间进行博弈，那么这个博弈的结果是A、B两人都会选择坐后排，但存在有博弈参与人理性层次很低的情况下，必然会有参与人选择坐前排，这时就需要利用理性层次较低的大规模有限理性群体复制动态博弈模型来分析该博弈。

假设坐前排学生的比例是x，坐后排学生的比例是1-x，所有学生中随机配对进行该博弈时，每个参与人可能遇到“前排”的对手，也可能遇到“后排”的对手，前者的概率是x，后者的概率是1-x。“前排”和“后排”两种类型参与人各自的期望收益uf和ub分别为：

教室内所有学生的平均收益为：

根据上述结果可以看出，“后排”类型参与人的期望收益高于“前排”类型参与人的期望收益，也高于教室内所有学生的平均收益。当收益较差的参与人，即“前排”类型参与人发现坐在“后排”对自己更有利时，他们就会改变策略，从而坐到教室“后排”。这种动态变化的速度可用微分方程（2）表示：

参与人A和参与人B要签订一个协议，两个参与人都有“同意”和“不同意”两种可选策略，他们的支付矩阵如表1所示。

Offset=(Input8*Output0-Input0*Output8)/(Output8-Output0);

当0＜x＜1时，选择坐后排的学生会逐渐增多。

当x=1时，变化速度为0，即所有学生都选择坐后排，“后排”的学生数量不再变化。

角砾状构造：早期形成的黄铁矿被错动成棱角分明，大小不等的角砾分布在石英脉中，有的角砾被次生铁锰矿物胶结。

有限理性博弈方有不同的理性层次，学习速度差别很大。参与人的学习速度慢表现为向优势策略转变是一个渐进的过程，称之为演化博弈。演化博弈的复制动态模型最早在1978年由Taylor和Jonker提出，复制动态模型来源于生物学中的进化动态方程。“签博弈协议”的例子很好的说明了复制动态模型。

图1 选座位博弈复制动态相位图

复制动态过程收敛到x*=1时，学习过程停止，有限理性参与人找到了本博弈中效率较高的纳什均衡，即x*=1是一个稳定状态。

当x*=1时，所有学生全部选择坐在后排，有限理性参与人的学习过程停止，所有参与人都通过学习找到了最好的策略。

当代课老师发现教室前两排无人坐时，对全班同学进行了批评教育，这时少数听话的学生就按照老师的要求坐在了前两排，我们假设比例为ε的学生坐在了前两排（记为前排），比例为1-ε的学生依旧坐在后排。这时，选择“前排”学生的期望收益为：

参与人往往不可能一开始就能找到最优的策略[11]，有参与人会选择“不同意”。假设“同意”类型的参与人占比为x，“不同意”类型的参与人占比为1-x（大群体中忽略参与人本身对其他类型参与人占比的影响），“同意”和“不同意”两种类型的参与人各自的期望收益uy和un分别为：

采集病料带回实验室后，进行细菌学检查，常规方法进行涂片镜检，未发现被阴性或阳性染色的致病菌。将病料粉碎后，划线接种到几种常见的培养基上，恒温箱内培养48 h，温度控制在37 ℃，在几种常见培养基上均没有出现致病菌生长。

教室内所有学生的平均收益为：

对比（3）（4）两式可知，选择坐前排学生的收益小于选择坐后排学生的收益，同时也低于教室内所有学生的平均收益，因此坐前排的学生会转变策略，最终仍然会趋向于x*=1，即所有学生都选择坐在后排，复制动态博弈最后依然收敛到x*=1，即x*=1是一个稳定状态。

对比可知，x*=1不是稳定状态。当有少数学生选择后排，即偏离0时，选择后排的学生会越来越多，最终导致趋向于1。

3 结论

本文运用大规模有限理性群体复制动态博弈模型，结合了大学生在上课时坐在教室前排和坐在教室后排时的收益情况，分析了大学生上课选座位的动态演化过程。结果表明：在教室座位有空缺的条件下，大学生会倾向于坐在教室后排而不是教室前排，最终全部坐在后排导致前排无人坐，即使少数学生偏离了该稳定状态，复制动态最终依然会收敛于上述稳定状态。因此，要纠正大学生选择坐后排而不坐前排的问题，仅仅依靠老师在课堂上的监督与叮嘱是远远不够的，学校应该考虑从教学方式、教学内容和课程安排等角度另谋良策，才有可能根治这一问题。

参考文献：

[1]闫建章，刘凌燕.大学生上课为何爱坐后排[J].中国教育报，2011-05-23（006）：23.

谈到生活审美与养生时，黄婉秋说：“一个人除生理年龄外，还有心理年龄和艺术年龄。传统观念认为，老年人必须老成稳重，否则会被视为老不正经。然而，现在许多老年人都按照自己的意愿，选择自己喜欢的生活方式。‘老来俏’就是很多老年人选择的一种生活方式。这些老人并不在意生理上的日渐衰老，也不计较别人怎么评判他们，因为‘老来俏’不仅使自己获得了好心情，更重要的是找到了一种积极、有效应对生理衰老的好办法。

[2]卢方元.环境污染问题的演化博弈分析[J].系统工程理论与实践，2011，9（9）：148-149.

[3]谢识予.有限理性条件下的进化博弈理论[J].上海财经大学学报，2001，3（5）：2-3.

[4]王先甲，全吉，刘伟兵.有限理性下的演化博弈与合作机制研究[J].系统工程理论与实践，2011，31（1）：83-84.

（c）The farmer，whose name was Fred，sold us 10 pounds of potatoes.

[5]吴昊，杨梅英，陈良猷.合作竞争博弈中的复杂性与演化均衡的稳定性分析[J].系统工程理论与实践，2004，2（2）：91.

[6]孙庆文，陆柳，严广乐，车宏安.不完全信息条件下演化博弈均衡的稳定性分析[J].系统工程理论与实践，2003，7（7）：11.

碾压时直线段压路机从外侧向中心碾压，设有超高或弯道的由中心向外侧碾压，压路机每次折回位置后呈阶梯形，在同一断面上，中途不停顿、转向，在碾压致密路段逐步借转方向。碾压过程中为防止黏轮，安排专人涂刷油水混合物（食用油：清洁剂：水=1：1：3）。禁止掺加柴油或者机油。

[7]刘德海，王维国，孙康.基于演化博弈的重大突发公共卫生事件情景预测模型与防控措施[J].系统工程理论与实践，2012，5（32）：937.

[8]王玉燕，李帮义，申亮.两个生产商的逆向供应链演化博弈分析[J].系统工程理论与实践，2008，4（4）：43.

[9]李树祥，梁巧转，伍勇.海关走私监管的演化博弈分析[J].系统工程理论与实践，2009，5（18）：29-30.

[10][11]谢识予.经济博弈论[M].上海：复旦大学出版社，2007.01.

作者

赵文强，蒋菡

出处

《价值工程》 2018年第15期

上一篇：河套灌区畦灌畦田规格对灌水效果影响的模拟分析

下一篇：演化博弈下的评标方法分析

《价值工程》2018年第15期文献

基于顾客需求刺激的档案服务创新研究作者：刘超，周波，张雅云，李清竹，秦国伟

基于AHP-模糊评价综合法的高星级酒店顾客感知满意度研究——以昆明市五星级酒店为例作者：黄平

湖北省区域物流与区域经济发展互动关系研究作者：闫成良，袁亮

河套灌区畦灌畦田规格对灌水效果影响的模拟分析作者：徐红梅，郑和祥

基于复制动态博弈的大学生上课选座位博弈分析作者：赵文强，蒋菡

演化博弈下的评标方法分析作者：付彦霖

基于SD的“互联网＋”WEEE回收三方演化博弈仿真研究作者：李春发，王美美

“一带一路”背景下浅谈国际工程争端DAB解决方式作者：何佰洲，王玉

研讨式组训法在雷达指挥训练中的运用探索实践作者：吴春林

环境治理修复类PPP模式项目特点及管控探究作者：邢志军，张隆隆，王珏，李海礁

EPC（设计—采购—施工）总承包模式下的工程建设项目造价控制重点解析作者：陶虹旭

互联网智慧能源创新驱动打造现代能源体系的示范项目——以杭州余杭国家经济技术开发区为例作者：郑文学，綦素素

论“一带一路”战略下广东民营企业“走出去”对策作者：练文俊，尹莉莉

河南自由贸易试验区建设对比分析作者：王晗

浙江省三大农村电商模式下农村电商经营主体调查及启示作者：路永华

大环保背景下地下水环境监测规划研究作者：姚平，张伟

浅谈高校工程造价全过程跟踪审计的重点作者：宋新新

引大入秦灌溉工程供水调度方案的实践与研究作者：朱成有

加快推进施工图文件审查数字化应用作者：邰立民

浅析城镇空巢老人养老模式作者：李庆华

施工企业人才培养工作中教育培训的重要性作者：潘友权

高速公路集中监控模式分析与运营管理作者：钱兴婷

浅谈公路工程工地试验室管理作者：李静

采用PPP融资模式的高速公路建设项目财务评价作者：唐雪迪

EPC总承包项目管理模式的实践应用研究作者：宋晓刚，吴峥

国有企业物资管理解决方案探析作者：洪治国

价值工程理论在工程施工阶段的造价控制分析作者：马艳娟

关于推动消防工作社会化的思考作者：赵慧生

基于低风险的建筑企业供应商管理作者：蒋文品

工程施工领域管理研究与实践作者：郑鹏飞

杂志信息网