更全的杂志信息网

城市出租车资源供求匹配程度的数据分析

更新时间:2009-03-28

0 引言

近年来,随着移动互联网的发展以及生活节奏的加快,人们的生活发生了颠覆性的转变[1].为了提高效率及方便大家的出行,人们发明了打车软件,这很大程度上提高了司机的满载率,减少了司机和乘客之间的交易成本.打车软件的兴起加剧了市场的竞争,各公司也推出多种租车的补贴方案[2],以增加司机载客的积极性[3].而在推出补贴方案之前,必须要建立合理指标,分析不同时间地域出租车资源的供求匹配程度[4-5].

为此,本文根据不同等级城市,分别选取北京、深圳、广州、杭州、成都、南京、宁波、济南八个城市作为研究对象,并选取市中心人口、打车需求量、市中心出租车拥有量、亿元GDP出租车拥有量、出租车万人拥有量、出租车月营业额、出租车单车净月营业额、驾驶员单班月营收和里程利用率等9项指标对出租车资源的供求匹配程度进行分析, 进而为各公司推出租车补贴方案提供参考.

1 模型建立

通过主成分分析法对选取的9项指标进行数据处理,使其转换为有代表性的综合性指标,即主成分分析模型的建立.主成分分析法是一种数学转换的方法,把给定的一组相关变量通过线性变换,转换成另一组不相关的变量.这些新的变量按其方差从大到小的顺序排列起来.方差最大的变量,称为第一主成分,方差次大的变量,并且和第一主成分不相关,称为第二主成分.依此类推,m个变量就有m个主成分.主成分分析法的具体介绍如下.

假设对某物体的研究涉及了m个指标,分别用X1,X2,…,Xm表示.假设这m个指标构成的m维随机向量为X=(X1,X2,…,Xm)′,随机向量的均值为μ,协方差矩阵为∑.

X指标进行线性变换,形成新的综合指标,用Y表示,新的综合指标可以由原来的变量线性表示,即满足下式:

 

通过上述主成分分析模型得出的三项主成分指标分别为打车需求量、市中心出租车拥有量、里程利用率.将这三项主成分指标通过加权系数法,得出衡量出租车资源供求匹配程度的综合指标,即匹配指数.如下表5所示.

模型的矩阵形式表示为:

(2)YiYj相互无关(ij,i,j=1,2,…,m);

(3)Y1X1,X2,…,Xm的一切满足原则(1)的线性组合中的方差最大;Y2是与Y1不相关的前提之下X1,X2,…,Xm所有线性组合中的方差最大;依此类推,Ym是与Y1,Y2,…,Ym-1都不相关的前提之下X1,X2,…,Xm的所有线性组合中的方差最大.

在学习目标阐述环节,教师要避免的误区是将“学习目标”设定为“教学目标”,应从学习者的角度对学习者应达到的目标进行行为或者认知方面的阐述。良好的学习内容分析结果为学习目标提供了坚实的基础,继而是在分析学习目标完成后,依据一定的学习目标分类理论,结合具体的教学实际确定哪些层次的学习目标需在课前通过观看视频自主学习完成,哪些则是必须通过课堂上的活动才能够实现的。

基于以上三条原则决定的综合变量Y1,Y2,…,Ym分别称为原始变量的第1、第2、…、第m个主成分.其中,各综合变量在总方差中占的比重依次递减,在实际研究工作中,通常只挑选前几个方差最大的主成分,从而达到简化系统结构,抓住问题实质的目的.

其次,是对能反映出租车资源供求关系的3项主要成分指标建立Panel data模型,进而得出所选取的8个城市的供求匹配程度.Panel data模型主要分固定效应模型、随机效应模型和混合回归模型三种情况.它是将时间序列数据和截面数据结合起来,具有横截面和时间序列两个维度.当这种类型的数据如果按两个维度进行排列时,则所有的数据都排在同一个平面上.与排在同一条线上的一维数据明显不同,整个表格就像是一个面板,因此称之为面板数据(Panel data).

Panel data模型可以从多个层面来分析经济问题.与截面数据或时间序列数据相比,面板数据能够更好地识别、控制和检验更复杂的模型.

运用主成分分析进行提取,得到解释的总方差如表3所示.

 

其中:i表示截面的维度,可以表示个人、家庭、城市和国家等研究对象;t表示时间序列的维度,是研究面板数据的时间段;Xit为解释变量,βK维列向量,为解释变量的个数,β是斜率,α是截距.

ui不加限制时,则var(Yi)可以任意增大,导致该问题没有任何研究意义.在进行线性变换约束之前还必须遵循以下3个原则.

其中

2 模型求解

支气管哮喘是一种以嗜酸性粒细胞及肥大细胞反应为主的气道变应性炎症,简称哮喘。近年来哮喘发病的严重程度及死亡率均有所升高。我国哮喘发病率接近1%,半数在12岁以下起病,成人男女发病率大致相同,约20%的病人有家族史[1-3]。现抽选我院收治的36例支气管哮喘患者为研究对象,探究支气管哮喘的临床护理干预效果。报告如下。

 

1 各指标相关数据

  

城市X1X2X3X4X5X6X7X8X9北京213301972.016664633.803.1211020.217205.04000.00.59深圳160021052.761269412.060.7914800.836636.37400.40.71广州16706625.332253736.041.3519500.027350.04500.20.64杭州9201455.431000321.961.0914411.029834.05453.00.59南京8820518.90894639.311.1812000.026000.06000.00.67成都7602451.491273328.201.449084.021094.55093.00.62济南5474484.6767515.841.4012000.019000.04000.00.61宁波5770227.60804315.501.397000.015000.04500.00.63

将表1数据经过标准化处理,再利用Excel进行主成分分析,得到下表2公因子方差.

 

2 数据的公因子方差

  

初始提取X31000920X11000898X91000741

Panel data回归模型的主要结构如下:

9月4日,由汽车后市场新技术峰会(CATS)组委会、广东省道路运输协会机动车维修检测分会、中国机械合作股份有限公司、笛威欧亚汽车技术有限公司、《汽车维修与保养》杂志社主办,中国汽车维修行业协会配件工作委员会与中国汽车维修行业协会连锁工作委员会联合主办,车盟链aa.vin、放心联合认证中心与CAASA软件联盟联合承办的维修连锁与供应链发展论坛暨中国汽车维修配件产业白皮书全国巡回研讨会第一站,作为广州汽车零部件及后市场展览会(AAG)中国汽车后市场店面运营综合解决方案展的同期活动在广州成功举办。

 

3 主成分分析提取后的总方差

  

成分初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%13.65540.61540.6153.65540.61540.61522.59228.79669.4112.59228.79669.41131.16512.93982.3501.16515.93982.350

运用主成分分析进行提取,得到表4的成分矩阵.

三是落实“三条红线”,加强流域水资源管理与保护。一要落实水资源开发利用控制红线。基本完成太湖流域水量分配方案,完成东南诸河取水许可总量控制指标方案、长三角取水许可总量控制和水资源保障方案编制。开展太湖流域用水总量考核评估方案研究和太湖流域省界断面水量考核方案编制,开展流域水资源监控能力建设。

 

4 主成分分析提取后的成分矩阵

  

成分123X3613579398X193347159X9265224788

其中,公因子方差注明了该分析从每个原始变量里所提取的信息.通过分析结果可以看出,除了里程利用率信息损失影响较大外,主成分包含了各个原始变量至少90%的信息.总方差表显示出各主成分解释原始变量总方差的情况,Excel默认保留的主成分的特征根大于1,在该问题里保留3个主成分即可[7-9],这3个主成分包含了原来9个变量信息的85.35%,可见包含变量信息是比较高的.

不妨设打车需求量为X1;市中心人口(万)为X2;市中心出租车拥有量为X3;出租车万人拥有量为X4;亿元GDP出租车拥有量为X5;出租车单车净月营业额(元)为X6;出租车月营业额(元)为X7;驾驶员单班月营收(元)为X8;里程利用率为X9.通过查找和处理国家数据统计局网站和各个城市的数据[6],得到下表1.

令匹配指数作为衡量城市出租车资源分配程度的指标,并作为该模型的解释变量.将“打车需求量”确定为模型的其中一个解释变量,且作为经济因素引入该模型.将“市中心的出租车拥有量”作为模型的解释变量,是因为城市出租车资源与城市的出租车拥有量呈一定关系.将“里程利用率”作为模型的解释变量,因为里程利用率是出租车作为衡量供求状况的重要指标,该指标在一定程度的反映出车辆载客效率,假如里程利用率高,车辆行驶中载客比例随着高,空驶率降低,对于需要坐出租车的乘客来说,可供应的车辆数量较少,乘客等车的时间增大,说明供大于求;相反,如果比例降低,则车辆空驶率升高,说明供过于求.在对数据进行试探性分析时,所选取的三项指标与匹配指数都呈现出较为稳定的相关性.

  

图1 主成分的特征值趋势图 图2 回归标准化残差图

由于原始变量可以任意地进行上述线性变换,不同的线性变换得到的综合指标Y的统计特性也不相同.为了取得更为明显的效果,令的方差尽可能大,并且各个Yi之间都是相互独立的.由于而对于任意给出的常数c,有

 

5 主成分指标表

  

城市X1X3X9匹配指数北京2133066546.000.5933210.78深圳1600112694.000.719763.69广州1670622537.000.6413964.40杭州920110003.000.596712.36南京76028946.000.675822.72成都882012733.000.627711.61济南54747675.000.614693.79宁波57708043.000.634928.45

由图1可知,第四个变量的特征值的变化趋势开始趋于平稳,所以选取前三个主成分是比较合适的.通过这种方法所确定的主成分的个数与贡献率确定的主成分个数一般都是相等的.在实际问题里,有的人习惯于保留特征值大于1的主成分.在一般情况下,当m=3时,所选取的主成分信息总量的比重达到85%以上.

在深山埋苗,在大自然中种植人参;将肉鸡散养,它们饿了吃草、馋了吃虫……如今,越来越多的从业者正在考虑着“自然养殖”“有机种植”,在实践中寻找着蔬果返璞归真的本来味道。

 

6 主成分基本统计量表

  

变量名最小值最大值标准差均值X15332.721330.835841.5610693.57X376756664618934.8517624.67X90.590.710.040.63

将选取的8个城市的上下班高峰期的出租车相关数据作为研究对象,通过数据建立下列模型:

Yit=β1nceit+β2posit+β3milit+μit,

其中:Yit表示出租车的供给匹配指数,nceit表示打车需求量,posit表示市中心出租车拥有量,milit表示里程利用率.使用Excel软件将主成分指标进行回归分析之后可以得到图2.

图2是根据变量的积累概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地检测样本数据是否符合某一概率分布.如果被检测的数据符合所指定的分布,则代表样本数据的点对应当基本在代表理论分布的对角线上.

 

7 模型方程的系数

  

模型非标准化系数标准系数B标准误差试用版tSig(常量)0.0190.01900.971376X10.28800.185716077.676251X30.40600.8453341250.041430X90.1010.02603.9430.051

表7列出了模型方程的系数,分别为β1=0.288,β2=0.406,β3=0.101,模型方程的误差系数为μit=0.019.进而得到下列模型方程:

Yit=0.288nceit+0.406posit+0.101milit+0.019.

另外,从以上分析结果可以看出,打车需求量、市中心出租车拥有量两个解释变量对城市出租车的有效需求都有显著的影响.其中市中心出租车拥有量对城市出租车有效需求的影响最大,与城市出租车资源有效需求呈正相关关系;由此可以推断,经济发达、市中心出租车拥有量大的省份对城市出租车资源有效需求较大;反之则较小.

将打车需求量、市中心出租车拥有量和里程利用率变量决定的城市出租车资源需求水平等同于匹配指数的拟合值,同时将匹配指数的实际值等同于是城市出租车资源供给水平;因此,匹配指数的拟合值与实际值的残差可以作为城市出租车资源供求匹配与否的衡量指标.因为实验存在一定的遗漏变量和抽样误差,所以在一定的误差范围内,不能将残差项都归因为与供给与需求的不匹配.由于没有直接将实际值与方程拟合值的差视为偏好不匹配的程度,所以通过设定特定的临界值,在构建供求匹配指数的同时也构建“多值”离散型匹配指数.定义残差的标准差作为临界值,并定义如下表:

 

8 供求匹配指数定义

  

条件赋值供需匹配程度|ln(Yit)-ln(Yit)∗|02供过于求

通过表8所述的定义,对所选取的8个城市进行供求匹配值计算,得到供求匹配度表,具体如表9所示.

 

9 供求匹配度表

  

城市匹配指数拟合预测值供求匹配值供求匹配度北京33210.7833201.633982供过于求深圳9763.699762.4247590供求平衡广州13964.4013967.698981供不应求南京7711.617710.0552672供过于求杭州6712.366711.2302650供求平衡宁波5822.725821.6859540供求平衡成都7629.797632.5656991供不应求济南4928.454927.4731030供求平衡

根据表9可看出所选取的8个城市出租车资源的供求匹配程度.大部分的城市出租车供求匹配程度基本供求平衡,处于供求匹配程度供不应求状态的城市有:广州、成都;处于供求匹配程度供过于求状态的省份有:北京和南京.

这样说,有人或许不理解:你不曾受过查处,站着说话不腰疼。其实,几年前有人就说过与吴德华类似的话。吉林省松原市国土资源局原局长陈建设,利用职务之便在土地出让、工程发包、安排工作等方面为他人谋取利益,收受贿赂1305.08万元,被法院以受贿罪判处无期徒刑,剥夺政治权利终身。案发后,他曾对检察机关说了这样一段话:“我特别感谢检察院,你们再晚来一段时间,我恐怕连性命都要丢了。”乍听起来,匪夷所思。冷静想想,不无道理。试想,短短三年时间,陈局长就收受1300余万元,假如不及时查处,任其继续在市国土资源局原局长的岗位上多干几年,则腐败的数额,可能要翻几番。那样,等待他的,怕就不是无期徒刑,而是死刑了。

随着大数据体量的爆炸式增长,数据中心规模的日渐扩大,高能耗制约大数据发展的问题已日益加重。针对降低能耗、提高数据中心可靠性问题,常见措施包括:冗余配置、云计算技术和分布式计算技术。在存储时,首先要对数据进行分类,然后进行数据过滤和去重操作,来减少数据体量,同时建立多级索引以方便日后的查询操作。

3 总结

本文运用主成分分析法及使用Excel从选取的9项指标中提取到3项主要成分指标,分别为打车需求量、市中心出租车拥有量、里程利用率,并通过加权系数算法得到出租车资源分配的偏好匹配指数,最后建立Panel data模型得出8个城市中供求匹配程度均衡的有深圳、杭州、宁波、济南4个城市;供大于求的城市有北京、南京;供不应求的城市有广州和成都.

计算法获得烃露点通过现场获取实际天然气样品,然后采用气相色谱法分析天然气的组成,再由天然气组成数据通过软件计算天然气的烃露点。由于天然气是一种组分十分复杂的混合物,影响计算法获得烃露点结果的因素较多,其主要影响因素包括样品的代表性、组成分析结果的准确性以及计算模型的选择等。

提高系统暂态稳定性的柔性直流受端电网故障穿越策略整定//于钊,李兆伟,张怡,谭真,贺静波,崔晓丹,等//(22):78

参考文献:

[1]聂笃宪,林健英,林奕敏,等.“互联网+”时代的出租车资源配置建模与分析[J].东莞理工学院学报,2016,23(1):24-31.

[2]张洋,赵思雨,王旭,等.出租车营运利润分配最优模型研究[J].中国传媒大学学报(自然科学版),2016,23(4):48-54.

[3]吴苗苗.出租车资源供求匹配的综合评价[J].河北北方学院学报(自然科学版),2016,32(5):42-49.

[4]沈琼,苏丹.滴滴打车对出租车行业冲击的实证分析[J].河南工业大学学报(社会科学版),2017,13(2): 26-30.

[5]李伟丽,杨鹏辉,孙漩,等.互联网+时代下出租车资源配置研究[J].海南师范大学学报(自然科学版),2015,28(4):367-371.

[6]杨泽民,石怡.基于数学建模的城市出租车供需分配方案设计[J].山西大同大学学报(自然科学版),2016,32(3):1-4.

[7]费威,马跃,李泊宁,等.我国城市出租车资源供求匹配程度研究[J].河北科技大学学报(社会科学版), 2016,16(1):1-7.

[8]李志亮,罗芳.基于初始值优化的灰色马尔科夫链预测模型研究[J].海南热带海洋学院学报,2016, 23(5):55-59.

[9]田瑾,黄锐露,吕跃进.一种带分布参数的区间粗糙数多属性决策方法[J].海南热带海洋学院学报,2017,24(5):56-62.

 
李富荣,高卓
《海南热带海洋学院学报》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号