更全的杂志信息网

多元线性回归模型异方差检验研究

更新时间:2009-03-28

0 引言

在经典线性回归模型中,最常用的方法是普通最小二乘法,而要想用普通最小二乘法对数据进行回归拟合,该线性模型必须满足六个基本假设条件[1-2]。如果线性模型满足这几个基本假设条件,在现实的应用中,由于考虑的问题错综复杂,因而在建立线性回归模型时异方差现象会经常出现。在忽略异方差的情况下,对回归模型进行最小二乘参数估计就会产生严重的后果:如对变量的显著性检验会失去意义;估计与预测的精度降低,或者预测模型失效等。因此,异方差的检验至关重要,研究异方差性的检验也是非常重要的理论与实践问题。传统的检验方法有很多,如图示检验法、Goldfeld-Quandt检验、Glejser检验、斯皮尔曼等级相关系数检验等。在近几年的发展中,冯珍珍[3]对这几种传统的检验方法做了比较分析,龚秀芳[4]、郑红艳[5]对 Goldfeld-Quandt检验法做了推广。尽管这些方法都能对回归模型的异方差进行检验,但是只有Glejser检验法能探测异方差性的具体表现形式,这样能为后面的异方差消除做准备。然而,对于含多个解释变量的模型,用戈里瑟法检验,需要多次重复检验步骤。本文基于Glejser检验法的思想,引用样本主成分的方法,在Glejser检验法上做适当的改进,使得整个检验过程简便化。

1 理论基础

1.1 异方差性的定义

设线性回归模型[6]为:

认知功能损害及睡眠障碍是抑郁症常伴发的症状[5-6],目前主要应用MCCB测量认知功能,儿童青少年抑郁症患者认知功能评分较低,且低于健康儿童的认知功能评分,表明儿童青少年抑郁症患者确实存在认知功能障碍[7]。在童年时期经历了各种负面事情造成的心理或生理创伤被称之为童年创伤,有研究表明,抑郁症的发病与患者在童年受到的创伤有相关性。本研究中观察组成长经历量表评分显著高于健康儿童青少年的量表评分[8]。通过分析可得,儿童青少年在童年的创伤经历与其的认知功能存在负相关性,即儿童青少年的童年经历水平越低,则其认知功能越好,也可说明儿童青少年在童年受到的创伤会导致其认知功能状态变差。

 

经典回归模型中的同方差性的假定要求对所有的i(i=1,2,…,n)都有Var(ui)=δ2,即要求在各个观测点处ui离开均值E(ui)=0的分散程度是相同的。如果模型违背了同方差性假定,随机误差项ui的方差在不同观测点处不再为同一常数,即:

Var(ui)=(i=1,2,…,n),则称ui(或模型)存在异方差性。

1.2 戈里瑟检验

事实上,这种想法是可以实施的。首先,可以用样本主成分对所有的解释变量进行分析,然后提取第一主成分,由第一主成分生成一个新的变量,这个新的变量就会尽可能地包含所有解释变量的信息。其次,用残差序列对这个新变量建立试验模型等价于戈里瑟检验中用残差序列对每个解释变量建立试验模型,因为我们建立试验模型的目的是为了观察残差序列是否与解释变量存在相关关系,由于这个新变量包含了解释变量的大部分信息,如果残差序列与解释变量有相关关系,那么与新变量同样有相关关系。因此,对多元线性回归模型的异方差检验实际上就转化为对一元线性回归模型的异方差检验。

g=x=l11x1+l12x2+…+l1kxk,将n组解释变量的值代入第一主成分得到相应的gi(i=1,2,…,n)。

 

G-J检验步骤为:

取显著性水平α=0.05,查自由度为28的t分布表,得临界值t0.025(28)=2.0484,由上述3个试验模型知,回归系数估计量的t值大于临界值t0.025(28),所以得出试验回归模型的斜率系数显著不为零,即残差序列的绝对值|ei|与变量有相关关系,因此,我们建立的多元回归模型存在异方差。

(2)以|ei|为被解释变量,某一Xji为解释变量建立试验模型,并进行最小二乘回归。

首先,我们利用普通最小二乘法对数据进行多元回归,得到的模型为:

戈里瑟检验法不仅可以检验异方差性是否存在,而且通过检验过程中设定不同函数形式的试验模型,可以探测异方差的具体表现形式,这有助于进一步研究如何消除异方差性的影响。对于一元线性回归模型来说,由于该模型只含有一个解释变量,利用戈里瑟检验异方差会使得检验过程十分方便快捷。然而对于多元回归模型来说,由于模型含有多个解释变量,需要多次重复上述戈里瑟检验步骤,方能得出随机误差项ui是否存在异方差性的结论,这样就使得检验过程十分复杂和繁琐。下面对这种方法作进一步改进,使得改进的方法对多变量异方差的检验过程简单化。

2 多变量戈里瑟检验的改进

由上述的戈里瑟检验法可知,对多元的线性回归模型:

通过上面数据分析得出,当活塞环与缸套的温差超过90.9℃,存在拉缸、熔顶风险。当设备在大功率下爬坡及作业,极易导致活塞环与缸套的温差超过90.9℃,使活塞环两端口间隙消除,并被抵住而变形。首先造成拉缸,如继续工作则进一步恶化造成熔顶。

 

进行戈里瑟检验时,要用所得的残差序列依次对多个解释变量建立回归模型。大多数情况下,我们并不知道哪个解释变量与残差序列有相关关系,所以在进行残差序列建模时,通常是按照回归模型中解释变量的顺序依次检验,如果残差序列只与最后一个解释变量存在相关关系,那意味着整个检验中残差序列要对所有的解释变量进行建模,这样就会使得工作量大,计算麻烦。然而,如果有人在检验过程中为了减轻工作量,不想对每个解释变量进行检验,而又想判定多元回归模型的随机误差项ui是否存在异方差性,这又该怎么解决呢?

我们考虑最好能找一个新的变量,它可以尽可能多地反映回归模型中每个解释变量的信息,得到这个新变量后,直接用所得的残差序列对新变量建立试验模型,然后利用t检验法检验“试验模型”中斜率系数a1的显著性,如果a1显著不为零,则这个新变量与残差序列有相关关系,即可认为多元回归模型中的随机误差项ui存在异方差性。

戈里瑟(Glejser)检验法[7],简称G-J法,该方法是戈里瑟1969年提出的,其基本原理是通过建立残差序列对解释变量的(辅助)回归模型,判断随机误差项的方差与解释变量之间是否存在着较强的相关关系。其基本思想是由普通最小二乘法得到残差ei后,再取得ei的绝对值|ei|,将|ei|对某个解释变量Xji回归,根据回归模型的显著性和拟合优度来判断是否存在异方差性。通常假定的函数形式为:

x=(x1,x2,…,xk)'是一个k维的向量,它有n组观测值,组成n×k的样本矩阵ASA的协方差矩阵。由样本主成分的求法,求出S的所有特征值λ1,λ2,…,λk以及它们所对应的正交化特征向量l1,l2,…,lk,其中λ1λ2≥…≥λk

2)构件信息标准化的应用,解决了不同专业之间的沟通问题,建筑、室内、结构、城规等相关技术人员可以用同一个信息化模型进行工作,有利于专业人员相互讨论交流合作。

我们取第一主成分

 

(3)以gi为解释变量,||ei为被解释变量建立试验模型,并进行最小二乘回归。

(1)根据样本数据用最小二乘法建立回归模型,并计算残差ei=Yi-的绝对值|ei|。

(2)用样本主成分对回归模型中解释变量的观测值进行分析,取出第一主成分

2.农村资金大量外流,银行信贷资金投放不足。金融机构就本质而言是企业身份,企业金融机构的身份决定了其一定是为自身追逐利润。因此,为了获取更大的利润,企业金融机构将其大部分资金不是投放在农村,而是投放到城市,支持农村发展与金融机构可持续经营存在冲突。除中国工商银行、中国农业银行、中国银行、中国建设银行和邮政储蓄银行之外,农村合作银行、农村商业银行、村镇银行以及小额贷款公司在农村的信贷投入比例也非常低。由此可见,农村地区银行信贷资金投放不足,金融资源占比很低,支持农村发展的能力和效果明显偏低。

g的贡献率较大(譬如达到70%等),则说明g已经较多地反映了解释变量的信息。把n组观察值带入(1)得到相应的g1,g2,…,gn,这样我们就可以用残差序列对新变量g建立试验模型,进行多元回归模型的异方差检验。具体步骤如下:

(4)利用t检验法检验每个“试验模型”中斜率系数a1的显著性。如果某一个模型的a1显著不为零,则认为随机误差项ui存在异方差性,进而可以依据R2确定异方差的表现形式,否则,则认为ui具有同方差性。

本文采用MIDAS-GTSNX岩土有限元软件来模拟双排水盲沟的渗流计算。一般计算模型如图2所示。计算时,在模型两侧以及排水盲沟处设置给定水头边界;在模型底面、顶面,以及排水盲沟上的开挖面设置给定流量边界,流量为0,即为隔水边界。

按:“逊退”,退位。“逊退”,其它文献也有使用,如《太玄经》卷第一:“杨子云处前汉之末,值王莽用事,身絷乱世,逊退无由,是以朝隐,官爵不徙。”《汉语大词典》收有同义的“逊避”,“逊退”与“逊避”系同构同根词。“逊退”一词,《汉语大词典》未载。

3 应用举例

下面结合案例来说明改进后方法的可行性和有效性。本例的数据记录了某年我国31个省(区)的城镇居民人均全年实际收入(x1)以及每人全年的消费性支出(y),包括食品支出(x2)、娱乐教育文化服务支出(x3),单位为千元,如表1所示。本例数据来源于文献[4]。

In this paper,Imainly examine the peritexts of the illustration as the visual paratext in the foreword,the cover,the title,reviews and the afterword in the work respectively.

由文献[4]可知,用表1中的数据x1,x2,x3y建立的回归线性模型存在异方差,下面使用本文提出的方法,再次对数据进行检验。

(3)利用t检验法检验每个“试验模型”中斜率系数a1的显著性。如果某一个模型的a1显著不为零,则认为随机误差项ui存在异方差性,进而可以依据R2确定异方差的表现形式,否则,认为ui具有同方差性。

 

将解释变量的值带入上式(2),得到拟合值用实际值yi与拟合值作差得到回归模型的残差序列ei,计算残差序列的绝对值|ei(|见表 1)。

 

表1 31个地区城镇居民家庭全年人均经济数据

  

北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆9.24 7.67 5.39 4.36 4.80 4.92 4.50 4.62 10.99 6.59 8.48 5.10 6.91 4.75 5.84 4.55 5.23 5.86 9.21 5.65 5.38 5.92 5.51 4.95 6.23 6.96 4.68 4,50 4,73 4,51 5.36 2.9592 2.4598 1.4956 1.4063 1.3040 1.7308 1.5619 1.4101 3.7123 2.2076 2.6292 1.8448 2.7095 1.5638 1.6758 1.4277 1.7834 1.9422 3.0552 2.0339 2.0579 2.3033 1.9743 1.6738 2.1943 2.6466 1.4730 1.5256 1.6547 1.3755 1.6088 1.141820 0.735970 0.540580 0.414720 0.463090 0.445200 0.459620 0.376820 1.034980 0.585230 0.795870 0.513180 0.461670 0.393990 0.599430 0.337760 0.617740 0.697220 0.873060 0.621740 0.477170 0.730050 0.575100 0.445590 0.561910 0.371040 0.490900 0.449690 0.479530 0.424750 0.541300 8.30 5.08 4.11 3.41 3.56 3.95 3.53 3.48 8.66 5.25 6.21 3.99 5.49 3.80 4.20 3.50 4.34 4.80 8.28 4.52 4.01 5.43 4.21 3.97 4.97 5.03 3.90 3.60 3.90 3.55 4.79 0.378238 0.991202 0.023915 0.026191 0.046602 0.076861 0.106138 0.076573 0.173002 0.104366 0.422570 0.178546 0.192756 0.212397 0.356236 0.202492 0.080568 0.148378 0.922609 0.229035 0.317650 0.163628 0.341110 0.118690 0.028676 0.042931 0.175203 0.008496 0.070695 0.102442 0.597570 7.86276 6.41111 4.38338 3.64702 3.87724 4.18611 3.84362 3.78335 9.28408 5.53675 7.02593 4.39732 5.94981 3.95949 4.78900 3.73008 4.49741 5.00953 7.75122 4.89539 4.66786 5.27270 4.75141 4.17122 5.30123 5.89290 3.91894 3.81909 4.04770 3.72428 4.43143

 

其次,用样本主成分对回归模型中解释变量x1,x2,x3的值进行分析,求出第一主成分g为:

最后,用残差序列的绝对值|ei|对(h=±1,±2,±3,…)做回归试验模型,结果如下:

 

其中,样本协方差阵的特征根分别为2.7194、0.2468和0.0338,g的贡献率为90.7%,因此,新变量g包含了解释变量x1,x2,x3的大部分信息。此时将31组观察值依次代入式(3),得到g1,g2,…,g31(见表1)。

(1)根据样本数据用最小二乘法估计回归模型,并计算残差ei=Yi-的绝对值|ei|。

4 结语

异方差问题是经典回归模型中必须考虑的问题,我们在建立回归模型的过程中不仅要检验模型是否存在异方差性,还要采取措施对异方差性进行修正,因此,选择什么样的方法去检验异方差就显得十分重要。戈里瑟检验法的优点是既能检验异方差的存在,又能通过“实验”探测异方差的具体形式,而它的不足之处是检验过程比较复杂,需要多次重复拟合试验模型。本文在戈里瑟检验法的基础上进行改进,将样本主成分中的方法与其结合,既继承了它的优点,又改进了其不足。

[参考文献]

[1]田金方.数理统计与数据分析[M].北京:机械工业出版社,2011.

[2]何晓群,刘文卿.应用回归分析[M].北京:中国人民大学出版社,2011.

英是不识字的,偌大的医院,四通八达,就是没有生病也昏头转向,分不清东西南北。男人是有方向感的,虽然老了,但好歹识字,总比英强。每天,两个老人相互搀扶着走出病房,呼吸新鲜空气,晒一晒温暖的阳光。缓慢下楼上楼,一步步穿过人群,英都紧紧地拽着丈夫的手,她害怕一放开就再也抓不住了。她隐隐约约感受到从未有过的幸福感和存在感,她有时甚至怀疑眼前一切的真实性。

新课程改革提出了“以学生为发展”的教育理念,提倡让学生在课堂活动中发挥出自身主体地位与价值,有效的激发学生知识能动性,让整个教学活动得以有序的实施。在这种课程教育理念之下,初中数学课堂就提出了要对学生自主探究能力进行培养的教学理念,因为如果能够做好这一项工作就能让学生真正参与到自主探究活动之中,进而就能让学生各方能力得以发展和进步,基于这一培养目标,笔者也提出了如下建议:

[3]龚秀芳,冯珍珍.几种异方差检验方法的比较[J].菏泽师范专科学校学报,2003,(4):19-22.

[4]龚秀芳.戈德菲尔德-匡特检验的推广[J].数理统计与管理,2005,(1):98-100.

[5]郑红艳.一种多变量线性回归模型的异方差检验方法[J].统计与决策,2010,(5):152-154.

[6]靳庭两.计量经济学[M].成都:西南财经大学出版社,2011.

[7]孙敬水.计量经济学教程[M].北京:清华大学出版社,2005.

对于CS架构的业务系统,需要业务系统进行改造,通过JSP页面获取到登录信息后,可以实现从JSP页面启动CS客户端,并跟进获取到登录信息登录至CS系统中。

 
唐裔,冯长焕
《廊坊师范学院学报(自然科学版)》2018年第01期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号