更全的杂志信息网

异组距数列开口组组中值的回归模拟计算

更新时间:2009-03-28

1 组中值及其传统计算法

统计学对数据进行组距式分组时,每组的起点值称为下限,终点值称为上限。上限和下限之差为组距,组距各不相同的分组即为异组距数列。上限和下限统称为组限,对于连续型变量(如身高、价格等)通常采用重叠式组限,即分组中上一组的上限与下一组的下限完全相同,对应的区间为左闭右开区间。对于离散型变量(如学生数、企业数)则采用不重叠式组限,即分组中的上一组上限与下一组下限数字不同。

组中值可作为该组数据的代表值。对于具有上下限的正常组:

 

此外,组限的形式还有开口式,使用“××以上”或“××以下”来表示。传统的统计教材中对于开口式数据组的组中值按如下公式计算:

 

国内不少学者对上述公式提出了不同的意见,指出公式的不足之处并给出了相应的改进建议。对于以不重叠形式出现的组限,文[1]提出采用相邻两组下限之和的一半计算组中值;文[2]提出在(1)的右端减去0.5的计算方法。

档案行业标准《归档文件整理规则》(DA/T22-2015)(以下简称新规则)经全国档案工作标准化技术委员会审查通过,国家档案局批准2016年6月1日起正式实施。《归档文件整理规则》(DA/T22-2000)(以下简称旧规则)失效。实施新规则是顺应时代发展、应对档案工作新变化的重要举措,推动档案工作走向成熟、完善。比较分析新旧规则,新规则的整体结构、适用范围、体例内容、语言表述及具体操作方面均呈现新的变化。

 

表1 月工资收入表

  

月工资收入/元 组中值 频数500以下 350 32 500-800 650 28 800-1 000 900 45 1 000-1 500 1 250 108 1 500-2 000 1 750 156 2 000-3 000 2 500 145 3 000-4 000 3 500 71 4 000-6 000 5 000 39 6 000-8 000 7 000 12 8 000-11 000 9 500 8 11 000以上 12 500 2

同理,应选用线性模型,即

1.2 纳入与排除标准 纳入标准:①符合手术适应证;②于本院行麦默通微创旋切术;③患者及其家属自愿配合心理干预行为。排除标准:①合并精神障碍或有精神疾病史者;②近期发生重大生活事件者。③合并其他重大疾病者。

回归分析包括线性回归和非线性回归。为了提供充分的方案选择,考虑作线性、对数、三次、幂、指数的回归模拟[5]

基于主干网设计视角下的高速公路联网收费数据通信研究……………………………………………………… 范敬光(1-275)

2 回归模拟计算组中值

[2]韩建丽.离散型变量采用组距式分组时组中值的计算[J].广东技术师范学院学报(自然科学),2013(3):31-33.

鉴于公式(2)不能客观反映实际情况,文[3]提出开口组的组中值系数应采用相邻组的组中值系数,从而计算出开口组的组中值。本文采用一元回归模拟的方法确定开口组的组中值。

[1]罗汉鸿.谈谈组中值的计算[J].广东农工商职业技术学院学报,1995(1):38-41.

以表1首行的开口组上限x=500代入,可得y=406.28,此即该开口组的组中值。线性模拟的效果如图1所示。

从表2看出,5种模型的显著性指标均小于0.05,但由于样本较小且自由度有差异,所以还需加以选择。其中,线性模型的显著性指标最小,故应选用线性模型,即y=-26.72+0.866x。

再对表1的组中值y和该组下限x作回归模拟,得到的结果如表3所示。

公式(2)也存在缺陷。例如,当开口组上限小于邻组组距的一半时,计算出的组中值为负数,在特定的现实背景下组中值为负数不合理(如工资收入、职工人数等)。下面再举一例,表1中月工资收入的组中值按公式(1)和(2)算出。公式(2)相当于将开口组“500元以下”和“11 000元以上”的数组作为有上下限的相邻组来处理,默认“500元以下”是指“200-500”、“11 000 元以上”是指“11 000-14 000”,那么月工资在 0~200 元、14 000元以上的人不存在,这与事实不相符。

 

以表1末行的开口组下限x=11 000代入,可得y=13 035.75,此即该开口组的组中值。此线性模拟的效果如图2所示。

(2)节假日因素。节假日对于用户以及企业用电都有很大的差别,我们在处理时将其离散化,0表示工作日,1表示节假日。

 

表2 组中值与上限回归模拟的模型摘要

  

方程 R方 显著性 常量 b 1 b 2 b 3模型指标 参数估计值线性 0.9 9 9 3 3.0×1 0-12 -2 6.7 2 0.8 6 6对数 0.8 8 4 9 1.6×1 0-4 -2 1 2 6 5.5 2 3 1 1 2.0 0 4三次 0.9 9 9 3 2.3×1 0-8 4 7.0 9 0.8 0 5 1.0 6 5×1 0-5 -5.0 4×1 0-10幂0.9 9 8 8 2.0×1 0-11 0.8 1 1.0 0 6指数 0.8 8 8 4 1.4×1 0-4 8 9 0.2 6 0.0 0 0 2

  

图1 组中值与上限的线性回归模拟

  

图2 组中值与下限的线性回归模拟

 

表3 组中值与下限回归模拟的模型摘要

  

方程 R方 显著性 常量 b 1 b 2 b 3模型指标 参数估计值线性 0.9 9 8 7 2.6×1 0-11 4 4.7 5 1.1 8 1对数 0.8 8 2 2 1.7×1 0-4 -1 9 6 8 1.9 1 3 0 4 4.5 7 2三次 0.9 9 8 7 1.1×1 0-7 -6 9.0 7 1.3 1 8 3.5 4×1 0-5 2.4 7×1 0-9幂0.9 9 7 6 1.9×1 0-10 1.3 5 0.9 8 6指数 0.8 7 9 4 1.9×1 0-4 9 1 3.0 3 0.0 0 0 3 3 7

3 结 论

根据回归模拟获得的结果,对于只有上限的开口组“500元以下”,其组中值由表1的350变为406.28,更偏近上限500;对于只有下限的开口组“11 000元以上”,其组中值从表1的12 500变为13 035.75,更偏离下限11 000。这与实际情况比较吻合:在最低工资制度等优惠政策下,开口组“500元以下”的组中值(代表值)理应接近于上限500;当今,随着社会财富不断增长,工资收入有递增趋势,“11 000元以上”的组中值(代表值)应有更高的数值。这从一个侧面说明,利用SPSS软件进行回归模拟,采用适当模型确定开口组的组中值,理论上与实际上都是可行的选择。

参考文献

先对表1的组中值y和该组上限x作回归模拟,运行SPSS软件[6]得到的结果如表2所示。

考虑到组中值均与该组或邻组的上下限有关[4],所以将具有上下限的正常组组中值作为因变量y、其所在组的上限或下限作为自变量x,利用SPSS软件进行一元回归模拟y=f(x)。

护理服务流程设计的优劣关系到病人就诊、住院的舒适体验,与病人满意程度息息相关[12]。针对以往护理评估中存在的问题,找出关键的处理点,制订护理评估操作规程,指导临床工作,最终提升护理人员的服务意识,提高病人的满意度。两组护理后护理满意度详见表1。

[3]毛象鹏.对异距数理开口组中值计算方法的探讨[J].统计与决策,2005(8):135-135.

[4]杨耀芳.关于组中值和序式平均数计算方法的思考[J].长治学院学报,2006(5):68-69.

[5]加雷斯·詹姆斯.统计学习导论 基于R应用[M].北京:机械工业出版社,2015:184-207.

高端消费阶层不同于普通消费者的消费心理是促进这一经济市场发展的内部因素之一,针对特殊的消费人群,可以设定独特的、符合其审美理念的产品和服务。在高端定制下,民族体育旅游可以成为一种艺术熏陶,从而使高端定制式的民族体育旅游不仅是一种消费形式,更是一种艺术感染力。在高端定制式民族体育旅游过程,游客不仅收获身体上的健康,心理上的满足,还从中找到文化认同感,是民族体育未来发展的方向。当然,消费者的个性需求也是促进高端定制式民族体育旅游模式的发展内因之一。游客希望可以自由选择旅游产品的服务标准、线路和出行时间,这也是高端定制的基本要求。

[6]宇传华.SPSS与统计分析 [M].北京:电子工业出版社,2014:233-282.

 
葛亚平,宋佳莹
《南通职业大学学报》2018年第01期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号