更全的杂志信息网

样本量为2的极小样本相容性检验方法

更新时间:2009-03-28

在评估机电产品疲劳寿命及可靠性过程中,根据抽样理论,疲劳试验样本量越大越能体现疲劳寿命的分布特征,疲劳寿命评估的准确度越高[1-2]。然而在航空航天领域,许多高新且昂贵的机电系统疲劳寿命试验样本量通常极少(m=1或2),仅用试验数据对疲劳寿命进行评估结果可信度非常低。

作为世界文学史上的一代文豪,海明威及其“冰山原则”所创造的价值和产生的影响都是不可估量的。而集中表现出他的“冰山原则”创作的《老人与海》更是世界文学宝库中的瑰宝。正如诺贝尔文学奖的评语所说:“《老人与海》是一部异常有力、无比简洁的作品,具有一种无可抗拒的美。”

最后,就是转化了。转化是指用户在浏览企业的相关网页后,可能存在注册企业网站会员、下载企业经营软件、收藏或关注企业网页等行为中。就电子商务企业而言,有效的转化主要是用户注册成为会员,或者直接下单购买。为了获得这个有效的转化数据,可以通过设置一个特点的页面来进行统计,例如,在用户完成购买行为后,弹出“谢谢您的光临”之类的页面,只要消费完成一次,就弹出一次页面,系统对于这一页面的弹出次数进行统计,就可以实现对于有效转化数据的获取了。

当样本量大于10个时国内外多采用Bayes和Bootstrap等方法进行参数和分布评估[3-8]。而当样本量极少时(m=1或2)可以利用现场试验数据对先验信息数据进行相容性检验将样本扩充到小样本(n≥10)后再进行处理[9-10]。航空航天产品试验前往往能够搜集到包括数字仿真、生物仿真、非全程试验结果、同系列产品试验结果等数据,利用灰色关联度理论等方法进行多源信息融合后方可作为先验信息数据使用[11]。常见的相容性检验方法如Wilcoxon秩和检验和K-S(Kolmogorov-Smirnov)检验多适用于现场试验数据为小样本的情况[12-19]。当现场试验数据为极小样本时,若按照小样本检验过程将先验信息数据和现场试验数据混合在一起检验,由于先验数据大量信息容易湮没现场试验信息,往往检验结果是接受假设,体现不了差异。因此使用传统小样本相容性检验方法处理极小样本问题并不妥当。文献[20-21]针对总体服从正态分布的情形分别提出一种适用于样本量为2的变尺度相容性检验方法;文献[22]提出现场试验数据样本量或先验信息数据样本量为l的条件下非参数检验方法,并对其原理和步骤进行了阐述。

8例患者术中全肝去除胆囊、肝门结构和附属韧带后进行称重及等渗液置换,从而测得病肝实际体积。测量两次取平均值。

综合上述文献的研究内容,小样本相容性检验方法并不适用于极小样本情况,而极小样本相容性检验方法研究较少,且大多数文献只是直接采用某种方法进行检验,缺乏对方法合理性的详细说明和对不同方法检验功效优劣的比较。航空航天产品疲劳寿命多服从正态分布,因此本文以正态分布作为研究对象,结合Monte Carlo方法,利用两个现场试验数据样本对先验信息数据逐个进行检验,提出一种适用于现场试验数据样本量为2的相容性检验方法。并就Monte Carlo仿真次数对检验功效的影响、先验信息数据样本量对检验功效的影响以及两个现场试验数据分布对检验功效的影响与两种文献方法进行了详细对比和研究分析。对于样本服从威布尔分布等其他情况,也可以参考本文思路进行研究,由于篇幅所限,在此不再展开。

1 两种经典的极小样本相容性检验方法

糖尿病与TG、总胆固醇(TC)、低密度脂蛋白胆固醇(LDL-C)等血脂指标水平的升高密切相关,而二甲双胍可有效降低上述血脂指标水平,并增加低密度脂蛋白(LDL)、极低密度脂蛋白胆固醇(VLDL-C)和游离脂肪酸水平,有助于纠正机体脂代谢紊乱,减少动脉壁的脂质沉积,抑制斑块形成,保护血管完整性,从而延缓AS的进展[1]。

 

(1)

 

(2)

步骤5 以(μi-2σi,μi+2σi)为范围筛选剩余的先验信息数据。

文献[22]是一种非参数检验方法,以两个现场试验样本和一个先验信息数据为例进行说明。将两个现场试验样本x1x2和一个先验信息数据x3混合排序得到次序统计量x(1)x(2)x(3),其中x3在次序统计量中的位置为j,则在3个数据相容的情况下x(j)的分布函数为

 

(3)

式中:F(x)为总体分布函数,当现场试验数据样本量较少时可利用自助法进行估计得到,具体方法和步骤见文献[22]。给定显著度水平α,计算满足以下条件的边界值L1L2

P{xj<L1}=Fj(L1)=α/2

步骤3 以(μi-σi,μi+σi)为范围筛选剩余的先验信息数据(第一次筛选时剩余的先验信息数据即为所有先验信息数据)。

(4)

P{xj>L2}=1-Fj(L2)=α/2

(5)

L1<xj<L2时则以1-α的概率认为现场试验数据x1x2和先验信息数据x3相容。

2 基于3σ原则极小样本相容性检验方法

假设某个总体服从正态分布N(μ,σ2),根据3σ原则可知样本值分布在±σ范围内的概率为68.26%;分布在±2σ范围内的概率为95.44%;分布在±3σ范围内的概率为99.74%;图1为3σ范围示意图。

 
 

图1 3σ示意图Fig.1 Schematic diagram of 3σ

2.1 检验原理

步骤6 判断本次筛选出来的先验信息数据是否为空,如果不为空令i=i+1并返回步骤2;若为空则进入步骤7。

对两个样本x1x2重复抽样104次,计算P1P2P3的均值,发现正态分布的±σ1范围内的数据落在总体正态分布N(μ,σ2)的±3σ范围内的平均概率为99.80%。图2为正态分布的±σ1范围在总体正态分布N(μ,σ2)中位置示意图。

正态分布的±2σ1范围内的数据落在总体正态分布N(μ,σ2)的±3σ范围内的平均概率为98.13%。图3为正态分布的±2σ1范围在总体正态分布N(μ,σ2)中位置示意图。

的±3σ1范围内的数据落在总体正态分布N(μ,σ2)的±3σ范围内的平均概率为97.37%。图4为正态分布的±3σ1范围在总体正态分布N(μ,σ2)中位置示意图。

1.2.2 提出护理问题 胸椎骨折手术风险大,术后并发症多,会不同程度降低患者生活质量。循证护理小组通过与患者及家属深入交流,了解患者需求,结合护理经验和患者病情,提出亟需解决的术后护理问题,主要包括:胸椎骨折术后容易发生哪些并发症?如何有效预防和减少术后并发症的发生,改善患者预后?

从而可以得到以下推论:

观察并比较两组患者的左室舒张末内经(LVEDD)、左室收缩末内径(LVESD)、左室射血分数(LVEF)、血清BNP,运动耐量参考6 min步行试验结果(6MWT)。

1)若先验信息数据x3落在x1x2构成的正态分布的±σ1范围内,那么x3有99.80%的概率落在总体分布N(μ,σ2)的±3σ范围内。

在认知水平分布上,7套试卷对“掌握”这一较高水平的考查要高于考纲中对该认知水平的要求,对考生的认知要求不低于考试大纲,充分体现了教师国考作为“选拔性考试”的任务与使命,证实教师国考的难度与权威性.

2)若先验信息数据x3落在x1x2构成的正态分布的±2σ1范围内,那么x3有98.13%的概率落在总体分布N(μ,σ2)的±3σ范围内。

军民融合发展战略虽然已经在很多军工企业中得到实行,但在很多企业领导的经营管理理念中,“重军轻民”的思想仍然根深蒂固,仅仅是将军民融合作为短期内解决企业生存发展问题的一种手段,而没有对军民融合发展的具体实现走出长期规划,也不愿投入过多的民用资源,有些军工企业甚至在军品任务较多、效益较好时完全忽视了军民融合发展策略。在这样的情况下,军工企业实际上并未实现真正的军民融合,甚至还出现了军用产品与民用产品自成体系、完全割裂的问题。

 
 

的±σ1范围在N(μ,σ2)中位置示意图Fig.2 Schematic diagram of ±σ1 range of shown in N(μ,σ2)

 
 

的±2σ1范围在N(μ,σ2)中位置示意图Fig.3 Schematic diagram of ±2σ1 range of shown in N(μ,σ2)

 
 

的±3σ1范围在N(μ,σ2)中位置示意图Fig.4 Schematic diagram of ±3σ1 range of shown in N(μ,σ2)

3)若先验信息数据x3落在x1x2构成的正态分布的±3σ1范围内,那么x3有97.37%的概率落在总体分布N(μ,σ2)的±3σ范围内。

2.2 检验步骤

步骤8 判断本次筛选出来的先验信息数据是否为空,如果不为空令i=i+1并返回步骤2;若为空则进入步骤9。

步骤1 初始化筛选次数i=1。

步骤2 利用x1x2和全部筛选出来的先验信息数据(第一次为空),计算均值μi和标准差σi后构建正态分布

Marine Life-Saving Training System Based on Virtual Reality Technology

步骤4 判断本次筛选出来的先验信息数据是否为空,如果不为空令i=i+1并返回步骤2;若为空则进入步骤5。

从对个案教师两个课题的分析,以及对每个课题两次教学的课堂观察、访谈后发现,他已经关注到本地区特殊的教育环境,认识到本地区学生的特殊性;他的数学知识较为扎实;在教学中,他都有意识地引导学生理解数学,且积极探索具有地方特色的数学教学资源,并形成了一些有效的课堂教学规范.他的课堂教学实践及课后反思也都在一定程度上促进了其PCK的发展,但在以下方面仍存在一些问题.

给定显著度水平α,当S>α时则以1-α的概率认为现场试验数据和先验分布数据相容。

用MATLAB软件从总体正态分布N(μ,σ2)中随机抽取两个样本x1x2,计算均值μ1和标准差σ1后构建新的正态分布从正态分布中随机抽样105次,统计其中落在±σ1范围内次数为m1,同时落在±3σ范围内次数为n1,则落在±σ1范围内的样本同时落在±3σ范围内的概率为P1=n1/m1;统计其中落在±2σ1范围内次数为m2,同时落在±3σ范围内次数为n2,则落在±2σ1范围内的样本同时落在±3σ范围内的概率为P2=n2/m2;统计其中落在±3σ1范围内次数为m3,同时落在±3σ范围内次数为n3,则落在±3σ1范围内的样本同时落在±3σ范围内的概率为P3=n3/m3

步骤7 以(μi-3σi,μi+3σi)为范围筛选剩余的先验信息数据。

文献[20]是一种变尺度的检验方法,以两个现场试验数据样本和一个先验信息数据为例进行说明。将两个现场试验样本x1x2和一个先验信息数据x3混合排序得到次序统计量x(1)x(2)x(3),构造统计量

在上述推论基础上,提出一种具备“自主优化”能力的相容性检验策略,检验流程图如图5所示:

步骤9 显示全部被筛选出的先验信息数据,程序结束。

以某个检验过程为例说明正态分布函数在历次迭代后的变化,如图6所示。

 
 

图5 相容性检验策略示意图Fig.5 Schematic diagram of strategy for compatibility test

 
 

图6 筛选函数自主优化示意图Fig.6 Schematic diagram of independent optimization of filter function

由图6可以看出,随着筛选次数的增加和筛选范围的不断扩大(步骤1~步骤5),每次迭代更新后正态分布函数曲线不断逼近总体正态分布曲线,呈现出良好的“自主优化”的能力。

3 基于3σ原则相容性检验方法性能研究

为验证本文提出的基于3σ原则的极小样本相容性检验方法(下文简称为3σ方法)的实际效果,将3σ方法与文献[19]提出的变尺度检验方法(下文简称为文献方法1)和文献[21]提出的非参数检验方法(下文简称为文献方法2)进行对比研究。从正态分布N(μ,σ2)中随机抽取两个数据x1x2作为现场试验数据,再从中随机抽取t1个数据作为先验信息数据中的“真值”,在正态分布N(μ,σ2)两侧3σ范围以外一定区间内随机抽取t2个数据作为先验信息数据中的“假值”,将t1t2混合后分别利用3σ方法和两种文献方法对t1+t2个先验信息数据进行相容性检验(设定两种文献方法的显著度水平α=0.1)。定义变量“误差率R”作为评价指标,其中R等于弃真概率和采伪概率之和。

3.1 Monte Carlo仿真次数对检验效果的影响

以某飞行器寿命为例进行说明,已知该飞行器寿命服从正态分布N(17 000,2 0002),从中随机抽取两个样本x1x2作为现场试验数据,随机抽取t1=20个样本作为先验信息数据中“真值”,在N(17 000,2 0002)3σ范围外两个区间[9 000,11 000]和[23 000,25 000]按照均匀分布随机抽取t2=4个样本作为先验信息数据“假值”,因此先验信息数据总数n=t1+t2=24,其中假值所占比例为16.7%。利用Monte Carlo方法对x1x2进行Nr次重复抽样,分别计算不同仿真次数下上述3种方法的误差率R,结果如图7所示。

当仿真次数少于400次时3种方法的误差率波动较大,而当仿真次数超过400次后误差率逐渐趋于稳定,在上述设定的初始条件下3σ方法误差率最终稳定在14.02%,文献方法1为20.40%,文献方法2为41.76%。因此利用Monte Carlo方法仿真时仿真次数不应低于400次。

 
 

图7 仿真次数与误差率关系示意图Fig.7 Schematic diagram of relationship between simulation times and error rate

3.2 先验信息数据样本量对检验效果的影响

在3.1节基础上,研究先验信息数据样本量对误差率的影响。为了保证精度,给定仿真次数为1 000次。先验信息数据样本量n由10逐次递增到100,保持其中“假值”所占比例16.7%不变,分别计算不同先验信息数据样本量下3种检验方法的误差率R,结果如图8所示。

如图8所示,随着先验信息数据样本量的不断增加,文献方法1误差率在25%上下浮动,基本保持稳定;文献方法2误差率在40%上下浮动,也基本保持稳定;而3σ方法呈现出误差率随先验信息数据样本量增加而不断下降的趋势,原因在于3σ方法利用相对保守的策略分批次甄别“真值”的同时利用已经确认的“真值”不断修正自身分布函数,使其不断向总体分布函数逼近。由此说明3σ方法具备良好的“自主优化”的能力。

《乡愁》共88个字,全诗以“乡愁”为题,应用了“乡愁是X”这一固定句式并分成字数相等的4个小节对乡愁进行了阐释,如原文所示:

 
 

图8 先验信息数据样本量与误差率关系示意图Fig.8 Schematic diagram of relationship between prior information data sample size and error rate

3.3 现场试验数据分布对检验效果的影响

由于现场试验数据样本量只有两个,因此样本的分布对检验效果有较大影响。为了方便描述,将正态分布区域以±σ、±2σ、±3σ为边界划分成6个区域,如图9所示。

将两个样本中的任意一个抽样范围固定在1~6区间的某个区间内,另一个样本抽样范围根据上述正态分布区间划分依次取5、3、1、2、4、6,分别计算每两个区间组合下3种检验方法的平均误差率,仿真次数定为1 000次。(x,y)代表第一个样本抽样区间为x区间,第二个样本抽样区间为y区间。仿真结果如图10所示。

从仿真结果可以看出,由于正态分布中1区间和2区间左右对称,因此x=1和x=2情况下误差率R变化图也呈现左右对称的趋势。同理3、4区间和5、6区间也是如此。当两个样本抽样范围位于同一个区间,即x=y时,3种检验方法的误差率R都达到峰值。具体而言,对于3σ方法,当x=y时误差率R达到最大,且最大值两侧随着两个样本抽样区间距离的不断增加,误差率R快速下降并随后呈现相对稳定的趋势;文献方法一误差率R峰值比3σ方法略低,且随样本抽样区间变化波动更小,但是总体上高于3σ方法误差率R;文献方法3当两个样本位于同一个区间时误差率R高达80%,并且误差率R随样本抽样区间变化呈现出较大的波动性。

 
 

图9 正态分布区域划分示意图Fig.9 Schematic diagram of division of normal distribution areas

 
 
 

图10 现场试验数据分布与误差率的关系图Fig.10 Schematic diagram of relationship between experimental data distribution and error rate

4 结 论

1) 当现场试验数据样本量等于2时,仅根据试验结果很难作出有实际意义的寿命评估。在已知寿命服从正态分布情况下,利用本文提出的基于3σ原则的极小样本相容性检验方法可以有效地对先验信息数据进行检验筛选,对样本进行扩充。若样本服从威布尔等其他分布也可以参考本文思路进行研究。

2) 基于3σ原则的极小样本相容性检验方法与两种文献方法相比误差率R总体上更低,检验性能良好。

(2)外加剂:选用SF-2型高效泵送减水剂。在进行试配前,必须先检测其减水率、相容性、缓凝时间以及对强度的影响情况等,以便有效地降低水化热,调整水化热的峰值时间,防止裂缝发生,提高抗渗性。其性能指标应符合GB 8076—2008《混凝土外加剂》的要求。

3) 基于3σ原则的极小样本相容性检验方法检验误差率R随着先验信息数据的增加而不断下降,具备“自主优化”的特性,因此使用该方法时应该尽可能多地收集先验信息数据,当然前提是保证先验信息数据的准确性。

4) 当现场试验数据样本量为2时,两个样本所在区间以及样本之间的相对距离对检验误差率R都会产生一定的影响,因此可以考虑利用专家意见、先验信息等对试验样本分布进行合理估计,并针对不同分布组合采用不同的检验策略。

参 考 文 献

[1] 周兆麟. 数理统计学[M]. 北京: 中国统计出版社, 1987: 4.

ZHOU Z L. Mathematical statistics[M]. Beijing: National Bureau of Statistics of China, 1987: 4 (in Chinese).

[2] 施雨. 应用数理统计[M]. 西安: 西安交通大学出版社, 2006: 4.

SHI Y. Introduction of applied statistics[M]. Xi’an: Xi’an Jiaotong University Press, 2006: 4 (in Chinese).

[3] KIJEWSKI T, KAREEM A. Bayes estimation of a langevin mean direction[J]. Communications in Statistics-Simulation and Computation, 2017, 46(4): 2769-2783.

[4] FABRICE G, BERNARD D, EMMANUEL U. Reliability estimation by Bayesian methods: Definition of prior distribution from architecture of the system[J]. Reliability Engineering and System Safety, 2013, 82: 299-306.

[5] SHONOSUKE S. On bootstrap averaging empirical Bayes estimators[J]. Statistics, 2017, 55(2): 331-357.

[6] LPEZ J P, KRZYWINSKI M, ALTMAN N. Points of significance: Bayes’ theorem[J]. Nature Methods. 2015, 12(4): 277-278.

[7] LI H Y, ZUO H F, SU Y, et al. Study on segmented distribution for reliability evaluation[J]. Chinese Journal of Aeronautics, 2017, 30(1): 310-329.

[8] 罗强, 骆飞. 基于Bootstrap法的小样本岩土参数标准值计算[J]. 华中科技大学学报, 2017, 45(8): 93-98.

LUO Q, LUO F. Calculating formula for standard value of small-sample geotechnical parameters based on Boot-strap method[J]. Journal of Huazhong University of Science and Technology, 2017, 45(8): 93-98 (in Chinese).

[9] 郭荣化, 李勇. 小样本试验中验前数据与现场数据相容性检验方法研究[C]∥第十三届中国系统仿真技术及其应用学术会议论文集. 北京: 中国自动化学会系统仿真专业委员会, 2011: 1115-1121.

GUO R H, LI Y. Research on checkout methods for the compatibility test between the pre-test data and the local-test data in small sample test[C]∥Proceedings of 13th Chinese Conference on System Simulation Technology & Application (CCSSTA2011). Beijing: Chinese Association of Automation and System Simulation Committee, 2011: 1115-1121 (in Chinese).

[10] 蔡洪, 张士峰, 张金槐. Bayes试验分析与评估[M]. 长沙: 国防科技大学出版社, 2004: 73-74.

CAI H, ZHANG S F, ZHANG J H. Bayes test analysis and evaluation[M]. Changsha: NUDT Press, 2004: 73-74 (in Chinese).

[11] 陈涛. 小样本条件下风电齿轮传动系统动态可靠性预测方法[D]. 大连: 大连理工大学, 2012: 40-56.

CHEN T. Prediction methods of dynamic reliability for wind gear transmission under the conditions of small samples[D]. Dalian: Dalian University of Technology, 2012: 40-56 (in Chinese).

[12] 刘冰月, 王景芹. 低压成套开关设备的先验信息相容性检验技术[J]. 东北电力大学报, 2013, 33(1-2): 14-19.

LIU B Y, WANG J Q. Compatibility check of the prior information on low voltage switchgear[J]. Journal of Northeast China Institute of Electric Power Engineering, 2013, 33(1-2): 14-19 (in Chinese).

[13] 王江元. 验前试验数据与现场试验数据相容性检验方法[J]. 战术导弹技术, 2004(2): 10-12.

WANG J Y. Checkout methods for compatibility of pre-test data and locale test data[J]. Tactical Missile Technology, 2004(2): 10-12 (in Chinese).

[14] KESELMAN H J, OTHMAN A R, WILCOX R R. The new and improved two-sample test[J]. Psychological Science, 2004, 15: 47-51.

[15] 李鹏波, 张士峰, 蔡洪. 导弹仿真试验结果静态一致性检验及其置信度[J]. 现代防御技术, 1999, 27(6): 31-36.

LI P B, ZHANG S F, CAI H. Checkout methods for compatibility of pre-test data and locale test data[J]. Modern Defence Technology, 1999, 27(6): 31-36 (in Chinese).

[16] 张金槐. 多源信息的 Bayes 融合精度鉴定方法[J]. 国防科技大学学报, 2001, 23(3): 93-97.

ZHANG J H. Bayes fusion precision identification method for multi-source information[J]. Journal of National University of Defense Technology, 2001, 23(3): 93-97 (in Chinese).

[17] MOSER B K, STEVENS G R, WATTS C L. The two-sample test versus Satterwaite’s approximate F test[J]. Communications in Statistics Theory and Methods, 1989, 18(11): 3963-3975.

[18] NEUHAUSER M. Two-sample tests when variances are unequal[J]. Animal Behaviour, 2002, 63(4): 823-825.

[19] KASUYA E. Mann-Whitney U-test when variances are unequal[J]. Animal Behaviour, 2001, 61: 1247-1249.

[20] 唐雪梅. 小样本场合下相容性检验方法[J]. 系统工程与电子技术, 2001, 23(10): 66-68.

TANG X M. Consistency test methods in small sample situation[J]. Systems Engineering and Electronics, 2001, 23(10): 66-68 (in Chinese).

[21] 王晖, 潘高田, 臧兴震. 正态分布的小样本数据的相容性检验理论和方法[J]. 数学的实践与认识, 2005, 35(10): 131-137.

WANG H, PAN G T, ZANG X Z. Theories and methods of compatibility test on normal distribution with few samples[J]. Mathematics in Practice and Theory, 2005, 35(10): 131-137 (in Chinese).

[22] 张湘平, 张金槐. 验前信息与现场字样的相容性检验方法研究[J]. 飞行器测控学报, 2002, 21(1): 55-59

ZHANG X P, ZHANG J H. Study on consistency test methods of pretest information and field subsamples[J]. Journal of Spacecraft TT&C Technology, 2002, 21(1): 55-59 (in Chinese).

 
徐颖强,陈仙亮,曹栋波
《航空学报》 2018年第05期
《航空学报》2018年第05期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号