更全的杂志信息网

FDR和定量差异分析方法在体育科研中的应用

更新时间:2009-03-28

0 引言

P统计方法目前面临着一定的挑战[1-3],特别是在医学和生物医学工程领域.P检验存在的不足:P值统计方法只能说明两组数据的分布差异,无法描述两组数据的平均值差异,也无法解释这个差异的生物医学意义.定量差异分析[4]则可以实现这一功能.

可是进行基因表达差异分析时,往往分析上万个基因,比如10 000个,就得进行10 000次假设检验,如果得到3 000次检验P<0.05,认为表达有差异.那按照5%的出错概率,就有150次的结果是假阳性,这个结果则是我们无法接受的.于是Bonferrnoi提出一种方法,如果多次比较,建议拿最初定的0.05界值去除以比较的次数.比如要比较3次,则调整alpha=0.05/3次=0.0167,医学上的临界值更多的为0.01,若临界值为0.01,则调整alpha=0.01/3次=0.003,即P<0.003才具有非常显著差异.意思是假设检验只有P<0.0167有统计学意义(本文比较2次,因此相对应的临界值分别为0.025和0.005).本文使用FDR和定量差异分析的方法对男女越野运动员无氧功率及其与身体成分再分析,探讨两种方法在体育科研中的应用价值.

1 研究对象与方法

1.1 研究对象

以广州体育学院越野队的运动员为研究对象[5],基本情况如表1所列.

“本”是指事字,由一个“木”字和一横组成。“木”指树木,一横是指事符号,在“木”的下方,表示树在地下的部分—根。因此“本”的本义是草木的根,引申为事物的根源,与“末”的意思相反。

从表1可知身高对应的q值为0.000,体重为0.002,均小于0.025,具有统计差异,与P值统计方法相一致; QD值分别对应的为0.130(小于0.27,与P值统计和q值评价不一致)和0.341(大于0.27)无差异和有显著差异.

 

表1 研究对象基本情况(x±s)

  

变量女越野运动员(n=21)男越野运动员(n=19)PqQD年龄/yrs22.58(1.38)22.57(1.51)0.9870.6220.000身高/cm163.33(2.64)173.86(4.60)**0.0000.0000.130体重/kg54.42(4.94)64.14(6.15)**0.0010.0020.341aBMI/kg·m-220.39(1.68)21.19(1.31)0.2960.3100.080训练年限/yrs1.51(0.32)1.43(0.41)0.7620.6000.113

注:**表示P<0.01.q值代表FDR分析结果,QD:定量差异分析结果.适用范围:0.22≤l<0.44,a表示达到显著定量级水平.

1.2 主要研究方法

对于年龄,l<0.22,0.22≤l<0.44,0.44≤l<1.00和l≥1.00分别表示完全没有定量差异、稍许定量差异、显著定量差异和极显著定量差异.对于关键非必需功能、器官和整体层次l<0.27,0.27≤l<0.47,0.47≤l<0.80与l≥0.80和分子细胞层次l<0.47,0.47≤l<0.80,0.80≤l<1.27与l≥1.27分别表示完全没有定量差异、稍许定量差异、显著定量差异和极显著定量差异[4].

从表2可知, q值法与P值方法具有较高的统一性,躯干肌肉、脂肪百分比、下肢肌肉、全身肌肉和脂肪百分比属于组织水平的比较,因此实用的QD范围为0.47≤l<0.80,只有躯干肌肉(QD:0.459<0.47)没有达到显著量级,与传统的P值统计有差异,其余均与P值统计一致.当q值法与定量差异分析比较的时候,在躯干肌肉这个指标上两者统计结果相反,在脂肪百分比参数上高度一致,其余参数基本一致,定量差异分析的QD值更为明确.

*{p>λ)=m0(1-λ)=mP0(1-λ).P0=*{p>λ}/m(1-λ).

(1)

(2)假设在无差异情况下p值服从均匀分布,则有F0(P)=p,采用经验估计F(P),则

其中“*”表示满足括号中条件的变量个数.选择λ(0<λ<1)需要在对P0的无偏估计和变异度之间取得平衡,对此可以使用boostrap抽样方法计算一个合理的取值.

F(P)=order(Pi)/m=i/m.

(2)

(3)实际上P0<1,若保守估计将P0=1代入Bayes公式,则得FDR=Pm/i.结果与前述BH基础方法等价,其算法实际上是在贝叶斯定义下的非参数保守估计.

(4)给出FDR的估计,称其为Q[8]

Q(Pi)=min(FDR(t)),

(3)

(2) 七星峰地质公园主峰上的“佛印”景观为平面上分布的联体冰臼,一个小的冰臼和相对大的冰臼相连,和秦皇岛祖山被韩同林教授认定为联体冰臼“神女卧”极其相似。

超声诊断卵巢性肿瘤,所反映的病理结构与病理学诊断基本相符,但仍存在漏诊、误诊的可能。超声声像图可反映病变组织界面特点、病变组织形态以及良恶性,还可以反映交界性间的交叉重叠状态[5]。对卵巢性肿瘤的病理性质进行判断的时候,可有机结合声像图特征、病理组织变化、彩超血流及间接征象,包括腹膜后是否存在淋巴结肿大以及大网膜、腹膜、腹水有无结节转移或者种植等,有利于提高超声诊断的符合率。

2.2.2 定量差异分析 对于任何两个数的绝对值xy,它们之间的相对差异可以用l来度量,称为l级定量差异:

水功能区 水功能区是指为满足水资源开发利用和节约保护的需求,根据水资源自然条件和开发利用现状,按照流域综合规划、水资源保护规划和经济社会发展要求,在相应水域按其主导功能划定范围并执行相应水环境质量标准的水域。

l=|logτ(x/y)|=|lg(x/y)/lgτ|.

1.2.1 q值法q-value法 FDR最早是benjamini,Y.1995等提出的[6],其是阳性检验检验结果中判断错误的比例,目前FDR估计方法已经有数十种,代表性的q-value法由Storev(2003)[7]提出,其基本思想是在最初的FDR控制过程基础上,估计了无差异变量占总变量个数的比例P0,以提高原有方法的检验效能.具体方法如下:

q来表示.

(4)北京水电勘察设计处利用砂土相对密实度对砂土液化的判别和实际有一定出入,只有地面最大加速度一个指标限制显然不能完全反映客观实际,通过日本新舄与阿拉斯加瓦尔德兹两地相对密度比较,低的非液化反而高的液化,就说明了这一点。

2 结果

2.1 男女越野运动员身体成分比较

(1)假设P值服从0-1间的连续分布,有

近年来,共享经济十分流行,共享单车的出现有效打通了城市交通最后一公里,给市民的出行带来了极大便利,得到了广大市民的认可,但随之而来的涉自行车事故数量不断攀升,问题日益凸显,给城市道路交通管理带来了新的挑战。我们统计单车事故得出,事故发生造成伤亡一大原因就是,骑行者没有任何安全措施的保护。由此可见,骑行佩戴头盔的重要性。而计划在新领域推动本来普及度就不高的骑行头盔,产品本身则显得至关重要。

2.2 男女越野运动员无氧功率比较

在无氧运动能力方面,男越野运动员无氧功率显著大于女性运动员(相对最小功率除外,见表3).

从表3可知,q值法与P值方法具有较高的统一性,无氧功率属于组织水平的比较关键非必须功能,因此适用的QD范围为0.27≤l<0.47,只有躯干肌肉(QD:0.459<0.47)没有达到显著量级,与传统的P值统计一致. 当q值法与定量差异分析比较的时候,在前5秒功率(W/kg)这个指标上两者统计结果相反,其余参数上基本一致,定量差异分析的QD值更为明确.

 

表2 运动员身体成分指标比较(x±s)

  

变量女越野运动员(n=21)男越野运动员(n=19)PqQD躯干肌肉/kg1.82(0.11)2.27(0.19)***0.0000.0000.459躯干脂肪百分比/F%24.13(3.53)17.50(3.74)***0.0010.0010.668a左腿肌肉/kg6.08(0.63)8.34(0.45)***0.0000.0000.657a左腿脂肪百分比/F%27.63(3.84)16.11(2.90)***0.0000.0001.121a右腿肌肉/kg6.10(0.67)8.37(0.44)***0.0000.0000.657a右腿脂肪百分比/F%27.38(3.75)16.39(3.04)***0.0000.0001.066a全身肌肉/kg37.18(2.81)48.74(3.30)***0.0000.0000.563a全身脂肪百分比/F%25.57(3.36)17.09(3.09)***0.0000.0000.837a

注:***表示P<0.001.q值代表FDR分析结果,QD:定量差异分析结果.适用范围:0.47≤l<0.80,a表示达到显著定量级水平,A表示达到极显著量级水平.

 

表3 无氧功率比较(x±s)

  

变量女越野运动员(n=21)男越野运动员(n=19)PqQD前5秒功率/W393.07(135.37)567.11(109.86)*0.0130.0100.762a前5秒功率/W·kg-17.34(2.58)8.82(1.30)0.1900.0860.382a最大功率/W454.14(151.11)713.64(143.31)**0.0020.0030.938a最大功率/W·kg-18.35(2.91)11.13(2.02)*0.0400.0210.597a平均功率/W326.98(54.80)500.80(47.53)***0.0000.0000.887a平均功率/W·kg-15.99(0.87)7.40(1.17)**0.0080.0080.439a最小功率/W246.49(33.65)315.73(83.26)*0.0190.0120.514a最小功率/W·kg-14.54(0.64)4.79(1.53)0.6160.2430.111

注:*表示P<0.05;**表示P<0.01,***表示P<0.001.q值代表FDR分析结果0.025和0.005分别代表显著和非常显著差异,QD:定量差异分析结果.适用范围:0.27≤l<0.47,a表示达到显著定量级水平.A表示达到极显著量级水平

3 讨论

通过对比P值、q值和定量差异分析方法发现,q值和定量差异分析方法与传统的P值统计具有较高的一致性,q值统计和定量差异分析可以作为P值统计进一步深入分析,在降低统计失误和发现假阳性率上具有重要积极.

3.1 QD在体育科学中的应用

定量差异分析方法能够区分两组数据的平均值差异,并且告知这个差异的生物医学意义,在一定程度上弥补了P检验此方面存在的不足[4].定量差异分析在体育科学中的应用目前相对较少,主要体现在运动人体科学专业研究领域,李蕾等[9]通过基于血清代谢组学的2型糖尿病大鼠运动干预的定量生物学研究发现,P值统计无法区分造模时和造模后的差异,定量差异分析则可以实现.在本研究中,定量差异分析的QD值在数据差别上更具有体现性.

3.2 q评价在体育科学中的应用

基于错误发现率(FDR:False Discovery Rate)的多重假设检验(MHT:Multiple Hypothesis Testing),已成为一种有效解决大规模统计推断问题的新方法[10],较早应用在计量经济学中.FDR具有以下优点:(1)可以灵活调整其取值,作为假设检验错误率的控制指标,其控制值可以根据需要灵活选取,而传统的假设检验(FWER)的取值则较为固定,通常定为0.05;(2)FDR的意义明确,可以作为筛选出的差异变量的评价指标,而FWER则主要是用来控制I类错误的.FDR与FWER两者的关系:当所有无效假设为真时,控制FDR和控制FWER等价[8],至今没有发现此种方法在体育科研中的应用.基于其统计学基本原理,未来这种方法可以应用在运动对机体细胞或者基因水平的影响方面的统计分析.当然,不论是q评价,还是定量差异分析还需要更多的数据和研究来进一步支持.

4 结论

本研究首次将P值统计与FDR、定量差异分析一起对数据进行分析比较,发现FDR方法在拒绝假阳性上具有积极的意义,定量差异分析的QD值在数据差别上更具有体现性.FDR方法、定量差异分析方法与P值统计具有较好的一致性,但是FDR方法在甄别假阳性率上效果显著,定量差异分析方法弥补了P值无法区分两组数据的平均值差异,也无法解释这个差异的生物医学意义的缺陷,同时定量差异分析的QD值在数据差别上更具有体现性.这两种方法在体育科研领域不同研究水平的具体应用情况需要更多的实验数据来支撑,希望未来可以建立替代P值统计的常规数据处理方法.

参考文献

[1] OSBORNE J W. Challenges for quantitative psychology and measurement in the 21st century[J]. Frontiers in Psychology, 2010,1(4):1-3.

[2] WOOLSTON CHRIS. Psychology journal bans P values[J]. Nature,2015,519(7541):9.

[3] WASSERSTEIN R L, LAZAR N A. The ASA's Statement on p-Values: Context, Process, and Purpose[J]. American Statistician,2016,70(2):129-133.

[4] 刘承宜,胡少娟,李晓云,等.定量差异及其在体育科学中的应用[J].体育学刊,2016,23(1):11-17.

[5] 蒲西安,弓腊梅,盛佳智.性别和体重对越野运动员无氧功率及其与身体成分关系的影响[J].河北体育学院学报,2014,28(5):75-79.

[6] BENJAMINI Y, HOCHBERG Y. Controlling The False Discovery Rate—A Practical And Powerful Approach To Multiple Testing[J]. Journal of the Royal Statistical Society,1995,57(57):289-300.

[7] STOREY J D. The positive false discovery rate: A Bayesian interpretation and the q-value[J]. Annals of Statistics,2003,31:2013-2035.

[8] 刘晋,张涛,李康.多重检验假设中假阳性错误率FDR的控制与估计方法[C]//中国卫生统计学年会论文集,2011.

[9] 李蕾,刘承宜.基于血清代谢组学的2型糖尿病大鼠运动干预的定量生物学研究[J].体育学刊,2016,23(4):140-144.

[10] 刘乐平,张龙,蔡正高,等.多重假设检验及其在经济计量中的应用[J].统计研究,2007,24(4):26-30.

 
陈爱民
《兰州文理学院学报(自然科学版)》2018年第03期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号