更全的杂志信息网

基于KPCA-Fisher判别分析的煤炭自燃预测研究

更新时间:2009-03-28

煤炭自燃火灾是煤矿安全开采过程中所面临的重要灾害之一。煤炭自燃预测与评价是防止煤炭自燃灾害的前提条件,及时、准确地预测煤炭自燃以便采取相应的措施来防止煤炭自燃事故发生已成为煤矿安全生产中亟待解决的科学问题。

目前,对煤炭自燃研究主要体现在两个方面:一方面是煤炭自然发火预测指标气体的优选,王从陆等[1]通过对新鲜煤样和氧化煤样的热解实验,测定实验煤样在不同热解温度下各气体的浓度,具体分析了指标气体浓度随温度的变化特性,为煤炭自燃预测指标气体的选取提供理论依据;吴兵等[2]通过自燃特性实验来研究煤炭自燃过程中的标志性气体,分析了各气体产生量随煤样温度变化的曲线,从而确定煤炭自燃预测指标气体。另一方面是煤炭自燃危险性预测的研究及优化,邵良杉[3]等将因子分析与支持向量机相结合并应用于煤炭自燃预测,较好地解决了煤炭自燃预测问题;邬剑明等[4]从非线性理论的角度分析煤炭自燃的本质特征,并利用BP网络的高度非线性关系映射来建立煤炭自然发火预测模型,该模型预测结果与实际结果基本吻合;邓军等[5]针对影响煤自燃程度的因素众多且关系复杂的特点,运用PCA-PSOSVM模型对煤自燃程度进行预测,预测精度相对较高,具有较强的适用性。以上学者在煤炭自燃危险性预测方面都提出了各自的方法,促进了该领域的发展,但是还存在一定的局限性。如支持向量机(SVM)在处理小样本事件时优势显著,但在应用过程中参数的确定比较困难;BP神经网络结构不易确定、收敛速度慢,算法存在易陷入局部极小值的缺陷,对解决小样本问题能力有限;PCA-PSOSVM模型虽然利用粒子群算法(PSO)对SVM的参数进行寻优,但模型结构较为复杂,应用时具有一定难度。此外,影响煤炭自燃的因素繁多,样本数据分布情况未知。因此,有必要建立一种适用于影响因素多、对样本数量及分布无特定要求且模型结构简单稳定的综合预测模型。

基于此,笔者利用KPCA模型可以浓缩数据的优点,实现对煤炭自燃影响因子的非线性特征提取,即把多个彼此相关联的指标变量通过非线性映射转化为彼此独立的新的样本指标,消除指标间信息重复造成的影响,并降低模型输入向量的维度;再结合Fisher判别分析模型的结构简单稳定、对样本数据的分布无特定要求等特性,建立基于KPCA-Fisher判别分析的煤炭自燃预测模型,并以实例来证明该模型的可靠性。

1 相关理论概述

1.1 核主成分分析法

核主成分分析法(Kernel Principle Component Analysis ,简称KPCA)是一种非线性主成分分析法(PCA),其基本思想是基于核函数原理,通过非线性映射将输入样本数据投影到高维特征空间,并在高维特征空间中对映射数据做主成分分析,从而实现对非线性数据的特征提取,因而具有较强的非线性处理能力[6-7]

1.2 Fisher判别分析法

Fisher判别分析(Fisher Discriminant Analysis,简称FDA)是一种对样本总体分布不做任何特定要求的线性判别方法[8],其基本思想是投影(或降维),即将高维数据点投影到低维空间,使得样本投影到低维空间后能在保证方差最小的情况下,将不同类的样本很好地分开,然后根据类间距离最大、类内距离最小的原则确定判别分析函数,进而将新的样本进行分类判别[9]

1.3 Fisher判别效果的检验

为检验Fisher判别分析模型的有效性,利用回代判别法求出回代误判率来衡量[10],即将所有训练样本N作为新样本,逐一代入已建立的判别函数进行判别。在回代判别过程中,记误判的样本数为n,则误判率为:

η=n/N

随着行业的发展,工程木协会(APA)也在不断发展,但其基本核心仍然保持不变。主席Edward Elias指出:“我们致力于产品质量、技术研究和测试,以及市场营销的三大核心功能。”

(1)

2 煤炭自燃预测的KPCA-Fisher判别模型及应用

2.1 判别指标的选取

煤炭自燃是一个复杂的物理、化学和环境作用的过程,是多种内在原因和外在条件综合作用的结果[11]。煤炭自燃必须同时具备3个条件[12]:存在有自燃倾向性、以碎裂状态堆积的煤炭;有一定的供氧条件以维持煤的氧化过程;煤发生氧化反应产生的热量易于积聚难以及时散失。根据煤炭自燃的条件可知,温度与氧气含量是预测煤炭自然发火的2个重要判别指标。煤在氧化自燃过程中伴随着燃烧产物(如CO、CO2、烷烃、烯烃等主要气体)的生成,不同的燃烧状态,其生成物也存在明显的差别,这也成为煤炭自燃预测的基础。因此,煤炭氧化自燃过程中生成的气体可以作为煤炭自燃预报的标志气体[1]。这些标志气体可以通过采空区瓦斯抽放钻孔进行抽取,然而瓦斯抽放钻孔的参数不同导致标志气体也会不同,其中钻孔参数包括钻孔距采煤工作面的距离、钻孔进采空区水平深度和孔高。笔者通过对大量煤炭自燃实例的分析,结合相关专家的研究成果[13-15],选取影响煤炭自燃发生的8个影响因素,分别为温度(X1,℃)和O2(X2,%)、CO(X3,%)、CO2(X4,%)及CH4(X5,%)这4种气体的体积分数,以及钻孔距采煤工作面距离 (X6,m)、钻孔进采空区水平深度 (X7,m)、孔高(X8,m)这3个钻孔参数,以此构建基于KPCA-Fisher判别分析的煤炭自燃预测模型。

尽管子墨并非伊一瞩意的情人,但子墨与伊一在虚拟“西窗”的情话依然让人感佩。这大约就是虚拟的魅力吧。它犹如一部情景剧,处身于情景剧中的男女,会奋不顾身地进入角色,演绎他们执意的情节,诉说属于自己的台词。我想到了旧俄时代的梅克夫人与柴可夫斯基的恋情。他俩不曾谋面,却苦苦相恋了13个年头。然而,他们的恋情最终还是崩殂了,俩人终成陌路。

2.2 煤炭自燃预测模型的建立

以文献[13]提供的宣东2号煤矿煤炭自燃样本数据为研究背景,结合KPCA和Fisher判别分析建立煤炭自燃的预测模型。根据煤炭自然发火程度,将其分为自燃和未自燃2个预测类别,并将其类标签分别设定为1和0,将这2种状态作为FDA模型的输出。从宣东2号煤矿多年的煤炭自燃观测数据中选取30组数据作为学习样本对模型进行训练,部分样本数据见表1。

 

表1 训练数据集

  

序号影响因素X1X2…X6X7X8核主成分F1F2F3实际结果回检结果120.319.8214…94542.82.237-1.032-0.653未自燃未自燃246.911.2365…1441944.32.497-0.764-0.146未自燃未自燃355.516.5321…2551945.62.370-1.1050.069自燃自燃︙︙︙︙︙︙︙︙︙︙︙︙2861.76.3521…582247.62.3441.042-0.490未自燃 自燃*2958.76.9352…542246.62.3141.086-0.549自燃自燃3036.814.3695…2147352.12.344-1.167-0.150未自燃未自燃

注:*表示误判的样本。

式中σ为高斯核半径。

依据KPCA计算原理,并按照下述步骤对煤炭自燃的原始样本数据进行KPCA处理。

1)原始样本归一化处理。为消除原始变量之间的量纲差异对模型预测效果的影响,利用Matlab中的Z分数(Zscore)法对原始样本进行归一化处理,该方法适用于某属性的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。

[2] 吴兵,苏赟,王金贵,等.煤炭自然发火预报指标气体研究[J].中国安全生产科学技术,2012,8(11):76-80.

 

表2 相关系数矩阵

  

因素X1X2X3X4X5X6X7X8X11X2-0.7101X3-0.6950.6321X4-0.7030.63911X50.752-0.811-0.701-0.7101X6-0.8830.6060.7750.782-0.7611X7-0.363-0.028-0.082-0.078-0.1550.0771X80.260-0.182-0.754-0.7490.311-0.5760.2561

3)利用KPCA提取主成分。首先,确定核函数,通过非线性映射将输入空间投影到高维特征空间;其次,计算特征值和特征向量,进行高维空间的正规化;最后,计算出各个样本的非线性主成分。

正如问题描述的那样,我们有10万大小的训练集和10万大小的测试集。在此基础上,可以对有标签的训练数据集采用各种算法(如 Logistic、Adaboost、Randomforst 等),通过调整算法参数和过采样策略,生成大量模型,分别对测试数据集进行预测。

设置KPCA核函数类型为高斯径向基函数(RBF),即:

 

(2)

2.2.1 数据的KPCA处理

当初,我怎么就讨了这么一个老婆呢!可是回过头来想一想,我老婆颖春的每一句话又说在当下的现实中,这就令我心里非常不爽了。

不同核半径σ的取值对KPCA降维效果有直接影响,通过实验方法确定最优σ值。以KPCA的计算原理为依据,在Matlab 2012b上编写相应的程序,计算得到特征值及累计方差贡献率。利用帕累托图对各主成分的方差进行解释,各主成分解释方差的帕累托图如图1所示。

  

图1 各主成分解释方差的帕累托图

利用KPCA方法提取煤炭自燃敏感指标,根据Matlab 2012b计算可得,前3项主成分的特征值分别为0.223 6、0.149 2和0.120 7。由图1可知,前3项主成分累计方差贡献率达到91.96%左右。根据主成分的选取标准(累计方差贡献率大于80%),可用前3项指标代替原来的7项指标。计算核矩阵在提取出的特征向量上投影 F1F2F3,即为经过 KPCA 降维后所得到的数据(见表1)。

4)主成分相关性分析。为检验提取的主成分F1F2F3是否仍存在相关性,运用SPSS 19.0对主成分F1F2F3进行Pearson相关性分析。由相关系数矩阵可知,F1F2的相关系数为-0.250,F1F3的相关系数为0.271,F2F3的相关系数为0.016。由此,可以将主成分F1F2F3作为Fisher判别分析模型新的判别因子。

2.2.2 Fisher判别模型的建立

将相关性较弱的判别指标(X7)及经KPCA分析后得到的3个综合指标(F1F2F3)共同作为Fisher判别分析模型的判别指标。运用SPSS 19.0对新的4个判别指标做Fisher判别分析,可以得到未标准化的Fisher判别函数为:

Y=1.077F1+1.302F2+1.521F3-

1.112X7-2.822

(3)

在Fisher判别分析中,判别函数特征值的大小体现了判别函数的解释能力,即特征值越大,说明函数越具有区别判断力。判别函数的特征值及组中心值见表3。

选取2016年1月~2017年12月我院收治的急性心肌梗死患者80例作为研究对象,具有不同程度的心衰、心律失常、疼痛、发热等临床症状,患者知情同意,而且此次研究经本院伦理委员会研究通过。按照护理方法不同将其均分成对照组和实验组,各40例。其中,对照组男22例,女18例,平均年龄(59.2±4.1)岁;实验组男24例,女16例,平均年龄(59.5±4.4)岁。两组患者的一般资料比较,差异无统计学意义(P>0.05)。

成本的管理对于任何企业来说都至关重要,很多行业大型公司对成本管理都很看重,负责成本企划的人员有很高的专业水平,因此成本管理人员能够很好的根据本行业的市场变化对企业生产经营成本做出相应的调整,以确保成本被控制在一个合理的范围内。但是物业管理企业为了节省人力资源让一般的财务人员身兼两职,他们的专业素质与成本规划师相比相差甚远,并且还要负责日常的会计工作,对成本的管理就会疏忽,工作效率低。由于财务人员相关专业知识的匮乏,因此很难做好成本管理的工作。

距离地球很远很远的星球上, 一个孩子诞生了, 他生得健康聪明, 却从来不快乐, 他的父母和亲友也为他叹气, 因为他只有一双眼睛, 而在那个星球上, 每人都有两双眼, 一双向前看, 一双向后看。

 

表3 判别函数的特征值及组中心值

  

函数特征值方差贡献率/%累计方差贡献率/%典则相关系数组中心值0111.4041001000.764-1.2241.071

由表3可知,所得到的唯一一个判别函数的特征值为1.404,方差贡献率为100%,即可以解释样本100%的信息,说明该判别函数的区别判断力是显著的。判别函数的典则相关系数为 0.764,仅利用此函数可以完成绝大部分样本的判别,但并不能完成全部样本的判别。典则判别分析的Wilks λ检验结果如表4所示。

 

表4 Wilks λ检验结果

  

函数Wilksλ卡方值自由度Sig.10.41622.80440.000

[1] 王从陆,伍爱友,蔡康旭. 煤炭自燃倾向性试验研究及指标气体优选[J].中国安全科学学报,2006,16(10):131-134.

2.3 模型的检验及应用

为验证基于核主成分分析的Fisher判别模型的有效性和可靠性,采用回代估计法进行检验,即将表1的全部训练样本逐个代入已建立的判别准则中进行回判,回判结果见表1。由表1可知,样本中有1个样本回判错误,28号样本误判为自燃,回代误判率为1/30。由此可认为基于核主成分分析的 Fisher 判别分析模型比较可靠,稳定性较好,可以运用到实际的工程项目中。经分析,发生误判的原因可能是将介于自燃与未自燃两类之间的样本确定为某一类,因此选取样本数据的代表性还有待于进一步研究完善。

根据学习好的KPCA与Fisher判别模型对另外10组待判煤炭自燃样本数据进行测试。煤炭自燃预测模型的测试样本测试数据集见表5。为验证KPCA-Fisher判别模型是否较其他智能算法模型在煤炭自燃预测方面具有优越性,将数据未经KPCA处理的SVM模型、BP神经网络(BPNN)、FDA模型与KPCA-Fisher判别模型的预测结果进行比较,测试样本判别结果见表6。

 

表5 煤炭自燃预测模型的测试样本测试数据集

  

序号影响因素X1X2…X6X7X8主成分F1F2F3实际结果123.814.9632…1551646.92.312-1.182-0.334未自燃2102.411.2320…551944.12.0111.6470.152自燃392.79.1021…962147.32.4980.7280.078自燃4106.111.0210…2452456.62.533-0.4910.179自燃554.514.6366…1501836.52.508-0.7390.060未自燃651.913.6897…1621942.12.484-0.823-0.029未自燃7105.914.3625…1501738.62.5590.0780.377自燃897.37.8302…452147.91.8661.839-0.021自燃9125.46.0596…961844.32.3100.9690.384自燃10107.414.6676…1501836.42.5550.0950.420自燃

 

表6 测试样本判别结果

  

序号函数值距第Ⅰ类距离距第Ⅱ类距离实际结果本文方法预测结果FDA预测结果SVM预测结果BPNN预测结果1-1.988850.764853.05985未自燃未自燃未自燃未自燃未自燃22.185453.409451.11445自燃自燃自燃自燃自燃31.421452.645450.35045自燃自燃 未自燃*自燃自燃40.055411.279411.01559自燃自燃自燃自燃自燃5-0.577570.646431.64857未自燃未自燃未自燃未自燃未自燃6-0.858890.365111.92989未自燃未自燃未自燃未自燃未自燃71.175612.399610.10461自燃自燃自燃自燃自燃81.928023.152020.85702自燃自燃自燃自燃自燃91.962903.186900.89190自燃自燃自燃自燃 未自燃*101.242022.466020.17102自燃自燃自燃自燃自燃

注:*表示误判的样本。

由表6可知,KPCA-Fisher判别模型的预测结果与实际结果是一致的,该模型能对待测样本进行有效地分类。而传统的FDA模型将3号样本误判为未自燃,预测误判率为1/10。由此可见,原始数据在经过核主成分分析后,Fisher判别模型的预测精度有明显提高,表明核主成分分析能有效地排除冗余信息的干扰,提高模型预测准确率,基于KPCA的Fisher 判别模型对待测煤炭自燃数据具有更好的识别能力。

此外,SVM模型及BPNN的预测误判率分别为0和1/10。然而,SVM的核函数受到Mercer条件限制,并且存在核函数构建及参数确定较为困难的不足;BPNN有结构不易确定、收敛速度慢、对训练样本需求量大、易陷入局部极小值等缺陷。相比之下,KPCA-Fisher判别模型计算过程比较简单,模型结构固定,并不会随着样本数量的变化而改变判别体系,学习效率较高。综合比较,基于核主成分分析的 Fisher 判别模型可满足实际生产的需要,为安全生产提供了可靠的科学依据,用其预测煤炭自燃的类别是完全可行和高效的。

3 结论

1)应用核主成分分析理论研究煤炭自燃的影响因素,可避免由于因素之间的信息重合,导致Fisher判别分析法夸大某些因素的作用,降低预测精度。

2)利用核主成分分析法得到的主成分F1F2F3,以及钻孔进采空区水平深度4个判别指标构建了煤炭自燃的Fisher判别模型。该模型结构简单固定,预测精度较高,预测结果与实际情况基本一致,有较高的工程应用价值,为煤炭自燃预测提供了一种新思路。

3)Fisher判别分析是建立在较严密的统计分类理论基础上的,训练样本越多,分类结果越准确。煤炭自燃预测是一个较为复杂的问题,FDA模型应用于煤炭自燃预测还只是初步尝试,仍有一些方面存在不足。例如影响煤炭自燃的主要因素及判别因子如何选取的问题,且学习样本的数量、代表性和正确性对判别模型的判别精度有着直接的影响。要做到煤炭自燃预测更加准确、合理,还需要更进一步研究。

参考文献

除了颅内出血,其他不良反应发生概率较低,包括全身出血、过敏反应和口舌血管性水肿等,其中口舌血管性水肿发生于患侧大脑对侧,症状轻微且是暂时性的,估计1.3%~5.1%接受阿替普酶溶栓治疗的患者会出现此反应,通常与使用血管紧张素转换酶抑制剂或大脑岛、额叶皮质梗死有关。早期暂时性神经损害与阿替普酶溶栓治疗引起的脑实质水肿及阿替普酶潜在的神经毒性有关[33,53]。

Wilks λ值是组内平方和与总平方和的比,其值为0~1,值越小,表示组间的差异越大。由表4可知,Wilks λ的值为0.416,卡方检验统计量的观测值为22.804,F检验统计量的Sig.值为0.000小于0.050,说明不同类的指标均值的典则函数值是有显著性差异的。煤炭自燃危险性的两类总体典则判别函数在各组别的中心值分别为-1.224和1.071。在此基础上,可以通过比较待判样本函数值与两组别中心值的距离来判别某一新样本归属哪一组别。

2)相关性分析。若各个影响因素之间存在相关性,在用Fisher判别分析法进行判别时,可能会夸大某些影响因素的作用,这样不仅会影响判别的效果,还会增加运算时间及空间复杂度。因此,有必要对8个判别指标进行相关性分析。运用SPSS19.0统计软件对选取的8个指标变量进行Pearson相关性分析,以降低指标之间的信息重叠。对求得的相关系数矩阵(如表2所示)进行分析,其结果表明:X1X2X3X4X5X6这6个判别指标间相关系数绝对值大于0.6,表明这6个指标数据间存在显著的相关关系;X3X4X6X8这4个判别指标间相关系数绝对值大于0.5,表明这4个指标数据间也存在显著的相关关系。由此可见,只有X7与其他指标变量的相关性较弱。指标变量间存在较强的相关性及信息重叠,若直接作为Fisher判别分析模型的输入变量可能会对预测精度产生影响,可能产生误判。依据KPCA的原理及优点,对相关性较强的X1X2X3X4X5X6X8这7个变量进行KPCA处理。

社区参与:澳大利亚土著民族参与高等教育的新途径…………………………………………许伊娜,陈·巴特尔(3,106)

[3] 邵良杉,马寒,温廷新. 因子分析与支持向量机相结合的煤炭自燃预测[J]. 辽宁工程技术大学学报(自然科学版),2014,33(4):433-436.

考虑在一定的支出约束下消费者分别购买互为替代品的国产大豆和进口大豆,因此国产大豆和进口大豆的需求函数可表达如下:

[4] 邬剑明,王俊峰. 基于神经网络的煤层自然发火的非线性预测[J]. 中国安全科学学报,2004,14(5):11-13.

[5] 邓军,周少柳,马砺,等. 基于PCA-PSOSVM 的煤自燃程度预测研究[J]. 矿业安全与环保,2016,43(5):27-31.

结果表明,研究2组与对照2组化疗性静脉炎治疗有效率差异有显著性,喜辽妥与湿润烧伤膏局部交替外敷治疗化疗性静脉炎效果显著。

[6] 邵良杉,徐波. 岩溶塌陷倾向性等级的KPCA-SVM 预测模型 [J] .中国安全科学学报,2015,25(3):60-65.

[7] 王雨虹,付华,张洋. 基于KPCA和CIPSO-PNN的煤与瓦斯突出强度辨识模型[J]. 传感技术学报,2015,28(2):271-277.

一铵部分企业报价陆续调高,下游对高价有所抵触,新价成交较少,但企业自身库存较少,且待发量较大,企业挺价信心较强,后市成本支撑依旧较强,市场维持看涨趋势。报价方面:湖北地区55%粉主流出厂价2350元/吨,58%粉2400元/吨,60%粉2500元/吨。多数企业前期订单可运至下月中旬,成本支撑较强,市场价格高位运行。河南地区55%粉出厂价2350元/吨,成本压力较大,企业报价高位盘整。云南主产区55%粉主流出厂价2200元/吨,58%粉主流出厂价2300元/吨,60%粉出厂报价2400元/吨,价格高位盘整,部分企业限制接单,主发前期订单。

[8] 姜春露,姜振泉,孙强. 基于Fisher判别分析法的隧洞围岩分类[J]. 煤炭学报,2012,37(10):1665-1670.

[9] 姜春露,姜振泉. 基于Fisher判别分析法的岩溶塌陷预测[J]. 地球科学与环境学报,2012,34(1):91-95.

[10] 鲁金涛,李夕兵,宫凤强,等. 基于主成分分析与 Fisher 判别分析法的矿井突水水源识别方法[J]. 中国安全科学学报,2012,22(7):109-115.

[11] 胡英俊,邹德蕴,朱丕凯,等. 基于BP神经网络的煤层自燃预测[J]. 安全与环境学报,2007(1):125-128.

[12] 秦毅,杨胜强,严家程,等. 煤炭自然发火事故树分析及预防[J]. 中国安全生产科学技术,2012,8(8):198-204.

[13] 蔡玲. 粗糙集与支持向量机在采空区自然发火预测中的应用研究[D]. 阜新:辽宁工程技术大学,2012.

[14] 张建业,陈举师,孙新. 漏风测定和煤温监测防治采空区煤炭自燃技术[J]. 矿业安全与环保,2016,43(3):60-63.

[15] 邵良杉,李相辰. 不平衡数据下的采空区自然发火预测研究[J]. 中国安全科学学报,2017,27(6):61-66.

3.2 植被生境构筑的研究 库区水位周期性消涨过程中,水体对库岸的长期冲刷、侵蚀和浪淘使得土壤结构被破坏,植被生长基质极不稳定,植被难以扎根生存。因此,如何通过一定的工程辅助措施来构筑适合植被修复重建的生长环境十分重要。学者们对于适宜植物生长的生境构筑的研究大致可以归纳为对驳岸土壤基质进行加固的生态护坡技术研究,以及对驳岸进行形态上的改造使其适应水位消长的水位变动适应性的策略研究。

 
温廷新,于凤娥
《矿业安全与环保》 2018年第02期
《矿业安全与环保》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号