更全的杂志信息网

基于支持向量机的弓网间电弧诊断策略

更新时间:2009-03-28

截止2015年底,我国铁路运营总里程突破12万km,其中高速铁路超过了2.3万km,电气化铁路更是达到了7万km以上,供电在铁路运输安全生产中的重要性进一步提高[1]。在如今电气化铁路的牵引供电系统中,主要采用的是受电弓与接触网相接触的受流方式为电力机车供电。在铁路的牵引供电系统中,最容易出现故障的设备就是接触网。接触网一般没有备用,一旦弓网间出现故障,则会影响整个供电区间的正常运行。因此加强对弓网间的状态检测与故障诊断是保证电力机车正常运行的关键。随着我国电力机车朝着高速化、重载化发展,对弓网间电弧的检测与诊断是评价高速铁路弓网受流质量的重要方式。

经研究发现,长寿地区具有明显的“优越的微量元素谱”,如湖北钟祥长寿老人以富锰富硒为特性,广西巴马长寿老人具有高锰低铜元素特征,新疆和田长寿老人的镁、铝、铁、锰、钡、锶含量明显高于普通人,云南长寿老人具有高锰高锌的特点。长期的调查研究表明,土壤质量对人类长寿的影响是多种有益生命功能元素共同作用的结果。当然,目前人类对于土壤中的长寿“密码”的认识还处于起步阶段,土壤中更多的长寿密码还有待我们进一步地去深入调查和研究。

电弧现象是一个电场、磁场、气流场及热场等多物理场之间相互耦合变化的复杂过程。电力机车在运行的过程中,一旦弓网间出现接触性能不稳定,或者发生分离,便会引起弓网间的燃弧现象。随着我国电力机车运行速度的不断提高,接触网振动、轨道不平顺等因素造成受电弓和接触网发生不良接触而引起的弓网间燃弧现象愈发频繁。弓网间电弧不仅会使车载电力设备承受高频振荡过电压外,轻者会烧蚀接触线,缩短接触线与受电弓的使用寿命,影响车载电力设备的正常运行,重者烧断接触线,造成列车停运、线路损坏等重大事故。在实际中,受现场运营条件、设备安装空间、技术手段不成熟等因素的限制,很难在现场对弓网电弧进行直接检测与诊断[2]

国内外对弓网间电弧检测的研究取得了一定的进展,检测方法主要为以下几种[3]:在接触网附近安装高帧率相机,对弓网间电弧进行图像处理以达到实时检测,但这种方法的缺点在于需要处理的图像数据过于庞大,造成计算机负担过于沉重而影响效率;根据弓网离线时其间电阻会变大的原理实现对电弧电流的检测,但这种方法的准确性较差;利用传感器对弓网间的接触压力与温度进行测量,而实现对电弧的诊断,但是这种方法容易受到外界其他因素的干扰。这些方法具有一定局限性,对电弧诊断的准确度也难以保证。本文将基于支持向量机建立起一个弓网间电弧诊断模型,通过对线路中电流信号的检测,以实现对弓网间电弧的诊断,并为弓网间电弧故障诊断提供一个新思路。

1 原始数据获取与分析

1.1 弓网电流采集系统

采用如图1所示的电弧试验系统来对电流数据进行采集[4]。电动机带动转盘转动,转盘带动接触线运动,使接触线与受电弓滑板之间有相对运动,对机车运行时弓网间作用进行了模拟;电流传感器能够测量出受电弓与接触线中的运行电流,通过数据采集卡采集后传送到计算机;同时高速摄像机能够记录下发生电弧时的图像与时间点;R、L为用于模拟机车负载的电阻与电感。

本次实验模拟了500个弓网间电弧电流信号,再任取500个弓网正常状态下的电流信号,构成一份数量为1 000的原始数据集合。

  

图1 电流采集系统结构图Fig.1 Structure graph of current acquisition system

1.2 原始数据分析

对采集到的线路电流进行初步分析,任取某一弓网正常状态的电流,其波形如图2所示。同时,任取某一弓网间发生电弧时的电流,其波形如图3所示。

  

图2 正常状态电流波形Fig.2 Current waveform in normal state

  

图3 电弧状态电流波形Fig.3 Current waveform in arc state

对比图2与图3可以看出,弓网间发生电弧时的电弧电流与正常运行状态下的电流在波形上并无明显的畸变,其峰值也没有明显的增大。因此仅通过电流波形无法判断线路中是否出现了电弧。

对这两种状态下的电流进行总谐波失真(THD)分析,结果如图4,图5所示。图中给出了频率在0~1 000 Hz范围内的整数次谐波含量,通过对比可以看出,弓网间产生电弧后电流中谐波含量相对于正常电流会略有增加,其总体显现出一定的混沌特征。

2 电流信号的特征提取

弓网间出现电弧现象有不同的原因,非线性因素对电流信号有不同的影响,当无法直观地对故障类型进行判断时,就需要提取出不同故障类型下的特征值,提高对故障识别、分类的准确度。

2.1 电流信号的混沌特性判断

从图4,图5看出,机车运行时弓网间电流都存在一定的谐波,总体表现出一定的混沌特性。最大李雅普诺夫指数表示相空间相邻轨迹的平均指数发散率的数值特征,用于识别混沌运动的主要特征。计算一个信号最大李雅普诺夫指数,指数为正时表明该信号具备混沌特性[5]

  

图4 正常状态电流谐波含量Fig.4 THD of current in normal state

现采用wolf算法对正常状态与电弧电流信号的最大李雅普诺夫指数[6]进行计算,下表1为计算所得结果。从表中可以看出,这两种状态下的电流信号的指数值均为正,表面它们都具备一定混沌特性。

下面将本文方法与文献[9]、文献[12]和文献[19]的方法进行比较。表4所示为不同方法的比较结果,从表4可以得出如下结论:

  

图5 电弧状态电流谐波含量Fig.5 THD of current in arc state

 

表1 两种状态下电流的最大李雅普诺夫指数Tab.1 The maximum Lyapunov exponent of current in two states

  

?

2.2 功率谱熵

影响模型诊断准确率的关键的因素在于式(13)中核参数g与惩罚因子C的选取。目前在国际上对SVM的参数优化选取并没有一个公认统一的办法。在实际中常用的方法就是通过网格搜索法[9-10](Grid Search),使g与C的取值在一定范围内划分网格并对网格内所有点进行取值,对于所选定的g与C的值,通过交验证法(CV,cross validation)验证在此组g与C值下模型诊断的准确率,取能使对训练集分类准确度最高的一组g与C作为最终的模型参数。参数寻优的步骤如下:

伴随着老龄化社会的不断发展,中老年患者人群在临床中疾病的发生率也在随之提高。冠心病心绞痛也属于发生率比较高的疾病类型,伴随着老龄化社会的发展其发病率不断提升[1]。冠心病心绞痛主要是多种原因导致心肌缺血、缺氧,并形成系列性的症状,如气促、气短以及胸痛等,严重时还会影响患者的生命健康[2]。临床中患者往往会因为疾病的疼痛感、对治疗的恐惧心态形成严重的负面情绪,导致对医护服务形成抵触。对此,为了持续提升临床护理水平,以我院的部分患者为例,以对比分析方式探讨关于冠心病心绞痛患者的临床最佳护理服务措施,现报告如下。

 

对于某个系统来说,信息熵是用来表示该系统内各个因素的混乱程度。

功率谱熵是通过对信号的频域特征进行提取而获得的。给定一个长度为N(N>0)的离散信号x(i),其中i=0,1,2,…,N-1,对其进行 Flourier变换后得到频谱序列 X(k)

 

式中:n为测试集中样本个数。

 

用pi表示各频率分量归一化后的功率谱密度函数

 

结合信息熵的定义,可以写出相应功率谱熵H的表达式

 

式中,n为对集合S(k)的划分参数。

从表4,表5中可以看出,采样点数对诊断结果有一定影响,但由于样本集合不大,对断准确率影响不是很大;而不同的采样频率对诊断结果的准确率影响非常小。

3 基于SVM的弓网间电弧诊断

3.1 SVM简介

在机器学习领域中,支持向量机(SVM)是与学习算法有关的监督学习模型,它基于结构风险最小化原则和VC维理论等统计学原理,能应用于数据识别、非回归分析和监督分类等方面。支持向量机能有效解决样本小、非线性和高维识别等实际问题,其具备通用性广、鲁棒性好、相关理论完善、计算简单和有效性高等优点,并能有效地克服维数灾难、局部过优和过度学习等传统分类器具有的缺点[8]

支持向量机是通过对少量训练样本的特征子集,即支持向量进行训练,从而实现对整个样本进行分类。 对于某样本集合:(xi,yi),i=1,2,3,…,n,其中 xi∈Rn,yi∈{-1,+1},取该 n 维空间中的判别函数 φ(x)=(ω·x)+b,则该样本集合中有一最优超平面 (ω·x)+b=0能将这些样本全部划分开来,分类原理如图6所示。

水资源司在网站开辟试点工作专栏,报道试点工作动态和各试点地区经验做法,建立了试点工作联系人和信息上报制度。试点工作开展以来,被《人民日报》(海外版)、《中国水利报》、《水利部优秀调研报告集》、《水资源工作信息》、水利部门户网等报刊网站收录信息及文章50余条 (篇),部分信息经新华网、新浪网等转载,扩大了试点工作的社会影响力,发挥了试点的示范作用。

  

图6 SVM分类原理Fig.6 Classification principle of SVM

根据最优超平面的定义,支持向量与该超平面之间的距离为1/|ω|,因此寻求该超平面的问题可以转化为如下形式的二次规划问题

 

式中:ω为权重向量;C为惩罚因子且C≥0;ξi为松弛因子;b为偏置项;N为样本个数;φ(xi)为非线性转换函数,其作用是将xi映射到高位特征空间之中;yi用来表示分类结果,对分类结果yi定义如下一个分类函数

 

式(6)中目标函数与约束条件都是凸函数,根据最优化理论可知该函数能找到一个全局最优解。为解决该约束优化问题,现引入Lagrange算子αi,将式(6)转化为无约束的目标函数

 

令式中 ω,ξi,αi和 b 的偏导值等于 0,可得

 

式(6)中的偏置项b可用下式计算

 

其中:SV={i:αi>0};NSV为样本中支持向量的个数,即 αi>0 时所对应的 xi个数。

观察式(7)与式(10),可以看出目标函数与偏置项中都存在数量积ωTφ(xi),引入核函数k对其进行计算

 

通过引入核函数k,将该数量积进行非线性变换映射到高维空间中。决策函数用下式表示

 

构建好训练集与测试集后,通过MATLAB软件中LIB-SVM工具箱,采用径向基(RBF)核函数对训练集进行建模,初步建立起隔离开关故障诊断模型。建模后,将测试集的样本导入到模型中进行结果测试,将诊断结果与真实值进行比较,计算出该模型的诊断准确率。若效果不理想,则需要对模型参数进行修改以达到满意结果。

 

式中:g为核参数。

3.2 弓网间电弧诊断过程

获取的原始数据是连续时间信号,对原始数据进行采样后(采样频率为5 kHz,采样点数为800),构建成一份数量为1 000的样本集合。对这1 000个样本进行特征提取,构造出弓网间电弧电流的特征向量xi(xi为计算所得的功率谱熵)。并用yi来对样本进行相应的类别标记,属于电弧状态的样本标记yi=-1,正常状态的标记yi=1。样本集合如表2所示。

 

表2 样本集合Tab.2 The sample database

  

?

电弧电流频带比正常电流的频带要宽,因此其功率谱熵值大于正常电流。

在这1 000份样本种,前600份样本作为支持向量机的训练集,用于建立诊断模型;剩下400份样本作为测试集,用以测试本次实验所搭建起的诊断模型的诊断效果。

(2)采用湖南当地背景值计算研究区各元素的地积累指数及其污染情况。土壤重金属Mn的Igeo最大值为5.38,达极严重污染水平;Cd的Igeo最大值为2.57,属于中污染-强污染;Pb的Igeo最大值达1.77,属于中度污染水平;Cu、Cr、Ni、Zn的Igeo值均小于1.00,属于无污染-轻微污染。其中重金属Mn受污染最为显著,其次为Cd,而Cr、Ni 几乎不受影响。

支持向量机的核心就在于通过非线性映射将变量x映射到高维空间中,在这个空间中找到一个最优分类的超平面将变量进行完美划分。而核函数k(xi,xj)能够避免在这个高维空间中进行复杂的计算,常用的核函数有线性内核,多项式内核,径向基内核(RBF),sigmoidal核。由于RBF核适用于样本线性不可分且样本数量适中的情形,因此本次实验选取RBF核函数,其表达式如下

信息熵最早是由美国数学家Shannon于1948年提出,其目的是为了解决对信息的量化度量问题。对于非线性的随机变量,信息熵可以给出某特征的定量表述。其基本定义为:假设X为一个可测集合U生成的δ代数和具有μ测度的勒贝格空间,且空间X可表示有界划分A=Ai中互不相容集合的形式,对于该划分A的信息熵H(A)可用下式表示

1)建立起网格坐标,设定网格搜索变量(g,C)的取值范围与搜索步长。其中C的范围设置为[2-10,210],g的范围设置为[2-10,23],步长设置为 0.1。

其中:n为测试集中样本个数;yi*为诊断结果;yi为实际值。

 

2)使用K-fold交叉验证法对训练集进行验证。将训练集分为K个子集(K≥3以保证训练集数量大于测试集),以其中任意一个子集作为测试集,剩下K-1个子集作为训练集,对网格中的每一组(g,C)进行验证。使用训练集建立起诊断模型,然后用测试集对模型诊断效果进行测试,并计算出诊断结果的均方误差(MSE,mean-squared-error),计算公式如下

3)将测试集更换为K个子集中的另一个子集,并将剩余的K-1个子集做为训练集,直到将K个子集都用做为训练集进行效果测试后,取这K个均方误差的平均值作为该组参数(g,C)下的诊断准确率。

4)重复以上步骤,找出使均方误差的平均值最小的一组(g,C),即为该诊断模型下的最优参数组合。

“修禊”是中国的传统风俗。每年在阴历三月上旬的巳日(魏以后始固定为三月三日),人们相偕到水边嬉戏游玩,招魂续魄,秉兰草以驱除不祥。后来,这一风俗慢慢被演化成士人们开春出游、踏青除邪的“修祓禊之礼”。兰亭修禊就是发生在上巳节的一个雅集。

基于网格划分法对参数进行交叉验证,能大大提高对参数寻优的效率与准确率,也能有效避免训练集中样本的随机性对模型性能的影响。

3.3 诊断结果分析

应用训练集中600个样本建立起诊断模型后,对测试集中400个样本进行分类诊断,将诊断结果yi*与测试集中的真实值yi进行比较,验证该模型的诊断效果。分别进行了3、5、7折的交叉验证并对比RBF核函数与Sigmoidal核函数的诊断效果,结果如表3所示。模型诊断结果的准确率用式(15)计算

2.2 两组体质量净增值的比较 出生至42 d、42 d~2个月、2~3个月,体质量净增值干预组均大于对照组,差异有统计学意义(均P<0.05),而3~6个月两组体质量净增值差异无统计学意义(P>0.05)。见表2。

 

该频谱序列在频率k处的功率谱值S(k)如下

如是想着,人力车终于没有踪迹。天色真的晚了。远处对街的店铺门前有几个短衣的男子已经等得不耐而冒着雨,他们是拼着淋湿一身衣裤的,跨着大步跑去了。我看这位少女的长眉已颦蹙得更紧,眸子莹然,像是心中很着急了。她的忧闷的眼光正与我的互相交换,在她眼里,我懂得我是正受着诧异,为什么你老是站在这里不走呢。你有着伞,并且穿着皮鞋,等什么人吗?雨天在街路上等谁呢?眼睛这样锐利地看着我,不是没怀着好意吗?从她将钉住着在我身上打量我的眼光移向着阴黑的天空的这个动作上,我肯定地猜测她是在这样想着。

 

表3 诊断结果Tab.3 Diagnosis results

  

?

从表3中可以看出,在诊断准确率上RBF核函数明显优于Sigmoidal核函数;同时交叉验证的折数越大其诊断准确度也越高。但交叉验证的折数越多诊断所耗费的时间也更多,7折交叉验证的正确率相比5折略有提高,但在实验过程中耗时却大大增加,对于样本数量更巨大的测试集来说耗时也会更加可观。

弓网间出现电弧时,持续时间很短,因此对原始信号进行采样时,采样频率与采样长度的不同会在一定程度上影响对电弧信号表述。现对原始信号进行不同长度与频率的采样,对重新构造出的样本以5-fold CV进行诊断,诊断准确率如表4,表5所示。

 

表4 不同采样点数所得诊断结果(采样频率=5 kHz)Tab.4 The diagnosis results at different sampling number(sample frequency=5 kHz)

  

?

 

表5 RBF不同采样频率所得诊断结果(采样点数=800)Tab.5 The diagnosis results at different sample frequencies(sampling number=800)

  

?

信息熵能够体现出一个系统中不确定因素的混乱程度[7],而功率谱熵作为信息熵在频域上的表征,能够反映出系统中谱型结构情况。电弧电流与正常电流在频谱上存在差异,功率谱熵值能在一定程度上将这种差异表现出来。

4 结论

本文基于支持向量机建立起数学模型,通过对线路中的电流信号的检测来判断弓网间是否出现电弧现象,为弓网间电弧诊断提供一个新思路。通过实验,可以得到以下几点结论:

1)弓网间出现电弧时,电弧电流与正常电流波形相比并无明显的畸变,无法直观对它们进行分辨。但电弧电流中混有很多高频噪声,具有一定的混沌特性。针对电弧电流的这种混沌特性可以通过计算其功率谱熵而进行特征提取,在本次实验中这种方法能较好地区分电弧状态电流与正常状态电流。

2)本文所建立的模型准确率较高,但仍存在一定的误差。误差原因主要来自于模型参数、样本数量,以及某些电弧电流与正常状态电流在频域与时域上的区别较小,样本的随机性会对模型的诊断性能造成一定的影响。此外,本文仅采集了弓网间电流,数据维度较为单一,但诊断结果较为理想;对原始数据进行处理时,可考虑采用电流加电压的方式构建特征向量提高数据维度,以实现更为准确的诊断结果。

3)应用支持向量机建立起的电弧诊断模型对本次实验所收集到的数据诊断正确率比较理想,总体能正确率能达到90%以上。证明了该方法对电弧诊断的可行性与有效性。当给定一个适当的阈值对普通电弧电流与故障电弧电流进行区分,使用该模型就能有效实现电弧故障的诊断,为高速铁路弓网间的故障诊断提供了一个新的思路。

参考文献:

[1]刘仕兵,朱雪龙,武磊,等.基于灰色聚类和组合赋权法的高速铁路接触网健康状态评估研究[J].铁道学报,2016,38(7):57-63.

[2]王万岗,吴广宁,高国.高速铁路弓网电弧试验系统[J].铁道学报,2012,34(4):22-27.

[3]王英,刘志刚,范福强,等.弓网电弧模型及其电气特性的研究进展[J].铁道学报,2013,35(8):35-43.

[4]王万岗,吴广宁,高国强,等.高速铁路弓网电弧试验系统[J].铁道学报,2012,34(4):22-27.

[5]刘仕兵,葛俊祥.基于K-means聚类法的牵引供电隔离开关故障状态监测[J].华东交通大学学报,2017,34(3):109-117.

截至2014年年底,全国有效使用绿色食品标志企业总数达到8700家,产品21153个,达到历史新高。2014年上半年统计数据显示,绿色食品大米、水果和茶叶产量已分别占全国大米、水果和茶叶总产量的10.8%、6.8%和3.7%。全国共创建了635个绿色食品原料标准化生产基地,基地种植面积1.6亿亩。

DataValueCollection values = new DataValueCollection();

[6]蔡聪波.混沌系统最大Lyapunov指数的计算及其在脑电数据分析中的应用[D].厦门:厦门大学,2001.

[7]QU LIANGSHENG,LI LIANGMING,LEE JAY.Enhanced diagnostic certainty using information entropy theory[J].Advanced Engineering Informatics,2003,17(3-4):141-150.

治安学虽然已经确立了学科地位,但离一门成熟的学科还有相当远的距离。俗话说得好,“先天不足后天补”。这需要学界同仁不懈努力,根据实际,深入开展实实在在的学科建设,为治安学学科的发展成熟做出应有的贡献。

[8]白鹏,张喜斌.支持向量机理论及工程实例[M].西安:西安电子科技大学出版社,2008.

根据表3综合排序结果,综合指数值越大,水质越好。根据《地下水质量标准》中10种评价因子的界限值,由公式(6)得出其中5类水的综合指数值,Ⅰ类水界限指标排序为3;Ⅱ类水限指标排序为22;Ⅲ类水限指标排序为77;Ⅳ类水限指标排序为134;由于Ⅴ类水的界限指标为范围值,初始矩阵建立时,将其限值设为边界值,综合指数分值与Ⅳ类水一致,将<0.0018的综合指数值划分成Ⅴ类水,总体趋势是丘陵地区水质优于第四系覆盖区,内陆地区好于沿海地带,工业密集区上游好于下游地区,地下水质量评价分区见图3。

[9]张剑,王波.Grid-Search和PSO优化的SVM在Shibor回归预测中的应用研究[J].经济数学,2017,34(2):84-88.

地壳当然比我们对弹性波传播不完整表述得出的模型更加复杂多样。有时候,当与波长相关方法的分辨率低于基于射线方法的分辨率时,其属性可以描述为统计分形介质(如,Levander and Holliger,1992)。有为得到更多这种不均匀性质而提高地壳模型分辨率的可能性吗?答案是肯定的,但是需要更合适的波传播的物理性质(波动方程的数值解)和密集采样波场的记录。

[10]王兴玲,李占斌.基于网格搜索的支持向量机核函数参数的确定[J].中国海洋大学学报,2005,35(5):859-862.

 
刘仕兵,曾聿田,刘欢,马志方
《华东交通大学学报》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号