更全的杂志信息网

模糊C均值聚类在光伏阵列故障样本数据识别中的应用

更新时间:2016-07-05

0 引言

在全球气候环境日益恶化和化石能源日益枯竭的背景下,大力发展可再生能源已经成为世界各国的共识[1-2]。在政府的大力支持下,我国可再生能源发展迅速,预计到2020年和2030年,非化石能源占一次能源消费比重分别达到 15%和20%左右[3-4],其中太阳能以其清洁、安全、取之不尽、用之不竭的显著优势,已经成为发展最快的可再生能源。光伏阵列作为光伏(photovoltaic,PV)系统中最为重要的组成部分[5-6],因复杂的生产工艺和艰苦的工作环境,发生故障难以避免,这将会降低光伏电站的发电效率,减少其服用寿命,甚至造成火灾,引发安全问题[7]。因此,研究光伏阵列直流侧故障的诊断方法具有重要意义。

光伏阵列常见的故障包括短路故障、开路故障、异常老化、阴影遮挡、旁路二极管失效等,故障种类繁多[8]。随着光伏发电装机容量的扩大,近几年来,光伏系统的智能诊断技术越来越受到大家的关注,常用的方法包括人工神经网络[9]、支持向量机[10]、决策树[11]等。该类智能诊断方法主要通过人工利用先验知识划分并标识故障样本,通过训练诊断模型进行故障诊断。但人工筛选故障样本容易出现漏选、错选等现象,而故障样本的选取直接影响诊断模型的判别精度。因此,针对光伏系统直流侧样本数据智能筛选的研究很有必要。

本文提出一种基于模糊 C均值(fuzzy C-means,FCM)聚类的方法对样本数据进行智能筛选。FCM算法是一种基于目标函数模糊划分的柔性聚类算法,其思想是使得被划分到同一类的对象之间相似度最大,而不同簇之间的相似度最小。其迭代中心可以根据预定义的簇数更新与数据点相对应的隶属度值,更容易达到全局最优,因此十分适合用于样本数据的筛选。本文通过分析不同故障条件下光伏阵列的出力特性,提取故障特征向量;基于 FCM 算法良好的模糊处理功能,成功地将数据样本聚类划分;最后,通过实验验证了该方法的有效性和可靠性。

1 光伏阵列典型故障的仿真和分析

1.1 故障模型仿真

因工作环境艰苦恶劣,光伏阵列发生故障难以避免,本文的主要研究对象包括短路故障、开路故障、异常老化故障、阴影故障。但在实际生活中,往往并不允许光伏阵列工作于故障条件,因此有必要进行不同条件下光伏阵列输出特性的建模仿真。为了得到含有正常的、不同故障条件下光伏系统直流侧输出的数据库,基于文献[12]的方法,在Matlab 2015a环境下建立光伏阵列工程仿真模型。该模型共有3条支路,每条支路包含5个光伏组件,仿真模型如图1所示。该模型仅需出产商提供的参数(如表 1所示),就能在一定度下还原光伏系统在不同条件下的输出特性,满足工程适用的精度。其中,Uoc为开路电压,Isc为短路电流,Um为最大工作点电压,Im为最大工作点电流,Pm为最大工作点功率。

图1 光伏阵列仿真模型 Fig. 1 Simulation model of PV array

表1 光伏组件基本参数 Tab. 1 Basic parameters of PV module

参数 数值U oc/V 3 7.5 I sc/A 8.7 6 U m/V 3 0.1 I m/A 8.1 4 P m/W 2 4 5

1.2 故障条件下阵列的电气特性分析

研究了光伏系统4种典型故障下的电气参数分布特征,对开路故障、短路故障、阴影故障、异常老化故障,4种故障条件进行仿真。简单起见,仿真条件均设置为标准测试条件(1000 W/m2,25℃)。通过分析不同故障条件下光伏系统的输出特性,提取故障特征向量。

不同短路故障条件下的I-V、P-V特性曲线如图2所示。当外部激励条件不变时,与正常运行的光伏阵列相比较,随着被短路组件数量的增多,光伏阵列的短路电流、最大工作点电流不变,而开路电压、最大工作点电压、最大功率逐渐下降。因此,光伏阵列的短路故障在电气参数上体现为开路电压、最大工作点电压、最大功率的减少。

3)它对初始化相对不敏感。

对所有输入参量求导,使式(6)达到最小值的必要条件为:

不同阴影遮挡条件下光伏阵列的输出特性如图5所示。可见,当光伏阵列出现阴影故障时,因被挡组件带负压导致旁路二极管导通,其I-V、P-V曲线均呈现多峰值,阶梯状的特点[13]。从电气参数分布上考虑,开路电压、短路电流基本无变化,但最大工作点电压、最大工作点电流、最大功率随着被挡组件数量的增多、被挡程度的增大而增大。因此,阴影遮挡在电气参数上的体现为最大工作点电压、最大工作点电流、最大功率减少。

图2 不同短路故障条件下光伏阵列的I-V、P-V特性曲线 Fig. 2 I-V and P-V characteristic curves of PV arrays under different short-circuit fault conditions

图3 不同开路故障条件下光伏阵列的I-V、P-V特性曲线 Fig. 3 I-V and P-V characteristic curves of PV arrays under different open-circuit fault conditions

图4 不同老化故障条件下光伏阵列的I-V、P-V特性曲线 Fig. 4 I-V and P-V characteristic curves of PV arrays under different abnormal aging fault conditions

图5 不同阴影故障条件下光伏阵列的I-V、P-V特性曲线 Fig. 5 I-V and P-V characteristic curves of PV arrays under different shading fault conditions

1.3 故障特征提取

光伏阵列I-V、P-V特性曲线不同的非线性畸变,主要反映在 Uoc、Isc、Um、Im等电气特征参数的变化上,如表2所示。因此选取开路电压、短路电流、最佳工作点电压和电流作为故障特征向量,而每种故障均会导致最大功率的减少,故并未选择其作为故障特征向量。

①卜世仁冷笑道:“你小人儿家很不知好歹,也到底立个主见,赚几个钱,弄得穿是穿吃是吃的,我看着也喜欢。”(第二十四回)

表2 不同故障条件下电气特征参数变化 Tab. 2 Variation of electrical characteristic parameters under different fault conditions

类型 Uoc Isc Um Im开路故障 不变 下降 不变 下降短路故障 下降 不变 下降 不变阴影故障 不变 不变 下降 下降异常老化 不变 不变 下降 下降

1.4 特征向量的标准化转换

即使光伏阵列正常工作,由于所接受的辐照度和温度不断变化,其输出特性也会存在很大差异[14]。 因此,为了消除因辐照度和温度变化而带来的影响,本文提出了如式(1)—(4)所示的转换方法。

式中:G和T分别为光伏阵列实际接收的辐照度和温度;Uoc0、Um0、Isc0、Im0分别为标准测试条件(standard test condition,STC)下光伏阵列的参数;Uoc_n、Um_n、Isc_n、Im_n分别表示标准化后的参数值。

其目标函数Jb一般可表述为

2 基于FCM算法的故障样本聚类

式中:dik为欧式距离,用来度量第i个样本xi与第k类聚类中心的距离;m为样本特征数;b为加权参数,b∈[1,]∞。

设n个数据样本为 X =| xi ,i = 1 ,2,3...n |,把 x i分为 C个组类,计算出 C个聚类中心为V={v1 , v2 , v3 ,...,v C },并使得该分类能产生最小的目标函数值,然后计算每个数据点与聚类中心的隶属度。隶属度可以是[0,1]区间内的任意值,它要求一个样本对于各个聚类中心的隶属度总和为 1,即必须满足以下2个原则:

“医学内分泌、泌尿外科疾病数据库”建设是借助网络技术实现医学专业成果推广的跨学科工作。因此,网络技术的合理应用、技术路线的科学设计是两者有机融合的必要基础[1]。

式中:n为样本个数;C为聚类中心个数,即目标分类数;μik为样本xi对于第k类聚类中心的隶属度。

将特征向量标准化后,所有数据均为0-1之间,仅代表光伏阵列不同故障下的电气特征属性。FCM 算法通过计算欧式距离而使得划分到同一类的数据相似度最大,不同簇之间的相似度最小。因此,标准化故障特征向量可有效解决因外部环境参数变化导致 FCM 算法无法识别故障样本的困难。

这个条件是为了保证碰撞算子中关于球面的积分是存在的,从而给方程的研究带来方便.但从物理背景出发,实际上b(cosθ)有如下的一个奇点:

模糊C均值聚类算法是一种基于目标函数模糊划分的柔性聚类算法,在模糊聚类应用中最广泛且较为成功。它的思想是使得被划分到同一类的对象之间相似度最大,而不同簇之间的相似度最小。它通过迭代优化目标函数并得到每个样本点对各聚类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。因此,十分适合用于故障样本数据的智能分类。

使式(6)有最小值的目标函数表达式为

式中λ为拉格朗日乘数。

FCM 算法的输出是 C个聚类中心点向量和一个C×n的隶属度矩阵,这个矩阵表示每个样本点属于每个类的隶属度。根据这个矩阵按照模糊集合中的最大隶属原则就能确定每个样本点的分类。相比较于其他聚类算法,FCM具有以下优点:

光伏阵列3种不同的异常老化故障下的I-V、P-V特性曲线如图4所示。可见,与正常运行的光伏阵列相比,随着电阻器阻值的增加时,最大功率点到开路电压点连线斜率的绝对值、最大工作点电压和最大功率明显降低,最大工作点电流略微下降,而开路电压、短路电流基本保持不变。因此,光伏阵列异常老化故障在电气参数上的体现为最大工作点电压,最大工作点电流和最大功率的下降。

2.2.1 株高 从玉米全生育期株高调查结果看(表4),玉米生育初期不同施肥处理间株高差异不大,到中后期各处理间表现出一定差异,且各处理株高在灌浆期达到最大。其中,AO乡喜、液体氮肥2个处理植株株高值较大,复合酵素、PK处理植株株高值较小,其他处理差异不大。

“说到奢侈,怎么比得上明清时期故宫里的那一套最土豪的供暖系统——故宫火道!”我不由自主地幽幽感慨起来,当年明朝皇帝明成祖朱棣在修建故宫时,就在故宫的地下同步设计修建了四通八达的通道。而且“故宫火道”用来烧火供暖的入口都在室外,烧的材料又是名贵少烟的木炭,整个系统绝对是一流的环保工程。

1)可能会导致不确定性,这有助于在确定边界时产生更适合的结果。

2)计算复杂程度最小。当使用模糊集间隔值时,将进一步减小计算复杂程度。

不同开路故障条件下的I-V、P-V特性曲线如图3所示。可见,与正常运行的光伏阵列相比较,随着断开支路增多,光伏阵列的短路电流、最大工作点电流、最大功率逐渐下降,但最大工作点电压、开路电压保持不变。因此,开路故障在光伏阵列电气参数上的体现为短路电流、最佳工作点电流、最大功率的下降。

4)使用模糊规则的数量最少。

“乔”字是较为常见的。该字经常用于人名、地名、姓氏、植物名,如王子乔、乔山、乔吉、连乔,亦用于表达某种美好的祝愿,如乔松。该字从其本义“高而曲”开始,在共时的演变与历时的发展中,向着两条线不断的发展。一条线就是继续往着“更高”更好的方面引申,此时乔字带有褒扬的感情色彩,如乔桀、乔迁等。另一条线就是朝着“过高”过好的方向演变,其内涵是有贬低的感情色彩的,如乔人物、乔家公等。

5)断点和相似性概念的使用,使得分类更为精确且用时更短。这种量化的相似性概念使得变量的聚类与其他方法相比更有效。

FCM算法流程图如图6所示,默认情况下,ε取值为0.000 01。首先根据样本数据和预分类的故障类别数,计算各类别的聚类中心;然后计算各个数据对于聚类中心的隶属度大小;最后计算目标函数值。如果目标函数的差值ΔJ小于设定的阈值ε,则完成迭代,输出隶属度矩阵。通过比较隶属度的大小,即可完成样本数据的智能筛选。

图6 FCM流程图 Fig. 6 FCM algorithm flowchart

3 方法验证

通过仿真数据及实证平台的实际运行数据对提出的故障数据提取方法的有效性进行验证。

3.1 实证平台的搭建

图7 光伏阵列实证平台 Fig. 7 Photovoltaic array empirical platform

搭建实证测试平台如图7所示,包括:3×13的光伏阵列,组件基本参数如表1所示;高精度的水平和倾斜面辐照仪;温度传感器;IV扫描仪等。通过该平台,分别对短路、开路、阴影遮挡、异常老化4种不同的故障进行实验研究,并采集阵列运行数据。

表3 各类故障的聚类中心 Tab. 3 The cluster centers of different faults

类别 Uoc/pu Isc/pu Um/pu Im/pu仿真 实际 仿真 实际 仿真 实际 仿真 实际1(正常) 0.936 0.924 0.994 0.994 0.861 0.860 0.958 0.958 2(短路2) 0.874 0.851 0.994 0.995 0.796 0.786 0.953 0.959 3(短路4) 0.743 0.733 0.993 0.995 0.661 0.659 0.947 0.959 4(短路6) 0.584 0.577 0.994 0.995 0.512 0.514 0.966 0.959 5(开路1) 0.932 0.919 0.664 0.663 0.876 0.862 0.642 0.639 6(开路2) 0.934 0.919 0.333 0.332 0.878 0.862 0.327 0.320 7(老化2) 0.931 0.919 0.997 0.998 0.817 0.824 0.950 0.955 8(老化4) 0.932 0.919 0.995 0.993 0.753 0.747 0.912 0.920 9(老化6) 0.934 0.920 0.998 0.990 0.657 0.649 0.848 0.842 10(阴影2) 0.932 0.917 0.998 0.995 0.818 0.775 0.963 0.960 11(阴影4) 0.929 0.915 0.998 0.995 0.807 0.805 0.873 0.867 12(阴影6) 0.928 0.911 0.994 0.995 0.780 0.816 0.798 0.796

3.2 FCM聚类结果分析

图8 聚类结果误差分析 Fig. 8 Error analysis of cluster results

基于第 1.1节和 3.1节建立的仿真和实际运行数据库,通过式(1)—(4)转换后,本节使用FCM算法将样本数据划分为 12类。仿真数据库共有1476组数据,其中每种类型的故障各123组数据;实际运行数据库共有984组数据,其中每种类型的故障各82组数据。通过FCM算法得到12组数据及各组的聚类中心,如表3所示。

聚类使得被划分到同一类的数据相似度最大,而不同簇之间的相似度最小,而每一类数据的聚类中心代表着该类的电气特性。以短路故障为例,从表3可以看出,与正常情况相比,随着短路组件数量的增多,开路电压(仿真结果)由0.936 pu逐渐跌落到0.584 pu,最大工作点电压(仿真结果)由0.861 pu逐渐跌落到0.512 pu。此时,FCM算法能够有效的识别出此类故障数据。

仿真数据聚类结果的分类模糊矩阵如图 8(a)所示,红色和绿色的子矩阵分别表示分类错误和正确的样本数量。例如,目标分类为‘1’的样本的数量为123个,占总样本的8.3%。基于FCM算法聚类后,实际分类为‘1’的样本数为123个,正确率为100%。同理,目标分类为2、3、4、5、6、11、12的样本经FCM算法聚类后,分类正确均为 100%。可以看到,错误聚类主要发生于目标分类为7、8、9、10之间。有6个原属于类别7的样本却被错误的分到了类别 9,正确率为95.1%;有7个原属于类别8的样本却被分到了类别9,正确率为94.3%;最后有4个原属于类别10的样本被分到了类别7,正确率为96.7%。右下角蓝色的子矩阵表示算法整体的正确率和错误率分别为98.8%和1.2%。

实际运行数据的聚类结果如图8(b)所示,算法的聚类正确率为 97.2%。样本错误聚类主要发生于目标分类为 7、8、9、10、11、12,即阴影故障和异常老化故障之间,其主要是因为该2种故障均影响光伏阵列的最大工作点电压和最大工作点电流。

现有的工业互联网平台,尽管水平参差不齐,各有千秋,但是至少初心都是好的,都是想为工业转型升级贡献力量,顺便争取一点研发经费。

目前微信公众号后台具有数据统计的功能,在这一功能板块下,运营者可以对用户数量、用户群体类型等数据进行用户需求分析,并通过统计文章的浏览、点赞以及评论数量,这些系统反馈的数据,推算出合理的推送频次、满足用户需求的推送内容和推送形式。

环境数据监测采集系统可对PM2.5、CO2、CO、噪声、紫外线、温度、湿度7个环境指标进行数据采集,并通过特定算法得到准确稳定的信息数据,然后发送至蓝牙串口与无线串口,实现数据的远程传输,按照需要对环境进行调节.

4 结论

针对从光伏阵列的运行数据中有效提取故障样本的问题,提出了基于模糊C均值聚类算法对样本数据智能聚类的方法,通过仿真和实验得到以下结论:

1)不同的故障条件对光伏阵列的输出特性有不同的影响。开路故障主要影响光伏阵列的短路电流、最大工作点电流;短路故障主要影响光伏阵列的开路电压、最大工作点电压;阴影故障和异常老化故障主要影响光伏阵列的最大工作点电流、电压。

2)标准化故障特征向量,能有效解决因外部环境参数变化而导致 FCM 算法无法有效识别样本数据的困难。

3)该方法能简单、快速、高效的对样本数据进行聚类划分,为后期光伏阵列的故障诊断提供技术支持。

应当看到,大股东股票质押贷款的风险正在得到控制,政策效用已经开始释放,强行平仓、公司易主的风险已大幅降低。尤其是多数大股东的股权质押贷款并未用于上市公司,而是用于母公司。也就是说,爆仓并不影响上市公司本身的经营。

参考文献

[1] 孔德同,贾思远,王天品,等.基于振动分析的风力发电机故障诊断方法[J].发电与空调,2017,38(1):54-58.

[2] 张钟平,宣施超.分布式光伏设计要点分析[J].发电与空调,2015(1):10-13.

[3] 国务院办公厅.能源发展战略行动计划(2014-2020年)(摘录)[J].上海节能,2014(12):1-2.

[4] 刘保松,刘晓光,刘庆超.现行条件下我国光伏发电盈利分析[J].发电与空调,2015(1):43-45.

[5] Madeti S R,Singh S N.Online fault detection and the economic analysis of grid-connected photovoltaic systems[J].Energy,2017,134(1):121-135.

[6] 唐治平,周璐,魏超.光伏电站智能清洗模型及实例分析[J].发电与空调,2015(1):25-29.

[7] Triki-Lahiani A,Abdelghani B B,Slama-Belkhodja I.Fault detection and monitoring systems for photovoltaic installations:A review[J].Renewable &Sustainable Energy Reviews,2017,82(3): 2680-2692.

[8] Hazra A,Das S,Basu M.An efficient fault diagnosis method for PV systems following string current[J].Journal of Cleaner Production,2017,154(15):220-232.

[9] 王元章,李智华,吴春华,等.基于BP神经网络的光伏组件在线故障诊断[J].电网技术,2013,37(8):2094-2100.

[10] Yi Z,Etemadi A H.A novel detection algorithm for Line-to-Line faults in Photovoltaic (PV) arrays based on support vector machine (SVM)[C]//Power and Energy Society General Meeting,Boston,MA,USA,2016:1-4.

[11] Zhao Y,Yang L,Lehman B,et al.Decision tree-based fault detection and classification in solar photovoltaic arrays[C]//Applied Power Electronics Conference and Exposition,Orlando,FL,USA,2012:93-99.

[12] 傅望,周林,郭珂,等.光伏电池工程用数学模型研究[J].电工技术学报,2011,26(10):211-216.

[13] Youssef A,El-Telbany M,Zekry A.The role of artificial intelligence in photo-voltaic systems design and control:A review[J].Renewable & Sustainable Energy Reviews,2017,78(10):72-79.

[14] 钟天宇,刘庆超,杨明.并网光伏电站光伏组件支架最佳倾角设计研究[J].发电与空调,2013,34(1):5-7.

陆灵骍

陆灵骍,朱红路,连魏魏,戴松元,姚建曦
《发电技术》 2018年第02期
《发电技术》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号