更全的杂志信息网

基于大数据简约及PCA改进RBF网络的短期电力负荷预测

更新时间:2009-03-28

1 引 言

随着智能电网发展,电力工业产生大量结构多样、来源复杂的数据,电力负荷数据呈指数级增长,复杂程度增大,逐步构成了电力负荷大数据[1,2]。本文提出基于最小绝对值收敛及选择(least absolute shrinkage and selection operator,Lasso)算法,对电力负荷及相关天气因素大数据进行高维数据简约和降维,剔除坏数据,获得有用数据集对电力负荷进行预测[3,4]

涉河建设项目管理必须走出仅注重审批环节的管理模式,要按照新的管理办法要求,全面实施涉河事项的监管。监管主体实行属地管理原则,所有涉河项目涉河事项(包括市级以上审批)的监督管理工作均由当地水行政主管部门负责。为体现分级管理原则,重庆市水行政主管部门已委托市河道管理站负责市级以上水行政主管部门许可的涉河建设项目的监督管理工作,但其监督管理内容只是部分监管,必须坚持区县属地监管为主、河道管理部门监督为辅的基本原则,做好河道涉河建设项目监管工作。

预测模型是电力负荷预测的关键。其中人工神经网络(artificial neural network,ANN)方法在负荷预测中的应用越来越广泛,现有的ANN方法一般采用BP神经网络,然而其学习收敛速度较慢,易陷于局部极小点,以至于极大地限制神经网络方法在负荷预测中的实际应用;径向基函数(radial basis function,RBF)网络在一定程度上却能克服这些问题,其逼近能力、分类能力和学习速度均优于BP网络。因此,在电力负荷预测中,RBF网络具有更广阔的应用前景[4~6]

影响电力负荷预测的气象因子较多,容易造成输入空间严重自相关及网络维数较高,影响RBF神经网络的计算效率和预测精度[7,8]。对此,论文提出一种基于主元分析(principal component analysis,PCA)的改进RBF神经网络预测方法对多天气影响因素的电力系统短期负荷进行预测分析。采用PCA技术将多个气象因素进行数据降维预处理,获得新气象特征数据,解决神经网络建模时输入量过多导致效率下降的问题。

“真”的另一方面是创设情境必须有用。情境创设与新课导入不同,它是教师课堂教学活动的平台,是学生开展自主学习,合作探究的有效载体,是贯穿整个课堂的教学主线。因此,情境创设要对整节课堂的教学内容有直接的作用,学生能依据情境去发现问题和解决问题。

2 基于Lasso原理的数据简约和变量选择

常数项和回归系数的Lasso估计定义为:

传统粉彩人物瓷画最早出现在清朝雍正时期,而现代粉彩人物瓷画起始于二十世纪八十年代中期。正是受到“八五”美术新浪潮的冲击,这个时期的传统粉彩人物瓷画虽然出现短暂的恢复期,但是也逐渐开始由传统粉彩艺术向现代粉彩艺术的转型。当代粉彩人物瓷画虽然已经发展成熟,但还是相比现代山水和现代花鸟瓷画显得单薄。但不可否认的是,粉彩人物瓷画也在稳步进入现代发展阶段,艺术风格的现代特性已经逐渐形成。

运用Lasso方法,需要对数据进行中心标准化处理,以消除不同指标量纲的影响。

即,对于线性模型:

y=α+β1x1+β2x2+…+βpxp+ε

(1)

(3)确定主元个数,计算主元贡献率和累计贡献率。

将设施园艺景观发展为农业旅游后,要根据游客的一些需求开展景观的规划工作,划分好景观区域。休闲娱乐设施是必不可少的一部分,设计师需要考虑互动以及体验式项目的位置安排,将景观与这些体验式项目设施结合在一起,让游客们在参观景观的同时,能够比较方便地参与到体验项目中,从而感受家庭庭院的乐趣[3]。同时,设计师还需要考虑设施园艺景观的展示区域,使设施园艺景观通过展示被更多的游客所了解。设计师需要在设施园艺景观的布局以及美观设计上面花费更多的精力,要让游客在欣赏设施园艺景观的同时,能够发现自己喜欢的产品,刺激游客消费。

Lasso方法通过构造一个惩罚函数获得一个精炼的模型,最终通过确定一些指标的系数为零,实现了指标集合精简的目的。通过添加约束条件对模型系数进行压缩,将没有影响或影响较小的自变量的回归系数自动压缩到零,这不仅在一定程度上能消除多重共线性的影响,而且在对参数进行估计的同时也实现了对变量的选择,得到解释力较强的模型[2]

皮肤中的黑色素分为优黑素(真黑素)和褐黑素,优黑素为黑色或暗棕色不溶聚合物,褐黑素为红、黄色含硫可溶性聚合物。褐黑素在黑色素细胞内合成,形成成熟的黑素小体,沿微管、微丝运动被运输到黑素细胞的树突上,通过胞吞作用至周边的角质形成细胞中[10]。在角质形成细胞分化过程中,黑素小体被酸性水解酶降解,最终随角质层脱落而排出体外[11]。陆洪光等[12]研究不同肤色人种皮肤角质层细胞黑素颗粒颜色区别,结果表明白种人角质层细胞中黑色素外观呈淡红、黄红或红棕色,而黄种人和黑种人角质层细胞中黑色素外观呈棕色、棕黑或黑色,该研究也表明了不同人种皮肤优黑素和褐黑素含量水平的 差异。

(2)

式中:这里s≥0是调和参数。

(1)数据标准化,将原始数据指标标准化为[0,1]之间的有效数据。

3 PCA改进RBF网络的预测模型

3.1 RBF神经网络

与BP网络同属前馈神经网络的RBF网络在逼近能力、分类能力和学习速度等方面均优于BP网络[6,11]。图1为以我国西南某地震预测的RBF网络训练过程曲线[11],RBF网络仅用5步即达到1%的预测精度,充分表明RBF网络收敛速度快的特点。

推进国家地面气象观测站无人值守工作是加快观测自动化,促进业务提质提效的重要举措。[1]为达到无人值守的目标,必须要改变以往以观测员为主的观测模式,要最大化的利用计算机完成常规的观测工作,把观测员定位成应急和决策的角色,快速应对突发情况,快速排查故障过程。[2]无人值守的情况下可以更加合理的安排业务人员的工作,使业务运转更加协调,进一步解放观测员,推动观测工作的规范化和现代化,达到一人多岗,一岗多责的目的。

RBF神经网络中常用的径向基函数是高斯函数,因此径向基神经网络的激活函数可表示为:

 

(3)

式中:为欧式范数;为第p个输入样本,p=1,2,…,P,P为样本总数;ci为网络隐含层节点的中心;σ为高斯函数的方差。

由径向基神经网络的结构可得到网络的输出为:

 

(4)

式中:ωij为隐含层到输出层的连接权值;i=1,2,…,h,为隐含层的节点数;yj为与输入样本对应网络的第j个输出节点的实际输出。

RBF网络是一种典型的局部逼近神经网络,只有少数几个权值影响网络的输出,在训练时也只有少数权值需要进行调整,从而使得RBF网络的学习速度大大提高[6,9~11]

  

图1 RBF网络训练过程误差曲线

3.2 基于PCA改进RBF网络

为避免将天气因素引入预测模型的弊端,通过采用PCA方法对原始输入量进行数据预处理,消除变量相关性,剔除冗余数据,实现输入量从高维到低维的简化;低维变量作为输入引入RBF网络,从而有效避免输入空间严重自相关及网络维数较高,造成难以通过控制神经元的分布来覆盖整个输入空间不良结果,最终提高RBF神经网络的计算效率和预测精度。改进RBF网络的结构如图2所示。

  

图2 改进的RBF网络结构图

PCA是一种多元统计分析方法。该方法通过构造原变量的一系列线性组合形成新变量,使这些新变量在彼此互不相关的前提下尽可能多地反映原变量的信息。数据信息主要反映在数据变量的方差上,方差越大,包含信息越多,通常用累计贡献率来衡量[7,9]。主元在代数上是p个随机变量X1X 2、…、XP的线性组合,其几何意义是对原空间用新的坐标系重新表示。新坐标系的坐标轴代表数据变异性最大的方向,并提供一个对协方差结构较为简单但更为精炼的刻画。

假定一p维随机矢量X=(X1,X2,…,Xp)有n个样本。当p较大时,研究问题会随着变量个数的增大而大大增加分析计算的难度和复杂性。为了克服这一困难,经过PCA进行降维处理,求得其主元Yi(i=1,2,…,m;mp)。具体过程如下:

βj的最小二乘估计,s<s0时,模型中回归系数的Lasso估计的绝对值就会小于其最小二乘估计的绝对值,随着s的进一步减少,某些系数的Lasso估计值会很小,甚至等于0。这些估计值为0的系数所对应的变量将会被删除,从而达到变量选择的目的。例如,当s=s0/2时,模型中的非零系数的个数从p个大约减少到p/2个;当ss0时,Lasso估计就是最小二乘估计,所有的变量均被选入模型中,将不再具有约束作用。对于参数s的估计方法,主要有交叉验证法和广义交叉验证法。

(2)建立相关矩阵R,并计算其特征值和特征向量,即

干旱是在全球气候变化和人类活动双重驱动下,水资源—经济社会—生态与环境复杂系统极值缺水过程在不同时空尺度上的综合体现。按受旱机制分类,干旱分为:气象干旱、水文干旱、农业干旱和经济社会干旱。按受旱成因分类,干旱分为:资源型干旱,即干旱区降水量稀少,土壤缺水,不足以满足人的生存和经济发展的需求;工程型干旱,即缺少水利工程的开发调度;政策型干旱,即非理性的水资源分配;结构型干旱,即水质水量达不到用水要求;布局型干旱,即追求经济社会快速发展情势下的水土资源不匹配;管理型干旱,即水资源得不到高效利用和有效调配,缺少全局可靠规划与应对策略;复合型干旱,即多种因素综合作用下的干旱。

R=X*TX*/(n-1)

(5)

式中:X*为标准化后的数据矩阵。求得自相关矩阵R的特征值λ1λ2≥,…,≥λp≥0;然后分别求出对应于特征值λi的特征向量ei(i=1,2,…,p)。

式中:α为常数项;β1β2,…,βp为回归系数;ε为随机扰动项;(xi1,xi2,…,xip;yi),i=1,2,…,n是变量的n组观测值,需满足其中j=1,2,…,p

贡献率为:

 

(6)

累计贡献率为:

 

(7)

选取主元的个数取决于累计贡献率, 通常累计贡献率大于85%~95%对应的前m个主元便包含p个原始变量所能提供的绝大部分信息。

(4)计算主元样本值

根据式(8)计算出各主元:

色彩元素有两个分类,直接城市色彩与间接城市色彩,直接城市色彩指对天津滨海新区具象的城市色彩元素进行提炼;间接色彩指通过对能够表现天津符号的抽象元素进行视觉分析而得到的具有代表性的色彩。根据自然环境及城市发展理念,天津滨海新区的色彩可以概括为蓝色、白色、浅灰色。

 

(i=1,2,…,m)

(8)

当网络维数较高时,通过控制神经元的分布以覆盖整个输入空间是比较困难的,即使在神经元能够覆盖整个输入空间的情况下,控制神经元之间的重叠程度也很困难,这就会造成不必要的误差。RBF网络引入PCA,分析输入空间的各主元的贡献率并以此来确定RBF网络的输入空间,最终通过原输入空间各矢量的线性组合表示原输入空间,由于主元之间相互独立,由各主元组成的新输入空间不存在相关性,从而有效地简化了RBF网络在高维时难以寻找网络中心的问题,提高了预测精度,有效提高预测效率。

4 电力负荷预测实例分析

4.1 电力负荷预测模型建立与步骤

基于Lasso特征选取及改进RBF网络电力负荷预测步骤如下:

(1)采用Lasso算法对电力负荷及相关天气因素大数据进行高维数据特征提取,简化数据结构,挖掘有效数据集,有效提高计算效率。

(2)将提取的天气因素数据集经PCA处理,得到少数不相关天气特征变量,进一步简化预测过程;同时为避免数据的范围较大,导致神经网络输入的影响产生偏差、收敛慢的问题,需对天气特征变量及电力负荷数据进行归一化处理;将归一化结果数据作为建模对象,建立预测模型,包括隐含层基函数的选取,层节点数(输出层节点数应与输出量个数相同)的确定等。

(3)设定训练参数进行训练,完成训练后,调用训练结果,输入测试数据,进行测试。

(4)得到目标测试数据,进行反归一化,还原为原始范围数据;将预测数据与实际数据进行对比及误差分析。

4.2 电力负荷预测实例分析

本文采用美国南部某地区的某年1月1日~1月 8日时间段内的日负荷及相关天气因素数据进行预测分析[12~16],经Lasso数据简约得到192个点负荷数据及7个与天气因素(SO2浓度X1、降水量X2、温度X3、风速X4、湿度X5、云量X6、气压X7)有关的主元。改进的RBF网络预测方法首先采用主元分析对该时间段内的7个天气因素进行数据预处理,具体数据处理结果见图3。

  

图3 数据处理结果

图3(a)中,各主元对应的贡献率依次减小,前3个主元的贡献率分别为41.67%、22.73%、20.89%。由图3可以看出:前3个主元的贡献率占主要部分,累计贡献率大于85%。根据贡献率大于85%的原则选取新因子,选择前3个特征值并计算相应的特征向量及主元样本值,作为新气象特征量。PCA得到的以上天气特征量及历史负荷共同作为建模对象,建立预测模型进行预测。在RBF网络的训练及测试过程中,扩展系数spread对精度的影响较大:当spread选择不合适时,误差很大。取不同的spread值计算网络的预报精度确定最佳的spread,不同spread对应的网络逼近误差曲线见图4。

  

图4 不同spread网络逼近误差曲线

由图4可知,spread=0.6时,网络的逼近效果最好,因此,可将spread的最佳值设定为0.6。同时采用传统RBF网络预测方法和BP网络预测方法进行负荷预测,3种方法进行效果对比,预测结果和预测误差分别如图5和图6所示。

这倒提醒了柳红。刚才她的大脑突然跳闸,现在终于恢复了思维,想起自己为什么穿梭这片状况很不一般的玉米地,忙便朝苏秋琴背后的方向指了指:“我去抓小偷!我去抓小偷!”就拔腿跑了,跑得跟个小偷似的。

  

图5 3种方法预测结果图

  

图6 3种方法预测误差图

由图5可知,改进预测方法得到的预测曲线更接近实际负荷曲线,说明预测值更接近真实值;由图6可知,改进预测方法的预测误差曲线在1%附近波动,而传统RBF网络预测方法误差较大,BP网络预测方法误差最大,说明改进预测方法具有更高的精确度。

为了进一步从数值上说明改进模型的优越性,对24个整点时刻的预测误差进行分析,结果见表1。从表1中各方面来看,改进预测方法的预测误差大都在1%以下且全部均在3%以下,相比于BP网络预测法及原始RBF网络预测法,预测精度明显提高。

 

表1 预测误差分析 (%)

  

相对误差BP网络RBF网络改进RBF网络≤12545 887 5≤370 8100100≤591 6100100

5 结 论

Lasso算法有效解决智能电网大数据给电力负荷预测带来的难题,剔除坏数据,实现高维数据特征选取;PCA改进的RBF神经网络将多天气因素进一步简化数据结构和降维,提取天气因素特征量,有效提高模型的计算效率和预测精度,同时,有效避免局部极小的问题,提高网络的收敛速度。实例预测分析结果证明本文方法能更加全面、有效地解决电力负荷大数据难题,明显提高电力负荷预测的精度及效率。

任务的复杂度和难易度的把握决定学生是否能够顺利通过任务完成过程,巩固知识和技能,并让学生对系列任务保持兴趣。Carla&Gerard发现按照在现实生活中有序呈现的信息会比无序呈现的信息更容易理解和掌握,[3]因此汽车英语任务的设计严格按照工作过程的发生来进行。另一种解决方式是降低任务难度不一定就是简化输入信息,还可以通过把任务分解成系列难度系数不一的子任务来完成。[4]比如,一项“买一辆新车”的情景任务可以包括以下几个子任务。

(2)监理单位应该对施工单位的各项操作过程进行规范和完善,监督施工单位能够更好的执行和落实各项操作规程。施工单位项目经理为第一负责人的质量保证体系,使监督管理和施工管理的网络能够得到完善。监理工程师在对现场进行检查的时候,发现问题应该及时的解决,避免错误的累积。

[参考文献]

[1] 钟清,孙闻,余南华,等.主动配电网规划中的负荷预测与发电预测[J]. 中国电机工程学报,2014,34(19):3050-3056.

[2] 宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,37(4):927-935.

[3] 王金甲,陈春,洪文学.基于序lasso的时间序列分析方法[J].燕山大学学报,2015,39(1):30-34.

[4] Hor C L, Wajithia S. Analyzing the impact of weather variables on monthly electricity demand[J].IEEE Transactions on Power Systems,2005,20(4):2078-2085.

[5] 张淑清,赵朋程,陈颖,等.基于EEMD和关联维数的小电流接地故障选线[J].计量学报,2016,37(3): 300-305.

[6] Lei S L, Sun C X, Zhou Q, et al. Short-term load forecasting method based on RBF neural network and ANFIS system[J].Proceedings of the CSEE,2005, 25(22):78-82.

[7] 李冬辉,王乐英,李晟.基于PCA的空调系统传感器故障诊断[J].电工技术学报,2008,23(6):130-136.

[8] 刘荣,方鸽飞.改进Elman神经网络的综合气象短期负荷预测[J].电力系统保护与控制,2012,40(22): 113-117.

[9] 周松林,茆美琴,苏建徽.基于主元分析与人工神经网络的风电功率预测[J].电网技术,2011,35:128-132.

[10] 王惠新,王玉田,黄满义,等.基于双树复小波及递归图的管道泄漏定位方法[J].计量学报,2015 ,36 (6):617-621.

[11] 贾明兴,赵春晖,王福利,等.基于RBF神经网络的非线性主元分析方法[J].仪器仪表学报,2008,29(3): 453-457.

[12] 毛李帆,姚建刚,金永顺,等.中长期电力组合预测模型的理论研究[J].中国电机工程学报,2010,30(16):53-59.

[13] 张淑清,董璇,翟欣沛,等.基于EEMD和混沌的信号特征提取方法及应用J]. 计量学报,2013,34(2):173-179.

[14] 何群,赵文爽,江国乾,等.基于EEMD与AR建模的风电场风速预测[J]. 计量学报,2015, 36(2):181-186.

[15] 张淑清,任爽,姜安琦,等. PCA-GRNN在综合气象短期负荷预测中的应用[J]. 计量学报,2017, 38(3): 340-344.

[16] 焦润海,苏辰隽,林碧英,等.基于气象信息因素修正的灰色短期负荷预测模型[J].电网技术,2013,37(3):720-725.

 
张淑清,任爽,陈荣飞,钱磊,姜万录,李盼
《计量学报》 2018年第03期
《计量学报》2018年第03期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号