更全的杂志信息网

基于标签分布学习森林的电价概率预测

更新时间:2009-03-28

0 引言

电价作为电力系统实行市场化运行的核心内容,很大程度上决定了市场参与者的成本与利润。发电商需要准确预测电价以便做出竞标策略,来规避风险,追求最大收益;供电企业也需要根据准确的电价预测信息来规划其在现货市场和长期双边合同中购电量的最优购买分配方案;投资者也同样需要参考准确的电价预测信息做出正确的投资决策。因此,准确的电价预测已成为电力市场各参与者共同关注的焦点[1]

然而,由于影响因素众多[2],如系统负荷需求,燃料价格,国民经济发展水平,市场参与者对电价的预期等,电价常表现出较强的波动性与随机性,使得准确预测电价的成为电力市场众多的研究难点之一。

近年来,众多学者专家就短期电价预测进行了大量的研究,尝试了多种预测模型和方法。现有的电价预测方法大致可分为两类,即市场模拟法和基于历史数据的预测方法。

通常情况下,试卷得分达标良好等级的比重不允许小于74.49%。针对这一结果,专家展开反复性评定,最终保证意见的一致性。若良好等级的标准得分率被确定成75%,而测试的满分是100分,那么良好等级标准则要设定成75分。

市场模拟法,如随机生产模拟[3-4],是通过模拟电力市场的竞争运营,来预测市场价格,但是,由于模拟法需要大量的系统、数据结构,计算量大,从而限制了其在较大电力系统中的应用,并且在进行模拟实体或环境条件实验时,难以完全表现真实情境,容易出现对知识的片面理解,从而导致实验准确度不高;基于历史数据的预测方法,如神经网络模型[5-8],支持向量机[9],时间序列法[10-13]和组合预测法[14-17]等,其特点是所需要的数据量相对较少,主要利用电价的长期历史数据来预测市场价格。在基于历史数据的概率学预测研究方面,文献[18]基于非线性分位数回归理论,利用神经网络计算概率分布,文献[19]把支持向量回归与核密度估计结合来计算概率密度函数。以上研究均未考虑时间因素的影响。文献[20]考虑到电价的时序性特点,建立自回归条件异方差模型对电价进行预测,但是对计算量较大,电价波动异常,电价序列相邻时段相关性较弱的电力市场来说,适用性较差。

本文提出了一种基于标签分布学习森林(Label Distribution Learning Forests,LDLFs)的电价概率预测模型,主要考虑负荷对实时电价的影响,与上述主要对短期电价进行点预测的预测方法相比,基于LDLFs的电价预测模型能得到实时电价的概率密度函数,它比点预测更能体现出电价的不确定性,可为发/售电提供更多的有用信息,这对电价波动异常的电力市场同样适用。该模型由一个线性模型和可微决策森林组成,以电价、时间与负荷数据做输入特征,经线性变换得到新的抽象特征,然后随机指派到分裂结点,在分裂结点的概率分裂函数下划分到左右子树,最终由叶子结点输出电价的概率密度函数。在新加坡电力市场的电价数据集上的实验结果显示,本文所提方法不仅体现了电价的不确定性,而且与其他概率预测方法相比具有较高的预测精度。

1 基本原理

1.1 标签分布学习概述

标签分布学习(LabelDistributionLearning,LDL)是一个处理分类问题中标签模糊性问题的学习框架。LDL不是为一个实例分配一个或多个标签,而是学习对于给定实例的描述中标签间的相对重要性,例如一组标签集合的分布,在人脸年龄估计、影评打分预测等任务中有了初步的应用。标签分布学习可以形式化为如下问题:

令X=Rm表示输入空间[21],Y={y1,y2,…,yc}表示完成的标签集,其中C是可能标签值的个数。那么,标签分布学习问题可以看作,对于每一个样本x∈X,都有一个标签分布这里,表示样本x属于第c个标签yc的概率,因此满足约束条件LDL的目标是学习输入样本x和它对应的标签分布d之间的映射函数g:x→d。

标签分布学习的方法包括最大熵模型及表示、Boosting和SVR扩展等方法,但是它们要么由于模型的指数部分限制了分布形式的泛化,要么在表示学习上的局限性导致无法端到端的学习抽象特征。Shen等人[22]提出利用标签分布学习森林解决标签分布学习问题,得到了很好的效果。

1.2 基于标签分布学习森林的电价概率预测模型

受到标签分布学习森林的启发,本文提出基于标签分布学习森林的电价概率预测模型,将标签分布学习中的离散标签学习问题扩展到电价概率预测领域中的连续概率密度函数问题。具体概率预测模型如图1所示。

  

图1 标签分布学习森林电价概率预测模型流程图

本模型由一个线性函数f和多个可微决策树形成的可微决策森林组成。

一颗决策树包括一组分裂节点N和一组叶子节点L。在每个分裂节点n∈N定义了一个分裂函数该函数以为参数,决定一个样本应该被放入左子树还是右子树,每个叶子节点具有一个在标签集Y上的分布为了构建一个可微决策树[23],使用概率分裂函数其中σ(·)是一个sigmoid函数,φ(·)是一个索引函数,将函数的第个输出与分裂节点n联系上,f :xRM是一个依赖于样本x和参数Θ的实值特征学习函数。

第一种为支持向量分位回归模型(support vector quantile regression,SVQR),以0.01为步长选取100个分位点分别进行训练,将训练得到的模型预测结果经统计得到电价概率密度曲线;第二种同样选取100个分位点,但在综合预测结果时采取核密度估计(Kernel density estimation,KDE)的方法;第三种采取本文提出方法,但是不包含时刻点。4种模型的电价预测结果如表1所示。

 

其中,1(·)是指示函数,分别代表节点n的左子树和右子树所拥有的叶子节点的集合,最终得到树τ的输出,即映射函数g定义为:

垦利油田群位于渤海南部海域,经多年开发,周边已建立多座平台和相应的海底管线。新油田在开发研究过程中需对周边各种依托可能性进行研究,即该稠油与周边各油田油品掺混后外输至FPSO或陆上终端储存。这就需要对各种方案开展实验,研究掺混不同油品的黏温特性。若一一开始实验,会严重影响油田的开发进程,造成不必要的人力和财力浪费。其可行的方法是研究该油田原油掺混黏度相关规律,通过计算预测掺混后黏度数据,用于依托海管的计算。

 

和其他模型相比,标签分布学习森林的优点在于整个模型从原始特征输入到电价概率输出是一个端到端的学习过程,在整个模型训练过程中无需再对数据进行处理。模型一体化学习的能力极大地减轻了工作量。

2 案例分析

2.1 数据处理与精度度量

本文以2017年新加坡电力数据集为实证研究对象。由于电价是一个时间序列,因此,本文选取前十个点的电价、负荷及时刻点作为特征来预测第十一个点的电价,采取十折交叉验证进行试验。

家乡的田野,处处都充满着生机。昔日不规则的小田已被改成方方正正的大块土地。田间的小路、山林的边沿,都开满了绚丽多彩而又不知名的花朵,有朱红的、湛蓝的、紫红的、淡黄的……一阵微风吹过,花朵们便在小草的绿色海洋中舞动。它们有的连连点头,好像在向农民伯伯问好;有的扭着身姿,宛若舞蹈家在翩翩起舞。

1、优化财政支农结构,明确支农资金重点投入领域。在确保粮食安全的基础上,财政支农资金重点向科技创新、产业融合、品牌营销、农业转型升级和绿色发展、农村电商等农商文旅融合的新产业新业态领域投入,以着力补齐农村农业发展短板,加快促进广西农业供给侧结构性改革,激发农业农村发展内生动力。

在进行预测之前,先对数据进行归一化处理以消除量纲影响:

 

式中:为第j个指标第i个样本归一化值;xij为该样本指标原始值;xj_min为第j个指标所有样本中的最小值;xj_max为第j个指标所有样本中的最大值。

由于模型得到的是电价的概率密度曲线,用之前点预测的损失函数来衡量预测误差的效果并不理想,这里采用相对熵(Kullback-Leibler divergence,KLD)方法来度量。

相对熵的一般表达式为:

 

式中:p(x)为电价的真实概率密度,q(x)为预测电价概率密度,n为样本可能标签值的个数。

柱温影响保留时间、柱效、选择性等。当温度升高时,分析时间缩短,仪器压强降低;温度较低时,仪器压强升高,保留时间延长。控制流速均为1.0 mL/min,在35,40,45,50,55,60 ℃下进行实验,探究色谱柱温度对10种酚类物质分离度的影响。结果表明,随着温度的升高,10种酚类物质的保留时间逐渐缩短。柱温从35 ℃改变至60 ℃时,10种酚类物质的保留时间从26.50 min缩短至24.275 min。色谱柱的最大承受温度为65 ℃,综合实验结果,选择60 ℃为最佳实验温度。

2016年4月,清华大学前副校长施一公教授推进教学改革,清华大学医学实验班采取的是“3+2+3”的人才培养方式,其中的“2”是该班学生出国前往与清华大学合作的海外医学院,进行为期两年的医学科研训练,这个阶段是为他们将来成为“医师科学家”所准备的。目的是培养能够解决临床疑难杂症的医学领军人才。

2.2 预测结果

[7]Zabir Haider Khan,Tasnim Sharmin Alin,Akter Hussain.Price Prediction of Share Market Using Artificial Neural Network 'ANN'[J]. InternationalJournal of Computer Application,2011.22(2):42-47

图2是3月1日到5月30日间随机抽取某一天的短期电价预测结果与真实结果概率密度曲线的对比,可以看出,在经过500次迭代后,预测曲线已经非常接近真实曲线,此时KLD=0.109014。从图3上可以明显看出,预测电价峰值总出现在真实电价周围,且相距很近,预测结果良好。

仪器:烧杯、滤纸、电子万用电炉、台式恒温震荡仪锥形瓶、漏斗、锥形瓶、500 ml容量瓶、50 ml的移液管、TAS-990原子吸收分光光度计、烘烤箱、组织搅拌机、精密ph计、电子天平、筛网、玻璃棒

  

图2 真实电价与预测电价概率密度曲线对比图

  

图3 真实电价与预测电价峰值对比图

为了更好地说明本文方法的预测效果,采用相同数据,用另外三种模型对2017年5月31日的24个时间段进行电价预测。

关于识别模型的训练方法,该方法要求制作一个足够大的单步统计特征-速度数据集。即采集不同人员在不同速度下的惯性数据,利用加速度数据峰值检测单步划分之后,将从单步惯性数据中提取的65维统计特征与该单步对应的实际速度对应,利用该数据集训练速度识别模型。采用最小二乘法(LS)分类器、支持向量机(SVM)分类器、k近邻(KNN)分类器、线型贝叶斯正态分类器(LDC)4种常见机器学习分类算法对以上数据集进行训练并验证其识别准确性,寻找其中最佳的识别方法。

分裂节点和函数f的输出单元之间的联系由φ(·)表示,在树的学习之前是随机产生的,之后,样本x落入叶子节点l的概率:

 

表1 各方法日前电价数据对比

  

SVQR KDE LDLFs(无时刻点)LDLFs(有时刻点)时间真实值0:00 1:00 2:00 3:00 4:00 5:00 6:00 7:00 8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 100.73 86.51 83.4 80.63 77.38 80.63 80.64 81.5 89.49 91.74 181.01 133.14 124.26 92.07 90.65 88.91 84.89 84.5 83.85 87.41 87.52 92.07 87.56 87.39峰值95.32 95.67 80.03 74.71 70.38 72.41 96.11 78.84 94.01 104.98 190.68 120.71 102.89 96.42 95.39 94.7 90.74 88.65 79.78 91.61 91.78 82.67 91.7 91.58相对误差-5.37 10.59-4.04-7.34-9.05-10.19 19.18-3.26 5.05 14.43 5.34-9.34-17.20 4.72 5.23 6.51 6.89 4.91-4.85 4.80 4.87-10.21 4.73 4.79绝对误差-5.41 9.16-3.37-5.92-7-8.22 15.47-2.66 4.52 13.24 9.67-12.43-21.37 4.35 4.74 5.79 5.85 4.15-4.07 4.2 4.26-9.4 4.14 4.19峰值78.65 70.86 68.53 68.55 68.51 68.50 70.86 70.87 82.67 73.23 85.03 85.10 82.68 85.03 85.04 85.11 85.10 82.67 73.23 82.67 82.68 85.03 75.59 73.22相对误差-21.92-18.09-17.83-14.98-11.46-15.04-12.13-13.04-7.62-20.18-53.02-36.08-33.46-7.65-6.19-4.27 0.25-2.17-12.67-5.42-5.53-7.65-13.67-16.21绝对误差-22.08-15.65-14.87-12.08-8.87-12.13-9.78-10.63-6.82-18.51-95.98-48.04-41.58-7.04-5.61-3.8 0.21-1.83-10.62-4.74-4.84-7.04-11.97-14.17峰值97.81 98.04 95.90 72.88 79.85 69.93 94.78 73.04 79.85 105.83 174.27 137.13 116.36 87.14 86.54 88.48 79.94 77.43 72.57 95.74 74.77 106.74 97.92 88.10相对误差-2.90 13.33 14.99-9.61 3.19-13.28 17.53-10.38-10.77 15.36-3.73 2.99-6.36-5.35-4.54-0.48-5.83-8.36-13.46 9.53-14.56 15.94 11.83 0.81绝对误差-2.92 11.53 12.50-7.75 2.47-10.70 14.14-8.46-9.64 14.09-6.74 3.99-7.90-4.93-4.11-0.43-4.95-7.07-11.28 8.33-12.75 14.67 10.36 0.71峰值103.41 83.09 94.16 72.65 71.41 71.25 71.06 72.68 96.97 95.64 173.00 126.34 134.30 85.22 83.23 92.78 78.51 87.93 86.28 93.68 90.44 91.90 96.32 76.09相对误差2.66-3.95 12.90-9.90-7.72-11.63-11.88-10.82 8.36 4.25-4.43-5.11 8.08-7.44-8.19 4.36-7.52 4.06 2.89 7.17 3.33-0.18 10.00-12.93绝对误差2.68-3.42 10.76-7.98-5.97-9.38-9.58-8.82 7.48 3.90-8.01-6.80 10.04-6.85-7.42 3.87-6.38 3.43 2.43 6.27 2.92-0.17 8.76-11.30

与其他三种方法相比,本文提出的方法对于电价波动较大的电力市场来说仍具有比较好的预测精度。同时,考虑到电价的时序性特点,本文将时间作为特征输入,事实证明,考虑时间序列的LDLFs模型能得到更好的实时电价预测结果。

 

表2 各方法日平均百分比误差比较

  

SVQR MAE 7.23 MAPE 7.62 KDE MAE 16.20 MAPE 14.85 LDLFs(无时刻点)MAE 8.02 MAPE 8.96 LDLFs(无时刻点)MAE 6.44 MAPE 7.07

3 结论

针对电力市场中电价时间序列的非平稳随机性特点,本文提出了基于标签分布学习森林的电价概率预测模型。通过对新加坡电力市场历史数据的验证,得出以下结论:

⑴ 本文方法充分考虑到了电价的时序性,将时刻点也纳入考虑范围;

⑵ 本文模型所得结果体现了电价非平稳随机性的特点,同时具有一定精度;

⑶ 本文所提方法在进行算例测试时,较对比模型取得了更好的预测效果,对一些电价波动异常的时刻点也同样适用,这说明线性函数与可微随机森林的组合算法可以较好地处理电价概率预测问题。

参考文献(References):

[1]刘丽燕,邹小燕.GARCH族模型在电力市场电价预测中的比较研究[J].电力系统保护与控制,2016.44(4):57-63

除潘云外,陈大勇不愿当“俘虏”,他和另外一个“鬼子”换了服装,和吴参谋走在一起。孔老一和缺一指刚经历了那么多事,加上一路疲惫,神情沮丧得比“俘虏”还像俘虏。

[2]刘达,牛晓东,杨光.电力市场中的电价影响因素[J].陕西电力,2009.1:9-12

[9]Yao Gao Chen,Guangwen Ma,Electricity Price Forecasting Based on Support Vector Machine Trained by Genetic Algorithm[C],2009:292-295

[8]吴兴华,周晖.基于减法聚类及自适应模糊神经网络的短期电价预测[J].电网技术,2007.19:69-73

[5]王萌,景志滨,孙兵,等.基于BP神经网络的短期市场出清电价预测[J].中国电力教育,2011.30:100-102

在虚宁寺看来,传播正能量也是寺院的责任。为了响应国家弘扬中国优秀传统文化的号召,目前,虚宁寺还计划与一些国学教育机构合作,在周末为上山的信众和游客开设免费的国学教育课,来弘扬传统文化。昆明几家中医馆也在积极加入这些传统文化活动中,定期来给香客进行免费义诊,给大家讲解一些健康养生的小常识,让更多人了解我国的传统中医养生之道。

[6]翁陈宇.基于神经网络的短期电价预测[D].西南交通大学硕士学位论文,2007.

实验采用能源市场资源股份有限公司(Energy Market Company PteLtd)在新加坡电力市场的经营数据,选取2017年3月1日到5月30日批发电价及需求负荷数据作为测试算例,每隔半个小时一个数据点,共4416个数据点。考虑到电价是个时序特征,本文将相应时刻点与星期得到独热向量,也作为特征输入,采用十折交叉验证进行了大量的预测验证工作,下面给出预测结果:

[4]Florian Ziel,Rick Steinert.Electricity Price Forecast using Sale and Purchase Curves:The X-Model[J].Energy Economics,2016.59(3):435-454

[3] H.Y Yamin.Adaptive short-term electricity price forecasting using artificial neural networks in the restructured power markets[J].International Journal of Electrical Power&Energy Systems,2004.26(8):571-581

[10]赵军.基于区域和时间序列及电价政策的电网负荷建模研究[J].华东电力,2017.9:104-105

[11]宁艺飞,陈星莺,颜庆国等.分时电价下大用户概率响应建模研究[J].电力需求侧管理,2017.19(1):22-28

[12]邓佳佳,黄元生,宋高峰.基于非参数GARCH的时间序列模型在日前电价预测中的应用[J].电网技术,2012.36(4):190-196

[13]夏君常.电力市场短期电价预测的时间序列模型研究[D].重庆大学硕士学位论文,2011.

从价值观角度去告诉员工什么该做,什么不该做,团队的用人标准和工作模式是什么样的,培养团队成员的目标感,遇到价值观不符的要及时遏制,并给予警告,不要让其存任何侥幸心理去钻制度的漏洞,提前告知防范于未然。

[14]Akash Saxena,Sinrath Lal Surana,Deepak Saini.Hybrid Approach of Addictive and Multiplicative Decomposition Method for Electricity Price Forecasting[J],2017.

[15]Deepak Sain,Akash Saxena,R.C Bansal.Electricity price forecasting by linear regression and SVM[C],2017.

[16]Abbas Rahimi Gollou,Noradin Ghadimi,Abbas Rahimi Gollou等.A new feature selection and hybrid forecast engine for day-ahead price forecasting of electricity market[J].JournalofIntelligent& Fuzzy Systems,2017:1-15

[17]牛丽肖,王正方,臧传治等.一种基于小波变换和ARIMA的短期电价混合预测模型[J].计算机应用研究,2014.31(3):688-691

但我们都知道,想要诱骗孩子的人一定不会凶神恶煞,而且都是看上去特别“友好善良”的。同时,大部分孩子被性侵都是发生在熟人之间,恰恰不是陌生人所为。

[18]何耀耀,许启发,杨善林等.基于RBF神经网络分位数回归的电力负荷概率密度预测方法[J].中国电机工程学报,2013.33(1):93-98

[19]何耀耀,闻才喜,许启发,撖奥洋.考虑温度因素的中期电力负荷概率密度预测方法[J].电网技术,2015.39(1):176-181

[20]刘丽燕.基于非参数GARCH模型的电力市场日前电价预测研究[D].重庆师范大学硕士学位论文,2016.

[21]X Geng.Label Distribution Learning.IEEE Trans.Knowl.Data Eng.,2016.28(7):1734-1748

[22]Shen W,Zhao K,Guo Y等.Label Distribution Learning Forests[C].In Advances in Neural Information Processing Systems,2017:834-843

2.4.3 供试品溶液的配制(HPIC-CD法) 取注射用硫酸核糖霉素适量,精密称定,加水溶解并稀释至含硫酸核糖霉素0.3 mg·mL-1的溶液。

[23]P.Kontschieder,M.Fiterau,A.Criminisi等.Deep neural decision forests[J].ICCV,2015:1467-1475

 
王翔
《计算机时代》 2018年第05期
《计算机时代》2018年第05期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号