基于支持向量回归的豆油期货数据分析*
1 引 言
中国的期货交易萌芽在清朝时期,随着100多年的发展,上海期货交易所、大连商品交易所、郑州商品交易所和中国金融期货交易所四家期货交易所应运而生,并且对我国期货交易产生了深远的影响.目前,我国上市的期货品种覆盖农产品、有色金属、贵金属、能源化工、金融等重要品种,而且我国已经发展成为全球第一大商品期货市场.
检索范围:BCCWJ语料库中书籍,杂志,报纸,白皮书,教科书,广报纸,Yahoo知识堂,法律,国会会议录,Yahoo部落格,韵文11类检索对象
马克思曾多次谈到精神生活的内容:“对科学的向往、对知识的渴望,他们的道德力量和他们对自己发展的不倦的要求”,“为自身利益进行宣传鼓动,订阅报纸,听课,教育子女,发展爱好等等”[2]246。精神生活可以从哲学、伦理学、心理学、社会学等多角度进行研究,现在还没有一个确定的概念。但大致上,精神生活是指人在实践中为满足自己的精神需要,精神投入和精神交流,以影响自己的精神状态和精神构建的一切活动。
2010年4月16日,随着沪深300股期货正式上市交易,期货交易成为中国股市的重要组成部分和金融市场体系的重要组成部分.对于投资者而言,期货交易具有方便的卖空机制、交易成本较低、市场流动性较高等特点.研究期货交易有利于方便人们的投资,对我国资本市场的完善发展具有重要的作用.
(2)教学内容的呈现一目了然.由于计算机技术更新速度快,网页制作几乎囊括了所有的计算机软硬件技术,使得网站类课程的教学内容包罗万象,一本教材无法覆盖课程教学的所有知识点,因此网络学习平台在教学内容的组织上,考虑网页元素相对不变的思路,采用网页元素按目录结构的形式组织章节内容,并按顺序排列,便于学生课内和课外的学习,实现课内知识与课外知识的无缝衔接,同时教师团队以网络学习平台为桥梁和纽带开展协同工作,促进课程建设的深入开展.
近年来,期货市场呈现出健康快速的发展状态[1],随着科学技术的发展,人们对期货市场的研究也越来越深入.文献[2]运用多元回归分析大豆期货价格,并探求对大豆价格的影响因素.文献[3]运用粒子群算法得到最优的支持向量机核函数,并对近期价格做了相关的预测.文献[4]引用了多种时间序列模型预测期货数据,得出了Garch模型最适用的结论.于航[5]使用支持向量机模型预测价格变化趋势,与传统的预测具体数值不同,在一定程度上提高了预测的准确性.本文使用支持向量回归来研究豆油期货的数据,并由当天的数据预测下一天的数据,实验表明SVR对短期预测具有较好的效果.
2 支持向量回归(SVR)模型建立
支持向量机(SVM)是在1995年由Cortes和Vapnik[6]等人提出,是一种具有核函数和解的稀疏性的特点的特殊的算法.SVM建立在VC维理论和结构化最小原则上,建立了一个函数使误差最小化,有效的避免了过度拟合的问题.在分类(SVC)的情况下,试图寻找一个最优超平面分开两类.在回归(SVR)的情况下,则是建立一个尽可能多地接近数据点的超平面[7].
设给定的训练样本为:{(x1,y1),…,(xn,yn)}∈Rn×R,在SVR中,线性回归的目标是找到一个函数f:Rn→R:
普通外科Ⅰ类(清洁)切口手术主要感染病原菌是葡萄球菌,包括金黄色葡萄球菌和凝固酶阴性葡萄球菌 ,我院反复强调选择广谱、疗效确切、安全及价格相对较低的第一代头孢菌素作为预防用药。干预前后用药种类均以一代头孢居首,预防用药种类选择上较为合理。但干预前也存在使用三代头孢、喹诺酮类药物的不合理现象,第三代头孢对肠杆菌科细菌等革兰阴性杆菌有较强的抗菌作用,用于预防清洁手术切口感染不合理,喹诺酮类药物于大肠杆菌中耐药率较高,并且易产生交叉耐药现象,预防用药不具备优势。
f(x)=<w,x>+b,w∈Rn,b∈R.
使其满足下列的优化问题:
其中,ε>0表示线性近似的参数.
实际问题中更多的是非线性回归,处理方法是将数据通过映射φ映射到高维空间,然后在高维空间中进行线性回归,对涉及的内积运算用核函数代替.在此,误差存在是允许的.这里引入松弛变量损失函数采用ε-不敏感函数,定义为:
可以得到如下优化问题:
期货成交量是指某一期货合约在当日成交合约的双边累计数量,单位为“手”.
其中α,α*≥0,约束为:
将该问题转化为对偶形式:
通过求解该二次规划问题得到α和α*的值,可以得到最后的回归方程为:
1.1.2排除标准 (1)合并心衰以及恶性肿瘤者。(2)存在精神疾病、听语障碍者。(3)配合度、依从性较差者。
3 期货指标变量选取
有效的判断一个期货的价格走势,最直接方法就是观察其各项指标走向,为此,选取了开盘价、收盘价、成交量、移动平均线(MA)、随机指标(KDJ)、能量潮(OBV)6个指标来进行实验.指标介绍如下:
1)开盘价
开盘价,又称开市价,由集合竞价产生,是某种期货在每个交易日开市后的第一笔买卖成交价格.
OBV指标就是发现热门股票、分析股价运动趋势的一种技术指标。它是将股市的人气——成交量与股价的关系数字化、直观化,以股市的成交量变化来衡量股市的推动力,从而判断股价的走势.
收盘价是当日期货在交易所一天交易活动结束前最后一笔交易的成交价格.
3)成交量
设计建筑电气时,不能忽略供水系统、电梯、空调及通风的用电量。选择的电梯,其型号、功率应与其电机驱动相互匹配,并应尽量安装在小机房内;通风设计,应结合风机等设备的参数,在考虑电能不同的需求量的情况下,选择性价比相对较高且合适的设备;优化空调系统节能时,应充分考虑其功率高、耗电量大等特点,选择环保、节能的水源热泵式空调,因为其污染小且运行效率高,使用空调时,应设定合理的工作模式,以避免过度损耗电能;设计供水系统时,选择的供水设备应无负压作用,因为其节能环保并能净化水质。
4)移动平均线(MA)
移动平均线指某一段时期的收盘价之和除以该周期.按时间长短分类,常用的有5日,10日,30日均线.
5)随机指标(KDJ)
当日D值前一日D值当日K值.
指标KDJ的计算较为复杂,首先要计算周期(n日,n周等)的RSV值(未成熟随机指标值),然后再计算K值,D值,J值.以日KDJ数值的计算为例,其计算公式为:
本病的治疗,包括基础治疗(排便习惯的训练、合理饮食、足量饮水、增加活动量、心理行为治疗),药物治疗(如泻剂、肠动力剂、微生态调节剂、中药),以及生物反馈治疗。药物治疗可分为两个步骤:首先解除粪块嵌塞,避免患儿再次进入粪便潴留和排便恐惧的恶性循环;然后立即启动维持治疗,使粪便松软、保证每次排便无痛苦,便于患儿做出自主排便的选择[4]。
若无前一日K值与D值,则可分别用50来代替.
当日K值前一日K值当日RSV,
随机指标广泛用于期货市场的分析,是综合了动量观念、强弱指标及移动平均线的优点,用来度量股价脱离价格正常范围的变异程度的一个指标.
式中,Cn为第n日收盘价;Ln为n日内的最低价;Hn为n日内的最高价.RSV值始终在1~100间波动.其次,计算K值与D值:
6)能量潮(OBV)
2)收盘价
4 实证分析
选取大连商品交易市场中的豆油指数(YL9)数据,选取时间段为2014.05.26~2017.10.24,共835个数据(见图1).选取开盘价、收盘价、成交量、移动平均线、随机指标、能量潮6个指标,利用前一个交易日的6个指标数据预测下一个交易日的开盘价.
图1 选取的数据的开盘价
运用R语言程序,选用e1071程序包进行实验。为了消除指标间的量纲性,先对数据进行归一化处理,变换形式为:
其中,xi表示需要归一化的数据列中的第i个值,xmax 表示每项数据中的最大值,xmin 表示每项数据中的最小值.
几个月前,英的子宫就开始有白色或血色排液,稀薄如水,她伸手触摸,感觉一丝一丝的黏稠。英起初并没有当一回事,或缘于难以启齿的私密,她选择埋在心底,要知道,村里的赤脚医生是自己的侄子辈。她不好意思也不敢和老头子说,她不好也没机会和女儿说,因为她们要么在外面打工,要么在城里带孩子,她不可能也不会和儿子儿媳说。英为自己不争气的子宫,为刘家传宗接代的子宫,现在满目疮痍的子宫,开始坐立不安。她每天照常洗衣做饭,挑水砍柴,料理屋前那一畦菜地,直到自己突然倒下。
将随机选取的835个数据分为两部分,第一部分为815个数据,作为训练样本;第二部分为20个数据,作为测试样本.运用e1071程序包中的tune.svm语句,并经过交叉试验可以得到核函数中的最优参数为σ2=0.0625,C=2.常用的误差指标有平均绝对误差与均方误差,其公式为:
在完成一学年的教学实验后,为了解教学效果和可行性,笔者对参加实验的201位学生进行实验后问卷调查和随机抽样访谈,结合课堂观察记录和学生作业情况,总结如下:
当你要切东西或者钻洞的时候,可能会用到楔子。它有时是圆圆的、尖尖的,像图钉一样;有时是长长的、薄薄的,像刀一样。
其中,N代表了样本的个数,xi代表了样本的真实值,代表了样本的预测值,结果如表1所示.
表1 回归结果
MAEMSE[0,1]区间0.00030440483.024761e⁃06返回原值0.59176311.43098
并做出其拟合图像,用来体现原始数据和预测数据的相关程度,如图2和图3所示.
交易日天数/天
图2 归为[0,1]区间的拟合结果
交易日天数/天
图3 返回原值的拟合结果
5 结 论
本文选用豆油期货近期850个数据进行实证分析,采用支持向量回归方法进行建模,结果显示MAE和MSE的数值较小,表明SVR在豆油期货预测中具有可行性,可以判断一定时期内的开盘价走势,对短期内的交易有一定的参考作用.实验中核函数的参数选取对结果有显著的影响,论文采用交叉实验的方式选择最优参数.期货商品大多数为农产品、金属和能源,在长期的交易内,不排除GDP、通货膨胀等经济因素的影响和气候等自然因素的影响,所以SVR在长期预测中还有待深入研究.
参考文献
[1] 宋承国.中国期货市场的历史与发展研究[D].苏州:苏州大学社会学院,2010.
[2] 高昂,范雯娟,陈皓.我国大豆期货变动因素的多元回归分析[J].中国物价,2008(6):10-13.
[3] 赛英,张凤廷,张涛.基于支持向量机的中国股指期货回归预测研究[J].中国管理科学,2013,21(3):35-39.
[4] 孙德山,钱程,韩国涛. GARCH类模型在我国期货市场预测中的应用研究[J].辽宁师范大学学报,2012.03,35(1):4-8.
[5] 于航.基于支持向量机模型的股指期货高频交易策略研究[D].北京:北京理工大学数学与统计学院,2015.
[6] CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20(3):273-297.
[7] MARIETTE A, RAHUL K. Support Vector Regression[J]. Neural Information Processing Letters & Reviews, 2007, 11(10):203-224.
SEQ2SEQ模型的目标是给定输入序列最大化预测序列概率的过程,该方案包括2个SEQ2SEQ 模型,他们都是完全端到端的模型,通过梯度下降的方式更新参数训练模型。给定若干(1个batch)学习实例,目标函数为最小化,如式(7):