更全的杂志信息网

基于高斯核支持向量机的商品期货市场套利研究*

更新时间:2009-03-28

1 引 言

目前,进行商品期货套利时使用比较普遍的方法是均值回归套利方法和机器学习套利方法两大类.顾全和雷星晖[1]选取大连商品交易所豆油、大豆和豆粕期货主力合约收盘价,建立误差修正模型,证明三者之间存在协整关系,可使用均值回归模型进行套利.Han和Liang等[2]运用向量误差修正模型以及结构向量自回归模型对芝加哥商品交易所和大连商品交易所大豆商品期货进行跨市场套利研究,实证结果表明国内外两个市场上的大豆期货价格存在长期稳定的协整关系,投资者可以进行跨市场套利.覃良文和唐国强等[3]使用协整-GARCH模型对沪铜期货进行跨期套利研究.

随着机器学习方法的普及,其在金融工程上的应用越来越多.Wiles和Enke[4]运用神经网络模型对大豆及其压榨品豆粕、豆油价差的短期波动进行预测,认为可以根据远期合约和近期合约价差之间的协整关系进行套利.靳朝翔和梁仁方[5]等基于神经网络模型对焦炭、铁矿石和螺纹钢进行跨品种套利研究,认为NAR动态神经网络套利效果明显优于传统的套利方法.Chen和 Shih[6]采用了BP神经网络与支持向量机对多个亚洲指数进行预测,得到后者相比于神经网络具有更高的预测准确度.目前应用支持向量机模型[7]进行棉花期货套利的研究很少.因此,本文实证分析部分使用MATLAB软件为工具,利用高斯RBF核函数,并使用多项式核函数作为对比,构建支持向量机套利模型.

2 支持向量机模型

2.1 支持向量机

SVM最初是用于数据分类的一种监督学习算法[8],目标是创建一个平安边界,称为一个超平面,使得任何一边的数据划分都很均匀.

④治疗性诊断。过去多数学者对该病诊断性神经阻滞方法是:在颈部第二横突尖部给予消炎镇痛药做试验性治疗,若注射后疼痛迅速缓解,或消失,有助于确立诊断。

假设训练样本集x1,y1,…,xn,ynxi,yiR,则SVM回归模型的线性回归函数方程是:

f(x)=ω·x+b

(5)土的不排水抗剪强度Su与土的破坏模式、土体的非均质性、应变速率和应力历史等有较大关系。根据参数对比,旧路基不排水抗剪强度Su更大。

(1)

 

s.t.yiωTxi+b≥1,i=1,…,n

本研究存在一些不足:样本量偏小,影响统计结果;sEMG的结果可能受到皮肤表面电阻的干扰。未来进一步研究,课题将加大样本量,探索应用功能磁共振(fMRI)研究低频rTMS联合EMGBFT治疗时脑卒中患者皮层兴奋性的改变。

(2)

3.2.2 支持向量机预测模型训练

吃晚饭的时候,牛皮糖回了一趟家。他本来是在工地吃饭,但想到夜里寒冷,打算回去拿两件衣服。人还未进门,老婆就兴高采烈来报喜。牛癫子牛癫子,村长送钱来了,一大包呢。

2.2 非线性核函数

在许多实际应用中,变量之间的关系是非线性的.支持向量机的一个关键特征是能够使用非线性核函数的方法将将样本从原始空间映射到一个更高维的特征空间,使得样本在这个空间内线性可分.

核函数相当于把原来的分类函数:

高龄STEMI患者与普通成年STEMI患者比较,其各脏器的生理功能均有着不同程度的衰减或障碍,多数患者均合并多种疾病。由于人口的老龄化现象严重,我国的高龄STEMI患者发病率明显升高[2] 。

其中,R2=0.9458,括号中的数字为t统计量,从各个系数的t统计量和拟合优度R2来看,模型的拟合效果很理想.

(3)

映射为:

多项式核函数如公式(6)所示,次数为d的多项式核函数添加了一个简单的非线性数据变换.高斯RBF核函数如公式(7)所示,类似于RBF神经网络,对于许多类型的数据都运行得很好,是许多学习任务的一个合理的开始.其适用于低维度数据、高维度数据以及小样本、大样本等不同情况,具有较宽的收敛域,这些特点使其成为理想的分类预测方法,将样本在经过映射后的特征空间中线性分开的能力更强,再加上还具有较好的差值能力,能够很好的提取样本的局部性质.在确定参数误差惩罚因子c时,取值范围一般为(0,100] ,用于调节学习置信范围和经验风险的比例,以增强其推广能力.本文采用网格搜索法对最优参数进行搜素,确定最优惩罚参数c以及最优核函数参数g,最佳的[c,g] 能够有效提高支持向量机模型的分类和预测能力.

(4)

其中α由以下方法获得:

为保证线性方程的平坦,需寻找一个最小的 w,因此采用最小化欧几里得空间范数.假设所有的训练数据可以在精度ε 下用线性函数拟合,那么寻找最小w的问题可以表示为一个凸优化问题:

(5)

因此可知,选择合适的核函数能简化映射空间中的内积运算.核函数的引入灵活巧妙地避开了高维空间复杂的数学运算,使得支持向量机可以在样本不充足的情况下,有效处理高维特征空间中的问题.

本文使用的核函数包括:

(ⅰ)多项式核函数

K(xi,xj)=xi·xj+1dd≥1,

利用Solidworks 2012软件建立挖沟机的三维仿真分析模型,其基本参数:挖沟机原理样机质量为2 000 kg,长度Lmax=4 532 mm,宽度Wmax=1 485 mm,高度Hmax=1 540 mm,车轮直径为R=304.8 mm.根据上述参数建立仿真分析模型如图3所示,该三维模型的外形尺寸、质量分布等均按原理样机实际参数设定,同时,考虑到车轮与接触地面情况比较复杂,选择沙石简易铺装路面为模拟地面,即挖沟机在仿真运行过程中为刚性地面相互作用,在高低不平的地面行走时车轮与地面具有一定的冲击.

(6)

(ⅱ)高斯RBF核函数

(7)

徐韫哲,石家庄市友谊大街小学语文教师,石家庄市骨干教师、优秀班主任、小学教学改革先进个人、语文学科名师。十四年的教学中,她坚持阅读与写作培养学生语文实践能力,始终如一地陪伴孩子勾画生活和理想,带出了一批批热爱阅读、爱写会写、思想独立的优秀学生。2014年担任石家庄市语文兼职教研员,成功召开了个人语文教学研讨会,参与录制国家、省市级课例并获一等奖。

3 实证分析

3.1 数据预处理

本文选取郑州商品期货交易所棉花期货主力合约和次主力合约共计400天的收盘价数据.其中前250天收盘价数据作为训练数据集,用来训练支持向量机模型,后150天收盘价数据作为套利交易测试数据.本文实证研究部分所有数据源于国泰安量化投资终端Quantrader数据库.在训练支持向量机模型之前,先对数据进行预处理,剔除无效数据,并使用三次样条插值法补齐缺失值.对数据进行归一化处理,采用MATLAB中的归一化函数mapminmax将数据都归一化到[-1,1].

3.2 基于支持向量机预测的套利策略

3.2.1 协整关系

根据ADF检验可知,样本内主力合约cfin1和样本内次主力合约cfin0都是一阶单整序列,可以使用E-G两步法检验协整关系.本文对两价格序列进行OLS回归,协整关系为:

Remark 3.According to the analysis on the load characteristic of the motor-pump group,the output torque of the motor is the main factor restricting the dynamic characteristic of the EHA.

(8)

 

协整价差序列平稳性检验结果见表1.

 

表1 样本内协整价差序列ADF单位根检验

  

样本内统计量P值检验结论Ei-3.14050.0024平稳

由上表ADF检验可知,棉花主力合约和次主力合约确实存在稳定的协整关系.

对于非线性回归,首先使用一非线性映射把数据映射到一个高维特征空间回归,再在高维特征空间进行线性回归,从而取得在原空间非线性回归的结果.采用适当的内积函数K(xi,yi) 就可以实现某一非线性变换后的线性回归.

根据协整关系式(8),可以得到样本内协整价差序列Ei,通过采用滚动分组的方式利用连续前10个Ei的数据去预测第 11个Ei数据(见图1).

  

交易日/天

 

图1 高斯RBF核样本内协整价差Ei预测对比

3.2.3 套利步骤与结果

1)预测样本外Ei

使用已训练好的支持向量机模型,同样采用滚动预测的方式利用连续前10个Ei的数据去预测第11个Ei数据(见图2).

  

交易日/天

 

图2 高斯RBF核样本外协整价差Ei预测对比

2)套利交易策略

张译还称,他申报了25批狂犬疫苗批签发,5年了没有得到任何答复,只能看着价值约3000多万元的疫苗过期销毁。而2012年到2013年申报的117批合格疫苗,也由于批签发问题,造成了将近4亿元的损失。

Ei:交易日i的实际价差值;predictEi:交易日i+1的预测价差值.

ΔEi=predictEi-Ei

三是注重点面结合,强调系统规范。对日常监管中发现的普遍性、趋势性问题,约谈相关金融机构,并召开行业会议进行系统示警。如召开中央在浙主要金融机构防范地方政府性融资风险座谈会,宣传讲解中央政策,回应金融机构关切,强调坚守底线和红线,减少“监管博弈”,有效防范金融风险。

(9)

当ΔEi>K时,进行牛市建仓操作,即做多次主力合约,做空主力合约,持有熊市头寸时,先平仓熊市头寸,再进行牛市建仓.当ΔEi<-K时,进行熊市建仓操作,做空次主力合约,做多主力合约,持有牛市头寸时,先平仓牛市头寸,再进行熊市建仓.K和-K分别是开仓阈值和平仓阈值,本文的目的在于研究高斯核支持向量机套利的有效性,因此,设置阈值K从0开始逐步增加到10.

[3]Culpeper,Jonathan.Towards an anatomy of impoliteness.Journal of Pragmatics,1996,25:349-367.

3) 多项式核支持向量机套利结果(见表2和表3)

 

表2 多项式核样本内套利结果

  

K=0K=3K=6K=10年化收益率22.14%20.9%20.9%22.67%胜率最大持有期最大盈利最大亏损总收益最高保证金81%81596-335434441555875%81596-310432511555875%81596-310432511555878%71596-3104352715558

注:年化收益率 = (250/总交易日)×(总收益-总成本)/最高保证金.

 

表3 多项式核样本外套利结果

  

K=0K=3K=6K=10年化收益率-9.78%-3.58%-3.58%-3.57%胜率最大持有期最大盈利最大亏损总收益最高保证金75%117420-1548-7871343075%116670-1298-2881343075%116670-1298-2881343075%116670-1298-28813455

注:年化收益率 = (250/总交易日)×(总收益-总成本)/最高保证金.

4) 高斯核支持向量机套利结果(见表4和表5)

 

表4 高斯RBF核样本内套利结果

  

K=0K=3K=6K=10年化收益率51.41%78.3%68.03%58.98%胜率最大持有期最大盈利最大亏损总收益最高保证金71%21596-172979991555874%51596-1682121811555873%111596-1661105831555870%71596-1632917615558

注:年化收益率 = (250/总交易日)×(总收益-总成本)/最高保证金

 

表5 高斯RBF核样本外套利结果

  

K=0K=3K=6K=10年化收益率-5.53%2.14%29.55%22.01%胜率最大持有期最大盈利最大亏损总收益最高保证金70%6771-624-4381322568%5771-6691691322579%13771-74323451322567%41021-624174713225

注:年化收益率 = (250/总交易日)×(总收益-总成本)/最高保证金

5)套利收益率对比(见图3)

  

图3 样本内和样本外套利年化收益率对比

4 总结分析

根据以上数据可知,基于高斯核支持向量机的预测准确度明显优于多项式核支持向量机,并且不管是在样本内还是样本外,高斯核支持向量机的套利年化收益率总是优于多项式核支持向量机套利年化收益率.在阈值取值大于6时,高斯核支持向量机的套利年化收益率可超过20%,获得了非常可观的套利收益率.

支持向量机的预测能力会受到SVM参数、SVM核函数、训练数据集、训练周期等的影响而产生较大的波动,因此,未来打算在这些方面进行优化.鉴于高斯RBF核类似于RBF神经网络,未来也将致力于构建高效的动态神经网络进行套利交易,使用多种方法拟合价差序列的非线性特征,从而进一步提高套利效果.

参考文献

[1] 顾全, 雷星晖. 基于协整的豆类期货统计套利实证研究[J]. 统计与决策, 2015(7):151-154.

[2] HAN L, LIANG R, TANG K. Cross-market soybean futures price discovery: does the dalian commodity exchange affect the chicago board of trade?[J]. Quantitative Finance, 2013,13(4):613-626.

[3] 覃良文, 唐国强. 基于协整-GARCH模型最优阈值统计套利研究[J]. 桂林理工大学学报, 2016,36(3):625-631.

[4] WILES PS, ENKE D. Nonlinear modeling using neural networks for trading the soybean complex[J]. Procedia Computer Science, 2014, 36:234-239.

[5] 靳朝翔, 梁仁方, 刘建和. 基于神经网络模型的商品期货跨品种套利策略——以焦炭、铁矿石和螺纹钢为例[J]. 云南财经大学学报, 2016, 32(4):150-160.

[6] CHEN W H, SHIH J Y, WU S. Comparison of support-vector machines and back propagation neural networks in forecasting the six major Asian stock markets [J]. International Journal of Electronic Finance, 2006, 1(1):49-67.

[7] 周志华. 机器学习[M]. 北京:清华大学出版社, 2016:121-145.

[8] CORTES C, VAPNIK V. Support-vector networks [J]. Machine Learning, 1995, 20(3): 273-297.

 
邓亚东,王波
《经济数学》 2018年第01期
《经济数学》2018年第01期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号