股指预测范文

2024-05-14

股指预测范文(精选6篇)

股指预测 第1篇

计算标的股票价格的加权值得到的结果, 即是股票指数。股指期货是股价指数的缩写, 指的是这样一种期货合约:把股价指数作为标的物, 买卖双方事先确定好一个特定的股价指数大小, 约定在未来某个既定时间进行买卖, 最后以现金形式计算差价的方式完成交易。2010年2月20日, 中国金融期货交易所沪深300股指期货合约, 以及详细的业务规程, 由中国证监会正式批准施行。自2010年4月16日以来, 在上海和深圳将近有300个股票指数期货合约正式开始交易。与股指期货相对应的是对组合风险的管理、无风险套利和风险套利, 以及套期保值。而投资者在判断股票指数的升降时, 若预测正确, 那么就可以获得高额回报, 否则他们将遭受巨大损失。无论是在哪个或者领域, 人们都希望找到一种能够预测股票走势的定量方法, 得以获取高额利润。关于对市场时机的理解, 一般认为是投资者事先构建一套合适的程序, 来模拟股票指数的走势, 从而帮助自己选择最佳的买进和卖空时间。一般可以分成基于时机和定时技术。基于时机的宏观经济, 能够影响资产价格或行业预测的资产价格, 一般适用于长期市场, 决定未来发展趋势;而定时技术主要在短期市场乃至高频市场才最适用。即使是在重复类似的交易价格的前提下, 来判断资产价格的变化, 只要投资者能够做出最佳的预测, 还是可以获取高额的利润。早在上世纪八十年代末, 就有国外学者把隐马尔可夫模型定义为一个双重嵌套的随机过程。而国内金融工程领域对该模型的研究尚处于不成熟阶段。罗军2009年做出的广发证券研究报告表明, 在国内, 该模型在周择时的应用上还是卓有成效的。

二、相关理论

(一) 马尔科夫过程

马尔科夫过程, 指的是一类具有马尔科夫性的随机过程, 因安德烈·马尔可夫 (A.A.M arkov, 1856~1922) 而得名。对于这个过程, 如果该过程当前的状态是确定的, 那么与之相应的过去的历史状态和以后的未来状态是不相关的。可借助以下方程式对该过程进行描述, 具体如下所示:

首先假设一类随机过程, 用{X (t) , t∈T}来表示, 其状态空间

用E表示, 若对任意的t1<t2<...<tn<tn+1, 任意的X1, X2..., Xn, X∈E, 随机变量X (tn+1) 在已知条件X (t1) =x1, X (t2) =x2, ..., X (tn) =xn下的条件分布函数只与X (tn) =xn有关, 而与X (t1) =x1, X (t2) =x2..., X (tn-1) =xn-1无关。

(二) 隐马尔科夫模型

隐马尔科夫模型 (H M M) 的提出, 最初是基于离散的马尔科夫过程, 二者最大的不同表现在隐马尔科夫模型对应的观测值是与一组概率分布相联系, 而离散的马尔科夫对应的观测值是与状态一一对应的。一个完整的隐马尔可夫模型是由两个随机过程来组成的, 首先是逐个考察所得到的序列变化, 然后根据第一个状态序列的变化推断出第二个, 即隐状态序列。我们可以通过盲人扔球的例子对隐马尔可夫模型进行直观地描述。假定房间里有3个箱子, 分别编号1, 2, 3。每箱装有红黄蓝三种颜色的球, 并且个数不同。设置实验过程:首先让盲人随机选取一个箱子, 并从中摸出一个球扔出去, 然后等待外面的人把球的颜色记录下来, 最后盲人再将球放回箱子即可。整个过程中, 盲人并不知道所扔出去的球各是什么颜色, 但他清楚从哪个箱子摸出的球, 因为箱子的形状各异, 由此可以推断出来。在这里, 可以把盲人对箱子的选择过程看成是一个离散的、随机的马尔科夫链。这样反复进行这个过程, 箱子的个数和球的颜色对应序列, 只有记录颜色的人才知道, 但他却不清楚箱子里球的颜色分布规律和盲人选择箱子的规律, 也就是被隐藏起来的马尔科夫链。这就形成了一个离散的隐马尔可夫模型。

三、基于隐马尔科夫模型的股指期货交易策略

(一) 股指期货当月连续合约

代号IF01可以用来表示股指期货当月连续合约, 指的是每个月的到期合约之后的延续合约, 并非是确定的详细的合约。现有的一些软件 (如证券咨询类软件) 都能够发现一些对应的代码用来表示当月连续合约。股指期货的当月合约的交割日是在每个月的第三个星期五, 节假日要顺延。举例来说, 假设当月的第三个周五对应的是2010年5月21日, 那么这一天也就成为IF1005 (即当前股指期货连续合约) 的交割日。如果5月24日对应的是下一个交易日, 那么此时IF1006就会被IF01所替代。选取2010年4月16日到2012年12月21日间共655个交易日作为股指期货的研究对象, 其中沪深300指数与IF01单日的涨跌方向一致的交易日可达577个, 比例高达88%.这说明合同的变更和基差的变化存在不同步。根据IF01交易的首日收盘价与前日沪深300指数的收盘价之间的差额, 计算出IF01单日的涨跌对应即胜率。本文统计了655个交易日对应的IF01胜率, 由于只有88%的沪深300指数与IF01单日的涨跌方向一致, 因此说明IF01的胜率呈现下降趋势。随着交割日即将来临, 成交量逐渐减少, 基差变化对应的幅度也开始缩小, IF01 (即当月合约的价格) 也就慢慢与沪深300指数更加接近了。这样的话, 对股指期货当月连续交易的预测, 就可以依赖于沪深300指数的模型得出的涨跌信号。因此沪深300股指期货当月连续合约的交易, 就可以根据这些预测模型进行模拟。

(二) 交易策略

本文主要运用了这样一种交易策略:对建仓平仓的确定, 依赖于所给出的涨跌信号。具体过程如下:

1.首先对模型所需指标的选取, 主要是通过专业的证券软件, 确定涨跌信号:具体操作是:将每一个交易日对应的观测值向量组计算出来, 并代入模型, 进而推测出下个交易日的涨跌;然后, 由前面得到的涨跌信号来指导下一个交易日的具体操作。

2.当下个交易日对应的是持有合约的交割日时, 那么此时对应的交割日当天不允许建仓, 只能进行平仓, 也不再受前一个交易日涨跌信号的影响。在交割日收盘后, 对新合约的多空策略的选择可以根据模型给出的下一交易日的涨跌信号。

3.如果期间有进行交易的需要, 那么在下一个交易日开盘时, 开始买卖行为的同时就应该进行平仓。

4.本文选取的股指期货交易的第一天, 交易信号已由前一交易日给出, 对应的即是交易试验样本的首日操作。2012年12月21日是最后一天, 对应的正好是持有合约IF1212的交割日。所以试验样本结束后对应的操作应该是空仓。

(三) 模拟交易的效果

由于交易策略的建仓和平仓并非每天都在进行, 所以IF01的日涨跌胜率和累积盈利之间并不存在必然的正相关关系。可以得知指标组是决定累积盈利水平的直接影响因素, 所以如何选取合适的指标集是至关重要的。如果一种模型过滤掉了不必要的波动信号, 并且对拐点的把握程度也很好, 那么这个模型对应的累积盈利水平就高。因此应该有比日涨跌胜率更适合的模型判别指标可被用于这种交易策略。从中挑出累积收益最高的176指标组的5日加权值, 来预测这个模型, 选取2010年4月16日上市交易, 到2012年12月21日收盘的共计655个交易日内, 共包括284份多头和空头合约, 持仓时间对应的平均值约为2.3天, 亏损对应的最大值为126840元, 累积收益对应3606个指数点, 每份合约对应大小为0.49%的平均收益率。

四、讨论

最大回撤, 作为评价一个量化交易模型的关键指标, 表示累积收益从最高点下降的最大幅度。本文所设定的模拟交易的最大回撤高达22.1万, 占本金的44.2%, 出现在2010年11月5日到12月17日期间。对于量化模型来说, 这个结果不管是从最大亏损还是最大回撤考虑, 风险都偏大。而且要面临一个月将近44.2%的回撤, 这对机构投资者和个人投资者来说, 心理上还是会有很大压力。由于IF01单日胜率和交易策略的累积盈利没有必然正相关关系, 那么可以不把这个指标考虑在内。若对二者间的关系做更深入的探讨, 可以做如下假定:如果给定一个模型, 胜率较高, 手中持有一份多头合约, 该模型正确预测出了前5天的涨势, 却没有预测到第6天和第7天的暴跌。这样的话, 前5天所带来的累积收益, 会完全被之后造成的多头头寸的亏损淹没掉。因此这种交易策略的累积盈利较高的原因在于对足够多拐点的把握程度和对造成亏损的合理规避, 而与单日胜率并无直接关联。

参考文献

[1]郭志刚.社会统计分析方法[M].中国人民大学出版社.1999.

[2]施东晖.中国股市微观行为理论与实证[M].上海远东出版社.2001.

[3]谢海玉.我国债券收益率变动分析[J].国际金融研究, 2004.7:65-72.

[4]杨之曙, 姚松瑶.沪市买卖价差和信息性交易实证研究[J].金融研究.2004.4:45-56.

[5]何诚颖, 卢宗辉, 何兴强等.中国股票市场逆向选择成本研究[J].经济研究.2009.2:68-80.

[6]才静涵, 夏乐.卖空制度、流动性与信息不对称问题研究[J].管理科学学报.2011.14 (2) :71-85.

股指期货推出会导致股指下跌吗 第2篇

为何大权重股票一涨再涨?这主要缘于市场对股指期货推出的预期。

仔细分析沪深300指数权重分布可以发现,不同行业权重偏差很大,银行等板块权重突出。因此在最近的大盘上涨中,不少人感觉银行股一涨,指数就上涨,而自己手中的股票并未上涨,原因就在于银行板块在指数中占着举足轻重的作用。

指数权重分布不均衡与当前大盘股上涨有何关系?由于国内A股市场板块间有强烈的联动效应,往往板块内某只股票涨跌将带动板块内其他股票随之涨跌,从而导致该行业整体呈现上涨或下跌。这样,就使一些具有资金实力的机构,通过对某只权重股票的操纵,从而影响整个权重板块走势,进而使操纵指数成为可能。

在即将推出的股指期货中,操纵者有可能通过此种方式在期货上获得有利的价格。因此,在股指期货推出前,抢先获得权重股筹码,不论是对期货操纵方,还是反操纵方,都是必须要进行的。因此,各方对权重股的收集,是诱发此轮大盘股上涨的原因。

我们说“期货话语权”非常重要,但是否说明大盘股上涨就无封顶?“话语权”行情下一步将如何演绎?

应该说,估值因素仍为现货市场根本。我们曾对美国、日本、韩国、印度等市场股指期货推出前现货市场走势进行过分析,结果表明,虽然“股指期货标的指数成分股,相对于非标的指数成分股而言出现阶段性溢价”是普遍规律,但从长期看,股指期货并不会改变现货自身的运行趋势。股票市场虽然可能因股指期货推出预期在一定程度上加速上涨,但最终仍然受到自身估值的制约。

另一方面,我国现阶段投资者结构,也不支持大权重股无限上涨。当前,我国已逐步形成了以基金等机构投资者为市场主导的日趋理性的投资格局,机构的理性、价值投资理念与模式,不会支持股票市场估值长期高企的局面。机构对大盘股的较为灵活的调仓行为,更是对权重股的高估值提出了挑战。

因此,我们的判断是,估值因素将诱发“话语权行情”短期内出现调整,但由于权重股在指数及未来股指期货中的重要性,其调整幅度也不会跌破其估值下限。权重股在未来的时间里,将围绕其价值中枢,小幅度波动。

市面上有一种担心,就是股指期货推出初期,由于机构可以通过做空获利,是否短期内将导致现货指数下跌?这与何时推出股指期货有直接关系。

如果推出之时正值股市高估,则现货本身就面临下跌调整的需求,股指期货就可能成为触发因素。但我认为,管理层选择在高估时推出股指期货的可能性很小。

如果推出之时股市估值尚属合理,则作为当前市场的主力——基金等机构,首先没有在现货市场因价值高估而抛出股票的动力,其次由于其在期货推出初期参与期货的力度相当有限,因此也没有在期货市场上“做空”的动力。而高风险偏好的私募基金、资金量较大的个人投资者等,虽然他们有操纵股市和期货市场的动力,但由于这部分投资者并非现货交易的中坚力量,理性价值投资者的“反操纵”行为,可能使他们的操纵行为面临无法预估的失败风险。

因此,我们认为只要选择合适的推出时机,股指期货推出初期并不会导致现货指数短期内的下跌。

股指预测 第3篇

1 灰色—马尔柯夫模型预测过程

1.1 GM (1, 1) 模型

灰色系统理论认为任何随机过程都是在一定幅值范围、一定时区内变化的灰色量。灰过程处理的主要手段是将原始数据进行有规则的处理来寻求数据间的内在联系, 这种方法称为数的生成。最常用的是累加生成法, 它可以弱化原始数据的随机性, 使其呈现出较为明显的特征规律。然后对生成变换后的数列建立微分方程型的动态模型即灰色模型, 简称GM模型。实践中较为常用的是一阶一个变量的灰色模型GM (1, 1) 。模型建立的方法步骤如下:

(1) 生成新数列并检验光滑条件。设原始数列为

检验X (0) (i) 光滑条件, 即εK=X (0) (K) /X (1) (K-1) , 当K≥3时, 数列εK是递减数列, 且0≤εK<1;当n足够大时, 该数列收敛于零。

(2) 对新数列式 (2) 建立白化形式的微分方程。以数据序列X (1) 建立白化形式的方程:

其中a和u分别为GM (1, 1) 的发展参数与灰色内生控制参数。用最小二乘法估计可以得到GM (1, 1) 模型参数向量:

求解微分方程式 (3) , 得到近似解;写成离散形式, 得X (1) (i) 的预测模型

对x (1) (i) 进行逆累加生成还原, 可得到x (0) (i) 的预测模型

记, …即k时刻GM (1, 1) 模型求得的原始数据序列的灰色预测值, 它反映了原始数据呈指数规律变化的总趋势。

1.2 划分状态, 并建立状态转移概率矩阵

对于一个符合n阶马尔柯夫非平稳随机序列y (t) , 其任一状态Ei, 可表述为, 其中, y为原始数据的均值。由于是一个时间函数, Ai和Bi也是时间的函数, 因而灰元也随时序发生变化, 即状态具有动态性。关于的含义, 状态划分数目m和常数ai, bi的确定, 可根据研究对象的实际意义、样本数据的多少选取。

P (m) 反映了系统各状态之间转移的规律。通过考察P (m) 和初始状态, 便可预测系统未来的发展变化状况。

1.3 计算模拟值

确定了预测对象未来的状态转移后, 即确定了预测值变动的灰区间我们可以用该区间中位数得到系统的模拟值:

1.4 模型检验

GM (1、1) 模型可采用残差检验、关联度检验、后验差检验等三种方法。本文使用第三种方法进行检验。所谓后验差检验是指对残差分布的统计特性进行检验。

对于给定的C0>0, 当时C0, 当p>p0时, 称模型为小残差概率合格模型。

2 实证分析

2.1 样本数据的选取

本文选取沪深300指数2007年1月4日到1月24日共15个交易日的收盘价进行预测。

2.2 建立GM (1, 1) 模型

根据上面选取的数据, 利用公式 (4) 得出灰色模型参数:

2.3 划分状态, 并建立状态转移概率矩阵

根据表2中的沪深300指数样本数据的分布状态, 可以分成四个状态:

2.4 计算模拟值

确定了预测对象未来的状态转移后, 即确定了预测值变动的灰区间, 我们可以用该区间中位数得到系统的模拟值: (见表3)

2.5 模型的检验

对该模型分别进行后验差检验, 从表2、表3中各具体数据看, 灰色—马尔柯夫模型的各项指标比GM (1, 1) 模型相应指标都有显著的提高, 该模型拟合效果优良, 各项检验均通过且精度等级提高到一级水平, 因而可以用于具体预测。

2.6 预测

由于第15期沪深300指数处于, 考察一步转移概率矩阵的第三行可预测以后各期都将处于状态, 因为

同理可预测以后各期的值。 (见表2)

参考文献

[1]刘思锋, 党耀国等, 灰色系统理论及应用[M], 科学出版社, 1999年版。

[2]谢乃明, 刘思峰, 离散GM (1, 1) 模型与灰色预测模型建模机理[J], 系统工程理论与实践, 2005第1期, p93-94。

[3]李国平, 王址, 李斯平, 《给予黄金分割的股票灰色预测GM (1、1) 模型》[J], 商场现代化, 2005年第3期。

股指预测 第4篇

在金融系统的预测研究中,金融股票指数预测是一个热门的课题。很难建立一个足够精确的模型来描述金融非线性系统,利用传统的时间序列等统计手段很难解决金融股票指数预测问题。近年来模糊神经网络成为针对非线性系统预测研究的一个热点,并形成了一个较为完善的体系[1,2,3,4]。现有模糊神经网络预测必须预先划分输入空间,然后确定模糊规则数,从而预先定好神经网络的结构,在此基础上,再利用神经网络的学习功能和自适应能力对系统参数优化,并且其学习方式多为BP算法。BP算法速度较慢,且容易陷入局部极小点。因此迫切需要寻找针对实时应用的模糊神经网络算法。

针对传统模糊神经网络自身存在的以上缺点,本文采用动态模糊神经网络(Dynamic Fuzzy Neural Network,DFNN)对上证指数进行预测,该算法构架基于RBF神经元的模糊神经网络,通过自适应构建专家推理规则来构建神经网络拓扑结构。通过启发式学习算法实现参数估计与结构辨识同时进行,并采用误差下降率(Error Reduction Rate,ERR),使得网络结构不会持续增长,避免了过拟合及过训练现象,确保了模型的泛化能力,实现模型的动态在线控制。

2 动态模糊神经网络(DFNN)

2.1 DFNN结构

DFNN采用五层神经网络拓扑结构:x1,x2,…,xr是输入的语言变量,y是系统的输出,MFij是第i个输入变量的第j个隶属函数,Rj是第j条模糊规则,Nj表示第j个归一化节点,wj是第j个规则的结果参数或者连接权,u是系统总的规则数。

第一层:输入层,每个节点代表一个输入的语言变量。

第二层:隶属函数层,每个节点分别代表一个隶属函数,该隶属函数采用高斯函数;

式中,uij是xi的第j个隶属函数,cij是xi的第j个隶属函数的中心,σj是xi的第j个高斯隶属函数宽度,r是输入变量数,u是隶属函数的数量,即系统总的规则数。

第三层:T-范数层,每个节点分别代表一个可能的模糊规则中的IF-部分。第j个规则Rj的输出为:

式中,,是第j个RBF单元的中心。

第四层:归一化层,这些节点为N节点,第j个节点Nj的输出为:

第五层:输出层,每个节点分别表示一个输出变量,该变量是所有输入信号的叠加

式中,y是输出变量,wk是THEN-部分(结果参数)或者第k个规则的连接权。对于TSK模型:

将(2.2)、(2.3)、(2.5)代入(2.4),则:

2.2 DFNN学习算法

2.2.1 规则产生准则

(1)系统误差判据

对于第i个观测数据(Xi,ti),其中,Xi是输入向量,ti是期望的输出,由(2.6)计算出DFNN现有机构的全部输出yi。定义系统误差ei:|ei|=|ti-yi|;当|ei|>ke时,则增加一条新的规则,其中ke是根据DFNN的期望精度预先设定的。

(2)可容纳边界判据

对于第i个观测数据(Xi,ti),计算输入值Xi和现有RBF单元的中心Cj之间的距离,即di(j)=|Xi-Cj|,j=1,2,…,u;其中,u是现有的模糊规则或者RBF单元的数量。取dmin=arg min(di(j));当dmin>kd时,则增加一条新的规则,其中kd是可容纳边界的有效半径。

2.2.2 分级学习

文献[5]提出每个RBF单元的可容纳边界不是固定的而是动态调整的:开始可容纳边界设置较大,以实现全局学习,随着学习边界逐渐减小,开始局部学习。ke、kd不是常数,而由下式确定:ke=max[emax×βi,emin];ke=max[dmax×γi,dmin]。其中,emax是预先定义好的最大误差,emin是期望的DFNN精度,β(0<β<1)是收敛常数,dmax是输入空间的最大长度,dmin是最小长度,γ(0<γ<1)是衰减常数。

2.2.3 前提参数分配

新产生的规则的初始参数按照如下方式分配:Ci=Xi;γi=k×dmin;其中,k(k>1)是重叠因子。

当第一个观测数据(X1,t1)得到后,此时DFNN还没有建立起来,因此C1=X1,σ1=σ0,其中σ0是预先设定的常数。(1)当|ei|>ke,dmin>kd时,则DFNN增加一条模糊规则。(2)当|ei|kd时,则DFNN具有较好的泛化能力,只对结果参数调整。(4)当|ei|>ke,dmin≤kd时,则Xi可以聚集在已有的RBF单元的附近,但覆盖Xi的RBF单元泛化能力不好。该RBF节点及结果参数同时被更新。对于最接近Xi的第k个RBF单元按照下式调整:σki=kw×σki-1;其中,kw(kw>1)是预定的常数。

2.2.4 修剪算法

本文采用文献[6]提出的误差下降率(ERR)作为修剪策略。ηi反映第i个规则的重要性,ηi越大表示第i个规则越重要。若ηi

3 仿真实验与分析

3.1 实验数据

上证指数作为反映宏观经济形势的重要指标,其价格的波动和宏观经济指标也是密切相关的。本文通过第n周的上证指数收盘价和成交额及当期的月社会商品零售总额、物价指数、固定资产投资额针对第n+1周的上证指数收盘价(n=1,2,…,187)进行预测,构建基于DFNN的预测模型。

3.2 实验评价指标

v1是规格化的均方误差,v2是方向一致性指标。指标的计算方法如下:

其中,preal,i为第i周的周收盘价实际值,ppred,i为第i周的周收盘价预测值(i=1,2,…,n)。

3.3 实验环境与结果分析

采用Matlab语言在PC Pentium4/CPU3.0GHz/RAM1.0G上编程实现上述DFNN。为了测试算法的有效性,将针对上证指数的预测与现实中的上证指数进行比较,并与传统RBF预测效率及结果进行比较。

DFNN所涉及的参数预先设定如下:预先定义好的最大误差emax=1.1;期望的DFNN精度emin=0.02;收敛常数β=0.85;输入空间的最大长度dmax=35;最小长度dmin=2;衰减常数γ=0.98;预先设定的第一个隶属函数宽度σ0=1;重叠因子k=2.5;隶属函数宽度调整参数kw=1.05;修剪算法阈值参数kerr=0.000 7。

RBF采用三层神经网络拓扑结构,隐层传递函数采用高斯函数,输出层采用线性函数。RBF所涉及的参数预先设定如下:根据输入样本数(共187个数据),隐含层神经元数为187;相应宽度C=187。

实验1:DFNN拓扑结构、性能参数分析及模糊规则分布情况

如图2(a)所示,经过175个训练数据,规则数稳定在2条。需要指出的是,规则数保持稳定不代表规则是保持不变的。实际上,当新的样本数据加入后,前提参数(宽度)和结果参数一直保持更新。而且,一条新规则的产生可能会剔除一条或两条已有的规则而同样保持系统的精确。

实验2:DFNN与RBF预测效果比较

表1给出了两种算法通过对样本进行训练学习后,对上证指数2007年11月9日到2008年7月4日进行仿真预测后,评价指标对比情况及算法计算时间比较。DFNN的评价指标v1,v2均优于RBF,证明在神经网络中融入模糊专家规则后,DFNN的预测效果要优于同样以高斯函数作为隐层函数的RBF;DFNN在算法计算时间方面略长。

两种算法预测误差走势图如图3(a)所示,在预测稳定性方面,本文采用的DFNN预测误差能够控制在15%以内,其稳定性要优于RBF。如图3(b)所示,与RBF预测结果相比,DFNN滚动预测37周上证指数周收盘价格与实际值较接近,并且走势一致。

4 结束语

本文采用DFNN直接利用金融股指以及相关宏观经济指标的输入/输出数据进行学习并进行预测。仿真结果表明,基于DFNN提取模糊规则的算法比较有效。将DFNN与RBF对上证指数预测的评价指标比较发现,DFNN算法在预测准确性、稳定性上均优于RBF神经网络。DFNN控制算法为研究非线性多变量金融系统预测问题,提供了一种新的思路,具有一定的理论意义和工程应用价值。

参考文献

[1]Lin C T,Lee C S G.Neural Fuzzy System:A Neural-Fuzzy Synergism to Intelligent Systems[M].Englewood Cliffs,NJ:Prentice-Hall,1996.

[2]Jang J-S R,Sun C T,Mizutani E.Neuro-Fuzzy and Soft Computing[M].Englewood Cliffs,NJ:Prentice-Hall,1997.

[3]刘瑞兰,苏宏业,褚健.模糊神经网络的混合学习算法及其软测量建模[J].系统仿真学报,2005,17(12):2878-2881.

[4]胡玉玲,曹建国.基于模糊神经网络的动态非线性系统辨识研究[J].系统仿真学报,2007,19(3):560-562.

[5]Lee S,Kil R M.A Gaussian Potential Function Network with Hierarchically Self-Organizing Learning[J].Neural Networks,1991(4):207-224.

股指预测 第5篇

关键词:BP神经网络,三次指数平滑,股票价格指数

股票价格指数波动比较频繁, 本文使用三次指数平滑、BP神经网络对其预测精确度加以分析对比, 为股民提供可靠的决策依据, 将股票投资的风险降为最低。

1 三次指数平滑算法

一般来说历史数据对未来值的影响是随时间间隔的增长而递减的, 即随着数据的远离, 赋予逐渐收敛为零的权数。三次指数平滑[1]是在二次指数平滑的基础上做的进一次平滑, 其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。预测值应是对各期预测值以时间顺序进行加权平均。由于股票价格指数波动大致呈二次曲线变化, 故采用三次平滑算法。字母S表示指数平滑值, t表示期数, St (1) 表示第t期一次指数平滑值, St (2) 表示第t期二次数平滑值, St (3) 表示第t期三次指数平滑值。平滑指数计算公式为:

预测公式为:

其中at、bt、ct均是由α、指数平滑值同时决定, T为正整数, t为起点。

选择合适的加权系数α是提高预测精度的关键环节。根据时间序列的发展趋势和预测者的经验做出判断, 本文中得α的最佳取值为0.15。

2 BP神经网络算法

BP (Back Propagation) 神经网络[2,3,4,5]是一种按误差逆传播算法训练的多层前馈网络, 其拓扑结构包括输入层、隐层和输出层BP神经网络。BP神经网络模型容错性强, 对野点有很强的免疫能力, 且它的鲁棒性也很强。它能够学习和存贮大量的输入-输出模式映射关系, 且无需提前描述这种映射关系的数学方程。当实际输出与期望输出不符时, BP神经网络进入误差的反向传播阶段, 误差通过输出层, 按负梯度下降的方式修正各层权值, 向隐层、输入层逐层反传。本文采用梯度最速下降法, 通过不断地调整输入层和隐层的权值来达到训练样本的预测最优, 最终使得输入和输出可以高精度逼近对应的非线性函数, 即减小预测误差。反复的信息正向传播和误差反向传播过程一直持续到网络输出的精度提高到提前设定的程度, 或者到达预先设定的学习次数。

根据股票价格的变化特征, 从输入层到隐含层传递函数采用S型的对数函数logsig () , 从隐含层到输出层采用S型的对数函数logsig () , 训练函数采用trainlm () , 对于该BP神经网络有最快的收敛速度。在模型建立的过程中, 本文对股票价格指数进行归一化处理, 取连续的三组股票价格指数 (仍取平滑指数模型所用数据) 作为样本输入, 以下一组作为期望输出对神经网络进行训练。

3 结果分析

随机从民生证券“成份A指--成交明细--2014_04_11”中随机选取了22组股票价格指数数据8549.6、8536.5、8552.5、8561.7、8564.4······8588.3、8579.3, 完成股票价格指数预测模型。采用三次指数平滑算法, 取T=1, α=0.5经过MATLAB编程, 股票价格指数预测结果依次为:8546.2、8548.7、8540.2、8547.8、8558.8······8598.5、8587.3。采用BP神经网络算法, 经过MATLAB编程, 股票价格指数预测值依次为:8561.7、8540.0、8563.2、8557.7、8551.9······8586.8、8580.0。

三次指数平滑算法对股票价格指数进行预测, 得到预测均差为33.2950, 模型误差较大, 拟合度并不理想。利用BP网络进行预测, 得到预测均差为25.1555, 其预测精度较三次指数平滑模型提高24.4%, 即BP神经网络判断股票价格指数误差较小, 网络泛化能力较好。

4 结束语

三次指数平滑算法使用固定的公式完成对短期股票价格指数趋势的预测, 缺乏灵活性, 导致预测误差较大。BP网络能学习和存贮大量的输入-输出模式映射关系而无需事前揭示描述这种映射关系的数学方程, 映射关系是在模型建立的过程中经过不断训练与学习的结果, 预测精确度确度较高。但是任何股票分析预测模型均存在误差, 股票预测模型仅为投资者提供更加可靠的决策依据。

参考文献

[1]马晓珂, 王慈光.三次指数平滑法在大秦铁路运量是预测中的应用[J].华东交通大学学报, 2005, 22 (3) :8-11.

[2]徐丽娜.神经网络控制[M].北京:电子工业出版社, 2003.

[3]高琴.人工神经网络在股市预测模型中的应用[J].微电子学与计算机.2007, (11) :27-29

[4]史玉峰, 宁津生.指数平滑改进灰色模型及其在形变数据分析中的应用[J].煤炭学报, 2005, 30 (2) :206-209.

股指预测 第6篇

关键词:主成分分析,BP神经网络,股指期货价格预测

期货市场是一个复杂的非线性动态系统, 其特有的套期保值、价格发现、高杠杆性等性质使其成为广大投资者亲睐的对象。自我国首只股指期货产品——沪深300股指期货出现后, 经过多年的发展, 股指期货的日均成交金额已经占到国内期货市场总成交额的40%。股指期货的短期预测, 成为投资者的迫切需求。

主成分分析法是一种优良的降维方法, 本文将主成分分析法与BP神经网络结合, 实现对股指期货价格的预测。

一、数据与模型说明

(一) 实验数据来源及处理

实验数据来自中金所2014年1月1日至2015年1月7日的沪深300股票指数当月合约的每日收盘价, 共计248个数据 (数据由作者从中国金融期货交易所网站整理而得) 。

由图可知, 沪深300收盘价有较大的波动性。

通常情况下, 使用BP神经网络进行预测时普遍使用的数据预处理方法是将原始数据进行归一化处理, 即通过一定的线性变换将原始数据统一限制在某个区间。由于本文所选用的输入数据分别包括:开盘价、最高价、最低价、成交量、成交金额、持仓量和收盘价, 各个因变量的数值等级相差较大, 为了避免出现因变量数量差别较大导致输入数据包含高噪声, 引起网络模型震荡而造成预测误差较大的现象, 本文对原始数据进行归一化处理。本文运用MATLAB R2012a软件中的mapminmax函数对原始数据进行归一化处理, 使其落在[-1, 1]区间。Mapminmax函数的调用格式如下:

函数将x中的值归一化到[-1, 1]区间, x可以是矩阵或细胞数组。归一化的结果保存在p中, settings侧保存了归一化的信息, 可以用来做数据的反归一化。

(二) BP神经网络简介

BP网络具有输入层、隐含层和输出层, 网络中各个神经元之间依靠S型函数来传递信息, 它具有强大的非线性映射能力, 用于处理复杂的非线性关系。网络权值的调整采用的是反向传播学习算法, 这样可以将“误差”反向传播到神经节点, 达到较高的预测进度。

1、BP神经网络的特点:

(1) 网络有多层构成, 层与层之间全连接, 同一层之间的神经元无连接。多层的网络设计, 使BP网络能够从输入中挖掘更多的信息, 完成更为复杂的任务。

(2) BP网络的传递函数必须可微。BP网络一般都是使用sigmoid函数或线性函数作为传递函数。根据输出值是否包含负值, sigmoid函数可分为logsigmoid函数和tansigmoid函数。在输出层, 如果使用sigmoid函数, 将会把输出值限制在一个较小的范围, 因此, BP网络的典型设计是隐含层采用sigmoid函数作为传递函数, 而输出层则采用线性函数作为传递函数。

(3) 权值调整采取反向传播算法进行学习。在BP网络中, 原始数据依次由输入层、隐含层、输出层向后传播, 各层节点数可变, 隐含层层数视具体情况而定。当对网络权值进行调整时, 则沿着减少误差的方向逆向传播, 依次由输出层、隐含层逐层向前修正网络的权值。伴随着网络不断的自我学习和自我训练, 得到的预测结果趋于准确。

2、BP神经网络的学习过程

第一个阶段是输入原始数据, 网络自我学习和训练, 再通过已经建立好的网络结构和前一次迭代后形成的权值和阀值, 从网络第一层向后计算各神经元的输出。

第二阶段是通过反向传播学习对权值和阀值进行调整, 以最后一层为起点, 逐层向前计算各权值和阀值对总误差的影响, 据此对各权值和阀值进行修改。

以上两个阶段是不断重复进行, 以致将误差降到满足点或达到收敛位置。

(三) 主成分分析法的原理

假定输入一个决策其中U为论域, , C和D分别为条件属性和决策属性。需输出条件属性的主成分。则其步骤如下。

(1) 原始数据的标准化处理。按进行标准化处理使每个属性均值为0, 方差为1.

(2) 计算相关系数矩阵。计算第1步中得到的数据集X的相关系数矩阵R。

(3) 计算特征值及单位特征向量。计算R的特征值λi及其对应的单位特征向量ei, i=1, 2, L, m.并将特征值按由大到小的顺序排列, 即λ1>λ2>Lλm。

(4) 计算主成分的方差贡献率和累计贡献率。第k个主成分方差为, 主成分y1, y2, L, yp的累计方差贡献率为。其中a1的值最大, 说明y1综合x, x2.L, xm信息的能力最强, 主成分p值的选取一般为使得累计方差贡献率≥80% (或特征值大于1) 的前p个特征值。

(5) 计算主成分。利用个特征值对应的单位特征向量

计算数据的原始主成分y1, y2, L, yp

二、实证分析

BP神经网络的构建

通过主成分分析达到降维的目的。首先对开盘价、最高价、持仓量等6个变量和收盘价数据进行归一化处理, 消除数量级差别。然后运用主成分分析法, 可得 (表1, 表2)

前两个主成分累计贡献率已经达到9 4.7 1 7%, 所以选取两个主成分。其中主成分1的方差为4.6 8 2, 贡献率为7 8.0 3 7%;主成分2的方差为1.0 0 1, 贡献率为

主成分2表达式

B P网络经过5次训练后训练终止。此时训练目标达到0.000911。为了更形象化显示预测效果, 将预测值反归一化后与实际值进行图像拟合, 可以看出拟合较好。 (图3) 为进一步证明该模型的可行性, 实验再选取最后10个训练数据作为输入集, 利用BP网络结构得到预测值, 将预测值反归一化后与实际值进行对比。 (图4)

预测值与实际值吻合度较高, 而且走势也基本相同。 (表5)

平均绝对误差率=0.92%, 预测效果较好。

三、总结

通过实证分析, 根据主成分分析法选取主成分, 将主成分作为BP神经网络输入元素, 对股指期货价格进行预测, 取得较好的预测效果。

参考文献

[1]罗孝玲.期货与期权[M].北京:高等教育出版社, 2011.

[2]徐兴军.基于B P神经网络的股价趋势分析[J].资本观察, 2011, (4) .11-13

[3]邓维斌, 唐兴艳, 胡大权, 周玉敏.统计分析使用教程[M].北京:电子工业出版社, 2012.

[4]邓维斌, 唐兴艳, 胡大权, 周玉敏.统计分析使用教程[M].北京:电子工业出版社, 2012.

[5]潘发明.SPSS统计分析大全[M].北京:清华大学出版社, 2014

[6]梅端.基于BP神经网络的沪深300股指期货价格预测[J].流通经济, 2013, (5) .

上一篇:创新进程下一篇:Cu掺杂