上证指数预测范文

2024-06-23

上证指数预测范文(精选10篇)

上证指数预测 第1篇

股票价格的形成及波动不仅受制于各种经济、政治因素, 而且受投资心理和交易技术等的影响。股票价格的影响因素很多, 股票随业绩调整是股市不变的原则。但事实上, 股票价格不仅与上市公司企业内部财务状况有着密切的相关关系, 还与整个股票市场状况乃至整体经济运行状况有关。

上证综合指数则是集中了有代表性的多种股票的研究, 基本认为其反映了中国股市的高低, 个别公司股票价格的异常反应对大盘指数的影响则是有限的。因此用技术手段研究股价波动, 选择上证综合指数做研究对象更合适。相应的, 对于投资组合的操作和机构或基金投资也有指导意义。

由于影响股票价格波动的因素众多, 使得其预测难于实现。确切地说, 要对股票价格做出准确预测是不可能的, 但我们总试图寻找不同的方法, 不同的模型来刻画它。而用传统的回归分析模型来进行预测, 不仅复杂而且费用较高, 因为要找出真正影响预测对象变化的因素并非易事, 而且由于股票市场的变化, 其预测精度并不比时间序列分析方法更精确, 而时间序列分析方法模型一般简单, 成本较低, 特别适用于表面上毫无规律可循的数据因此, 我们用时间序列分析中的ARIMA模型[1,2]来对股票价格建立模型。

1 ARIMA模型

1.1 ARIMA模型种类介绍[3]

1.1.1自回归模型AR (p)

P阶自回归模型记作AR (p) , 满足下面的方程:

ut=c+φ1ut-1+φ2ut-2+…+φput-p+εt;

t=1, 2, …, T。

其中:参数c为常数;φ1, φ2, …, φp是自回归模型系数;p为自回归模型的阶数;εt是均值为0, 方差为σ2的白噪声序列。

1.1.2移动平均模型MA (q)

q阶移动平均模型记作MA (q) , 满足下面的方程:

ut=μ+εt+θ1εt-1+θ2εt-2+…+θqεt-q;

t=1, 2, …, T。

其中:参数μ为常数;θ1, θ2, …, θq是自回归模型系数;q为自回归模型的阶数;εt是均值为0, 方差为σ2的白噪声序列。

1.1.3自回归滑动平均模型ARMA (p, q)

ut=c+φ1ut-1+φ2ut-2+…+φput-p+εt+θ1εt-1+θ2εt-2+…+θqεt-q;t=1, 2, …, T。

显然此模型是AR (p) 和MA (q) 的混合形式, 称为混合模型, 常记作AARMA (p, q) 。当p=0时, AARMA (0, q) =MA (q) ;当q=0时, AARMA (p, 0) =AR (p) 。

1.1.4自回归求和滑动平均模型AARIMA (p, d, q) [4]

对于单整序列能够通过d次差分将非平稳序列转化为平稳序列。设ut是d阶单整序列, 即ut~I (d) , 则ωt=Δdut= (1-L) dut。ωt为平稳序列, 即ωt~I (0) , 于是可以对ωt建立AARMA (p, q) 模型。

ωt=c+φ1ωt-1+φ2ωt-2+…+φpωt-p+εt+θ1εt-1+θ2εt-2+…+θqεt-q;t=1, 2, …, T。

1.2应用ARIMA (p, d, q) 模型建模的过程[2,5]

Box和Jenkins的建模思想总结为如下4个步骤:

(1) 对序列进行平稳性检验, 如果序列不满足平稳性条件, 可以通过差分变换 (单整阶数为d, 则进行d阶差分) 或者其他变换, 如对数差分变换使序列满足平稳性条件;

(2) 通过计算能够描述序列特征的一些统计量 (如自相关系数和偏自相关系数) , 来确定AR MA的阶数p和q, 并在初始估计中选择尽可能少的参数;

(3) 估计模型的未知参数, 并检验参数的参数的显著性, 以及模型本身的合理性;

(4) 进行诊断分析, 以证实所得模型确实与观察到的数据特征相符。

2 ARIMA模型在上证指数预测中的应用

以上证指数 (记为Index) 为例, 具体探讨ARI-MA模型在股票价格预测中的应用。数据来源于大智慧, 以1990年12月至2009年02月的月收盘价和月收盘价的平均值为原始数据进行ARIMA建模, 图1为序列Index的折线图。然后对2009年3月上证综合指数进行预测和实证分析[6]。

2.1 判定原始序列的稳定性, 识别模型

序列Index变量记为Y, 利用EVIEWS软件对其进行分析可知, 该序列为非平稳序列。将一阶差分的序列记为ΔY, 进行ADF检验, 从图2可看出, 差分后的序列为平稳时间序列, 即YI (1) 。

2.2 模型的定阶

观察ΔY序列的相关图 (图3) , ΔY序列的自相关系数在1阶截尾, 偏自相关系数在1阶截尾, 则取模型的阶数p=1和q=1, 建立AARIMA (1, 1, 1) 模型, 输出结果如图4。

从图4中可以看出, 该ARIMA (1, 1, 1) 模型的参数都在1%的水平下是显著的。而且AR特征根和MA特征根的倒数都在单位圆之内。

同时对AARIMA (1, 1, 1) 的残差序列进行Q-检验[7], 如图5所示。由图可知该残差序列为白噪声过程。因此确定模型AARIMA (1, 1, 1) 来拟合序列Index是合适的。其方程可以表示为

ΔYt=Yt-Yt-1;

ΔYt=9.366+0.329 (ΔYt-1-9.366) +εt+0.458εt-1。

2.3 预测和分析

对于含有滞后因变量的预测, EViews提供了两种方法: 动态预测和静态预测[3]。动态预测是预测样本的初始值将使用滞后变量Y 的实际值, 而在随后的预测中将使用Y 的预测值, 因此用动态预测来做多步预测时预测样本初值的选择非常重要。但是, 当新的预测值出现时, 它并不能进行适时修正预测。而静态预测是采用滞后因变量的实际值而不是预测值来计算一步向前的结果。对ARIMA模型来讲, 一步静态向前预测比动态预测更为准确。

因此, 在此文中所采用的是一步向前静态预测, 依据模型对Index (上证指数月开盘价和收盘价的平均值) 进行预测。由大智慧软件可查得2009年3月上证综合指数收盘价2 373.213和开盘价2 066.229的平均值为2 219.721, 而模型预测结果为2 135.933, 误差率为3.8%。同时由大智慧软件可查得2009年4月上证综合指数收盘价2 477.569和开盘价2 380.979的平均值为2 429.274, 而模型预测结果为2 321.686, 误差率为4.4%。

3 结论

通过上述拟和预测, ARIMA模型在描述上证综合指数方面有一定借鉴性, 拟和预测的结果在一定程度上可以代表上证综合指数的走势。但它只在短期趋势预测方面有一定可行性, 对于长期趋势以及突然上涨或下跌, 就会表现出局限性[8], 预测的偏差就会比较大, 因为变幻莫测的股票市场, 影响其价格波动的因素多种多样, 不仅与股票市场自身体制因素有关, 还与国家宏观经济政策, 国民经济发展方向等各种因素相关。用此模型对大盘走势进行短期预测, 可为投资者提供投资决策的依据。

参考文献

[1]易丹辉.数据分析与Eviews应用.北京:中国统计出版社, 2002:30—50

[2]于俊年.计量经济学软件———Eviews的使用.北京:对外经济贸易大学出版社, 2002:145—161

[3] (美) Tsay R S.Analysis of Financial Time Series.潘家柱, 译.北京:机械工业出版社, 2006

[4]高铁梅.计量经济分析与建模.北京:清华大学出版社, 2008

[5]黄杰, 钱瑾, 殷浩文.ARMA模型在预测船价指数中的应用.环境工程学报, 2007; (1) :71—74

[6]李升江.ARMA模型在苏州河总磷预测中的应用.船舶工程, 2007; (6) :139—143

[7]蒋涛, 吴俊芳.ARIMA模型在基金指数预测中的应用.统计教育, 2007; (7) :12—13

上证指数12月6日走势分析 第2篇

12月5日上证指数日K线收出了9月7日以来久违的一阳穿三线的大阳线,成交量达到854.75亿元。这是预料之中的,但仍改变不了年底的惯例下跌的基本格局。

其理由如下:

1、年底机构、银行资金回笼,流动资金吃紧,是明摆的现实。想为者也巧媳妇难做无米之

炊啊!。

2、长期的下跌,散户损失惨重,加之年底这个特定时期散户资金入市意愿本来就极差。所

以,此时的星星谁愿出来捧月亮?

3、鉴于上述原因年底之前股指就算见底跌不动了,也不会有什么像样的行情。更何况目前

点位真的“见底”了吗?回答是肯定的:没有!。

4、理论的底应在何方?上证指数自6124点下跌以来,1664点是A浪的底、3478点是B

浪的顶这是勿用质疑的了,问题是C浪的底在哪?C浪的底能高于A浪的底吗?其理论依据有吗?在哪?大跌小涨的反弹肯定是有的,但抢反弹是散户不可取的!

5、票票是自己的,猜底是危险的!上亿双眼睛在盯着,侥幸心理是要不得的!

6、12月6日上证指数走势应是小阴小阳的回调整理是主基调,当然也不排除创新高或出中

大阴线的可能性,但回落是必然的,只是时间推后1~2天罢了。

基于支持向量机的上证指数预测研究 第3篇

关键词:支持向量机,上证指数,预测,BP神经网络

一、引言

股票起源于西方,到今天已经有300多年的历史了。如今股市已经成为国民经济的“晴雨表”。股市不仅是投资的重要对象也是广大企业筹集资金的重要手段,对国民经济的发展和政府的决策制定都有着重要影响。但是股票的价格具有很大的不确定性,受政治、经济、投资者心理等诸多因素的影响。因而股市的走势成为许多人关注的焦点。

近年来在股市预测方面运用的最广的是神经网络,BP神经网络由于它自身的优点如结构相对简单和很强的解决问题能力而成为流行和成功的方法。然而由于神经网络自身存在的易于陷入局部极小值,隐含层难以确定,训练速度慢,过学习等问题所以也需要进一步改进。支持向量机是Cortes和Vapnik在1995年首先提出的,建立在统计学习理论和VC维理论和结构风险最小的基础上的,它在解决小样本、非线性和高维模式识别中具有独特的优势,还能够有效的克服维数灾难、过学习等问题,并且能够推广应用到函数拟合、实践序列预测等其他机器学习问题中,比起神经网络具有更大的优越性,如能够取得全局最优解,具有更好的泛化能力,结构容易确定等等。将支持向量机引入上证指数的预测中,研究结果表明支持向量机预测方法计算速度快,准确率高,具有很好的推广应用价值。

二、支持向量机模型

回归问题:设已知训练集为如下形式所示x1,y1,...,xN,yN∈X×Y,xi∈X,X奂Rm。xi为输入数据yi∈Y,Y奂R。yi为输出数据。通过对训练集的训练,找出y=f(x)。

回归问题分为线性和非线性两种,以下分别讨论支持向量记得线性回归和非线性回归。

(一)线性回归

对于线性函数f(x)有:

为了使(1)式逼近实际函数,对损失函数实行风险最小化求解。根据结构风险最小化原则,原问题变为:

是结构化项,也就是描述复杂度的项。C是调节参数,是用于权衡复杂度和经验风险的。ξi*,ξi是松弛变量。因为采用的是ε-不敏感损失函数,所以小于的误差予以忽略。

(2)式为原目标问题,它的求解需要运用拉格朗日乘子法。引进正的拉格朗日乘子αi(*),μi(*),则原拉格朗日函数为:

L分别对w,ξi,ξi*,b求偏导,并使之为零,得到(2)式的对偶形式:

根据经典的Karush-Kuhn-Tucker(KKT)条件,计算b有如下形式

b=yi-w·xi-ε,对于0<αi

(二)非线性回归

非线性回归是通过映射φ将数集X映射到高维空间H,然后在高维空间进行线性回归。结构如下:

为了使(5)式逼近原函数,对损失函数进行风险函数最小化求解

另外,我们需要定义核函数是K(xi,xj)=φ(xi)·(xj),其中xi,xj∈X,φ是将X映射到高维空间H的函数。

则(6)式对偶函数可以表达为

根据KKT条件,计算b有如下形式

三、实例分析

选取锐思数据库提供的上海证券交易所的上证指数2001年10月8日到2010年9月30日中2178个交易日中收盘指数作为研究对象,训练集和测试集大致按照3:1的比例划分。以2001年10月8日到2008年9月8日的1678个数据作为训练数据,对2008年9月9日到2010年9月30日的股票收盘价序列共计500个数据进行预测。

应用支持向量机方法对上证收盘指数进行预测,为了提高收敛速度和预测准确率,对原始数据进行归一化处理,将数据归一化到[1,2]之间。经分析上证收盘指数一步模型为xt=f(xt-1,xt-2),选用最常用的径向基核函数K(x,x*)=exp(γ||x-x*||2),在这里建立支持向量机预测模型需要确定惩罚参数C和核参数γ,通过网格搜索法确定参数,建立支持向量机预测模型。

为了分析支持向量机的预测功能,将其和BP神经网络的预测进行对比。BP神经网络采用相同的训练集和测试集,网络训练前对数据进行归一化处理而预测后进行反归一化处理。建立3层的神经网络,确定输入层节点为2,隐含层节点为5,输出层节点为1。应用支持向量机和BP神经网络进行的预测结果如图1和图2,相对误差如图3和图4,计算结果如表1。

从图1、图2和表1可以看出,支持向量机和BP神经网络预测精度都很高,说明两种方法都能够较好的对股市指数进行短期预测。通过图3、图4和表1可以看出支持向量机预测结果相对误差的平方均值小于BP神经网络预测结果相对误差的平方均值,表明支持向量机预上证指数的预测结果表测模型要优于BP神经网络模型。

四、结束语

股票指数走势一直是人们关注的热点。针对股票指数走势的不易确定性,本文提出支持向量机的股票指数预测模型,并且以上证指数为例进行预测。在预测过程中,运用网格搜索法优化了参数。预测结果表明支持向量机的预测精度较高,一定程度上优于BP神经网络的预测模型。这一研究对于股票指数的预测有着重要的理论和实践意义。

参考文献

[1]曹丽娟,王小明.金融工程的支持向量机方法[M].上海:上海财经大学出版社,2007

[2]徐建华,张学工,李衍达.支持向量机的新方法[J].控制与决策,2004,19(5):481-485

[3]邓乃扬,田英杰.数据挖掘中的新方法——支持向量机[M].北京:科学出版社,2004

[4]Ince H,Trafalis T.Short term forecasting with support vectormachines and application to stock price prediction[J].Inter-national Journal of General Systems.2008;37(6):677-687

[5]Atsalakis G,Valavanis K.Surveying stock market forecast-ing techniques-Part II:Soft computing methods[J].ExpertSystems with Application.2009,36:5632-5941

[6]Yang H,Huang K,King I,Lyu M.Localized support vectorregression for time series prediction[J].Neurocomputing.2009,72(10-12):2659-2669

上证指数预测 第4篇

据了解,上述2条指数的基日均为2003年12月31日,基点均为1000点。

根据编制方案,上证100指数以上证380指数为样本空间,选择营业收入增长率和净资产收益率综合排名靠前的100只股票作为指数样本,以突出反映新兴蓝筹类股票的成长特征。

上证150指数以上海股票市场中剔除上证180、上证380指数成份股后剩余符合条件的股票作为样本空间,选择营业收入增长率、换手率综合排名前150名的股票作为指数样本,以集中反映潜力蓝筹板块内股票交易活跃、发展速度快的特征。

最新数据显示,上证100指数、上证150指数的总市值分别为7976亿元和4579亿元。历史数据显示,2004年至2011年上证100指数和上证150指数年化涨幅分别为17.12%和14.27%。

上证指数预测 第5篇

经典的最小二乘回归假定随机残差序列无自相关,误差的方差为一常数。然而研究金融市场时却发现,大多数时间序列往往具有变方差的特征,即在某些时期的波动十分剧烈;而另一时期的波动又相对平稳。为了模拟这种波动,提高预测精度,1982年恩格尔(Engle)提出了方差随时间变化的自回归条件异方差ARCH模型,博勒斯莱文(Bollerslev)又于1986年进一步提出了广义自回归条件异方差GARCH模型。此后,ARCH模型的一些扩展模型也被相继提出,如ARCH-M模型、EGARCH模型、TARCH模型等形成ARCH族模型。这些模型在收益率、利率的波动性、市场风险评估、价格波动等方面得到了广泛的应用并取得了很好的效果。

国内学者关于我国股票市场波动性的研究主要是利用ARCH模型来拟合上证股票收益率序列的异方差性。曾慧(2005)利用ARCH族模型对上证综合指数进行实证分析得出,我国股票市场收益有明显的尖峰厚尾性。刘强等(2006)年运用ARCH模型对上证指数收益率的异方差进行了详细的分析,得出涨幅制度的实施对收益率的异方差性有明显的影响。英英等(2005)年利用ARCH族模型对上证指数的波动进行了拟合,结果表明GARCH(1,1)模型对上证指数波动具有较好的拟合效果。上述文章都仅对上证股票收益序列进行拟合而未对股票指数进行预测。

本文利用不同的ARCH族模型对上证股票指数序列进行拟合,并选择显著性较高的模型对指数序列进行预测,得到的结论是:GARCH模型对上证股票指数序列的拟合和预测比其他ARCH模型效果要好。

二、ARCH族模型简介

(一)ARCH模型

自回归条件异方差(ARCH)的定义有多种方法,目前常用的是恩格尔(Engle)于1982年提出的定义。

若有一随机过程{εt},εt2服从AR(q)过程:

其中{ηt},独立同分布,且有E{ηt}=0,D{ηt}=λ2,t=1,2,…T,则称{εt}服从q阶的ARCH过程,记作εt~ARCH(q)。

为方便研究ARCH(q)的性质,也为方便与其拓展形式联系,ARCH(q)模型可以表示为:

其中,{υt}独立同分布,E{υt}=0,D{υt}=1;ht可以表示为:

(二)GARCH模型

若序列εt可以表示为:

其中,{υt}独立同分布,且υt~N(0,1),t=1,2,…T。由上式定义的过程值的大小,反应出外部冲击对εt波动特征产生影响的持久性,若其值越大,说明产生的影响越持久。

(三)EGARCH模型(指数的GARCH模型)在ARCH过程

则称εt服从EGARCH过程。EGARCH模型的条件方差ht是由指数形式表示的。ht非负且杠杆效应是指数型的。若λk≠0,说明信息作用非对称。

(四)TARCH模型

TARCH模型最先由Zakoian(1990)提出,具体形式如下:

其中,dt-k是一个虚拟变量

由于引入dt-k,股票上涨信息(εt-k>0)和下跌信息(εt-k<0)对条件方差的作用效果不同,上涨时γkε2t-kdt-k=0,其可用系数。若γk≠0,则说明信息是非对称的,而当γk>0,则可认为存在杠杆效应。

三、实证分析

(一)数据说明

本文采用的数据为上海证券交易所每日收盘的上海综合指数(数据来源于雅虎财经网:http://finance.cn.yahoo.com/)。数据时间跨度为2008年1月2日至2009年6月3日,共315个观察值。本文用前310个数据构建ARCH族模型,将后面5个数据留作检验数据,不参与建模。同时,设时间序列yt为这时间跨度上的观察值,为了减缓序列的波动程度,对yt进行自然对数处理,结果如下:

由图1、图2可知,经过对数处理后没有改变上证综合指数的波动趋势,只是减缓了波动程度,这对后面建立方程模型并对其进行一系列统计检验提供了便利,使得模型残差更趋近于平稳,减少两类错误风险。

为了深入了解序列lnyt的性质,我们对序列进行简单的统计检验和单位根检验,结果见表1和表2。

由表1可知,上证综合指数对数序列偏度为0.857617,大于0呈右偏状态;峰度为3.287563,大于3呈尖峰状态。而J-B正态性检验结果也拒绝对数序列成正态分布的假设(P=0.000000),这些结果表明,上证综合指数对数呈现出“尖峰厚尾”形态。

由表2可知,检验统计量t的值是-16.60473,小于显著性水平为1%的临界值,表明至少可以在99%的置信水平下拒绝原假设,认为序列lnyt的一阶差分不存在单位根,即序列lnyt是一阶单整的。

建立方程:

对εt进行条件异方差的ARCH LM检验,得到了在滞后阶数p=1时的ARCH LM检验结果,检验统计量F的值是9.948735,小于显著性水平为1%的临界值,表明至少可以在99%的置信水平下拒绝原假设,说明上式的残差序列εt存在ARCH效应。

(二)建立ARCH模型

1. GARCH(1,1)模型

ht服从GARCH(1,1)过程的模型:

对上海证券市场的上证综合指数通过以上的步骤建立GARCH(1,1)模型,用Eviews计量经济学软件进行参数估计及检验,得到:

均值方程:lnyt=0.999962lnyt-1+εt

方差方程:ht=5.86×10-5+0.105386ε2t-1+0.821272ht-1

在条件方差等式中,系数α1+β1=0.926658<1,满足参数约束条件。模型的AIC和SC值比较小,且R2=0.989716也接近于1,可以认为该模型较好地拟合了数据。

2. EGARCH(1,1)模型

均值方程:lnyt=0.999866lnyt-1+εt

模型中条件方差采用了自然对数形式,α1的估计值0.148219,非对称项λ1的估计值为-0.128614。当εt-1>0时,该信息冲击对条件方差的对数有一个0.019605冲击;当εt-1<0时,它给条件方差的对数带来的冲击大小为0.276833倍。

3. TARCH(1,1)模型

均值方程:lnyt=-0.990877lnyt-1+εt

方差方程:ht=3.52×10-5+0.004366ε2t-1+

0.13934ε2t-1dt-1+0.877552ht-1

可以看到λ1的估计值0.13934>0,认为信息作用是非对称的且存在杠杆效应。因此看到上证股票市场,股价下跌和上涨幅度一样时,股票价格下跌过程中往往伴随着更剧烈的波动。但α1估计值的p值为0.8547,说明ε2t-1项不显著,因此不用此模型来进行预测。

图3、图4分别代表GARCH(1,1)和EGARCH(1,1)模型对序列lnyt的拟合曲线,可以看出拟合效果非常好,下面用这两个模型先对对序列lnyt进行预测。

(三)模型预测

上述模型是利用2008年1月2日至2009年5月25日的310个观察值建立的。用GARCH(1,1)和EGARCH(1,1)模型进行一步验证2009年5月26日的上证综合指数;然后把2009年5月26日的实际值加入到模型中,对模型重新进行估计并一步验证2009年5月27日的上证综合指数;按照上述过程继续增加新的数据,分别一步验证2009年6月1日、2009年6月2日以及2009年6月3日的上证综合指数。因为模型中是上证指数的自然对数值,验证得到的也是对数值,通过对数转换,就可以得到上证指数的原始验证值。计算结果如下:

由表3可知,GRACH(1,1)模型和EGARCH(1,1)模型的计算结果很接近,这说明用同属于ARCH族模型、都运用条件异方差原理,在分析结果上大体一致,具体结果存在细微差别。这也说明运用ARCH族模型进行测算是很稳定的。虽然从表3可以看出测算结果与实际值之间绝对误差不一致,但是从均方差考虑,测算结果还是非常有意义的。

实际值数据来源于雅虎财经网:http://finance.cn.yahoo.com/。

四、结论

本文通过对上证综合指数的对数形式进行研究,用ARCH族模型对其进行拟合和测算,得到结论如下:

1.以上海证券交易所股票价格综合指数日收盘价格序列为样本,研究了我国股票价格序列波动的ARCH效应,结果表明我国股市的股票价格波动具有条件异方差性。

2.并不是所有的ARCH模型都能用来拟合上证指数的对数形式,TARCH(1,1)模型中的一个系数就在置信界限以外,且通过改变模型的滞后阶数也不能很好地改善这种情况。

3.在GRAHCH(1,1)模型中,系数α1+β1=0.926658,接近于1,这说明外部冲击对股价造成的影响具有无限期延伸下去的趋势,股票市场的记忆期也变长了。在这种情况下,政策对股票市场的影响将是长期的。

4.在EGARCH(1,1)模型中,非对称项的估计值为-0.128614,这说明在上海证券交易市场中存在杠杆效应。负的外部冲击导致股价下跌,减少公司债务的股东权益,由此增加了公司的杠杆作用,能带来更大的股价波动。也就是说,在上证股票市场上,利空消息对股票市场的影响要大于利好消息对股票市场的影响。

5.通过对比GRACH(1,1)和EGARCH(1,1)模型的测算值,可以发现EGARCH(1,1)模型的测算值普遍小于GRACH(1,1)模型的测算值。且GRACH(1,1)模型的测算值更接近于实际值,说明GRACH(1,1)模型的测算效果比GRACH(1,1)模型要好。

6.GRACH(1,1)和EGARCH(1,1)两种模型的的测算结果存在波动性,即部分测算数据很接近实际值,部分数据的测算误差就大一些,可能是中国股市的波动性还不是纯随机性的,与国家政策关系密切。因此,为了更好地模拟和测算数据,我们在对模型进行构建时,还需进一步考虑其他因素。

参考文献

[1]陈飞,高铁梅.结构时间序列模型在经济预测方面的应用研究[J].数量经济技术经济研究,2005,(2).

[2]王佳妮,李文浩.GARCH模型能否提供好的波动率预测[J].数量经济技术经济研究,2005,(6).

[3]魏娜.ARCH族模型及其对深圳股票市场的实证分析[J].数学理论与运用,2006,(3).

[4]耿源,贺晋,杨秋玲.ARCH族模型在深沪A股中的应用[J].统计观察,2004,(11).

[5]陈晓杰.沪深300股指期货仿真交易价格风险实证研究[J].山西财经大学学报,2008,(7).

[6]刘强,徐全智,杨晋浩.GARCH模型在上证收益率分析中的应用[J].成都大学学报(自然科学版),2006,(2).

[7]英英,张勇,吴润衡.上证指数收益率的特征及其波动性分析[J].统计与信息论坛,2005,(2).

[8]张玉春.中国股市收益的ARCH模型和实证分析[J].首都经济贸易大学学报,2006,(1).

上证指数预测 第6篇

一、数据介绍

本文所用数据来自于上证指数2008年12月到2012年1月每月的全部交易日收盘价, 由于股票价格指数的时间序列每月均值和方差都在变化, 本文将不直接使用每月的全部交易日收盘价的方差来进行分析, 而是先对原始收盘价数据求完方差后, 再计算出每月全部交易日的均值, 通过这两个数据得出标准差系数, 它们的标准差系数数据如表1。

二、时间序列中ARIMA模型的建立

(一) 序列图描述

本文数据是根据时间顺序排列, 处理数据方法可采用时间序列分析技术。时间序列数据是随机过程的一个特殊样本, 在时间序列分析中, 常用时间序列数据样本对其背后总体的随机过程进行推断, 包括对时间序列的数字特征的推断。在ARIMA分析中, 我们常用的数字特征有:均值函数、自协方差函数、自相关函数和偏自相关函数。本文使用以上数字特征对数据进行平稳性检验、白噪声检验, 最终得出模型方程。

平稳时间序列是指时间序列的统计特征不会随时间的推移而发生改变, 即生成时间序列数据随机过程的统计特征不随时间变化而变化。平稳时间序列分为严平稳和弱平稳, 严平稳的条件在现实生活中很难实现, 而弱平稳则较为普遍。弱平稳的条件是: (1) E (Yt) =μ, 即期望为常数; (2) Var (Yt) =σ2, 即方差也为常数; (3) Cov (Yt, Yt-k) =E ( (Yt-μ) (Yt-k-μ) ) =γ (t, t-k) , 即随机过程两个间隔为k的随机变量间的协方差只与间隔k有关, 与两变量所处的时点t无关。这是从数学角度的验证标准, 在进行严格验证之前往往可以通过序列图的形状初步判断。一般地, 平稳时间序列的序列图如果为一条围绕其均值上下波动的曲线, 则可以认为是平稳时间序列。由本文数据得到的时间序列图如图1。

从图1可以看出, 标准差系数从2008年12月骤然下跌, 直观表明金融危机后期上证指数标准差系数的波动逐渐回稳, 总体序列图成尖状脉冲图形, 上下波动但不明显, 需要做进一步的样本自相关函数检验。标准差系数作为衡量金融市场波动性的手段之一, 反映外界信息对金融市场的冲击, 无论是利好还是利空消息, 都可能导致股票价格的突发性猛烈波动。由于整个金融市场中不良贷款的积累可能每20年出现一个峰值, 这时候如果恰好遭遇标准差系数的波动峰值, 若是利好消息引起的猛烈波动, 则将加大不良贷款的违约风险, 使系统崩溃提前发生;若是利空消息引起的, 则可能导致极短时间内股价不可逆转的暴跌, 在不良贷款和系统内波动的共同影响下, 触发股市崩盘, 引发金融危机。

这种标准差系数的波动还反映投资者的非理性投机行为。我国的金融市场刚刚兴起不久, 政府干预力量巨大, 相关法律不够健全, 交易规则不够合理, 风险管理意识淡薄。股票市场中小股民居多, 他们往往缺乏投资的专业知识, 对消息的敏感度高, 当随机发生的信息进入股票市场时, 就可能会引起投资者的强烈反应, 所以序列图呈现尖状脉冲。

(二) ARIMA模型介绍

ARIMA模型是自回归单整移动平均时间序列的英文缩写, 记为ARI-MA (p, d, q) , 其中p是指组成ARIMA模型的自回归模型部分 (AR (P) ) 的阶数, 记作Yt=φ1Yt-1+φ2Yt-2+...φpYt-p+μt, φ1、φ2、φp称为自回归系数, μt为随机干扰项, 是一个白噪声过程;q是指ARIMA模型的移动平均模型部分 (MA (q) ) 的阶数, 记作Yt=μt-θ1μt-1-θ2μt-2-...θqμt-q, μt、μt-1、μt-2、μt-q为滑动平均系数, 是一组白噪声过程;d是指对原始数据差分的次数, 在这里, “d阶单整”是指非平稳过程的时间序列数据d阶差分后是平稳的。所以ARIMA模型可写作AR模型与MA模型的合成, 即:Yt=φ1Yt-1+φ2Yt-2+...φpYt-p+μt-θ1μt-1-θ2μt-2-...θqμt-q。为了简化模型, 引入滞后算子L, 定义:LYt=Yt-1, 同理:L2Yt=Yt-2, ...L2Yt=Yt-p, 对MA模型也是一样:L2μt=μt-2, ...Lqμt=μt-q。于是, ARIMA模型可化作: (1-φ1L-φ2L2-...φpLp) Yt= (1-θ1L-θ2L2-...θqLq) μt。定义差分算子▽Yt=Yt-Yt-1, d阶差分与滞后算子L之间有如下关系:▽d= (1-L) d。所以对于非平稳时间序列ARIMA (p, d, q) , ARIMA模型可简化为:φ (L) (1-L) dYt=θ (L) μt。

(三) 平稳性严格检验的数学原理及检验效果

上文提到, 对于时间序列平稳性严格检验, 我们采取样本自相关函数 (AFC) 来进行判断, 自相关函数写作:

通过自相关函数可以看出, 当K增大时, γk的分子将急剧减小, 导致自相关函数减小, 很快趋近于零, 这种现象叫做截尾或拖尾。当出现截尾或拖尾现象时, 可以认为时间序列是平稳的。用这种方法检验的ACF结果, 并不拖尾或截尾, 说明原始数据并不是平稳的, 所以需要通过差分技术来对非平稳数据平稳化。经过尝试后认为三阶差分后效果最好, 明显的围绕某个值上下波动的状态, 而且没有趋势性, 直观上可以认为三阶差分后的时间序列是平稳的。

(四) 模型建立的数学原理与实证分析

下面进行ARIMA (p, d, q) 模型建立。模型建立依赖于对组成ARIMA (p, d, q) 的AR (p) 和MA (q) 中p和q的分别估计。下面引入AR (p) 的偏自相关函数。对于AR (p) 部分:Yt=φk1Yt-1+φk2Yt-2+...φkkYt-k+μt, 偏自相关系数是指最后一个自回归系数φkk。它的作用是判断Yt和Yt-k是否有直接关系, 而非通过各自与其他自回归系数建立间接关系。φkk有如下性质:对于AR (p) , 当k≤p时, φkk不等于0, 反之则为0, 也就是所谓的偏自相关函数的截尾现象。又因为φkk是随机变量的数字特征, 所以如果找到其概率分布, 即可通过假设检验判断φkk从p为何值起开始截尾, 从而得到p值。数学家证明, 当k>p时, φkk无限趋近服从均值为0, 方差为1/n的正态分布。所以在0.05显著性水平下, 可以通过计算机迭代得到p值。

对于MA (q) 部分, 则应使用其自相关函数ρk, 此函数为:当k=0时, ρk=1;1≤k≤p时, ρk= (-θk+...θq-kθq) / (1+θ12+...θq2) ;k>q时, ρk=0, 也就是自相关函数的截尾现象。所以, 只需找出从何值开始, ρk=0, 截尾现象出现, 此值即为q值, 这一切也可通过计算机迭代来实现。PACF三步截尾, 可判断为平稳时间序列, 从而得到p=3, q=1, d=3, 所以ARIMA模型为ARIMA (3, 3, 1) 。最后利用SPSS19.0的创建时间序列功能, 得到模型白噪声检验以及参数估计值, 如表2。

由表2可知, sig值为0.443, 远大于0.05, 可以认为模型显著性很高。由表3可知, AR部分的三个系数的sig值均小于0.05, 接受估计值, 但是发现MA部分的系数估计值的sig值大于0.05, 可以拒绝估计值, 但是当设q值为0时, 即将ARIMA (3, 3, 1) 改为模型ARIMA (3, 3, 0) 后, 得到的拟合曲线为图2, 而q=1时的拟合曲线为图3。

对比图2和图3在2009年11月和2009年6月位置上的波动发现, 图3的波动能够更好的拟合观测值, 图2的标准差系数波动过大, 所以图3的拟合效果好于图2, 保留原来的模型假设, 取ARIMA (3, 3, 1) 。模型残差通过了白噪声检验。

从表3中还可以看到, 常数项为-0.785, sig值为0.985, 远大于0.05, 说明模型可以通过去除常数项进行优化, 去掉常数项后MA的第一个系数的估计值的sig值为0.502, 虽然仍大于0.05, 但较保留常数项时表2中的sig=0.672有了较大改善, 可以进行优化。最终得到的拟合图如图4。

可以看出, 估计出的时间序列较好的拟合了实际时间序列图, 虽然有一定偏差, 但都在允许的范围内, 而且比实际的标准差系数波动幅度大一点, 可以为决策者提供决策的提前量。虽然BIC值和拟合优度上去掉常数和不去掉没有区别, 但是从模型的简约性上讲, 去掉常数优于保留常数。

三、模型结果、预测及意义

本文最后得到模型的数学表达式为:φ (L) (1-L) dYt=θ (L) μt。其中, L为滞后算子, φ (L) 为自回归系数的特征方程, φ (L) = (1-φ1L-φ2L2-..φpLp) ;θ (L) 为移动平均系数的特征方程, θ (L) = (1-θ1L-θ2L2-..-θqLq) ;μt为白噪声过程。代入参数得到预测模型的方程为:

经过拟合的序列图分析可知:最终得到的2012年1月预测值为0.415014和-1.291084。从上证指数2012年1月的数据算出的实际标准差系数为0.304233, 结果差距不大, 拟合值比观测值略向前平移了一个月的时间间隔, 所以在实际应用中本文认为应将预测值对应的时间倒退1个月才是实际值对应的月份。预测图表现出尖状脉冲现象, 对于短期的股票价格标准差系数预测具有较好的应用价值。

本文认为, 标准差系数的波动主要反映的是股票市场外的信息对于股票价格的冲击程度, 更深层次反映的是信息对于投资者心理的影响。如果可以测量各大股票指数如道琼斯工业平均指数、标准普尔500指数、纳斯达克指数、日经指数、香港恒生指数及上证指数的标准差系数的方差, 或许可以比较各大股票市场投资者对于信息的敏感程度、理性程度以及投机成分含量, 为未来我国金融改革提供数据支持。更深远的, 由于信息是随机进入股票市场的, 如果有一种方法能够测出信息发生的概率分布, 将是对风险预警领域的一种巨大贡献。标准差系数能够间接反映信息对投资者乃至整个股票市场的影响程度大小, 或许可以以此为一种测度方法, 对影响市场的信息进行更深层次的研究。

四、结论

上证指数作为我国最重要的股票指数之一, 反映我国金融改革步伐和经济发展脉博。外界对股票市场的冲击不可避免, 但冲击后的结果因股票市场中投资者的风险承受力大小、对信息的敏感程度以及整个金融系统的稳定程度而异, 这三点是可以控制的。所以金融监管部门可以通过本文数据估计出股票市场将要遭受的冲击, 进一步推断出其他风险耐受程度指标, 尤其是投资者对信息的敏感程度。这对于理性投资、冲击预警以及金融监管等领域都有重要的指导意义。

摘要:稳定性是衡量股票市场风险程度的一个重要的指标, 主要通过方差的计算来对稳定性进行度量。本文通过对上证指数2008年12月到2012年1月每月全部交易日收盘价的标准差系数进行研究, 运用ARIMA时间序列技术, 得出预测模型, 对未来的标准差系数进行预测。

关键词:上证指数,ARIMA时间序列技术,标准差系数

参考文献

[1] .张龙, 王文博, 曹培慎.计量经济学[M].北京:北京交通大学出版社, 2010.

上证指数预测 第7篇

关键词:多元线性回归,层次分析法,案例推理,上证指数预测

一、引言

就股市投资而言, 辨认市场的运动规律, 对将来时刻的股价指数进行预测, 是股票市场投资决策的关键。股票系统预测的研究具有重大的理论意义和诱人的应用价值, 人们一直探索其内在规律, 寻找其有效的预测方法和工具。由于股票市场的价格走势是极为复杂且难以预测的, 在许多经济学家的共同努力下, 股票定价方法向着量化方向发展。

Ta i-Lia ng Che n等使用基于Fib ona c c i数列的模糊时间序列的方法对股票进行预测;Melike Bildirici等使用人工神经网络扩展的GARCH模型族对伊斯坦布尔从1987到2008年的股票交易进行预测, 并且发现经过人工神经网络的扩展会提高GARCH模型族的预测效果;Ping-Fe ng Pa i等将自回归移动平均模型和支持向量机模型杂交成为自回归移动平均模型和支持向量机组合模型, 并且对股票价格进行预测, 计算测试发现效果良好;Henri Nyberg使用动态二值probit回归模型对每月的股票超额收益进行预测;冯家诚等提出适用于神经网络型数据挖掘的过程模型, 按照选取数据样本、数据转换、网络建模、网络仿真、结果评价的数据挖掘过程, 对上证指数走势进行预测, 得到了较高的预测精度。

案例推理技术是根据相似性对当前案例进行检索, 得到与当前案例最相似的已发生案例, 把该案例的结果作为当前案例的结果。本文开发了基于多元线性回归和层次分析法的案例推理上证指数预测模型。通过相关性分析, 排除与目标函数相关性低的参数, 建立上证指数预测参数集;当使用基于案例推理技术计算案例的相似度时, 需要确定各个影响因素的权值, 本文采用多元线性回归和层次分析法计算各个影响因素的权重;采用灰色关联度的方法对案例进行检索, 通过案例择优对检索结果进行处理。最终对上证指数进行预测, 并且将本方法的预测结果与传统案例推理、多元线性回归和人工神经网络的结果进行比较, 给出了结论。

二、基于多元线性回归和层次分析法的案例推理上证指数预测模型的开发及应用

基于多元线性回归和层次分析法的案例推理上证指数预测模型包括四部分:影响上证指数指标的选取, 多元线性回归, 案例推理和层次分析法, 如图1所示。通过相关性分析, 排除与目标函数明日收盘价相关性低的参数, 建立上证指数预测参数集;通过多元线性回归和层次分析法确定各个参数对目标函数的影响权重, 建立比较矩阵;最终采用案例推理技术对目标函数进行预测。

1. 影响上证指数指标的选取

影响股票价格的各个因素如宏观经济、政策、心理等都反映在其价格变化中, 可以将研究影响上证指数运行的各个因素转化为研究上证指数历史价格的变动上, 应用技术指标分析方法, 对股票的原始数据进行处理, 得出指标值, 这些指标反应了股票的规律或内涵, 根据这些指标对上证指数进行分析。由于这些指标值可能具有一定相关性, 通过相关性分析, 排除与目标函数相关性低的指标, 剩下的指标构成了上证指数预测参数集, 如表1所示。

2. 多元线性回归和层次分析法的应用

当使用基于案例推理技术时, 必须计算案例的相似度, 而计算相似度时需要确定各个影响因素的权值。

采用多元线性回归, 确定各个指标的权重。其基本原理是:目标函数明日收盘价y受x1, x2…的影响, 利用选取的数据样本进行回归分析, 建立模型:

根据最小二乘法, 计算出模型中的参数a0 , a1 , a2…的值, 从而确定各个指标对目标函数影响的权重。

层次分析法 (Analytic Hierarchy Process, AHP) 是一种定性和定量相结合的、系统的、层次化的分析方法[8,9,10]。假设比较的个指标对目标的影响, 如今日收盘价、昨日收盘价、DEA等对明日收盘价的影响。次取两个指标和, 用表示和对的影响之比, 全部比较结果可用以下成对比较矩阵来表示:

对矩阵的一致性采用如下一致性比率公式来判定:

其中, CR为一致性比率, 为一致性指 (为矩阵A的特征向值) , RI为随机一致性指标,取表2的值。

3. 案例描述

从2.1的分析可以得出, 影响上证指数的指标包括:今日收盘价、昨日收盘价、DEA等, 这些指标既可能是状态向量, 也可能是特征向量, 所谓状态向量, 指的是该指标取值形式为离散值, 如今日收盘价={正常、偏高、偏低};所谓特征向量, 指的是该指标取值形式为连续值, 如今日收盘价={t|t>0, t∈R}。本文将所有因素同时考虑为状态向量和特征向量。如图2所示。

4. 案例检索

本文基于灰色关联度的方法计算案例的相似度。设待分析案例为s0, 候选案例为s1, 案例的特征向量维数为n则案例s0和s1在n色相似度为:1s n1=

为案例s0和s1在特征向量的第k个属性上的灰色距离。

为s0和 s1案例和在特征向量的第k个属性上的关联系数, ς∈[0, 1]为分辨系数, 一般取ς=0.5, wk为特征向量的第k个属性的权值, 该权值由多元线性回归和层次分析法计算确定。

5. 案例择优

基于案例推理搜索出的结果是一个根据相似度进行降序排列的案例集, 本文的案例择优不是选择相似度最大的案例, 而是考虑大于相似度阈值的案例集合。因此, 上证指数预测的计算公式如下:

其中, Gi是匹配案例的相似度, iY是匹配案例的实际上证指数, G0是相似度阈值, 本文取0.75。

三、预测结果

上证指数从2011年2月1日到2011年7月28日一共120个交易日, 经历上涨下跌再上涨下跌的行情, 本文采用该时段的数据作为原始数据, 生成前100个案例 (从2011年2月1日到2011年6月30日) 为已有案例集, 后20个案例 (从2011年7月1日到2011年7月8日) 为预测案例。采用多元线性回归, 计算各个指标的权重系数, 如表3所示。根据指标的权重系数计算各个指标的相对权重, 如表4所示。根据指标的相对权重计算出比较矩阵, 如表5所示。

模型使用Java编程, 预测结果如图3所示。为了验证本方法预测股票价格的效果, 分别采用传统的案例推理 (未采用多元线性回归计算参数权重和案例择优算法) 、多元线性回归和人工神经网络预测股票价格, 预测结果如图6, 表6所示。由表6可知, 本模型预测股票价格具有较高的精度, 误差区间在[-5, +5]范围内, 本方法为45.0%, 其他方法都小于或等于30.0%;误差区间在[-10, +10]范围内, 本方法为75.0%, 其他方法都小于或等于55.0%;误差区间在[-20, +20]范围内, 本方法为95.0%, 其他方法都小于或等于90.0%。如果对每天的上证指数波动的预测在±10个点内被定义为预测准确的, 那么基于多元线性回归和层次分析法的案例推理的预测模型的准确率达到75%, 而上证指数±20个点的预测准确率为95%。

另外, 案例推理具有检索时间短的特点, 案例推理每个案例检索时间大约1秒, 20个案例检索只需要20秒左右, 而人工神经网络进行上证指数预测, 需要进行长时间训练, 大约需要217秒。下一步的研究将引入宏观经济指标和政策因素到模型中, 利用案例推理进行上证指数和个股股价的预测。本模型以天为单位进行预测, 改进后还可以进一步以5分钟或10分钟为一个时段对下一个或二个时段进行预测。

四、结论

本文开发了基于多元线性回归和层次分析法的案例推理的上证指数预测模型;通过相关性分析对上证指数预测指标进行筛选, 排除了与目标函数相关性低的参数;通过多元线性回归和层次分析法确定各个参数对目标函数的影响权重, 克服了传统定性分析方法不准确的缺点;通过案例推理对案例进行检索, 并且使用案例择优处理检索结果。最后基于同样的数据, 与传统的案例推理、多元线性回归和人工神经网络进行比较。

(1) 本模型预测股票价格具有较高的精度, 误差区间在[-5, +5]范围内, 本方法为45.0%, 其他方法都小于或等于30.0%;误差区间在[-10, +10]范围内, 本方法为75.0%, 其他方法都小于或等于55.0%;误差区间在[-20, +20]范围内, 本方法为95.0%, 其他方法都小于或等于90.0%。

(2) 案例推理具有检索时间短的特点, 案例推理每个案例检索时间大约1秒, 20个案例检索只需要20秒左右, 而人工神经网络进行上证指数预测, 需要进行长时间训练, 大约需要217秒。

参考文献

[1]冯家诚, 马锐.基于神经网络型数据挖掘技术的股价预测[J].计算机应用, 2009, 29:155-156. (Feng Jia-cheng, Ma Rui.Stock price forecast based on data mining of neural networks[J].Journal of Computer Application, 2009, 29:155-156.)

[2]李响.基于BP神经网络的股价预测[J].大连海事大学学报, 2008, 34 (增刊) :114-116. (Li Xiang.Prediction of the price of stock based on the BP neutral network[J].Journal of Dalian Maritime University, 2008, 34 (Suppl) :114-116.)

[3]储小俊, 刘思峰.基于新陈代谢GM-Markov模型的股价预测[J].山东财政学院学报, 2007, 3:43-45. (Chu Xiaojun, Liu Sifeng.Forecasting of Stock Prices Based on Metabolic GM-Markov Model[J].Journal of Shandong University of Finance and Economics, 2007, 3:43-45.)

[4]Tai-Liang Chena, Ching-Hsue Cheng, Hia Jong Teoha.Fuzzy time-series based on Fibonacci sequence for stock price forecasting[J].Physica A, 2007, 380:377-390.

[5]Melike Bildirici.Improving forecasts of GARCH family models with the artificial neural networks:An application to the daily returns in Istanbul Stock Exchange[J].Expert Systems with Applications, 2009, 36:7355-7362.

[6]Ping-Feng Pai, Chih-Sheng Lin.A hybrid ARIMA and support vector machines model in stock price forecasting[J].Omega, 2005, 33:497-505.

[7]Henri Nyberg.Forecasting the direction of the US stock market with dynamic binary probit models[J].International Journal of Forecasting, 2011, 27:561-578.

[8]Saaty TL.The analytical hierarchy process[M].New York:McGraw Hill.1980.

[9]冯伟.基于层次分析法的税收征管质量评价指标体系研究[J].广西师范学院学报自然科学版, 2011, 28 (2) :87-92. (Feng Wei.Evaluation Index System of Quality of Tax Collection and Administration Based on AHP Method[J].Journal of Guangxi Teachers Education University:Natural Science Edition, 2011, 28 (2) :87-92.)

[10]林丽, 关德君.基于层次分析法的空间信息网管理域划分算法[J].计算机应用, 2011, 31 (8) :2279-2285. (Lin li, Guang De-jun.Management domain division algorithm based on analytic hierarchy process in space information network[J].Journal of Computer Applications, 2011, 31 (8) :2279-2285.)

[11]许树柏.层次分析法原理[M].天津:天津大学出版社, 1988.

探索影响上证指数的因素 第8篇

关键词:汇率,利率,宏观经济景气指数

1 上证指数影响因素的背景分析

证券投资分析的基本理论认为, 证券市场的价格既受市场环境变化的影响, 这些因素包括诸如由利率、汇率、货币政策、通货膨胀率等的变化而引起的宏观经济情况的变化, 也受产业特征变化的影响。

本部分内容致力于研究上证指数的影响因素, 本文在其他研究成果的基础上综合考虑, 并结合本文特点, 选择了银行拆借利率、汇率、宏观经济景气指数、通货膨胀率、工商银行股价、日均成交金额六个因素作为影响上证指数的主要因素, 尝试分析各因素对上证指数的影响程度, 并依据得出的模型作适当的短期预测。

2 多元线性回归模型的建立

2.1 模型估计

通过上证指数与六个自变量的散点图 (图1 (a) ~图1 (f) ) 可以看出, 上证指数与工行收盘价之间有明显的正相关关系, 线形趋势明显;与汇率之间有明显的负相关关系 (即人民币贬值, 上证指数下跌) , 线形趋势明显;与CPI之间成正相关关系, 线形趋势较明显;与上证所日均交易金额成正相关关系, 线形趋势明显;与宏观经济景气指数成正相关关系, 线形趋势明显;与七天同业拆借利率成负相关关系, 线形趋势不明显。依据这些散点图可以初步判断, 模型的选择是基本合理的。

定义工行股价为x1, 汇率为x2, 七天同业拆借利率为x3, CPI为x4, 上证所日均成交金额为x5, 宏观经济景气指数为x6。使用SPSS软件估计得回归模型:

y=54490.787+200.756x1-55.959x2-

81.331x4+0.359x5-91.563x6 (1)

r2=0.981, sig=0.000, 说明判定系数具有统计上的显著性。r2=0.981, 说明此回归模型解释了上证指数98%的变差。回归模型sig=0.000, 说明回归模型整体通过了检验, 具有统计上的显著性。只有七天同业拆借利率的sig=0.918>0.05未通过检验, 其余五个自变量的sig值都小于0.05 (显著性水平为5%) , 都通过了显著性检验。

2.2 自相关检验、异常值检验

通过计算, DW=2, 查DW表知, 样本量为102, 自变量个数为6的临界值DL=1.58, DU=1.80, DU

图2为残差的直方图, 它所描述的是残差是否服从正态分布, 从图中可以看到, 残差直方图很好地拟合了正态曲线, 说明残差服从正态分布, 进一步说明模型误差项的正态假设是成立的。图3为因变量观测累计概率和模型预测值累计概率间的正态PP图, 也是用于观察残差分布是否正态的。可见散点基本呈直线趋势, 且未发现极端值, 进一步验证残差正态趋势明显。

在采用最小二乘法的回归模型估计中, 如果存在异常点或离群点, 它们离回归直线较远, 相应距离的平方就非常大, 回归直线不得不强烈地向该点所在的方位偏移, 显然, 这可能会导致错误的分析结论。因此回归分析中必须要仔细考虑有无强影响点存在。一般称严重偏离既定模型的书籍点为异常点 (即Y异常值) , 远离数据主体的点为高杠杆率点 (即X异常值) , 对统计推断影响特别大的点为强影响点。

(1) 散点图分析

各自变量及因变量并没有远离数据总体趋势, 所以不存在X异常值及Y异常值, 更不存在强影响点。

(2) 删除残差分析

删除残差的思想为:在计算第i个观测值的残差时, 用剔出第i个观测值的其余n-1观测值拟合回归方程, 计算出第i个观测值的删除拟合值undefined, 这个删除拟合值和第i个值无关, 不受第i个值的影响, 由此定义删除残差:undefined。由SPSS分析结果可知, 删除残差的最大值为180.4174, 最小值为-146.4375, 均值为-0.23917, 标准差为62.88, 由三倍标准差准则知, 没有关于Y的异常值。

2.3 多重共线性检验

多元线形回归的一个假设是, 各个自变量之间不相关, 如果相关将带来一系列问题:

(1) 回归系数的估计值方差越大, 估计精度就越差。

(2) 回归方程整体高度显著时, 一些回归系数则通不过显著性检验。

(3) 回归系数正负号也可能倒置, 使得无法对回归方程得到合理的经济解释。

(4) 直接影响最小二乘法的应用效果, 降低回归方程的应用价值。

2.3.1 直观检验法

由SPSS分析结果可知, 日均成交金额与汇率之间的相关系数达到了-0.932, 所以两变量的高相关很有可能会产生多重共线性。另外, 利率因素明显应该影响上证指数的因素, 却没有通过显著性检验, 这也有可能是共线性导致的。

2.3.2 方差扩大因子法 (VIF)

下表中Collinearity Statistics 一列数中, 汇率和日均成交金额的VIF值大于10, 所以判断共线性问题是由这两个变量引起的。模型修改:删除日均成交金额这一变量, 再次进行回归 (采用stepwise法选取变量) , 得如下分析结果:

由上表可以看到, 各个变量的VIF值全部小于10, 消除了共线性问题, 并且先前未通过检验的七天同业拆借利率也通过了检验, 另外, 判定系数仍然达到了0.989的高值。所以, 去掉日均成交金额变量的修正方法, 还是很有成效的。

日均成交金额之所以未被选入模型, 原因在于:当股市牛市时股民们争相投资股市, 成交金额会大幅上涨;而当股市熊市时, 股民会降低对股市的期望, 股市利空, 股民抛股, 成交金额也会很大。所以无论股市涨还是跌, 成交金额都有可能会很大, 所以日均成交金额这一变量与上证指数不存在明显的线性关系, 那么此变量未选入模型也就可以理解了。

新模型为:

y=68657.348-73.724x2+201.130x1-

120.827x4-60.489x3-89.723x6 (2)

3 模型的应用

3.1 经济因素分析

经济因素分析致力于研究各个自变量对因变量的影响程度, 它对模型的要求较高, 模型不能存在共线性等问题, 所以选择式模型 (2) 进行经济因素分析较为合适。

由上表可知, 汇率、工行收盘价、CPI、七天同业拆借利率、宏观经济景气指数的偏回归系数 (Partial Correlations) 分别为-0.891, 0.804, -0.514, -0.323, -0.256, 进一步可计算出, 汇率可解释因变量变差中的89.3%, 在引入工行收盘价时, 又消除了剩余变差中的64.6%, 在引入CPI 后, 又消除了剩余变差中的26.4%, 在引入七天同业拆借利率后, 又消除了剩余变差中的10.4%, 再引入宏观经济景气指数后, 又消除了剩余变差中的6.6%。最终, 这五个自变量共消除了因变量变差中的98.9%。

从各个自变量被选入模型的顺序可以得到, 汇率因素对上证指数的影响最为明显, 其次依次为工行收盘价、CPI、七天同业拆借利率、宏观经济景气指数。

3.2 经济决策预测

经济预测分析致力于研究根据现有估计模型去预测因变量在未来某个时点上的取值。由于影响上证指数的因素很多, 而且很难加以控制和掌握其变动规律, 所以依据估计模型的预测仅局限于短期的预测, 并且这种预测也仅能作为一种极其边缘化的预测。

根据回归分析理论, 如果建模的目的是预测, 那么只要保证自变量的相关类型在预测期内不变, 即建模自变量间的共同的相关趋势在预测时仍基本保持, 那么即使使用自变量之间具有多重共线性的回归模型去预测, 预测效果还是会不错的。根据本题特点, 各种经济自变量的相关关系在短期内一般是不会改变的, 所以可以使用式模型 (1) 进行预测, 且效果会较式模型 (2) 稍好, 因为其判定系数99.1% 大于式模型 (2) 的 98.9%。

4 结 论

文章对影响上证指数的因素作了一些力所能及的探寻。通过分析, 本文可以得出以下结论:

(1) 通过建立汇率、宏观经济景气指数、CPI、工行股价、日均成交金额与上证指数的回归模型知道:汇率因素对上证指数的影响最为明显, 其次依次为工行收盘价、CPI、七天同业拆借利率、宏观经济景气指数, 汇率可解释因变量变差中的89.3%, 五个自变量共消除了因变量变差中的98.9%, 并且日均成交量这一解释变量未通过显著性检验。

(2) 可以利用估计回归式 (1) 进行短期预测。虽然存在多重共线性问题, 但是这并不影响使用模型进行短期预测, 在涉及预测模型中的工行股价这一变量时, 虽然不可能得到预测期的工行股价, 但是可以根据工行的近期经营业绩, 或者是否有一些新的产品面世等相关数据对工行股价做一个预测, 再将此预测数据代入回归预测模型。

本文所做的研究, 只是从统计学角度观察股市走势的一种探索。影响股市走势的因素有很多, 这些因素有很多都是不可控的, 所以不可能只根据这两个模型就断定大盘走势, 这种研究只能对判断大盘走势提供相关信息或帮助。

参考文献

[1]晏艳阳, 胡俊.股票价格与上市公司业绩的关联分析[J].系统工程, 2006, 24 (8) :1-2.

[2]曹红辉.汇率变动与证券市场的关系.www.hexun.com, 2005/07/26.

[3]府亚军.加息对证券市场的影响分析[J].湖南经济管理干部学院院报, 2005 (3) , 16 (2) :1-3.

[4]顾军蕾.加息可能使银行股业绩普遍上升[N].中国证券报, 2007-03-20.

上证指数第一阶段下跌将要结束 第9篇

很多读者朋友问笔者,为什么会产生如此的暴跌?实际上答案很简单。任何一轮行情的产生,根本的原因是资金和心理预期。前一段时间的暴涨,是因为场外杠杆资金的疯狂入市;同时,各大主流媒体一再渲染“大牛市”的氛围。当资金和股民的心理预期重合上,即产生了暴涨。

而当前是什么情况呢?开户数环比下降、降杠杆、IPO未有停止,而随着指数的暴跌,特别是对“利好消息”的无视,导致股民心中的预期越来越悲观,形成了一个负反馈的恶性循环!

简单点,新增入市的资金少于前期的量(只有像“永动机一样”不断加量才可以),股民心理预期发生了变化,暴跌出现。

技术上看,5178点开始的第一阶段下跌马上结束,预期7月6日开始的一周将会是反弹运行的一周,将会给近乎窒息的股民朋友带来一丝安慰!但正式技术分析前,笔者需要重复老的观点,提醒大家不要太过乐观:将要运行的上升仅是一段反弹,最乐观的是针对5178点下来的B浪反弹,反转不可能,5178点成为2015年度高点的可能很大!

笔者自4月中旬提出6月16日一线可能见顶的观点,其间6月23日的反弹、各种利好消息引起的反弹等均未提出过“第一阶段下跌结束”的观点。一直到了7月2日14:00开始才提出“第一阶段下跌结束,反弹底部初成型”的观点!原因主要如下:

空间上:3800点到3950点一线为强大的空间支撑群,如图一所示,三个重大的历史高低点的黄金分割线位于此处,所以,笔者认为此处能支撑的住第一阶段的下跌。

通过看图一可知:

1、95点到6124点,共上升了6029点,则6029×0.618+95=3820点;

2、1664点到6124点,共上升了4460点,则4460×0.5+1664=3894点;

3、1849点到5178点,共上升了3329点,则3329×0.618+1849=3906点;

上述空间支撑,选取了比较重大的历史高低点进行了计算,正如同笔者每年元旦选取重要高低点时间进行时间计算一样,得出的结果都是比较重要的!同时,上证指数的30周线本周到达了3800点。

所以,笔者认为上证指数于有效低于3800点以下收盘的可能不大,在第一阶段下跌过程当中!

时间上:笔者在元旦时提出了全年最重要的日线时间节点,6月15日、6月16日、6月18日、6月26日均是中阴线报收。如此重要的日线时间,上证指数选择了中阴线报收,说明了整个市场处于一个下降趋势当中。纵观最近的日线时间,则也只有7月6日的时间了,而8月份的日线时间则最重要的在8月3日(待以后再分析)。7月6日的日线时间组序列如下:

2014年12月24日——2015年1月9日——1月27日——3月4日——5月19日——7月6日——8月3日——11月9日——12月7日——2016年第67个交易日!

通过观察可知,2015年的1月9日和1月27日均是小高点的性质,而3月4日和5月19日则是小低点向上的性质。据此可得出两点结论:

1、7月6日的时间节点仅是小级别性质,与上月的6月16日前后的时间节点不可同日而语;

2、其同样也为小级别低点的可能大于小级别高点的可能!

需要注意的是,同组时间序列中的2015年8月3日的时间节点,则是大小周期时间节点的共振。

结构上:笔者之所以面对前期的诸多利好而一直未提出“第一阶段下跌结束”的观点,除了时间未到外,根本原因还在于结构未达到。7月2日下午14:00分,笔者认为结构已经基本成型了!

通过看图二可知:

1,5178点的下跌走了ABC-X-ABC三浪下跌;当然,分时划浪容易错,也可划分成五浪下跌,不去细究,不是读者想呈现的重点,此处只要知道,第一阶段大的下跌浪进行到了尾声即可。

2,给广大读者看的重点是,上述下跌过程当中,截止目前共有4个下跌子浪,2个反弹上升浪。大家可以数下,每个下跌子浪运行时间,其中前三个下跌子浪均运行了10个(11个)小时,而自7月1日午盘(最高4316点)运行的最后一个下跌子浪,截止到7月2日收盘是运行了6个小时,即到了7月3日收盘或7月6日开盘第一小时结束,即运行完了一个直接的时间对称!而这正好与笔者在元旦时计算的2015年7月6日的时间相同。

3,底部结构来看:5178点下跌以来,上证指数在30分钟和60分钟共出现了两次相对低位的背离,6月23日的背离已经被打穿,目前是第二次背离。此与前面的15分钟底部结构相比,大了许多!

综上所列的各种原因,笔者给出结论:上证指数第一阶段下跌将要结束,反弹的底部已经初成,下周整体运行在反弹周期当中!

操作策略上:此处相当简单,对技术分析的结果完全可以不用理会!用操作策略来规避预测的不确定性即可。

深套的,持有等反弹。未介入的,列好止损前提下,低点积极介入。1)到了止损位坚決止损,否则还是不要操作反弹为好。2)列跟进止赢持有,每天上提止赢位!分时低点可以加仓,但加仓后的平均成本要低于加仓后所列的止赢出局位,到了止赢位坚决走人再说,以不亏本金为主!

我国上证指数周内效应研究 第10篇

周内效应也称为星期效应,特指股票市场中表现出来的某些现象,具体来说是研究股票市场中各个交易日的收益率和波动性的变化规律,即在一周的股票交易周期中,某一天的收益率显著区别于其他交易日,或者某一天的波动性明显不同于其他交易日,以此我们总结出的具有一定规律的效应称之为周内效应。

研究股市周内效应的文献很多,而且结论也存在很大的不一致性。从国外来说,Cross(1973)最早发现周内效应现象,得出纽约股票交易所周五的平均收益最高,而周一最低的结论。French(1980)也发现了类似现象的存在。后来Keim(1984)再次印证了美国股市收益率表现为正周五效应和负周一效应的结论。Jaffe和Westerfield(1985)发现澳大利亚、加拿大、日本、英国四个工业化国家股票市场也存在周内效应,具体表现为英国和加拿大股票市场周一的平均收益率最低、日本和澳大利亚的股票市场周二的平均收益率最低。Solnik和Bousguet(1990)证明巴黎证券交易所股票收益率表现为周二效应。Barone(1990)研究意大利的股票市场得出类似的结论。

众多学者在对中国股市的研究中也发现存在周内效应。赵俊等人(1994)探讨了1993年7月1日至1994年5月1日上证股市12种股票和上交所综合股价指数收益的周内效应,发现股票平均收益周一最低且为负,周四最高且为正。俞乔(1994)也发现沪深股市收益存在显著的周内效应。徐剑刚 (1995) 利用GARCH模型对沪深股市股市1992年—1994年间收益率的周内效应进行检验,发现周一平均收益最低且显著为负。杨朝军(1997) 对上证股市1993年—1995年收益率的星期效应进行F检验表明,周一、周二的收益率明显偏低,周四、周五的收益率较高。严太华、孟卫东等(2000)对上证股市1992年—1999年间收益率周内效应进行了Levene和Kruskal-Wallis-H检验,得出结论认为周二平均收益最低,周五平均收益最高。封立城(2000)通过对沪深股市1992年—1998年间的数据分析,得出沪深股市均存在负的周二效应和正的周五效应的结论,由于其仅仅使用普通最小二乘法,结论的可信性比较低。任燕燕等(2001)结合主成分分析和GARCH模型对我国股票市场周内效应进行检验,结果显示平均收益周二最低、周五最高。何兴强(2003)使用AR(m)-GARCH模型得出周五平均收益最高,周一平均收益最低和周四波动最大,周五波动最小的结论。王玉龙(2009)使用GARCH模型对上证综指1996-2008年的数据进行分析,发现存在负的周四效应。

我们认为,对周内效应的实证研究的差异来自于三个方面:一是研究市场的不同,不同市场可能会表现出不同的收益特性;二是研究方法的不同,不同模型基于不同假设从而对特定市场的适应性不同,研究结论也会不同;三是样本期间的不同,同一市场不同时期也会表现出不同的收益特性。本文关心的问题是,在较长的周期内,我国上海证券交易所是否存在稳定的星期效应。本文通过运用最小二乘法、GARCH-M模型以及修正的GARCH-M模型对上述数据进行研究,以分析我国上证指数的周内效应。

二、模型

对于最小二乘法我们选取多个变量做线性回归。下面主要是对GARCH-M模型以及修正的GARCH-M模型的介绍。在此之前我们必须要对ARCH模型做一个简单的介绍。

(一)ARCH 模型

ARCH模型 (autoregressive conditional heteroskedasticitymodel)由恩格尔(Engle,R.)在1982年提出。ARCH模型的主要思想是:扰动项μt的条件方差依赖于它的前期值μt-1的大小。ARCH(1)模型就是时刻t的μt的条件方差(σ2t)依赖于时刻(t-1)的扰动项平方的大小,即依赖于(μ2t-1)。ARCH(q)模型可表示如下:

式中 (ft,Xt-1,Xt-2,…)为序列ΣXt Σ的自回归模型;Σεt Σ是残差序列;ΣetΣ是独立同标准正态分布的序列;aj>0(j=0,1,…q);

记Ωt-1表示t-1时刻所有可得信息的集合,则:

所以Σht Σ为残差序列Σεt Σ在t时刻的条件方差。它反映了序列条件方差随时间变化的性质,即条件异方差性。

(二)GARCH-M 模型

博勒斯莱文(Bollerslev,T.)于1986年将ARCH模型发展成为GARCH模型(generalized ARCH model)。在GARCH模型中,要考虑两个不同的假定:一个是条件均值,另一个是条件方差。

GARCH(p,q)模型的结构为:

式中 (ft,Xt-1,Xt-2,…)为序列ΣXt Σ的自回归模型;Σεt Σ是残差序列;ΣetΣ是独立同标准正态分布的序列;aj>0(j=0,1,…q);

显然有

在金融领域被广泛采用的是GARCH (1,1) 模型。标准的GARCH(1,1)模型为:

式中Xt=(X1t,X2t,…,Xk)t' 是解释变量,γ=(γ1,γ2,…,γk)'是系数向量。由于σt2是以前面信息为基础的一期向前预测方差,所以称作条件方差,它包括三个组成部分:

(1)常数项:ω;

(2)用均值方程的扰动项平方的滞后来度量从前期得到的波动性信息:ε2t-1(ARCH项);

(3)上一期的预测方差:σ2t-1(GARCH项)。

其中α>0,β>0,同时保证GARCH(1,1)模型是平稳的,要求α+β<1。

一方面,GARCH(1,1)模型设定下,代理商或投资者通过长期均值的加权平均(方差中的常数)、以前各期中观测到的关于变动性的信息(ARCH项)和上期的预期方差(GARCH项)三项来预测本期的方差。资产收益的上升或下降都会引起代理商或投资者对下一期方差预测的变化。这很符合金融市场的收益特性。所以在本文中我们采用GARCH(1,1)模型来解释方差的波动性。另一方面,投资者在进行某一项目投资时,认为是否值得依据就是在不同风险下,是否获得了应有的回报,在估计收益率时,就应该将预期风险考虑在内,所以为了使模型更符合现实,我们在模型的均值方程中加入本期预测的方差。就是计量模型中的GARCH(1,1)-M模型。

由于我们是对股市的周内效应所做的分析,我们在此需添加五个虚拟变量。我们设:

所以在本文中的GARCH(1,1)-M模型的形式为:

(三)修正的 GARCH(1,1)-M 模型

修正的GARCH(1,1)-M模型是在方差中引入反映周内效应的虚拟变量。由于在条件方差中含有常数项我们只需引入四个虚拟变量。在本文中我们只引入了代表周一、周二、周四、周五的虚拟变量。其形式为:

三、数据

本文所选数据是从软件同花顺中导出的数据,选取自1999年7月1日证券法实施之日起到2011年7月15日的上证指数作为研究对象,为了减小误差我们对数据{Pt}进行自然对数处理。我们取t日的收益率Rt=100×(ln Pt-ln Pt-1)。

数据统计分析结果如下表所示。

从统计结果分析来看,平均而言,周一、周三和周五具有正的收益率,而周三平均收益最高,周二和周四具有负的收益率,且周四最低。从平均收益的标准差看,周一的波动最大,其次是周四,而周五的波动最小。从偏度、峰度和Jarque-Bera统计量可以看出这些数据具有狭缝、厚尾和非正态分布的特征。

四、实证结果

(一)多元线性回归模型

本文先通过单位根的检验来确定回归方程的形式,所用的方法是ADF单位根检验。结果如下:

由上表可以看出,-53.93586<-2.565757,所以收益率在1%的显著水平下拒绝原假设,可以认为收益率是平稳的。由此可以直接设模型形式为:Rt=a1D1t+a2D2t+a3D3t+a4D4t+a5D5t+εt。下表是线性回归的结果:

由最小二乘法模型结果可知,周一、周三和周五具有正的收益率,其中,周三最高,而周二、周四则有负的收益,且周四最低。但是由于t值较小,只有周三、周四在α=10%置信水平下显著,使得该模型的可信性较低,接下来要检验残差的异方差性,如果回归方程具有ARCH效应,我们可以用GARCH模型。一般常用的方法是ARCH-LM检验方法。结果如下:

由上表可 以看出 ,ARCH-LM检验结果LM统计量的Obs*R-squared值的伴随概率很小,拒绝原假设,该模型具有高阶ARCH效应,可以用GARCH-M模型。

(二)GARCH-M 模型结果

我们进一步使用GARCH(1,1)-M模型进行实证分析,结果如下表(见下页)。

由表的上半部分可以看出,在考虑本期预期方差的情况下,周四的收益为负,且在1%的水平上显著,而对于周一、周二、周三、周五收益为正,但是都不显著。GARCH项的系数为正,符合收益与风险的正相关关系,但是系数很小,且从p值来看,该结论并不显著。从表的下半部分来看,由于α=0.095413,β=0.892567,α+β<1,所以该波动具有长期性。

我们再对残差进行检验,结果如下:

由上表可以看出,随着滞后阶数的增大,Obs*R-squared值的伴随概率越来越大,当滞后阶数为6时,伴随概率几乎为1了,与前面相比,残差的ARCH效应在GARCH模型中已经消除。

(三)修正的 GARCH-M 模型结果

一般的GARCH-M模型不能分析一周内每日的波动,我们进一步通过修正的GARCH-M模型来分析,结果如下:

á通过模型结果可以看出,结论与模型二的结果是一样的,表现为周四具有负的最低收益,从z统计量和p值来看,该结果在1%的水平上是显著的,而在其他交易日内则是不显著。通过表的下半部分,我们可以看出周二的波动性最小,可以认为周二减小了收益率的波动,而且该值在1%的水平上显著。由于α=0.95459,β=0.891310,α+β<1,所以其波动具有长期的稳定性。

五、结论

本文依次使用了线性回归、GARCH (1,1) 模型和修正的GARCH(1,1)模型对上证指数1999年7月至2011年7月周期内的周内效应进行了实证检验。利用上述三种实证分析方法得出的结论一致,具体结论如下:

1.三种方法表明,周一、周三、周五的收益均为正,后两种方法,周二的收益率也表现为正,但系数都不是很显著,而只有周四的收益率显著为负,且在后两种研究方法中,都是在1%的高水平上显著,所以得出结论我国沪市平均收益率表现出了周四效应,具体为周四收益率最低。

2.修正的GARCH模型表明,周二的收益率波动最小,周三的收益率波动最大,从模型的系数显著水平来看,只有周二的系数在1%的水平上是显著的,因此表现出负的周二效应。

3.后两种模型表明,期望收益率与波动风险之间存在正向关系,但是系数很小,而且不显著。

一方面,周内效应通常被认为是一种与有效市场假说理论相悖的一种现象;另一方面,我国股市同西方发达国家相比,我们的股市仍然处于不成熟时期,所以在本文研究中并没有得出高风险高回报的结论。

摘要:随着股市对于经济发展的作用越来越大,以及自身规模的不断扩充,对于股市的周内效应的研究由来已久。文章以我国的上证指数作为研究的对象,研究股市的平均收益率与波动性的周内效应,研究表明:在长达12年的样本周期内,上证指数平均收益率具有负的“周四效应”,而在波动性上具有“周二效应”。

上一篇:怎样引导学生阅读经典下一篇:保险合同会计准则