预测系数范文(精选9篇)
预测系数 第1篇
关键词:组合预测模型,固定权组合预测,变权组合预测,人工神经网络
在预测实践中,对同一问题通常有不同的预测方法,但是它们的应用条件、构模机理,都存在一定的局限,采用任何单一预测方法,都难以获得较为满意的结果。于是,人们便将多种不同的预测方法进行适当的组合,综合利用各种方法提供的信息,扬长避短,以提高预测精度,便形成组合预测方法。组合预测能减少各个单项方法的随机因素的影响,将各种预测效果进行总体性综合考虑,比单个预测模型更系统、更全面。因此,自1969年J. N. Bates和G. W. J. Granger首次提出组合预测理论与方法以来,组合预测方法受到了极大关注和广泛应用[1]。
确定各个单项预测方法的加权系数是组合预测的关键。根据组合预测确定权系数的不同,将组合预测模型分为固定权系数组合预测模型和变权系数组合预测模型。固定权系数组合预测方法的权系数确定比较简单,有关研究一直占主导地位并取得一定的进展[2]。而变权系数组合预测的研究虽然是提高预测模型的预测精度,增强预测模型实用性的有效途径,但由于权系数是随时间变化的函数以至确定其形式就显得更加困难[3,4]。文献5针对最优组合模型出现负权重的情况,采用神经网络模型来解决最优权重分配的不足。文献6引入神经网络模型和三种灰色模型,从而建立了灰色神经网络组合预测模型。文献7 给出了几种确定变权系数方法。文献8 引入遗传算法,提出一种遗传定权组合方法,文献9利用模糊理论,提出一种模糊变权组合预测方法。在组合预测方法中权系数的确定问题上,本文提出变权和定权两种组合预测方法。这两种方法不仅权系数满足非负条件,而且提高了组合预测的拟合精度。
1 改进的定权组合预测方法
设对于某一个预测问题有m(m≥2)种不同的预测方法,实际观测值向量X=(x1,x2,…,xn),组合模型预测值向量
式(1)中
本文运用两种方法对时间序列进行综合预测,使运用这两种方法预测的SMAPE (symmetric mean absolute percentage error)和NRMSE (normalized root mean square error)达到最小,使预测结果的误差和稳定性达到最优。最终两种组合预测模型中的权系数ω1和ω2得到确定,记为SMNE固定权组合预测方法。
预测期的时间序列应该与相近的时间序列关系更大,而如果将所有训练样本的拟合误差均作为赋权的依据,就没能充分反映出序列依据趋势移动这一特点。本文提出一种对邻近预测误差较小的模型赋以较高权系数的方法:
式(3)中
2 基于神经网络的变权组合预测方法
确定各个单项预测模型的加权系数是组合预测的关键。本文利用以下方法来确定权系数:
2.1 第i种方法在t时刻的加权系数
2.2 以ωi1,ωi2,…,ωin为样本
用BP神经网络预测权系数
2.3 将
得出j时各预测方法的权系数:
式(5)中
大部分组合预测方法不能保证预测误差平方和较小的方法在每个时刻的误差绝对值较小。如果有一个或几个时刻的误差绝对值较大,却被赋予较大的权重,会导致组合预测误差平方和增大,影响组合预测效果。基于神经网络的变权组合预测方法不仅克服了以上缺点,而且保证对误差绝对值较小赋予较大的权重。
3 算例与分析
本文应用社会消费品零售总额的数据进行实例分析(数据来源于财新网)。
首先利用ARIMA模型预测和BP模型预测分别对2008年1月~2012年5月社会消费品零售总额进行预测。以前4年数据建立模型,将后5个月作后验检验。2012年1月~5月的预测结果如表1所示[10]。然后利用本文方法确定权系数,最后利用权系数组合两种模型得到社会消费品零售总额的预测值。
为了评价本文方法的预测性能,给出预测精度的两种评价标准:
式(6)中
为了验证本文两种方法的有效性,引入方差倒数组合预测方法和最优组合预测方法进行对比。其中方差倒数组合预测方法记为定权方法1;最优组合预测方法记为变权方法1;SMNE固定权组合预测方法记为定权方法2;误差倒数变权组合预测方法记为变权方法2。几种方法的预测性能指标如表2所示。
如表2可知:
(1)从预测方法的拟合精度比较中可以看出,组合预测模型的拟合精度优于单个模型的拟合精度。例如在对社会消费品零售总额预测中,定权方法1与ARIMA模型相比,前者的误差评价标准σ2为2.965 9×10-7,后者为4.793 9×10-7,前者的拟合精度比后者提高了38%。
(2)以为e评价标准,定权方法2与定权方法1相比,定权方法2的预测精度提高了12%;变权方法2与变权方法1相比,变权方法2的预测精度提高了18%。本文提出的两种权系数估计方法是有效的、可行的。
(3)变权方法2的拟合精度优于定权方法2,这是因为变权方法2的权重是时间的函数,其预测结果更接近实际,提高了预测精度。
(4)在社会消费品零售总额预测中,组合模型的预测精度比单个模型预测的精度高,以及变权组合预测比固定权组合预测的精度高。相比单个模型预测,组合预测模型在模拟性能和预测性能方面均大为改善。
4 结论
在组合预测方法中权系数的确定问题上,本文提出两种组合预测方法。一种是引入误差评价公式来确定权系数的固定权系数组合预测方法;一种是基于神经网络的误差倒数变权组合预测方法。这两种方法不仅权系数满足非负条件,并且SMNE固定权组合预测方法优于方差倒数组合预测方法;误差倒数变权组合预测方法优于最优组合预测方法。与SMNE固定权组合预测方法相比,由于误差倒数变权组合预测方法的权重是时间的函数,其预测结果更接近实际,提高了预测精度。与单个模型方法相比,组合预测模型充分利用原始数据和各预测模型的信息,弥补单个模型方法的不足,其预测精度高于单个模型。
参考文献
[1] Granger C W J,Bates J.The combination of forecasts.Operations Re-search Quarterly,1969;(20):451—468
[2]赵选民,吴勋.油气生产成本的组合预测研究.统计与信息论坛,2011;26(7):28—32
[3]陈华友,许义生.非负可变权重的组合预测模型研究.安徽大学学报(自然科学版),1998;22(2):3—7
[4]崔巍,王新民,杨策.变权组合预测模型在滑坡预测中的应用.吉林大学学报(信息科学版),2010;28(2):172—176
[5]张青.基于神经网络最优组合预测方法的应用研究.系统工程理论与实践,2001;21(9):90—93
[6]付加锋,蔡国田,张雷.基于GM和BP网络的我国能源消费量组合预测模型.水电能源科学,2006;24(2):1—4
[7]周传世,刘永清,变权重组合预测模型的研究.预测,1995;14(4):47—48
[8]谢开贵,李春燕,周家启.基于神经网络的负荷组合预测模型研究.中国电机工程学报,2002;22(7):85—89
[9]曹长修,王景,唐小我.一种模糊变权重组合预测方法—FVW法的研究.预测,1996;15(5):49—50
年径流预测的小波系数加权和模型 第2篇
年径流预测的小波系数加权和模型
利用连续小波变换和小波方差分析年径流的周期特征,已被众多学者认可并应用于年径流的分析中.但这种方法只是一种定性预测,并不能作出比较明确的定量预测.本文在原有定性分析方法的基础上,提出基于年径流时间序列主周期小波系数加权求和预测周期成分的.年径流预测模型.该方法更为有效地利用了小波分析的多分辨率特征,并可减小趋势成分的预测误差.经对千河流域年径流建模并检验,结果表明,文中所提出的预测方法可得到较为理想的预测结果,并可用于年径流时间序列预测.
作 者:李亚娇 沈冰 李家科 LI Ya-jiao SHEN Bing LI Jia-ke 作者单位:西安理工大学,水利水电学院,陕西,西安,710048刊 名:应用科学学报 ISTIC PKU英文刊名:JOURNAL OF APPLIED SCIENCES年,卷(期):200725(1)分类号:P333关键词:小波系数 加权求和 年径流预测 时间序列
预测系数 第3篇
关键词:灰色模型;灰色预测;恩格尔系数
中图分类号:F126 文献标志码:A 文章编号:1673-291X(2007)12-0013-04
一、引言
恩格尔系数可以反映一国或一个家庭的富裕程度与生活水平。其重要性被越来越多的人们所认识。文章依据灰色模型理论对中国城乡居民的恩格尔系数进行建模和预测。
二、数据来源
文章采集了1990—2005年中国城镇和农村居民家庭的恩格尔系数,见表3。1990—2005年城镇和农村居民恩格尔系数变化曲线,见图1。
由图1可以看出,农村和城镇居民恩格尔系数虽然整体上随着居民收入呈下降趋势,但是恩格尔系数下降都呈非线性的变化特征。从表3和图1可以看出,1990—2005年的16年间,农村和城镇居民恩格尔系数下降大体相似,都呈波浪式下降,只是略微有些不同。农村居民恩格尔系数从1990年的58.8下降到2005年的45.5,总体下降13.3,年均下降0.83。城镇居民恩格尔系数从1990年的54.2下降到2005年的36.7,总体下降17.5,年均下降1.094。参照联合国划分的贫富标准,见表2,可知经过改革开放10多年的发展,农村居民的生活水平从1990年的温饱阶段,进入小康阶段。城镇居民则从温饱阶段,跨越小康阶段,进入富裕水平。
为10 493元,每人年均消费支出达7 942.88元。这个阶段城镇居民的边际消费倾向为0.6990。每人年均可支配收入增加702.17元,年均消费性支出增加490.81元。由上可知,在这个阶段,城镇居民的边际消费倾向小于农村居民的边际消费倾向。城镇每人年均增加的收入是农村居民人均增加收入的4.2倍,年均增加的消费性支出则是农村居民的3.33倍。因此,可以说,城乡居民的收入水平差距进一步扩大,城乡生活水平仍存在较大差异,需要加以重视。
(2)消费热点
随着居民收入水平的增加,居民的消费结构逐步发生了变化,居民消费结构的变化会产生新的消费热点。表2给出2000年与2005年农村与城镇居民消费支出的各方面情况。通过表2与统计数据分析可知:农村居民1990-2005年消费性总支出年平均增长10.38%。食品支出、衣着、家庭设备年平均增长分别为8.5%、8.26%、18.10%,医疗保健、交通通讯、文教娱乐、居住年平均增长分别为15.71%、25.34%、16.21%、9.09%。家庭设备、医疗保健、交通通讯、文教娱乐的年增长幅度较大,表明农村居民消费模式已从温饱型转向注重家庭设施、健康、旅游、休闲等小康型生活模式。对城镇居民来说,1990-2005年消费性总支出年平均增长13.01%,食品支出、衣着、家庭设备年平均增长分别为10.09%、10.89%、9.95%,医疗保健、交通通讯、文教娱乐、居住年平均增长分别为23.52%、23.93%、16.50%、18.92%。其中医疗保健、交通通讯、文教娱乐、居住年平均增长幅度较大,表明城市居民消费模式开始从温饱水平转向注重健康、旅游、休闲、居住环境等富裕型生活模式。
從上述统计数据可以看出,农村和城镇居民的各类消费支出的增长幅度也是不同的,其中,二者在食品方面增加幅度较小,在医疗保健、交通通讯、文教娱乐等方面增长的幅度较为明显。除此之外,农村居民还在家庭设备方面增幅较快,而城镇居民在居住方面增幅较大。这表明随着经济的发展,农村和城镇居民都从温饱型转向注重健康、旅游、休闲、教育等方面发展。而由于近年来城镇房价上涨较快,因而城镇居民在居住方面的支出较大。而农村居民由于解决了温饱问题,开始加大了在家庭设备如电脑、手机、空调等方面的投资,因而家庭设备支出增长较大,随着恩格尔系数的持续降低,新的消费结构在未来将更加成熟。
六、结语
运用灰色模型软件建立农村居民和城镇居民的恩格尔系数预测模型,拟合结果表明,该模型具有较高的精度,运用该模型对2006—2020年城乡居民的恩格尔系数进行预测,预测结果表明:“十一五”期间农村居民的恩格尔系数年均下降约0.77,城镇居民的恩格尔系数年均下降1.06。农村居民在2012年左右可能进入富裕水平,而城镇居民生活水平同期相比,高于农村居民生活水平。恩格尔系数的下降与居民收入水平的提高密切相关。因此,农村居民和城镇居民的恩格尔系数变化趋势预测分析对于政府制定科学的发展决策,缩小城乡居民的收入差距,具有重要的参考价值。
参考文献:
[1] 沈伟.现代西方经济学原理[M].沈阳:东北大学出版社,1999.
[2] 邵民智.上海居民消费恩格尔系数的灰色建模和预测[J].上海工程技术大学学报,1999,(3).
[3] 黄民生.福州城镇居民恩格尔系数分形预测与分析[J].发展研究,2006,(9).
基于弹性系数法预测某县货运周转量 第4篇
县域城镇化、工业化农业产业化的深入发展, 给该县的物流与运输行业提出了新的要求, 为了物流与运输行业进一步平稳发展, 做好交通枢纽规划, 有必要对进出该县的货运周转量进行预测。
通过运用弹性系数法对该县货运周转量进行预测计算, 得出特征年份的货运周转量, 为该县物流与运输行业规划提供支持。
1 货运基本情况
近年来, 该县的货物运输呈持续快速增长的趋势, 对历年来货运量和货运周转量统计如表1所示。2001年至2011年统计数据显示, 公路货运量和货运周转量增速较快, 货运量年均增速达到了24.95%, 货运周转量年均增速达到了25.76%。
根据该县2001~2011年实际完成的公路货运周转量做出其变化曲线, 如图2所示, 可见该县公路货运周转量发展呈逐渐增长趋势。
为了准确预测该县公路货运周转量, 在分析该县社会经济指标、公路货运量历史数据的基础上, 采用弹性系数法进行预测。
本次规划预测年限为2012年~2024年。
特征年份为2012、2016、2020、2024年。
2 弹性系数法
货运量需求来源于社会经济活动, 由社会经济需求所派生, 因此, 货运量需求具有复杂性和影响因素多的特点, 产业布局、人口规模、消费结构等都会影响到货运量和货运周转量的发展。
由于社会经济活动需求直接决定了货运量和货运周转量需求的大小, 远景货运量和货运周转量的变化趋势与区域社会经济的发展密切相关, 因此可以通过分析经济社会活动的变化规律以及与货运量和货运周转量的关系来较准确的掌握货运量和货运周转量的变化规律。
弹性系数法是一种定性和定量相结合的货运周转量综合分析预测方法, 可以比较准确的体现社会经济发展与货运周转量的相互关系, 弹性系数用于体现货运周转量的增长率与社会经济发展的增长率之间的比例关系。
弹性系数E表示货物周转量年增长率Ry与国内生产总值增长率Rx的比值, 即:
货运周转量预测公式:
式中:A0———预测基年的公路货运周转量;
YT——预测年份的公路货运周转量。
3 弹性系数的确定
利用弹性系数法预测货运周转量的关键是确定弹性系数, 一般情况弹性系数与社会经济发展水平、区域特点、地区发展规划等因素相关, 因此可以通过综合分析地区的历史、现状和发展趋势来确定弹性系数。
根据统计资料计算得2003~2011年某县公路货运周转量弹性系数。
十多年来, 由于国民经济的快速发展及公路等级的提高, 使公路货运量和货运周转量有了突飞猛进的发展, 但当经济发展到一定水平后, 将会出现增长速度减缓的势头, 因此公路货运量和货运周转量的增长趋势将减缓, 货运将从量的增长, 转向服务质量的提高上来, 故取2012~2016年公路货运周转量弹性系数为1.2, 2020年以前为1.3, 2024年以前为1.4。
根据国内生产总值年均增长率Rx和弹性系数E, 可以得出货运周转量年均增长率, 某县各个时期的公路货运周转量弹性系数见表2所示。
4 预测结果
根据上述公式计算, 得出特征年份预测结果如表3所示。
根据最新统计数据显示该县2012年实际完成公路货运周转量27911万吨公里, 与弹性系数模型预测2012特征年公路货运周转量26669万吨公里相近, 预测值误差为4.45%, 处于合理偏差范围之内。
参考文献
[1]赵建有, 周孙锋, 崔晓娟, 王高青.基于模糊线性回归模型的公路货运量预测方法[J].交通运输工程学报, 2012.
[2]杨铭, 秦华荣, 陈荫三.区域公路货运周转量结构分析与推算方法[J].交通运输工程学报, 2011.
[3]周志娟, 陈森发.组合预测方法在我国公路货运量预测中的应用[J].中国水运, 2010.
[4]贾学锋.灰色预测模型在公路货运量预测中的应用[J].物流科技, 2010.
功效系数法在财务危机预测中的运用 第5篇
关键词:财务危机,预测,功效系数法
国内外学术界对财务危机有许多不同的定义, 但较为公认的是把财务危机定义为企业偿付能力的丧失, 即企业无力支付到期债务或无力维持必要支出的经济现象, 包括从资金管理技术性失败到破产以及介于两者之间的各种情况, 破产则是财务危机的极端形式。
一、财务危机预测
财务危机预测是以现有的财务比率为基础, 建立数学模型来预测企业财务危机发生的可能性。财务危机的预测研究是一项在西方国家中广泛进行的应用研究, 在学术界又称为“财务困境预测”、“财务失败判别”等等, 由于绝大多数西方财务危机研究都以破产或申请破产作为界定财务危机的标志, 所以财务危机的预测研究在很多情况下又被称为“破产预测分析”。本文通过修正国家经贸委财经司与国家统计局工交司联合推荐的功效系数法, 运用于企业财务危机预测中。
二、功效系数法在财务危机预测中的运用
功效系数法首先对财务危机的每个评价指标设定满意值和不允许值, 然后设计并计算各类指标的单项功效系数, 再运用德尔菲法等方法确定各指标的权数, 得到加权平均数, 即为该企业的综合功效系数。依据综合功效系数的大小即可进行财务危机警情预测。
(一) 指标体系的选择
1、反映偿债能力的指标:
资产负债率、已获利利息倍数、流动比率、速动比率、现金流动负债比率和长期资产适合率。
2、反映营运能力的指标:总资产周转率、流动资产周转率、应收账款周转率、存货周转率和资产损失率。
3、反映盈利能力的指标:净资产收益率、总资产报酬率、销售利润率和成本费用利润率。
4、反映发展能力的指标:销售增长率和资本积累率。
(二) 财务指标分类及其标准值的确定一般来说, 指标标准值包括指标立项
的各种财务指标进行了分类。标准值则可以结合各行业特征来确定。
1、极大型变量。
它是指标值 (实际值) 越大越好的变量。其满意值选取的是该行业的平均值。一般认为只要达到了该指标值的平均水平, 即可认为无警。该类指标包括:净资产收益率、销售净利率、总资产报酬率、成本费用利润率、销售增长率、资本积累率、已获利倍数、总资产周转率、流动资产周转率、应收账款周转率和存货周转率等。
2、极小型变量。
它是指标值越小越好的变量。极小型变量的标准值一般取为0, 其不允许值也为0。该类指标有:资产损失率。
3、稳定型变量。
它是指标值在某一点时最好的变量。该类指标有流动比率和速动比率, 其反映企业资产的变现能力。一般认为, 该类指标满意值为平均水平以上20个百分点, 其不允许值上限一般为该满意值的一倍, 下限为满意值的一半。
4、区间型变量。它是指标值在某一区
间时最好的变量。该类指标通常要先求出该指标的行业平均值, 在行业平均值的基础上增加或减少二十个百分点作为满意范围的上下限, 在行业平均值上增加一倍作为不允许值的上限, 减少一半作为不允许值的下限。该类指标有现金流动负债比率、长期资产适合率和资产负债率。
(三) 各项指标单项功效系数的计算
极大型变量单项功效系数
极小型变量单项功效系数
稳定型变量单项功效系数
区间型变量单项功效系数
(四) 确定各项指标的权数
指标的权数是根据指标的重要程度确定的。根据德尔菲法, 结合层次分析法, 将指标权重确定如下:获利能力指标权重为42%;营运能力指标权重为18%;偿债能力指标权重为22%;发展能力指标权重为18%。
(五) 综合功效系数的计算
综合功效系数=∑单项供销系数×该指标的权重。根据综合功效系数的数值大小, 可将警情划分为相应的警限区间。其中, 当综合功效系数小于60时, 处于巨警;当系数介于60-70间, 处于重警;当系数介于70-80间, 处于中警;当系数介于80-90间, 处于轻警;当系数大于90时, 处于无警。
三、结束语
随着财务管理理论研究的发展, 为财务危机预测研究的发展奠定了基础。在今后的研究中, 可以尝试从以下方面入手:一是财务指标体系的选择。财务指标选择是财务危机预测中的重要的环节, 它强烈影响预测模型的设计和性能。二是财务危机的基础经济理论。虽然财务危机预测的应用范围很广, 市场需求很大, 但缺乏经济理论基础, 这在某种程度上限制了预测方法的发展和准确性的进一步提高。
参考文献
[1]、王克勤, 曹培.公司财务危机与预警研究[J].四川经济管理学院学报, 2004 (4) .
预测系数 第6篇
近年来,随着我国煤矿开采深度的增加,矿井热害给矿工工作环境以及煤矿安全生产带来了严重威胁,成为了影响煤矿的又一大灾害。为此,广大学者进行了大量的研究,1953 年,伏拉索夫提出了干燥材料导热系数的计算公式,工程师契尔柯夫将该公式应用于保温材料导热系数的研究中,并提出低导热物质的导热系数,随温度的升高呈直线规律上升[1]。2000 年,彭担任[2]从煤和岩石的导热特性角度对矿井的热害问题进行了深入研究,通过实验发现物体导热系数与温度的倒数成正比关系,且单晶体物体导热系数大于多晶体物质。唐明云等[3]依据平行热线法国际标准原理,设计出松散煤体导热系数的测量装置,并对含水量不同的煤样进行多次实验,发现随着含水量的增加,煤体导热系数也随之增加,且越趋平稳。岳高伟等[4]通过建立松散煤体的热传导模型,数值模拟了在环境温度不相同的情况下,煤传热过程中温度的变化规律,发现煤样粒度一样时,随着环境温度的升高,导热系数值线型增大。
以上研究主要集中在实验、数值模拟方面研究导热系数与温度、含水量之间的关系,从煤质指标角度研究煤导热系数的相对较少,而物质组成又是煤导热系数的一个重要因素,因此有必要在该方面进行深入研究。为此,本文以山西大同矿区云冈矿、晋华宫矿、燕子山矿为实验煤样,应用灰色系统理论对煤样的导热系数及影响因素进行分析,寻找影响煤岩导热系数的主要因素,为导热系数预测提供新方法。
1 煤质指标与导热系数测定实验
1. 1 煤样的制备
在实验室将采集来的煤样拆封破碎,将破碎后的煤样装入高速多功能粉碎机中粉碎5 s左右,接着用200目的筛子对煤粉进行筛分,使其粒度符合工业分析实验要求; 最后将筛过的煤粉装入备好的60 ml磨砂广口瓶内密封保存。
1. 2 煤质指标的工业分析实验
实验按照《GB/T212 - 2008 煤的工业分析方法》进行煤质指标的工业分析[5],采用YX - GYFX7701 型全自动工业分析仪对煤样中的水分和灰分含量进行测量,选用恒重法测定原煤中的水分Mad和灰分Aad。具体步骤为: ①按预先选择的烘干温度将仪器加热、烘干,至已设定的时间并称重; ②继续加热、烘干( 灼烧) 、称重,直到样品重量不再改变; ③计算水分( 灰分) 含量[6]。
利用YX - GYF/V7700 型全自动挥发分仪对原煤中挥发分的含量进行测量,基本操作流程为: ①在计算机的控制下,自动称取空坩埚和煤样的初始重量; ②在15 ~ 25 min的时间内将炉温升至900 ℃ 恒温; ④把煤样送到900 ℃ 高温区,隔绝空气( 加盖) 加热7 min; ⑤根据失重计算挥发分。此外,本文选用的固定碳数据是依据煤的水分、灰分和挥发分计算得出的。
1. 3 导热系数的测定实验
利用NETZSCH LFA457 型激光导热系数测试仪测量煤的导热系数,实验仪器见图1。实验开始前先打开恒温水浴箱稳定2 h,水浴箱温度设定的下限为低于室温2 ℃ ; 然后将测量好直径、厚度、质量的样品: 厚度d =1. 5 ~ 2. 5 mm,直径 Φ = 12. 6 mm( 允许误差1% ) 的圆薄片,与陶瓷标样共同喷好石墨后放入仪器中,样品放好后打开测量软件,进行基本参数的设定,将陶瓷标样和待测样品的直径、厚度、密度信息录入,选取30、40、50、60、80、100 ℃ 为采样温度点,考虑到测试精度和实验时间,设定每个采样温度下的激光闪射点数为3 个,设定升温速率定为5 K/min; 待相关参数设定完成后,加满液氮开始实验,并在实验过程中记录每个升温段所用的时间。测量实验完成后,将测得数据库导入NETZSCH LFA 457 的分析软件,对测试数据进行计算,最终可得到样品在采样温度下的导热系数。
2 煤导热系数影响因素的灰色关联分析
2. 1 煤质指标的选取
煤岩导热系数的影响因素包括煤岩的水分Mad、灰分Aad,挥发分Vad,固定碳Fcad和密度 ρ 等。山西大同矿区云冈12#406 盘区和8#408 盘区、晋华宫2232 掘进头、燕子山303 盘区煤样的导热系数及其影响因素数据见表1。对导热系数影响因素进行灰色关联分析[7],取大同矿区不同煤样的导热系数 λ 为母因素系列x0; 水分Mad、灰分Aad,挥发分Vad,固定碳Fcad和密度 ρ 分别为子因素序列x1、x2、x3、x4、x5。
2. 2 数据处理
对原始数据采用均值化方法处理后各数列为:
x0=(1.15,0.64,1.50,0.70)
x1=(0.59,1.46,1.40,0.55)
x2=(0.76,1.58,0.47,1.20)
x3=(0.89,1.15,1.02,0.94)
x4=(1.11,0.84,0.99,1.06)
x5=(0.95,1.05,1.08,0.92)
2. 3 关联系数计算
1)求差序列:xi与x0的绝对差见表2,Δi(k)=|x0(k)-xi(k)|
2) 求两级最小差与最大差
3) 计算关联系数
将数据代入关联系数计算公式,得
ε1(1)=0.572,
ε1(2)=0.461,
ε1(3)=1,
ε1(4)=0.925
ε1=ε1(1),ε1(2),ε1(3),ε1((4))=(0.572,0.461,1,0.925)
ε2=(0.680,0.423,0.398,0.606)
ε3=(0.794,0.6,0.618,0.815)
ε=(1.108,0.860,0.6,0.703)
ε5=(0.860,0.665,0.658,0.837)
4)计算关联度
γ1=γ(x0,x1)=0.740,
γ2=γ(x0,x2)=0.527,
γ3=γ(x0,x3)=0.707,
γ4=γ(x0,x4)=0.818,
γ5=γ(x0,x5)=0.755
5) 比较导热系数的关联度大小
经过关联比较,可以得出: γ4> γ5> γ1> γ3> γ2,充分说明固定碳Fcad、密度 ρ 、水分Mad与导热系数 λ关系最密切,这三者是影响大同矿区云冈12#406 盘区和8#408 盘区、晋华宫2232 掘进头、燕子山303 盘区煤样导热系数的主要因素。挥发分Vad、灰分Aad的密切程度依次较差,是影响山西大同矿区云冈12#406 盘区和8#408 盘区、晋华宫2232 掘进头、燕子山303 盘区煤样导热系数的次要因素。
3 煤样导热系数的灰色预测
3. 1 灰色预测模型
灰色预测可以应用于同时含有已知信息和未知信息的系统[8]。此方法是把影响系统变化的随机变量看作在一定范围内变化的灰色量,把无规律或规律性较弱的原始数据生成处理为规律性较强的序列[9],从而发现系统变动的内在规律,建立与之相应的微分方程,解出可以预测事物未来发展状况的模型[10]。
GM( 1,N ) 是一阶、N个变量的线型微分方程模型[10],其中含有相互影响的多个因素[11]。该模型的建模步骤如下。
1) 设原始数据序列xi(0)有n个观察值,有N个原始数据序列
xi(0)=(xi(0)( 1) ,xi(0)( 2) ,…,xi(0)( n)),通过累加生成新序列[8]:
2) 对xi(0)作一次累加生成,得到新数列为[8]:
3) 对xi(1)可建立白化形式的微分方程,如x1(1)白化形式的微分方程为[12]:
记参数列=(a,b2,…,bn)T。
4)用最小二乘法估计参数为[12]:
5) GM( 1,N) 灰色预测模型的方程为[13]:
式中,x1(1)( 0) = x1(0)( 1) ,则模型计算的模拟值为[13]:
6) 求相对误差值,计算公式为[10]
式中,为灰色预测的模拟值。
对模拟值和实际值进行误差检验,如果相对误差满足精度要求,则可以用该灰色预测模型进行系统预测。
3. 2 煤样导热系数的灰色预测
煤岩的固定碳Fcad、密度 ρ 和水分Mad含量是影响山西省大同矿区云冈12 #406 盘区、晋华宫2232 掘进头、燕子山303 盘区和云冈8#408 盘区煤样导热系数的主要因素。取以上4 个煤样的导热系数为系统特征数据序列,固定碳Fcad、密度 ρ 、水分Mad为相关因素序列,建立GM( 1,4) 模型。
3. 2. 1 导热系数的GM( 1,4) 预测模型
x1=(0.318,0.178,0.415,0.193)(导热系数)
x2=(0.678,0.510,0.602,0.646)(固定碳)
x3=(1.245,1.386,1.426,1.204)(密度)
x4=(0.039,0.096,0.092,0.036)(水分)
将x(0)i累加生成得新的序列x(1)i为:
x(1)1=(0.318,0.496,0.911,1.104)
x(1)2=(0.678,1.188,1.79,2.436)
x(1)3=(1.245,2.631,4.057,5.261)
x(1)4=(0.039,0.135,0.227,0.263)
1) 通过Matlab计算得GM ( 1,4 ) 灰色预测模型参数为:
=(BTB)-1BTYN=(-0.055,-2.742,1.239,1.139)
2) 代入式( 4) 得GM( 1,4) 灰色预测模型方程
经计算得模拟值
3) 对GM( 1,4 ) 灰色预测模型进行精度检验,误差检验结果见表3。
灰色预测模型精度一般采取平均相对误差来检验,由表3 可知对GM( 1,4) 灰色预测模型的平均相对误差为4. 5% ,满足精度要求。
4) 对3 个相关因素固定碳Fcad、密度 ρ 、水分Mad的GM( 1,1) 模型分别进行精度检验,并求出大同矿区永定庄315 盘区和同家梁412 盘区的预测值; 代入GM( 1,4) 模型预测公式,得出永定庄315 盘区和同家梁412盘区煤样导热系数的预测值。
3. 2. 2 3 个相关因素的GM( 1,1) 预测模型
1) 固定碳Fcad的GM( 1,1) 预测方程为
2) 密度 ρ 的GM( 1,1) 预测方程为:
3) 水分Mad的GM( 1,1) 预测方程为:
4) 导热系数的预测方程为:
5) 代入数据求解
代入相应数据求出3 个相关因素的预测值,见表4。
将永定庄315 盘区和同家梁412 盘区的3 个相关因素预测值代入导热系数预测方程,并进行数据还原,x1(0)( k + 1) = x1(1)( k + 1) - x1(1)( k) ,得出x1(0)( 5) =0. 309,x1(0)( 6) = 0. 184。而永定庄315 盘区和同家梁412 盘区煤样的导热系数实际值分别为0. 287 W / ( m·K) 和0. 171W / ( m· K) ,相对误差分别为7. 12% 和7.60% 。由此可知,GM( 1,4 ) 模型的预测精度较好,可以较好的预测煤样导热系数。
4 结论
1) 通过煤导热系数序列与影响因素的灰色关联度分析,得出影响大同矿区云冈矿、晋华宫矿和燕子山矿煤样导热系数的主要因素依次为固定碳含量Fcad、密度ρ 和水分含量Mad。
2) 通过预测,得出大同矿区云冈12 #406 盘区和8 #408 盘区、晋华宫2232 掘进头、燕子山303 盘区煤样导热系数GM( 1,4) 灰色预测模型,平均相对误差为4.5% ,精度较好。
预测系数 第7篇
一、数据介绍
本文所用数据来自于上证指数2008年12月到2012年1月每月的全部交易日收盘价, 由于股票价格指数的时间序列每月均值和方差都在变化, 本文将不直接使用每月的全部交易日收盘价的方差来进行分析, 而是先对原始收盘价数据求完方差后, 再计算出每月全部交易日的均值, 通过这两个数据得出标准差系数, 它们的标准差系数数据如表1。
二、时间序列中ARIMA模型的建立
(一) 序列图描述
本文数据是根据时间顺序排列, 处理数据方法可采用时间序列分析技术。时间序列数据是随机过程的一个特殊样本, 在时间序列分析中, 常用时间序列数据样本对其背后总体的随机过程进行推断, 包括对时间序列的数字特征的推断。在ARIMA分析中, 我们常用的数字特征有:均值函数、自协方差函数、自相关函数和偏自相关函数。本文使用以上数字特征对数据进行平稳性检验、白噪声检验, 最终得出模型方程。
平稳时间序列是指时间序列的统计特征不会随时间的推移而发生改变, 即生成时间序列数据随机过程的统计特征不随时间变化而变化。平稳时间序列分为严平稳和弱平稳, 严平稳的条件在现实生活中很难实现, 而弱平稳则较为普遍。弱平稳的条件是: (1) E (Yt) =μ, 即期望为常数; (2) Var (Yt) =σ2, 即方差也为常数; (3) Cov (Yt, Yt-k) =E ( (Yt-μ) (Yt-k-μ) ) =γ (t, t-k) , 即随机过程两个间隔为k的随机变量间的协方差只与间隔k有关, 与两变量所处的时点t无关。这是从数学角度的验证标准, 在进行严格验证之前往往可以通过序列图的形状初步判断。一般地, 平稳时间序列的序列图如果为一条围绕其均值上下波动的曲线, 则可以认为是平稳时间序列。由本文数据得到的时间序列图如图1。
从图1可以看出, 标准差系数从2008年12月骤然下跌, 直观表明金融危机后期上证指数标准差系数的波动逐渐回稳, 总体序列图成尖状脉冲图形, 上下波动但不明显, 需要做进一步的样本自相关函数检验。标准差系数作为衡量金融市场波动性的手段之一, 反映外界信息对金融市场的冲击, 无论是利好还是利空消息, 都可能导致股票价格的突发性猛烈波动。由于整个金融市场中不良贷款的积累可能每20年出现一个峰值, 这时候如果恰好遭遇标准差系数的波动峰值, 若是利好消息引起的猛烈波动, 则将加大不良贷款的违约风险, 使系统崩溃提前发生;若是利空消息引起的, 则可能导致极短时间内股价不可逆转的暴跌, 在不良贷款和系统内波动的共同影响下, 触发股市崩盘, 引发金融危机。
这种标准差系数的波动还反映投资者的非理性投机行为。我国的金融市场刚刚兴起不久, 政府干预力量巨大, 相关法律不够健全, 交易规则不够合理, 风险管理意识淡薄。股票市场中小股民居多, 他们往往缺乏投资的专业知识, 对消息的敏感度高, 当随机发生的信息进入股票市场时, 就可能会引起投资者的强烈反应, 所以序列图呈现尖状脉冲。
(二) ARIMA模型介绍
ARIMA模型是自回归单整移动平均时间序列的英文缩写, 记为ARI-MA (p, d, q) , 其中p是指组成ARIMA模型的自回归模型部分 (AR (P) ) 的阶数, 记作Yt=φ1Yt-1+φ2Yt-2+...φpYt-p+μt, φ1、φ2、φp称为自回归系数, μt为随机干扰项, 是一个白噪声过程;q是指ARIMA模型的移动平均模型部分 (MA (q) ) 的阶数, 记作Yt=μt-θ1μt-1-θ2μt-2-...θqμt-q, μt、μt-1、μt-2、μt-q为滑动平均系数, 是一组白噪声过程;d是指对原始数据差分的次数, 在这里, “d阶单整”是指非平稳过程的时间序列数据d阶差分后是平稳的。所以ARIMA模型可写作AR模型与MA模型的合成, 即:Yt=φ1Yt-1+φ2Yt-2+...φpYt-p+μt-θ1μt-1-θ2μt-2-...θqμt-q。为了简化模型, 引入滞后算子L, 定义:LYt=Yt-1, 同理:L2Yt=Yt-2, ...L2Yt=Yt-p, 对MA模型也是一样:L2μt=μt-2, ...Lqμt=μt-q。于是, ARIMA模型可化作: (1-φ1L-φ2L2-...φpLp) Yt= (1-θ1L-θ2L2-...θqLq) μt。定义差分算子▽Yt=Yt-Yt-1, d阶差分与滞后算子L之间有如下关系:▽d= (1-L) d。所以对于非平稳时间序列ARIMA (p, d, q) , ARIMA模型可简化为:φ (L) (1-L) dYt=θ (L) μt。
(三) 平稳性严格检验的数学原理及检验效果
上文提到, 对于时间序列平稳性严格检验, 我们采取样本自相关函数 (AFC) 来进行判断, 自相关函数写作:
通过自相关函数可以看出, 当K增大时, γk的分子将急剧减小, 导致自相关函数减小, 很快趋近于零, 这种现象叫做截尾或拖尾。当出现截尾或拖尾现象时, 可以认为时间序列是平稳的。用这种方法检验的ACF结果, 并不拖尾或截尾, 说明原始数据并不是平稳的, 所以需要通过差分技术来对非平稳数据平稳化。经过尝试后认为三阶差分后效果最好, 明显的围绕某个值上下波动的状态, 而且没有趋势性, 直观上可以认为三阶差分后的时间序列是平稳的。
(四) 模型建立的数学原理与实证分析
下面进行ARIMA (p, d, q) 模型建立。模型建立依赖于对组成ARIMA (p, d, q) 的AR (p) 和MA (q) 中p和q的分别估计。下面引入AR (p) 的偏自相关函数。对于AR (p) 部分:Yt=φk1Yt-1+φk2Yt-2+...φkkYt-k+μt, 偏自相关系数是指最后一个自回归系数φkk。它的作用是判断Yt和Yt-k是否有直接关系, 而非通过各自与其他自回归系数建立间接关系。φkk有如下性质:对于AR (p) , 当k≤p时, φkk不等于0, 反之则为0, 也就是所谓的偏自相关函数的截尾现象。又因为φkk是随机变量的数字特征, 所以如果找到其概率分布, 即可通过假设检验判断φkk从p为何值起开始截尾, 从而得到p值。数学家证明, 当k>p时, φkk无限趋近服从均值为0, 方差为1/n的正态分布。所以在0.05显著性水平下, 可以通过计算机迭代得到p值。
对于MA (q) 部分, 则应使用其自相关函数ρk, 此函数为:当k=0时, ρk=1;1≤k≤p时, ρk= (-θk+...θq-kθq) / (1+θ12+...θq2) ;k>q时, ρk=0, 也就是自相关函数的截尾现象。所以, 只需找出从何值开始, ρk=0, 截尾现象出现, 此值即为q值, 这一切也可通过计算机迭代来实现。PACF三步截尾, 可判断为平稳时间序列, 从而得到p=3, q=1, d=3, 所以ARIMA模型为ARIMA (3, 3, 1) 。最后利用SPSS19.0的创建时间序列功能, 得到模型白噪声检验以及参数估计值, 如表2。
由表2可知, sig值为0.443, 远大于0.05, 可以认为模型显著性很高。由表3可知, AR部分的三个系数的sig值均小于0.05, 接受估计值, 但是发现MA部分的系数估计值的sig值大于0.05, 可以拒绝估计值, 但是当设q值为0时, 即将ARIMA (3, 3, 1) 改为模型ARIMA (3, 3, 0) 后, 得到的拟合曲线为图2, 而q=1时的拟合曲线为图3。
对比图2和图3在2009年11月和2009年6月位置上的波动发现, 图3的波动能够更好的拟合观测值, 图2的标准差系数波动过大, 所以图3的拟合效果好于图2, 保留原来的模型假设, 取ARIMA (3, 3, 1) 。模型残差通过了白噪声检验。
从表3中还可以看到, 常数项为-0.785, sig值为0.985, 远大于0.05, 说明模型可以通过去除常数项进行优化, 去掉常数项后MA的第一个系数的估计值的sig值为0.502, 虽然仍大于0.05, 但较保留常数项时表2中的sig=0.672有了较大改善, 可以进行优化。最终得到的拟合图如图4。
可以看出, 估计出的时间序列较好的拟合了实际时间序列图, 虽然有一定偏差, 但都在允许的范围内, 而且比实际的标准差系数波动幅度大一点, 可以为决策者提供决策的提前量。虽然BIC值和拟合优度上去掉常数和不去掉没有区别, 但是从模型的简约性上讲, 去掉常数优于保留常数。
三、模型结果、预测及意义
本文最后得到模型的数学表达式为:φ (L) (1-L) dYt=θ (L) μt。其中, L为滞后算子, φ (L) 为自回归系数的特征方程, φ (L) = (1-φ1L-φ2L2-..φpLp) ;θ (L) 为移动平均系数的特征方程, θ (L) = (1-θ1L-θ2L2-..-θqLq) ;μt为白噪声过程。代入参数得到预测模型的方程为:
经过拟合的序列图分析可知:最终得到的2012年1月预测值为0.415014和-1.291084。从上证指数2012年1月的数据算出的实际标准差系数为0.304233, 结果差距不大, 拟合值比观测值略向前平移了一个月的时间间隔, 所以在实际应用中本文认为应将预测值对应的时间倒退1个月才是实际值对应的月份。预测图表现出尖状脉冲现象, 对于短期的股票价格标准差系数预测具有较好的应用价值。
本文认为, 标准差系数的波动主要反映的是股票市场外的信息对于股票价格的冲击程度, 更深层次反映的是信息对于投资者心理的影响。如果可以测量各大股票指数如道琼斯工业平均指数、标准普尔500指数、纳斯达克指数、日经指数、香港恒生指数及上证指数的标准差系数的方差, 或许可以比较各大股票市场投资者对于信息的敏感程度、理性程度以及投机成分含量, 为未来我国金融改革提供数据支持。更深远的, 由于信息是随机进入股票市场的, 如果有一种方法能够测出信息发生的概率分布, 将是对风险预警领域的一种巨大贡献。标准差系数能够间接反映信息对投资者乃至整个股票市场的影响程度大小, 或许可以以此为一种测度方法, 对影响市场的信息进行更深层次的研究。
四、结论
上证指数作为我国最重要的股票指数之一, 反映我国金融改革步伐和经济发展脉博。外界对股票市场的冲击不可避免, 但冲击后的结果因股票市场中投资者的风险承受力大小、对信息的敏感程度以及整个金融系统的稳定程度而异, 这三点是可以控制的。所以金融监管部门可以通过本文数据估计出股票市场将要遭受的冲击, 进一步推断出其他风险耐受程度指标, 尤其是投资者对信息的敏感程度。这对于理性投资、冲击预警以及金融监管等领域都有重要的指导意义。
摘要:稳定性是衡量股票市场风险程度的一个重要的指标, 主要通过方差的计算来对稳定性进行度量。本文通过对上证指数2008年12月到2012年1月每月全部交易日收盘价的标准差系数进行研究, 运用ARIMA时间序列技术, 得出预测模型, 对未来的标准差系数进行预测。
关键词:上证指数,ARIMA时间序列技术,标准差系数
参考文献
[1] .张龙, 王文博, 曹培慎.计量经济学[M].北京:北京交通大学出版社, 2010.
预测系数 第8篇
关键词:多重分形谱,解析,高频时间序列,预测
0 引言
股票市场的变化莫测性, 是无法通过简单图像所能描绘的。现代科学不断进步, 分形理论走进了人们的视野, 它能够非常细致的描述股票市场所呈现出来的非线性行为特征, 是研究股票市场的一个新契机和方法, 它能更多的解决有效市场理论无法解决的问题, 已经成为金融研究领域中的热点问题。需要注意的是简单的分形虽然可以一定程度上描述中国股票市场的非线性特征, 但是无法全面真实的描述股票市场的情况, 多重分形就是在这种情况下应运而生的, 它是分形理论的新发展。多重分形可以将金融市场中复杂多变的金融交易复现, 获取不同时间标度上金融资产价格的不同波动信息, 提供关于市场动向的概率估计值, 显示市场易变性的实质, 进而帮助人们更加了解金融市场。
归根结底, 采用多重分形方法可以将复杂体系分成许多奇异程度不同的区域来研究, 从而使我们能分层地了解复杂系统的内部结构和所富含的信息。
因此, 通过对股票数据进行多重分形分析, 可以发现金融数据涨跌和多重分形相关参数指标变化之间的关系, 从而总结归纳出一定的规律, 用于反映和预测未来股票市场的动荡变化。
1 多重分形的研究方法及主要参数的解析求法
分形维是分形理论中的核心思想, 同时也是其很重要的特征[1]。多重分形的一个重要分析指标就是奇异性标度指数 α 和奇异谱函数f (α) , 多重分形就是定义在分形结构上的由有限几种或大量具有奇异性标度指数 α 的概率的子集构成的非均匀分形维分布的奇异集合。
本文采用盒计数法[2]计算高频时间序列的多重分形谱, 即把取样区间内高频金融时间序列当作一维平面上的点集, 采用尺度为 (ε燮1) 的“盒子”对其进行覆盖, 即按不同的单位时间标度 ε 将其划分成互不重叠的区间。设高频金融时间序列每日交易数据的个数为t, 每个单元连续考察个n交易日, 则每个单元共有nt个数据。因此 ε 可取为1/nt, 2/nt, ……, 1/3, 1/2, 1。
若令Pi (ε) 是时间标度为 ε 时第i个区间内金融资产价格的价位概率, 本章采用以下求法:
这里 ε 是盒子尺寸, Ii是在尺寸为 ε 的盒子中指数的和, 显然有。
我们根据统计物理中提出的求多重分形谱主要参数的方法[3], 利用一种解析的改进方法来计算多重分形谱的主要参数, 具体采用如下式子 (2) 计算 α (q) :
分别对不同的q取值进行运算, 然后得到
的图像, 进而采用最小二乘法得到 α (q) 的估计值。
再利用 α、f (α) 、τ (q) 之间的如下函数关系[3]:
即通过计算归一化价格Pi (ε) 、配分函数 χq (ε) 和质量指数 τ (q) , 采用最小二乘法回归拟合法就可得到 α 和f (α) 。同时, 以lnχq (ε) ~lnε 的双对数直线的斜率存在为依据, 这里选取 (以下数据处理工作和图像都是在软件MATLAB7.0 中实现的[4]) 。
2 5 分钟高频数据多重分形谱的参数分析说明
2.1 多重分形谱主要参数的说明
α 的大小是由系统在其动力学过程中辐射出的信息—金融资产价格的归一化价格所决定的, 其取值范围的宽窄表示不同奇异强度分布范围的大小。多重分形谱的宽度如下:
它表示在标度不变的情况下, 整个分形结构上的归一化价格分布的均匀程度, 即刻画出资产价格的涨跌幅度。△α 越大表示归一化价格分布越不均匀, 价格波动越剧烈;△α=0 则对应完全均匀分布的状况;
同时分析谱函数宽度为:
当 △f>0 说明价格更多地处于波峰, 此时谱的顶部相对较圆润, 股价有上涨的趋势;反之, 股价会呈下降趋势。
2.2 实际股票数据的多重分形谱主要参数分析
本文随机选取了上证大盘A股综合指数2007 年7月9 日-8 月22 日之间的5 分钟高频数据 (数据来自软件大智慧V5.55, 获取方式是每天从9:35 分至15:00 分, 扣除休息时间每天计48 个数据[5]) , 共计1440 个有效数据, 然后依照时间顺序每240 个数据为一个单元组, 共将其分成六组, 具体每个单元组时间段为7 月9 日-7 月13 日、7月16 日-7 月20 日、7 月23 日-27 日、7 月30 日-8 月8日、8 月9 日-8 月15 日、8 月16 日-8 月22 日, 按上述方法得到这六个单元组的多重分形谱主要参数表 (表1) 及主要多重分形谱图 (图1) ;同时结合图2 来分析上述这段时间内日收盘指数与单元组的多重分形谱主要参数变化之间的关系。
首先我们应认真观察表1, 计算第一单元组和第二单元组的所对应的 αmin和 αmax的变化幅度, 即|△αmin|和|△αmax|的具体值, 可以得到这两个单元组对应的变化值的绝对值分别为 |△αmin|=0.003695 和 |△αmax|=0.002504, 前者大于后者, 即高指数上升的速度高于低指数下降的速度, 说明这两个单元组时间段内高指数变化比较明显, 其应占主要地位, 再加上第二单元组中的 △f<0, 说明这段时间内指数多聚集在谷底, 且第一单元组的多重分形谱远小于第二单元组的, 对应的第三单元组时间段内的对应的实际日收盘指数呈现上涨并有局部下挫的情况;我们接着分析第二单元组和第三单元组之间的 αmin和 αmax的变化幅度, 得到它们的值依次为:|△αmin|=0.002064 和 |△αmax|=0.000061, 前者也大于后者, 说明这两个单元组时间段内高指数变化比较明显, 其应占主要地位, 再加上第三单元组中的 △f>0, 说明这段时间内指数多聚集在波峰, 且第三单元组的多重分形谱远小于第二单元组的, 多重分形谱开口远远大于, 对应的第四单元组时间段内的对应的实际日收盘指数呈现上涨并有个别下挫的情况;再继续分析第三单元组和第四单元组之间的 αmin和 αmax的变化幅度, 得到它们的值依次为:|△αmin|=0.001519 和 |△αmax|=0.001535, 后者大于前者, 说明这两个单元组时间段内低指数变化比较明显, 其应占主要地位, 再加上第三单元组中的 △f>0, 说明这段时间内指数多聚集在波峰, 且第三单元组的多重分形谱开口远小于第四单元组的, 对应的第五单元组时间段内的对应的实际日收盘指数呈现平缓上涨并有局部下挫的情况;再继续第四单元组和第五单元组之间的 αmin和αmax的变化幅度, 得到它们的值依次为:|△αmin|=0.001704和 |△αmax|=0.002772, 后者大于前者, 说明这两个单元组时间内低指数变化比较明显, 其应占主要地位, 再加上第五单元组中的 △f>0, 说明这段时间内指数多聚集在波峰, 且第五单元组的多重分形谱开口远小于第四单元组的, 对应的第六单元组时间段内的对应的实际日收盘指数呈现先期下跌并伴有后期上扬的情况;最后我们根据第五单元组和第六单元组之间的 αmin和 αmax的变化幅度, 得到它们的值依次为:|△αmin|=0.001680 和 |△αmax|=0.003001, 后者大于前者, 表明在这两个单元组时间内指数变化中比较明显的是低指数, 其应占主要地位, 再加上第六单元组中的△f>0, 说明这段时间内指数多聚集在波峰, 且第五单元组的多重分形谱开口要远小于第六单元组, 由此我们可以推测出在第六单元组时间段之后的短时间内指数应该继续上涨但也有局部下挫的情况, 对应的实际日收盘指数确实反映了这一情况, 也说明了我们推测的正确性。
类似于上述对上证大盘A股及澳柯玛股票的多重分形谱参数的分析, 我们继续分析了澳柯玛股票 (2007 年8月3 日-8 月30 日) 南航JTP1 (2007 年8 月23 日-9 月19日) 、长江通信 (2007 年8 月2 日-8 月30 日) 、国风塑业 (2007 年8 月2 日-8 月30 日) 、美罗药业 (2007 年8 月21日-9 月19 日) 等其他随机抽取的股票的多重分形谱参数变化情况与实际股价之间的关系。
通过对上述各股票进行多重分形谱参数的分析, 我们总结归纳了一条预测股票短期走势的基本结论表 (表2) (这里 |△αmin|和 |△αmax|是临近两个单元组的参数变化程度, αmin增加或者减少是最近一个单元组与上一个单元组数值的变化, 而 △f的正负关系属于最近一个单元组的变化) 。
2.3 预测验证情况
根据这个基本结论, 我们试着分析了2008 年6 月23日-7 月18 日的上证大盘A股指数的5 分钟高频数据, 得到了这段时间内共计960 个的有效数据, 按时间顺序分成了4 个单元组 (6 月23 日-6 月27 日, 6 月30 日-7 月4日, 7 月7 日-7 月11 日, 7 月14 日-7 月18 日) , 得到了类似上面的多重分形谱主要参数表 (表3) 。
按照上面的预测结论表, 我们很容易根据结论分析第一、二单元组的参数变化情况预测第三单元组时间段内指数应该呈现上涨且有大幅上扬趋势, 实际情况也真实反映了这一预测情况;而根据第二、三单元组的参数变化情况预测第四单元组时间段内指数应该呈现下跌且有小幅上扬趋势, 实际情况也真实反映了这一情况;再根据第三、四单元组的参数变化情况预测第四单元组时间段后指数应该呈现平缓且有小幅下挫趋势, 实际情况也真实反映了这一情况。
我们试着检验了随机的几只个股 (这里就不一一列出了) , 预测情况与真实情况基本吻合, 也体现了预测结论的一般有效性。但是针对这个结论的真实准确性, 我们还需要进一步验证, 希望能够进一步完善这个结论。
3 小结
通过对上证大盘A股综合指数5 分钟高频数据的多重分形谱研究, 以及多只个股股价的5 分钟高频数据的多重分形谱研究, 并根据大量实验结果分析, 提出了可以依据股票股价最近时间段的多重分形谱形状及参数变化情况来预测股票股价短期走势的初步结论, 这个结论难免会有统计失真, 还需要进一步检验, 但是仍然具有一定的参考价值。
参考文献
[1]李彤.多重分形原理及其若干应用[D].北京交通大学, 2008.
[2]笪婷婷.降趋交互相关性分析的多重分形拓展及其金融市场应用[D].中国科学技术大学, 2015.
[3]I.Antonios, , L.Lipsky.On the relationship between packet size and router performance for heavy-tailed traffic.Third IEEE International Symposium on Network Computing and Applications.2004.
[4]韩彦.中国境内外股市间的多重分形交叉相关性研究[D].南京信息工程大学, 2015.
预测系数 第9篇
风力发电机闸瓦摩擦系数的大小与闸瓦温升、速度和压力三个参数密切相关[1,2]。由于风力机在高速运转下实施制动的过程中闸瓦温升会急剧上升,会使摩擦系数急剧减少,从而严重影响了制动性能[3,4]。因此,积极开展对风力发电机制动闸摩擦系数预测方法的研究具有重要意义[5,6]。
1 制动闸的摩擦实验
对国产闸瓦进行了摩擦实验,总结了速度、压力和温升对摩擦系数的影响。实验电路如图1所示,控制器采用西门子S7-200的CPU224,而数据采集模块选用EM235,传感器有3个。分别为压力传感器、温度传感器和速度传感器,其输出信号均为4mA~20mA的标准信号。传感器将实时采集好信号之后,把信号传送给EM235进行A/D转换,得到的数字信号再传给CPU224进行处理,用于显示和报警。实验曲线如图2所示。
2 闸瓦摩擦系数预测模型
通过对图2的实验曲线进行分析可知,摩擦系数与温升、速度、压力呈非线性关系。且不同厂家、不同材料的闸瓦其摩擦系数差别很大。因此,应将温升、速度与压力对摩擦系数的影响进行综合考虑。由于人工神经网络能较好的反映非线性输入输出的映射关系[1]。因此,本文提出了利用神经网络来建立闸瓦摩擦系数的预测模型。
采用三层BP神经网络构造的神经网络预测模型如图3所示。将归一化的特征参数x1(温升)、x2(速度)、x3(压力)作为网络模型的输入信号,μ(摩擦系数)为输出信号,神经网络预测模型的训练样本如表1所示。
其中取学习率为0.01,误差为0.003,训练步数为2000,利用表1作为训练样本对模型进行训练,训练结束后得到权值矩阵为W1和W2。
图4为神经网络模型的训练误差曲线。
重新取新的数据x1=0.04,x2=0.83,x3=0.41代入上述训练好的模型中,得到的摩擦系数预测值为:0.3532,满足实际要求。
3 摩擦系数对制动安全的影响
通过上述分析可知,当闸瓦温升T>100℃时,摩擦系数就会急剧下降,严重影响风机的安全制动。而风力发电机运动方程可描述如下:
闸瓦摩擦系数μ可利用神经网络模型求出并代入式(1)。由于F与时间呈非线性关系使式(1)不好求解,为此可以把摩擦系数和系统运行速度在小的时间间隔Δt内看作常数,求出制动力矩,并利用式(1)求出系统的减速度
式中,系统前一时刻运行的速度和距离分别用Vt-1ht-1表示。方程的意义为系统安全的前提是Vt必须在有效行程内降为零,否则有可能发生事故。
案例分析:
风力发电机制动闸参数:∑m=91089kg,Q=82600(N),h2=40(1/m2),M=16Mn,λ=53.2W/m℃,α=1.4299×10-7,Bi=0.22;F=63700(N), r2=1.80m,Z=0.03m,P=2,R=1.83m,Rm=r=1.68m,r1=1.58m,利用给出的条件求出相关参数如表2所示。
通过对表2分析后可以看出,闸瓦热稳定性对安全运行的影响是巨大的,即使在超速运行时采用热稳定性好的闸瓦也可以让风机停机;而超速运行时采用热稳定性差的闸瓦则不能使风机刹住车,但在正常载荷时则可以把风机停住。
4 结束语
开展了风力发电机安全运行影响机理的研究,建立了基于神经网络的闸瓦摩擦系数预测模型;得出了如下结论:速度、压力和温升时影响风力发电机制动闸摩擦系数的三个重要参数,其中温升影响最大,因此,建议企业一定要选择热稳定性好的闸瓦并在使用前进行相关试验。应建立完善的制动闸状态检测系统,对速度、温升、压力进行检测,以避免在超速紧急制动时发生事故。
参考文献
[1]周东华,叶银忠.现代故障诊断与容错控制[M].北京:清华大学出版社,2000,6:121-123.
[2]葛世荣.矿井提升机可靠性技术[M].北京:中国矿业大学出版社,1994:44-47.
[3]肖兴明.摩擦提升重大事故分析及预防[M].北京:中国矿业大学出版社,1994:78-79.
[4]肖运启.双馈型风力发电机励磁控制与优化运行研究[D].北京:华北电力大学,2008.
[5]王子瑞,杨洪彬.风力发电机刹车元件摩擦系数测量装置的研制[J].机电工程技术,2009,3(9):46-47.