组合神经网络范文

2024-08-09

组合神经网络范文(精选10篇)

组合神经网络 第1篇

大规模光伏发电系统的应用,有助于缓解传统能源枯竭而引起的能源危机,但是其输出功率的波动特性会给电网造成较大的影响[1],因此,对光伏出力进行预测以便采取应对措施就变得极为重要。目前,针对光伏出力预测的方法大体上可以分为2种:直接预测和间接预测。直接预测是指通过对输出功率、天气等的历史数据进行统计分析,直接建立出力预测模型,不需要对气象、温度等外部环境进行预测[2,3,4,5,6,7,8]。而间接预测是指对天气情况或日照强度进行预测,建立天气变化与日照强度模型,通过这些参数与光伏发电量的关系,计算得出最后的预测值[9,10]。直接预测和间接预测都有一定的局限性,例如,直接预测在未考虑天气的情况下,对历史数据进行统计,建立预测模型,但是如果天气指数变化,则可能导致预测模型失效。间接预测方法只对外部环境进行预测,未考虑系统本身如安装角度、光伏阵列转换效率等因素对光伏出力的影响。

针对光伏阵列出力的特点,文献[5]采用改进GM(1,1)残差修正模型对光伏出力理论量和实际量进行预测,结果对符合太阳能辐射量峰值特点的预测日效果较好,反之可能会导致预测模型失效。文献[6]利用灰色理论和马尔可夫链建立了直接预测模型,并验证了预测模型的可行性,但精度有待提高。文献[7]提出了一种加入天气预报信息的神经网络发电预测模型的设计方案,采用光伏阵列的发电量序列、日类型指数和气温建立了神经网络直接发电预测模型。文献[8]介绍了一种演化神经网络(EPANN)算法,用来直接预测与电网并联的光伏发电系统交流输出功率,太阳辐射、风速、大气温度作为输入端,交流输出功率作为输出端。文献[9]采用前向反馈神经网络(FFNN)、径向基神经网络(RBFNN)和回归神经网络(RNN)3种神经网络算法对辐射强度进行预测。通过分析比对,选择了RNN对光伏系统进行出力间接预测,结果证实了神经网络预测方法的有效性。文献[10]采用多层感知器,利用24h的日平均辐射强度和温度对辐射强度进行预测。上述文献所涉及方法和模型都可以对光伏出力进行预测,但预测精度都有待提高。通常情况下,组合预测方法要比单独使用一种预测方法精度高,如文献[11]所介绍的风电场风速及风电机组功率预测方法就是基于相似性样本的多层前馈神经网络,并结合时间序列分析与灰色预测方法对风速进行预测,进而讨论风电机组功率预测。

本文拟建立一种基于灰色神经网络的组合模型对光伏短期出力进行预测。首先,通过统计与预测日相似天气环境下整点时刻的出力,建立各时刻出力的灰色模型。然后,利用输出结果与样本日的温度建立神经网络,并利用训练好的模型模拟预测日的输出。最后,利用实际光伏系统的数据进行方法验证。

1 影响光伏阵列短期出力的主要因素

太阳能具有能量密度低、稳定性差的弱点,并且受到地理分布、季节变化、昼夜交替等影响,使光伏发电系统的输出具有不连续性和不确定性。影响光伏阵列短期出力的因素通常可以归结为以下几类。

1.1 光照强度

地球接收到的太阳辐射并不是一个恒量,而是一个随时间变化的变量,用光伏阵列进行发电,其输出功率也随着太阳光的不同强度而改变。如图1所示,光伏阵列出力随着光照强度的波动而变化。

1.2 天气类型

受云量、风速、温度等因素的影响,不同的天气类型光伏阵列的输出也不一样。如图2所示,晴天和阴天时光伏阵列的出力明显不同。晴天时的发电功率要高于阴天时的发电功率。

1.3 光伏电池转换效率

光伏电池的效率也能影响光伏系统的出力。不考虑其他因素,电池效率越高,出力越多。太阳能电池的光电转换效率与电池的结构、结特性、材料性质、工作温度、放射性粒子辐射损伤和环境变化等有关。

1.4 大气温度

光伏阵列的输出不仅与光照强度、光伏电池的转换效率有关,而且还与大气温度有关,单位面积的光伏阵列输出功率可以表示为:

式中:η为光伏阵列转换效率;S为阵列面积;I为光照强度;t0为大气温度。

由式(1)可以看出,大气温度的变化会改变光伏阵列的输出性能。温度升高,功率会有所下降,所以在建立预测模型时,也应考虑大气温度的影响。

2 预测模型的选择

本文针对光伏阵列出力的特点,提出灰色模型和神经网络模型组合的方法进行预测。通过合理选取样本,尽量减小各种因素对预测模型的干扰。通过灰色模型预测出力的大致发展趋势,然后通过神经网络模型训练,减小由非线性因素带来的影响。

2.1 灰色模型GM(1,1)

1982年,中国学者邓聚龙教授创立了灰色系统理论,该理论以“部分信息已知,部分信息未知”的“小样本”“贫信息”不确定性系统为研究对象,通过对“部分”已知信息的生成、开发实现对现实世界的确切描述和认识[12]。而对于光伏发电量这个研究对象,它符合灰色系统理论研究对象的特点,所以建立灰色模型对光伏出力进行预测是可行的。根据光伏短期出力的特征,可以建立灰色模型GM(1,1),基本过程如下:(1)对样本建立1-AGO序列;(2)检验光滑性和准指数规律,判断是否满足建立条件;(3)建立GM(1,1)模型;(4)进行最小二乘参数估计,确定模型;(5)还原并求出预测值。

2.2 神经网络模型

灰色预测模型可在“贫信息”情况下对非线性、不确定性系统的数据序列进行预测,但其预测误差偏高,而人工神经网络由于具有强大的学习功能,可以逼近任意复杂的非线性函数,它不用事先假设数据间存在某种函数关系,信息利用率较高[13]。采用BP算法的多层感知器是至今为止应用最为广泛的神经网络。故在此利用所得的模拟值和实测值通过BP神经网络建立非线性映射关系。BP神经网络主要包括3层,分别为输入层、隐含层、输出层,各层的函数关系如文献[13]所述,这里不赘述。

本文所采用的变换函数均为单极性Sigmoid函数:

BP算法的基本过程是输入样本从输入层传入,经各隐含层逐层处理后,传向输出层。若输出层的实际输出与期望输出不符,则将输出误差通过隐含层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。

对于输入量来说,其各数据的量纲并不完全相同,因此需要通过尺度变换使其值限制在[0,1]内。本文采用的尺度变换方法为归一化法:

式中:xi为输入或输出数据;xmin和xmax分别为数据变化范围的最小值和最大值。

3 预测模型的建立

对于光伏出力的预测,可以对光照强度建立灰色模型间接预测,也可以对光伏阵列出力建立灰色模型直接预测。采用间接方法所用数据较多,且涉及天气数值,建模比较复杂,所以本文对光伏阵列出力直接建立预测模型。利用灰色神经网络组合模型对光伏出力进行预测,要注意灰色和神经网络这2种模型的输入样本和结构选择。

3.1 灰色模型的建立

模型的建立大多需要大量历史数据,但灰色系统理论在建模过程中利用较少的数据就能得到一定精度内的模拟数据。采用灰色理论的思想对原始数据进行必要的处理,可以大大改善预测模型的精度。灰色模型的输入选用与预测日相同的同一系统在相似天气情况下每天同一时刻的测量值,因为选择与预测日日类型相似的数据,可以保持天气情况对出力影响的一致性。另外,对于短期内同一系统每天同一时刻的出力,其系统转换效率、太阳高度角、光照强度等影响因素都较为接近,所以可以尽量减弱输入的不确定性,增强数值的规律性。图3为某一光伏电站在4月12—17日期间晴天条件下某一相同时刻出力的测量值。从图中可以看出,每天同一时刻的出力值基本相似,但是数值稍有波动,若想找到一条简单的曲线来逼近它非常困难。如果将数据经过1-AGO累加变换,数值会呈现指数增长的规律,这时用指数函数进行拟合较容易,即利用灰色模型可以模拟出每天各小时光伏出力的大致曲线。光伏发电系统主要在07:00—18:00时段内输出电力。算例的输入为07:00—18:00时段内相同时刻的出力实测值。这里选用4月12—16日各整点时刻的实测值,共12组数据。经过检验,输入的样本符合建立灰色模型的条件,即满足光滑性和准指数规律。建立12个灰色模型,得到相应的拟合方程,通过计算可以算出预测日4月17日和样本各天各时刻的拟合值。

3.2 灰色神经网络模型的建立

虽然对于同一系统设备、同一时刻、同一种天气类型,光伏系统的出力值较为接近,但是天气变化、温度、设备的影响等因素都是非线性的,很难对这些影响进行精确掌握。因而,本文不考虑这些问题,仅考虑灰色模型模拟出来的拟合值与实测值之间的关系。因为灰色模型拟合出来的数据在一定精度内已经反映了当天的数值,模拟值与实测值之间本身就有很高的相关性,利用这些特点建立的神经网络模型会更加可靠,通过这个模型进行预测,精度也会有所提高。3.1节已经通过灰色模型模拟出光伏出力变化的大致曲线,此时,利用得到的拟合值与实测值建立训练样本,从而建立它们之间的非线性映射关系。继续3.1节的例子,则神经网络模型的样本输入为灰色模型拟合出来的4月12—16日每天12h整点时刻的拟合值。另外,为了加强确定性因素,加入当天气温最高值和最低值作为输入,而样本的期望值分别为每天12h的实测值。也就是说,此网络的输入层共14个输入,输出层共12个输出,其中隐含层通过经验测试选为28个,建立训练网络。然后把灰色模型得到的4月17日的预测值输入训练好的网络,得到4月17日的最终预测值。简言之,利用灰色神经网络建立的预测模型就是用预测出来的具有一定精度的值来进行预测。

4 算例分析

本文编程实现了光伏发电短期出力预测的灰色神经网络组合模型,并对预测结果进行了分析。

4.1 3种模型的输入、输出设置及预测结果

1)灰色模型。利用4月12—16日各天12h的出力值作为输入样本,建立灰色模型,拟合出力的大致变化曲线得到响应序列。通过响应序列对4月17日12h的整点出力值进行预测并得到各天各小时的拟合值。表1为各天07:00—18:00整点时刻实测值。

2)神经网络模型。利用4月12—15日各天12h整点时刻出力值和隔天最低、最高温度作为输入,相同天气类型的样本次日对应时刻的出力值作为输出,建立并训练网络。把4月16日12h的整点出力和4月17日的最高、最低温度输入训练好的网络中,得到最后预测结果。

3)组合模型。通过灰色模型得到响应序列算出4月12—16日12h整点时刻的出力值,并利用得到的整点时刻出力以及确定性因素温度值作为输入,而当天对应时刻的实测值作为输出,建立灰色神经网络并训练。把利用灰色模型得到的4月17日的预测值和最高、最低温度输入训练好的网络中,得到最终预测结果。

3种模型预测结果如表2所示。

kW

从表2可以看出,3种模型都可以对光伏出力进行预测,预测的结果大致能反映出力的变化曲线,但是个别小时偏差较大。相比于单纯用灰色模型和神经网络模型,组合模型在相对偏差较大的预测值上的预测误差有较大幅度的减少。

4.2 3种模型的评估结果

从表2可以看出,对于个别相对偏差较小的预测值,单独使用灰色模型或者神经网络模型,其预测结果可能稍好,但是整体模型的好坏还需更进一步的评价,因此本文需要通过均方根误差ERMSE对模型进行评估。

式中:为预测值;P(i)为实测值;i为预测序列。

通过对3种模型的均方根误差进行计算,可以得到组合模型的ERMSE为6.3,而神经网络和灰色模型的ERMSE分别为8.48和12.58。也就是说,组合模型比单独用灰色模型和神经网络模型的预测精度高。建立灰色模型进行预测,方法较为简单,但预测精度不高。采用神经网络方法进行预测,精度有所提高,但个别小时的预测精度并未有很大的改善。因此,选择组合模型进行光伏出力预测是可行、高效的。

5 结语

本文提出的灰色神经网络组合模型光伏出力预测方法采用与预测日相同天气类型、相同设备、相同时刻的出力值作为样本,尽可能保持了日照强度、天气类型、系统转换效率、安装角度等因素对出力影响的一致性。利用灰色模型对其出力进行大致趋势的预测,然后利用趋势预测值和确定性因素温度值与实测值建立神经网络模型,用相对确定的值来预测未知值。实际算例表明,利用灰色神经网络组合模型能有效预测未来一天12h整点时刻的光伏出力情况,其预测精度较高。预先确定光伏系统在未来短期内的出力情况,对于电力系统制定调度计划、减轻光伏出力不确定性对电网的影响具有重要意义。

一种新的组合灰色神经网络预测模型 第2篇

一种新的组合灰色神经网络预测模型

对GM(1,1)灰色和几种灰色组合模型进行了讨论,针对多个相关序列预测的问题,提出了组合灰色GM(1,1)神经网络预测模型.此方法采用灰色模型对各序列进行预测,然后利用神经网络对预测值进行校正,得到最终预测值.实例表明此种模型在实际应用中的确能够提高预测精度.

作 者:许秀莉 罗键 作者单位:厦门大学自动化系,福建,厦门,361005刊 名:厦门大学学报(自然科学版) ISTIC PKU英文刊名:JOURNAL OF XIAMEN UNIVERSITY(NATURAL SCIENCE)年,卷(期):200241(2)分类号:N941.6关键词:模型 BP神经网络 组合灰色神经网络预测模型

“沉腰斜板组合”治坐骨神经痛 第3篇

去求医,医生初步诊断为坐骨神经痛,开了药,大女儿帮我取回家。我痛恨吃药,除了一些急性消炎药,其他的我基本不碰,因为我坚信药给身体带来的伤害,远大于它的好处,更可怕的是,很多伤害并非一目了然,而是在多年后再来暗算你。这回医生开了一个月的药量,我吃了两天,第一天似乎有点用,第二天无效了。在后面的几个月里,疼痛时剧时缓,严重干扰了我的正常生活。

药不敢吃,吃了也没用,但是腿还老痛着,怎么办呢?我尝试了针灸,无效;尝试了热敷,无效;走投无路时,看到了朋友电邮来的一位国内医生发明的几个简单的动作,据说疗效显著。我立刻试做起来,真的有用啊!一个星期下来,痛症消除百分之九十,腿又可以弯曲了,磨人的酸痛也基本消失了,如此,我又可以精神抖擞地、在无痛状态下出去走路健身了。

我嗜读成瘾,几十年来每天阅读不辍。以前我斜靠在床头看书,如今,我倒卧着在床上看书,既过了瘾,又治了病。这两个月来,我一直过着无痛的幸福生活,心中不禁充满了无限的感恩之情。日前向师母请安,她诉说了被坐骨神经痛折磨得寸步难行的惨痛遭遇,我立刻向她力荐此方。今日再致电问安,欣慰得知效果彰显。我相信受此病痛磨难者不在少数。我基本只练第一种俯卧沉腰法。

我所采用的俯卧沉腰法是由北京国都尚研究院的大夫设计的一种沉腰斜板组合法的其中之一。它们的优点是:病人治疗时基本没有痛感,见效快,方法简便,宜于推广。轻的几次就能使症状消失。

沉腰斜板组合法主要有以下几个组合:

俯卧沉腰法:病人俯卧在胸前三个枕头与小腿部三个枕头上,腰部不加任何压力,自然下沉10至15分钟。这种姿势可以使腰椎后缘间隙变小,把突出的骨髓核推入椎间盘问隙内。

仰卧沉腰法:病人仰卧在高枕上,臀尾骨部垫一个枕

头,双腿屈尊胸前,双手抱住,腰部自然下沉15分钟以上。这种姿势可以使腰椎后缘间隙增大,利用韧带的动力,把突出的骸核推入椎间盘间隙内。

上述两种姿势作为主要练习方法,一天至少两次,每次一至二势。

患者经过自我治疗,腰腿痛基本消失后,再做加强腰背肌功能的两种姿势。

俯卧鱼跃势:病人俯卧在平板床上,腰部挺在板床上,头、足里头向上翘起10次以上。

站立搁腿法:站立势(手可扶杆),患腿伸直搁起5分钟以上。

严重腰椎间盘突出症的患者,做完俯卧沉腰法和仰卧沉腰法以后,请别人帮助,再做一次”斜板使椎体旋转”,更有助于突出的髓核回纳到椎间盘内。

对于患腰椎间盘突出症的老年人或体弱病人,无力做俯卧沉腰法和仰卧沉腰法者,可采用病人仰卧在高枕上,臀尾骨部垫一个枕头,使腰部自然下垂的方法进行治疗,也能收效。

组合神经网络 第4篇

电力系统负荷序列既具有波动性又具有特殊的周期性, 可看作多个不同频率分量的叠加。每个分量呈近似周期性变化, 具有相似的频率特性和一致的变化规律, 从而具有更强的可预测性。因此, 在对负荷进行频域分解的基础上, 根据各频率分量特点进行建模是提高预测精度的有效途径。文献[1~3均采用EMD方法对负荷数据进行分解, 然后分别对各分量和余项采用同一种预测模型进行预测, 最后将这些预测分量加起来作为最终的预测结果, 它们利用EMD的优点成功地提高预测精度, 但没有考虑每个分量的特点及预测方法的适应性, 具有一定的不合理性。文献[4]将EMD分解后的子序列重构成三个分量, 用三种不同的预测方法进行预测, 这与利用EMD分解提高预测精度的初衷自相矛盾。另外经本人进行大量的实际数据测试发现, 利用EMD进行预测的误差主要来源于高频分量, 减小预测误差关键在于提高对高频分量的预测精度。本文提出基于HHT和神经网络组合的电力系统负荷预测模型, 该模型首先将负荷数据进行EMD分解, 得到一系列IMF分量及余项, 通过各分量的频谱观察, 针对低频IMF分量规律性及周期性强, 高频分量相对较弱的特点, 对低频IMF分量选择合适的预测模型直接进行预测, 高频IMF采用神经网络组合预测方法。通过实际数据检验, 此方法有较高的预测精度。

1 HHT算法简介

HHT (Hilbert-Huang Transform) [5]是全新的信号处理方法, 它由经验模态分解法EMD及Hilber变换两部分组成。EMD是美国N.E.Huang提出的信号分解算法, 此算法的目的是把复杂信号分解为简单的单分量信号的组合, 即将性能不好的信号分解为一组性能较好的具有瞬时频率的固有模态函数 (IMF) 和具有单调性或一个极值点的余项Rn。该方法分解过程基于数据信号局部特征, 不需要预先设定参数, 是自适应的。分解得到的IMF分量都是平稳的, 包含原始信号的局部特征信息, 尤其适用于非线性和非平稳性数据。HHT具有如下特点:IMF概念的提出使得用HT定义的瞬时频率具有实际的物理意义, 可用于复杂的非平稳信号的分析;瞬时频率的定义方法与频率的经典定义方法 (信号相位的导数) 相一致, 从而可以给出信号频率变化的精确表达, 而且该法简单、通用。近几年该法已经被应用于地球物理学、生物医学、工学等领域的研究, 并取得了较好的效果。

2 本文提出的模型原理和方法

电力负荷可表示为周期分量、随机变化量与趋势分量之和。EMD对负荷序列有平稳化的作用能将负荷按其内在特性自适应地分解为若干个不同频率平稳的IMF分解后的IMF突出了原负荷的局部特征, 能更明显地看出原负荷序列地周期项、随机项和趋势项, 对其进行分析能更清楚的把握负荷特性。在此基础上, 根据IMF变化特点分别建立不同的预测模型, 最后将预测结果相加得到最终预测值。

本文提出的预测方法步骤如下:

(1) 数据预处理——利用小波对预测数据进行去噪处理;

(2) 应用HHT算法——通过EMD对负荷数据进行分解, 得到若干个频率由高到低的IMF分量和余项;

(3) 提取规律——对各个IMF分量通过Hilbert求频谱, 通过观察其瞬时频率值、频带宽度、频率波动情况掌握其规律;

(4) 低频分量处理——将频率值较低、频率变化范围较窄的IMF分量和余项定位低频分量, 对它的预测较简单, 选择一种合适的预测方法既可;

(5) 高频分量处理——将频率值较高、频率变化波动性较大、频带宽的分量定为高频分量。它除了包含高频的周期信息外, 绝大部分为负荷数据中的随机变化量, 对于这些分量采用单一的预测方法往往效果不佳, 本文采用神经网络组合模型的预测方法;

(6) 预测结果综合——将各个IMF预测值相加得到最终的预测结果。

2.1 数据预处理

负荷数据的采集过程是经过人工或设备的传输, 这就不可避免会存在误差和噪声, 所以在进行数据分析预测之前需要对数据进行消噪处理。文献[6]提出利用小波包对信号分解重构, 去除噪声干扰信号, 该方法减少噪声对EMD分解的干扰, 从而减少由于分解无用的噪声信号引入的边界效应误差和分解层数提高EMD分解的准确性和时效性, 使EMD算法在信号的分析中更具实用性。本文采用此种方法对负荷数据进行去噪处理。

2.2 应用HHT算法

首先对去噪后的负荷数据做EMD分解, 得到一组IMF分量及余项, 对各IMF求频谱的过程如下:

对每个IMF分量ic (t) 作希尔伯特变换可得数据序列ci^ (t)

由ic (t) 和ci^ (t) 可以构成一个复序列zi (t)

其中幅值函数和相位函数

从而得到瞬时频率为

由此可看出各负荷分量的频率分布和变化范围, 通过它选取合适的负荷预测模型。

3 预测模型

(1) 神经网络模型

在负荷预测的研究中, BP是应用最多的神经网络模型, 它结构简单, 具有很强的非线性拟合能力。然而, 由于BP网络过分强调克服学习错误而泛化性能不强。这使得它对比较平稳的信号预测效果十分理想, 但对于高频宽频波动性和随机性比较大的信号预测不是十分准确。RBF网络能够将输入层到隐含层的非线性映射转变成另一个空间上的线性映射, 在某些复杂情况下拟合能力没有BP强, 但学习速度快并可以避免局部最优。

(2) 支持向量机SVM模型

支持向量机SVM的机器学习算法, 实现了结构风险最小化原理 (SRM) , 找到经验风险最小和推广能力最大的平衡点, 对未来样本有较好的泛化性能。较好地解决了小样本、非线性、高维数和局部极小点等实际问题。

(3) 组合模型

将多种不同的预测方法进行适当组合, 综合利用各种方法提供的信息, 便形成了所谓的组合预测方法。组合预测模型将各种预测结果进行总体性综合考虑, 比单个模型更系统、更全面, 且Bates和Granger证明了2种或2种以上无偏的单项预测可以组合出优于每个单项的预测结果, 能有效地提高预测精度[7]。

传统的线性组合预测模型, 基本思想是认为实际值和几种网络的预测值成一种线性的关系, 通过数学方法可以求出各自的权重系数。但事实上实际值和它们之间未必是一种线性关系, 因此本文提出了一种基于神经网络的组合预测模型, 利用神经网络的非线性拟合能力, 考虑将几种网络得到的预测值作为神经网络的输入, 将实际值作为输出, 训练出一个新的网络。预测结果表明, 本文给出的模型预测精度高于传统的线性组合预测模型。

设f1i, f2i, f3i分别是三种预测模型的第i次预测结果, 而fi是第i次的实际负荷值, 我们如果认为它们之间是较复杂的非线性关系, 考虑如下式子:

其中:m为样本个数, 为了使得式 (7) 取得最小值, 就是要求出非线性函数g (·) , 而传统的梯度法或遗传算法都不能正确的求解。

Hornik等人的研究表明前向三层神经网络能实现复杂的非线性映射, 其不仅能以任意精度逼近任意连续函数, 还能以任意精度逼近其各阶导数, 所以本文考虑选择三层前向神经网络逼近上述非线性映射g (·) 。本文采用的是BP神经网络, 将各种神经网络的预测值作为BP的输入, 实际值作为输出来训练网络, 它的结构图如图1所示。

4 数据仿真

本文选取四川某电网2006年7月5日~8月7日电网负荷数据来预测8月8日号一天24小时的负荷数据。经去噪后通过EMD分解为7个IMF分量和一个余项r, 如图2、图3为通过Hilbert方法求得频谱。

设负荷实际值为R (i) , 预测值为Y (i)

则每点相差值:

相对预测误差:

平均误差:

由图3可看出分量IMF1和IMF2的瞬时频率较高, 频带较宽, 突变较大, IMF3~IMF7瞬时频率较低, 频带窄, 基本平稳。经过实际数据测试, 对IMF3~IMF7直接采用一种预测模型就能达到比较高的预测效果, 而对IMF1和IMF2单单使用任何一种模型效果都很差。所以本文提出对IMF1和IMF2采用组合预测方法, 并在模型中考虑温度因素的影响。分别对上述提到的两种组合预测方法进行实验, 将结果进行了对比。本文规定C1代表线性组合预测的结果, C2代表神经网络组合预测的结果。C1中的权重系数由文献[7]中的公式求出。

对于IMF1和IMF2本文采用BP、SVM、RBF三种模型进行组合, 各种模型、C1、C2的预测结果与实际负荷曲线图如下, C2采用BP 3-8-1结构。

从表1和表2可看出, 组合模型的预测精度比单一的预测模型高。

对于IMF3~IMF6本文根据其波形和频率特性分别选择合适的预测模型, 分别选择对IMF3~4, 5~6, 7~9采用SVM、BP、线性神经网络。

表3列出了经两种组合预测模型的误差, 从表3中可看出神经组合预测方法优于线性组合预测。

5 结论

本文提出基于HHT和神经网络组合的电力系统短期负荷预测模型, 该方法简单, 无需考虑复杂的数学模型。负荷数据通过EMD的分解后, 对各分量频谱的观察, 可将IMF分为高频和低频两类, 据实际仿真数据表明, 针对它们各自的频率、带宽特性, 采用不同的预测方法对这两类数据进行预测可提高预测精度。对低频分量直接选择单一的合适的模型即可, 对于高频分量采用组合模型比较好, 本文做了关于传统线性组合模型和神经网络组合模型的对比研究, 结果表明神经网路组合模型优于线性组合模型。本文提出的该模型有效改善了高频分量的预测效果, 从而提高了整体预测精度。

参考文献

[1]ZHU Zhi-hui, SUN Yun-lian, LI Huang-qiang.Hybrid of EMD and SVMs for Short-Term Load Forecasting[A].in:IEEE International Conference on Control and Automation[C].2007.1044-1047.

[2]王洪波, 朱启兵.基于EMD和LS-SVM的非平稳振动信号趋势预测[J].计算机工程与应用, 2008, 44 (16) :157-159.WANG Hong-bo, ZHU Qi-bing.Trend Prediction of Non-stationary Vibration Signals based on Empirical Mode Decomposition and Least Square Support Vector Machin[J].Computer Engineering and Applications208, 44 (16) :157-159.

[3]谢景新, 程春田.基于经验模式分解与混沌分析的直接多步预测模型[J].自动化学报, 2008, 34 (6) :684-689.XIE Jing-xin, CHENG Chun-tian.A New Direct Multi-step Ahead Prediction Model Based on EMD and Chaos Analysis[J].Journal of Automation, 2008, 34 (6) :684-689.

[4]李媛媛, 牛东晓, 乞建勋, 等.基于因散经验模式分解的电力负荷混合预测方法[J].电网技术, 2008, 32 (8) :58-62.LI Yuan-yuan, NIU Dong-xiao, QI Jian-xun, et al.A Novel Hybrid Power Load Forecasting Method Based on Ensemble Empirical Mode Decomposition[J].Power System Technology, 2008, 32 (8) :58-62.

[5]胡国胜, 陈一天.基于HHT变换的电机故障信号频率分析[J].电力学报, 2005, 20 (4) :327-330.HU Guo-sheng, CHEN Yi-tian.The Study of MotorFault Signal Frequency Based on Hilbert-Huang Transform[J].Journal of Electric Power, 2005, 20 (4) :327-330

[6]徐仁林, 安伟.小波降噪在信号基于EMD的Hilbert变换中的应用[J].噪声与振动控制, 2008, 6 (3) :74-77.XU Ren-lin, AN Wei.Wavelet Denoise Application in the Signal Hilbert Transform Based on EMD[J].Control of Noise and Vabirat, 2008, 6 (3) :74-77.

[7]李林川, 吕东, 武文杰.一种简化的电力系统负荷线性组合预测法[J].电网技术, 2002, 26 (10) :10-13.LI Lin-chuan, LüDong, WU Wen-jie.A Linear Combination Based Simplified Load Forecasting Method for Power System[J].Power System Technology, 2002, 26 (10) :10-13.

[8]A1Fuhaid A S.Cased Artificial Neural Networks For Short-Term Load Forecasting[J].IEEE Trans on Power Systems, 1997, 12 (4) :1524-1529.

[9]Kwang-Ho.Short-Term Load Forecasting for Special Days in Anomalous Load Conditions Using Neural Networks and Fuzzy Inference Method[M].IEEE Trans on Power Systems, 2000, 15 (2) :559-565.

组合神经网络 第5篇

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~【项目描述】 1.项目背景

虽然杰罗姆•麦卡锡(Jerome Mccarthy)的传统4P营销策略组合横扫了半个世纪,但到90年代,随着消费者个性化日益突出,加之媒体分化,信息过载,传统4P渐被以4C为基础的市场营销策略组合所挑战。从本质上讲,4P思考的出发点是企业中心,是企业经营者要生产什么产品、期望获得怎样的利润而制定相应的价格、要将产品怎样的卖点传播和促销、并以怎样的路径选择来销售。这其中忽略了顾客作为购买者的利益特征,忽略了顾客是整个营销服务的真正对象。以客户为中心的新型营销思路的出现,使顾客为导向的4C应运而生。1990年美国学者劳特朋(Lauteborn)教授提出了与4P相对应的4C理论。

4C的核心是顾客战略。而顾客战略也是许多成功企业的基本战略原则,比如,沃尔玛“顾客永远是对的”的基本企业价值观。4C的基本原则是以顾客为中心进行企业营销活动规划设计,从产品到如何实现顾客需求(Consumer’s Needs)的满足,从价格到综合权衡顾客购买所愿意支付的成本(Cost),从促销的单向信息传递到实现与顾客的双向交流与沟通(Communication),从通路的产品流动到实现顾客购买的便利性(Convenience)。

2.项目目标

 深入理解网络营销的4C策略与传统营销4P策略的不同  掌握4C策略在企业实际运营中的应用  了解网络渠道和传统渠道和谐结合的方法

 能灵活运用网络营销策略,提升企业竞争力和盈利水平

【重点】

学习网络营销的策略组合在Internet环境下的具体运用。

【难点】

如何灵活运用网络营销策略,提升企业竞争力和盈利水平

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

〖工作任务1〗 网络营销产品策略

【工作任务描述】 1.任务背景

在市场经济中,产品是企业生存的核心。产品是能够提供给市场以满足需要和欲望的任何东西,产品作为连接企业利益与消费者利益的桥梁,包括实体商品、服务、经验、事件、人、地点、财产、组织、信息和创意。在传统营销中,企业设计开发产品是以企业为起点的,从而使得消费者与企业在产品设计和开发过程中基本上是分离的,顾客只是被动地接受和反应,无法直接参与产品概念形成、设计和开发环节。

2.任务目标

 认识网络营销产品的整体概念  了解网络营销产品特点

 了解企业核心竞争力的分析与定位  掌握目标客户群定位  进行核心产品定位  为产品找卖点

【工作过程】

步骤1:认识网络营销产品的整体概念

网络营销产品的概念可以概括为:网络营销活动中,消费者所期望的能满足自己需求的所有的有形实物、无形产品和服务的总称。一个完整的产品包括核心产品、形式产品、期望产品、延伸产品、潜在产品五个层次,各层次关系如图10-1所示。

图10-1 网络营销产品的层次

网络营销产品的五个层次是依据满足消费者需求的重要性排序,由内到外依次为:

1.核心产品

这是产品最基本的层次,是指产品能够提供给消费者的基本效用或益处,是顾客要购买的实质性的东西。

2.形式产品

这是核心产品借以存在并传递给消费者的具体物质形式。3.期望产品

指顾客在购买产品时期望得到的与产品密切相关的一整套属性和条件。4.延伸产品

指由产品的生产者或经营者提供的和购买者需求的、主要是帮助用户更好地使用核心利益的一系列服务。

5.潜在产品 这是在延伸产品层次之外,由企业提供能满足顾客潜在需求的产品层次,它主要是产品的一种增值服务,它与延伸产品的主要区别是顾客没有潜在产品层次仍然可以很好地使用顾客需要的产品的核心利益和服务。

步骤2:了解网络营销产品特点

一般而言,目前适合在互联网上销售的产品通常具有以下特性:

1.产品性质 2.产品质量 3.产品式样 4.产品品牌 5.产品包装 6.目标市场 7.产品价格 8.产品价值

步骤3:了解企业核心竞争力的分析与定位

核心竞争力是一个企业能够长期获得竞争优势的能力。在核心竞争力理论的创始人普拉哈拉德和哈默尔教授看来,核心竞争力首先应该有助于企业进入不同的市场,它应成为企业扩大经营的能力基础。

1.生产型企业

生产型企业其核心竞争力就是产品。2.销售型中小企业

如果是销售型中小企业,她的核心竞争力来自于企业对于销售管理上的简化,因为大企业在销售管理方面有系统的完善的流程,而中小企业因为人力资源不足,所以必然会在销售管理流程上比大企业来得简单。

3.服务型企业

服务型企业的核心竞争力就是服务。就应该围绕如何把您的服务做到最好来思考。4.科技型企业

科技型企业的核心竞争力就是技术。应围绕如何把技术做到最好,做到无可替代,您就成功了。

步骤4:掌握目标客户群定位

规划企业的产品战略,首先就要确定谁是您的目标顾客群体,市场看上去是一个整体,可实际上它是由许多个不同的“板块”构成的。

1.企业确认目标顾客群体的原则

企业在确认自己的目标顾客群体的时候应当把握如下三个原则:(1)追求价值(2)追求稳定(3)追求适宜

2.网络目标客户消费群的特点(1)个性化的消费需求

(2)消费者需求的差异性

(3)消费的主动性增强

(4)消费者与厂家、商家的互动意识增强

(5)追求方便的消费过程

(6)消费者选择商品的理性化(7)价格仍是影响消费心理的重要因素

步骤5:进行核心产品定位 1.核心产品定位时应遵循的原则

(1)核心产品应该代表了产业群中的一个有影响力的类别。例如,格兰仕集团的核心产品微波炉在生活电器产业群中的影响力。

(2)核心产品应该代表了企业的技术核心。例如,康泰克代表了中美史克的核心技术——缓释技术。

(3)核心产品应该代表了企业的实力和竞争优势。这种优势是能够在市场竞争中转化为经济效益的优势。例如,可口可乐在饮料市场的优势;麦包包在手袋市场的优势。

(4)核心产品一定要具备某种沟通元素。因为核心产品是用来同客户沟通的,因此,应该选择客户关心的,大众喜闻乐见的产品或服务,并与顾客形成良好的互动与联系。例如,读者看到图书会联想到亚马逊、当当;听到亚马逊、当当会联到图书。

(5)核心产品选择的因素一定是可以延伸消费的。例如,百度选择了搜索引擎作为核心产品,当企业在百度注册后,百度还会进一步提供关键词优化、网站优化、网站推广等服务,这就是产品的延伸。

步骤6:为产品找卖点 1.产品的卖点

什么叫“卖点”呢?“卖点”是企业对产品进行创新的结果,是能让消费者看得见的、摸得着的、具有可比性的或者是能达到真实效果的、实实在在的某种技术或某个部件。否则,就不能叫“卖点”。我们必须清醒地认识到,现在的市场是一个比较理性的市场,消费者也大都是比较理性的消费者。

2.产品卖点提炼的核心法则

组合神经网络 第6篇

关键词:故障诊断,雷达,主元分析,神经网络

目前文献中出现的各种故障诊断方法中, 还没有一种单一的方法能够满足雷达故障诊断问题的全部要求。各种方法在功能上互补, 如果集成它们各自的优势特征开发混合算法, 可以期望得到更好的诊断结果, 这是克服单一求解策略局限性的有效途径。Ch.Venkateswarlu等[1]采用不同形式的扩展卡尔曼滤波、递归最小二乘和降阶Luenberger观测器构建了不同的双层故障诊断系统。YoungSeok Oh等[2]提出了一个两步骤的诊断系统, 第一步采用故障树的反向链接功能查找可能的故障原因并赋予不同的概率级别, 第二步则采用模式识别比较采集到的和动态模拟得到的故障发展趋势, 最终确定故障原因。YvonnePower等[3]将大规模流程分解为多个子系统, 然后用基于实时数据的Petri网络定位故障发生的特定子系统, 之后则启动组合神经网络, 识别在该特定子系统中的准确故障位置。

基于以上认识, 利用主元分析 (PCA) 和神经网络构成组合故障诊断系统。PCA是一种利用统计原理建立系统低维模型以提取相关信息的方法;神经网络可以在不需要系统模型的情况下建立系统模型, 较为全面真实地反映雷达故障状态下的内部特征, 用于故障诊断时可以提高结果的全面性和机理性。组合诊断系统可以发挥二者各自在故障检测、识别和诊断中的优势, 有利于快速、准确地确定故障原因。

1组合故障诊断系统

组合故障诊断系统如图1所示。故障检测和故障识别构成了系统的第一级, 采用PCA (多元统计分析) 的方法进行。故障检测用于确定故障是否发生, 在大多数情况下, 可以通过分析现场实时数据完成。为了保证实测数据的可靠性, 应对其进行滤波处理。本研究采用一阶数字低通滤波器算法[4]:

β是介于0与1间的系数, 其值取决于采样周期与滤波器的时间常数之比。该值越小, 则对高频信号削弱得越厉害, 能够通过滤波器的频率上限越低。

滤波后的数据还需要进行标准化处理, 即每个变量减去其样本均值后再除以它的标准差, 使得每个变量在过程监控中被赋予同样的权重。然后, 考虑到化工数据的多变量特征, 进行维数压缩从而以较少的提取变量来表征系统状态就十分必要。PCA是一种线性降维技术, 通过最大化数据变化度来分解样本矩阵:

X=X^+E=ΤaΡaΤ+ΤrΡrΤ (2)

样本估计值和误差的变化可通过T2和Q统计量来度量:

T2=zTz, z=Λ-1/2PTax (3)

Q=rTr, r= (I-PaPTa) x (4)

T2统计量代表了系统状态的变化, 而Q统计量则代表了测量过程的随机变化。分别给定合适的阈值, 二者就可以检测不同类型的故障。上述两统计量的阈值分别为

Τα2=m (n2-1) n (n-m) Fα (m, n-m) (5)

Qα=θ1[h0cα2θ2θ1+1+θ2h0 (h0-1) θ12]1/h0 (6)

故障识别就是把与故障最有关联的观测变量识别出来, 以便把诊断的主要方向集中到最有可能发生异常的子系统上。PCA通过分析各变量对T2和Q统计量的贡献来识别关键变量。某一时刻单个变量xjT2统计量的贡献为:

contj=i=1a|ti2σi2pj, ixj| (7)

Q统计量的贡献为:

Qj= (xj-x^j) 2 (8)

根据变量贡献大小缩小诊断范围后, 就可以启动基于动态模拟的组合诊断系统。由于多数外在故障是由内在的模型参数异常变化引起的, 所以故障诊断可通过动态模型的在线校正完成, 从而得到模型参数的变化过程, 获取当前故障的基础原因。该过程实际为一有约束的最小二乘优化问题

2 实例研究

2.1 实例说明

为了验证上述诊断系统的可行性, 将其应用于某型雷达的故障诊断。该雷达由发射机、接收机和伺服机构构成, L1、L2和L3为三类故障。

为检验组合诊断系统的优越性, 需要针对纯PCA和模型法进行比较。PCA是一种数据分析的数学方法, 虽可以有效地判断数据的变化, 但由于没有考虑研究对象的内在运行机理, 故在确定数据变化原因方面的能力较弱。因此, PCA往往不能单独应用, 需要与其它诊断方法结合使用, 不便直接与组合系统进行比较。神经网络法是一种基于数据驱动的诊断方法, 可以有效地完成故障诊断的全部功能。采用文献[3]中的模型, 通过神经网络得到的实例诊断结果如图2所示, 而采用组合诊断系统得到的结果如图3所示。两图中的F1、F2和F3分别表示雷达三个组成部分的特征状态PIP1、PIP2和PIP3中, 而Afault1、Afault2和Afault3则分别表示各故障的严重程度。由两图可以看出, 两种方法的结果基本相同, 均能较为及时准确地找出故障的原因。但同时也看出, 由于神经网络依赖大量数据来同时完成故障检测和诊断两个任务, 所以在每一采样周期均需运行动态模拟, 计算负荷较大。而图3则表明, 组合诊断系统在任何时刻均首先快速地运行PCA, 只有在认为故障发生后才运行模型, 所以计算负荷相对较小, 有利于满足诊断系统的实时要求。

图3为组合系统运行后的T2和Q图。由于二者对应检测能力不同, 所以T2可在5 h、13 h和21 h及时检测到系统状态的异常变化, 而Q统计量则仅检测到了5 h时刻的异常。图4给出了根据式 (7) 计算得到的3次故障期间, 各状态对T2的贡献量。可以看出, 第1次故障时F1的贡献最大, 说明图2中的PIP1管段最有可能发生了故障。然后通过分析可知, 后两次故障时PIP2和PIP3分别最有可能发生泄漏, 说明PCA可以有效识别出故障区域。这些结果说明, 运用本文给出的组合故障诊断系统, 可以将PCA对数据的快速分析与神经网络的深入故障原因搜索功能很好地结合起来, 实现功能互补。

利用PCA进行实时故障检测时, 如何选取采样数据是关键问题之一。很多文献在介绍PCA应用时, 不对该问题进行说明, 或者假设稳态数据已知。实际上, 对于化工中常见的多变量统计问题, 通常仅需要检测单变量T2统计量就可以判断数据的稳定性。其方法是, 根据T2的变化速度来决定采样滞后量h, T2变化越快, 则说明系统状态的变化幅度越大, 稳态点距离当前时刻也应越远。本文采用采用如下公式计算h:

h=hmaxtanh (tdΤ2 (t) -Τ2 (t-1) dt) (10)

式 (10) 将T2变化速度用系数td校正后, 作为双曲正切函数tanh的输入。选择tanh是因为该函数在自变量趋于无穷大时, 因变量值趋于一定值, 从而可以将该值乘以hmax来设定h的上限。

3 结论

提出了一种基于PCA和神经网络的雷达故障组合诊断方法。该方法利用PCA检测和识别故障的存在, 在缩小故障部位后, 再用神经网络模型去拟合故障发生前后的状态变化, 同时实现模型校正和故障诊断功能。该方法同单纯的模型法相比, 可以在诊断结果基本一致的情况下, 减小模型运行次数。在应用过程中, 以T2变化速度和双曲正切函数手段确定相对稳定的采样数据, 从而保证了主元分析的有效性。

参考文献

[1]Venkateswarlu Ch, Gangiah K, B B Bhagavantha Rao M.Two-level methods for incipient fault diagnosis in nonlinear chemical processes.Computers and Chemical Engineering, 1992;16 (5) :463—476

[2]Young Seok Oh, Jong Han Yoon, Dongsoo Nam, et al.Intelligent fault diagnosis based on weighted symptomtree model and fault propa-gation trends.Computers and Chemical Engineering, 1997;21 (1) :S941—S946

[3]Yvonne Power, Bahri P A.A two-step supervisory fault diagnosis framework.Computers and Chemical Engineering, 2004;28 (11) :2131—2140

组合神经网络 第7篇

目前我国水质数据存在记录时间较短、种类较少等特点。如采用神经网络进行预测则需大量的历史数据,且容易陷入局部最小等缺陷,而灰色预测方法不仅所需历史数据较少,且具有原理简单、运算方便、短期预测精度高、可检验等优点。两者的组合模型既能克服神经网络的局限性,又能在长期预测中获得较为精确的预测值。

1 灰色模型预测

灰色模型是以灰色模块为基础,以微分拟合法而建立的模型。通过应用数学的语言和工具,对部分现实的信息加以归纳,找出因素本身或因素之间的数学关系,从而了解系统的运行状态和发展趋势。

典型的灰色模型为GM(1,1),给定原始时间序列x(t),其原始时间序列记为x(0)(t)={x(0)(1),x(0)(2),,x(0)(Ν)},首先对x(0)(t)作累加生成运算,x(1)(t)=i=1tx(0)(i),t=1,2,…,N,采用差分形式,e(t)为误差,由最小二乘法,让t=2Νe2(t)有最小值,于是得:B^=(qb)=(XΤX)-1XΤY,其中X=[1x(1)(2)1x(1)(3)1x(1)(Ν)]Y=[x(0)(2)x(0)(3)x(0)(Ν)],把a,b代入响应方程x^(1)(t)=(x(0)(1)+ab)eb(t-1)-ab,得到估计x^(1)(t),再通过式x(0)(t)=x(1)(t)-x(1)(t-1),(t=2,3,…,N),还原得到原始序列的估计值,当x^(0)(t)t=Ν,Ν+1,,Ν+q+1可得到q步预测。最后再进行模型精度的检验。

C为方差比,P为小误差概均是精度等级的参数,一级为最高精度等级。如表1。

BP网络是最常用的前向神经网络,它利用误差逆传播算法求解多层网络中隐含层神经元连接权值的学习问题。其学习过程是对网络权值(wij,Tli)的修正与阈值(θ)的修正,使误差函数(E)沿负梯度方向下降,BP网络三层接点表示为,输入接点:xj,隐节点:yj,输出节点:Ql。输入接点与隐层节点间的网络权值为wij,隐节点与输出节点间的网络权值为Tli,当输出节点的期望输出为tl时,BP模型的计算公式如下:

(1)隐节点的输出:

yi=f(jwijxj-θi)=f(neti);

(2)输出节点的计算输出:

Οl=f(iΤliyi-θl)=f(netl);

(3)输出节点的误差公式:

E=12l(tl-Οl)2=12l(tl-f(iΤliyi-θl))2;ΔW=(JΤJ+μΙ)-1JΤe=12l(tl-f(iΤlif(jwijxj-θi)-θl))2

然后再此基础上引入Levenberg-Marquardt算法(以下简称L-M算法)加入 BP 神经网络中以提高其预测速度,根本原理在于将其权值调整率选为:ΔW=(JΤJ+μΙ)-1JΤe,其中J为误差对权值微分的Jacobian矩阵,e为误差向量,μ为标量。

3 组合模型预测

现采用固定权法预测。f1为灰色预测值,f2为神经网络预测值,fc为最优预测值,w1,w2分别为相应的权系数,且w1+w2=1,则fc=w1f1+w2f2。预测误差分别为e1,e2和ec,ec=w1e1+w2e2,var(ec)=w12var(e1)2+w22var(e2)+2w1w2cov(e1,e2),关于w1对var(ec)求极小值,求出w1=var(e2)var(e1)+var(e2)w2=var(e1)var(e1)+var(e2),由此得出fc的值。由统计方差最小理论可知,此方法将优于各单一方法,可得最终的最优组合预测模型。

4 应用实例

珠江流域东江石龙段2004年1月—10月硫酸盐平均浓度的原始矢量数据为:x(0)(t)=(12.7,14.1,14,13.7,14.2,13.5,12.9,14.3,14.5,14.1),单位为mg·L-1。采用灰色模型计算得:方差比C=0.053 4,小误差概率P=1,符合精度等级1。采用三种预测方法后得到的结果如表2。

表中第一列为原始数据,即实测值。其后分别为三种预测方法所得的预测值和误差,以上结果均是采用MATLAB进行仿真获得,此外在对BP神经网络模型预测时,采用的L-M算法极大提高运算速率。通过比较,可以看出通过采用组合模型进行预测所得更加接近实际数据,这种方法兼有两种预测方法的优点,与传统的单一模型相比有更广泛的应用性。实验表明该方法能获得较为精确的预测结果。

参考文献

[1]陈建秋,张新政.基于小波神经网络的水质预测应用研究.2007控制与决策学术年会(中国成都),2007;72—726

[2]鞠琴,郝振纯,刘杰.河流水质预测的灰色神经网络联合模型.河北工程大学学报(自然科学版),2007;24(3):26—28

[3]朱长军,都振纯,周继红,等.组合灰色神经网络法在地下水动态预测中应用.辽宁工程技术大学学报,2005;24(增刊2):260—262

[4]Zhang Xinzheng,Ban Guining.A new data mining approach and its application.The Sixth IEEE International Conference on Control and Automation.IEEE ICCA.Guang Zhou2007:814—819

[5]王艳琼,白秀琴.基于BP神经网络模型的水质评价及预测.武汉工业学院学报.2007;(01);64—67

[6]邱林,黄鑫,李洪良.基于模糊权马尔可夫模型的综合水质预测.人民长江,2007;(01);75—77

组合神经网络 第8篇

科学地预测是进行决策的依据和保证。由于民用汽车运力的发展牵涉的因素众多,对其进行预测也是一项复杂的工作。单一的预测方式难以对这个系统取得令人满意的结果。组合预测被提出来之后,其较高的预测精度不断为人们所接受。它能够更有效地利用各种有用信息,更为全面地反映系统规律。本文将灰色预测模型、回归预测模型、BP神经网络模型有机组合,建立一种新的民用汽车运力预测模型,并将组合预测结果与单一预测结果进行比较,得出结论。

1 组合预测模型的建立

1.1 GM 1,X1X幂模型

灰色预测方法是根据过去及现在已知或非确知的信息建立一个从过去引申到将来的灰色模型,从而确立系统在未来的动态行为和发展变化的趋势。灰色模型具有所需信息较少、不必知道原始数据分布的先验特征的优势。

1.2 民用汽车运力的回归预测模型

由于民用汽车运力成逐年上升的趋势,可以考虑用多项回归模型预测。一元多项式回归模型的一般形式为Y=β0+β1X+β2X2+…+βmXm+ε,利用Matlab进行回归拟合,得出较优的模型用于预测,在本文采用三项多项式。

1.3 BP神经网络模型

1.4 BP神经网络组合预测模型

根据样本值首先建立GM 1,赞1赞幂模型和回归模型,以这两种模型的模拟值作为BP神经网络的输入,以样本值为理想输出对网络进行训练,计算网络的训练误差,当误差达到设定的精度则停止训练,这是即可用该网络进行预测。

2 民用汽车运力预测对比分析

表1是某地区1997~2006年间的载货汽车保有量统计,根据这些数据对2007年的载货汽车保有量进行预测。下面分别建立GM 1,赞1赞幂模型、回归模型和BP神经网络组合预测模型。

(2)由表1数据建立三次回归多项式模型:Y=2 176t3-2 528.4t2+17 973t+19 647,令t=1,2,…,10,得出的回归模拟值,见表2。

(3)以GM 1,赞1赞幂模型和多项式回归模型的模拟值作为BP神经网络的输入向量,实际保有量作为理想输出,采用有6个隐层,学习效率为0.2的网络,经过1 003 352次训练,达到1×10-5的既定误差,求得的模拟值,见表2。

(4)预测效果。由表2的对比看出,GM 1,赞1赞幂模型的平均相对误差为0.059118,回归模型的平均相对误差为0.035249,BP神经网络组合预测模型的平均相对误差为0.005343,可以看出组合预测的效果明显优于前两种预测方法。(下转第67页)(上接第52页)

为了预测2007年该地区载货汽车保有量,先利用GM (1,1)幂模型求出模拟值1 778 398,再利用已求出的三次回归多项式,令t=11,获得2007年的模拟值2 016 200,将这两个值作为输入,代入已经训练好的BP组合模型,求得2007年载货汽车保有量的预测值为1 922 750。

3 结论

预测结果表明,基于BP神经网络的灰色回归组合模型在对民用运力的预测上有着单一模型所不具备的优势,主要体现在:(1)通过对一定数量的样本的学习和训练,找出输入与输出之间的内在联系,从而获取问题的解,因此具有自适应功能。(2)灰色幂模型建模所需信息少且短期预测精度较高,多项式回归模型可以通过增加高次项来达到较高的拟合精度,这两种方法为神经网络提供了较为可靠的预测信息,神经网络综合了两种单一模型各自具备的优势,进而利用其自身良好的非线性逼近性,大大提高了预测精度。

参考文献

[1]刘思峰,郭天榜,等.灰色系统理论及其应用[M].2版.北京:科学出版社,2000.

[2]哈根(美),等.神经网络设计[M].北京:机械工业出版社,2002.

[3]吴今培,孙德山.现代数据分析[M].北京:机械工业出版社,2005.

组合神经网络 第9篇

传统上用于水果预测方面的模型有单一灰色模型、人工神经网络模型以及马尔科夫链模型等。在产量预测方面用得较多的是灰色模型。但灰色模型对随机性波动性较大的数据序列预测效果往往不好, 而BP神经网络有着较强自学习、自适应及容错性, 在实际预测中能够将数据进行训练, 使得找到更为接近实际的函数, 得出的预测结果更接近实际值。因此, 提出的灰色-BP神经网络组合模型为今后赣州市赣南脐橙产量的预测提供一种新方法。

1 灰色-BP网络预测模型

1.1 灰色预测模型

基于GM (1, 1) 模型均值形式, 分别按差分方程和微分方程两种不同路径求解。建立具体步骤如下:

(1) 以n年赣南脐橙产量作为GM (1, 1) 模型时间序列

(2) 考虑GM (1, 1) 模型波动性, 对原始序列进行k步累加处理, 记为:

其中a、b是需要通过建模来求得的参数;

(4) 设参数向量, 可以运用最小二乘法估计确定:

其中Yk、A分别为

(5) 建立均值GM (1, 1) 模型时间响应式为

(6) 可以将 (6) 式累减还原, 利用还原式求出赣南脐橙产量这n年的拟合值为

1.2 灰色-BP网络预测模型

则为灰色-BP神经网络组合模型的预测值。可以用组合后的模型来预测新的赣南脐橙产量这n年的拟合值。

2 赣南脐橙产量预测分析

采集2002年至2013年赣州市赣南脐橙产量 (万t) 数据, 运用MATLAB软件建模并计算出2008年至2012年赣南脐橙产量的拟合值见表1、图1。

经计算残差检验值为0.1556, 可以发现预测精度为三级, 预测精度一般。故运用人工神经网络对上式表中的残差进行修正。将训练出的修正值与GM (1, 1) 的拟合值相加, 即构造出了新的预测值。得出各变量的GM (1, 1) -BP拟合值及相对误差, 见表2、图2。两种预测模型对比, 见图3。

运用灰色-BP神经网络组合模型的平均相对误差0.0481, 而灰色预测模型的误差为0.1387。相比, 灰色-BP网络组合模型预测带来的误差较小。因而灰色-BP网络组合模型, 更能够深化对模型演化规律的认识。因此用该组合模型对未来2014至2016年这三年里的章贡区建成区面积进行预测, 2014年至2016年赣州市赣南脐橙产量预达到171.34万t, 190.81万t, 212.49万t。

3 结束语

研究结果表明灰色-BP神经网络组合模型的预测精度高于传统上单一的灰色预测模型。说明灰色-BP神经网络组合模型适用于赣南脐橙产量的预测, 具有着一定的准确性及可行性。并从2014年至2016年的赣州市赣南脐橙预测产量可以看出产出数量是呈持续增长态势。赣南脐橙产量的增长能够维系脐橙产业链, 并使得产业链不断地壮大。

摘要:赣南脐橙产量变动的随机性、波动性和复杂性, 给脐橙产量的预测带来了很大的困扰。将灰色-BP神经网络加以组合, 采用2004年至2013年赣州市赣南脐橙产量数据, 对赣南脐橙未来产量进行预测。通过MATLAB计算, 结果表明:灰色-BP网络组合预测模型精度高于传统灰色预测模型, 且2014年至2016年赣州市赣南脐橙产量预达到171.34万t, 190.81万t, 212.49万t。

关键词:灰色-BP神经网络组合模型,赣南脐橙产量预测,MATLAB

参考文献

[1]匡兵, 杨晓伶, 陈根生.赣南脐橙产业现状与发展趋势分析[J].农业工程技术农产品加工业, 2010 (03) :34-37.

[2]李智鹏, 李江宏.基于灰色系统理论的新疆水果产量预测[J].中国科技投资, 2013 (09) :92.

[3]侯丽薇, 孙立城, 穆维松.苹果产量的神经网络预测模型[J].中国农业大学学报 (社会科学版) , 2001 (01) :51-53.

[4]姚飞, 王波, 吴天魁.基于马尔科夫模型的我国水果产量预测分析[J].农村经济与科技, 2014, (11) :113-115.

[5]李凯.灰色预测模型及其应用[D].荆州:长江大学, 2012.

网络流量预测的组合方法研究 第10篇

随着网络规模和业务种类的不断增长,网络流量成为一个非线性、时变的动力系统。为了满足日益膨胀的网络通信量需求,需对高速网络进行有效管理,而网络流量预测是网络管理的基础,高精度预测模型不但可以对将来的流量数据进行预测,而且还可以应用于接入控制、网络带宽分配和网络拥塞控制等许多方面[1]。

针对网络流量预测问题,学者们进行了大量深入研究,提出了许多网络流量预测模型。传统网络流量预测模型有:线性回归分析、灰色模型和时间序列等[2,3],这些方法基于线性建模,而网络流量是一个复杂的非线性系统,因此,传统线性模型无法准描述现代网络流量变化特点,预测结果不可靠[4]。近年来,随着非线性理论发展,出现了基于神经网络、支持向量机等非线性网络流量预测模型[5]。由于网络流量是一种典型时间序列数据,具有滞后、后效性特征,因此,在网络流量预测中,需要确定网络流量的最优滞后阶数和模型参数。传统滞后阶数采用线性回归方法确定,难以找到最优滞后阶数[6]。此后有学者提出了一些非线性定阶方法,提高了模型的预测性能,但这些方法非常耗时,影响网络流量预测效率[7]。基于统计理论的支持向量机算法LSSVM较好地解决了非线性等问题,克服了传统机器学习算法的局部最优、运行效率低等缺陷,成为网络流量的主要预测方法。LSSVM预测的性能对于参数的选择比较敏感,然而到目前为止,还缺乏指导LSSVM参数选择的好方法,在实际应用中大多凭经验确定其参数,从而因参数选择不当导致网络流量预测精度低[8]。

针对当前网络流量预测存在的一些问题,提出一种网络流量组合预测算法(GS-GA-LSSVM)。首先利用地统计学GS(geostatistics)对网络流量数据之间相关程度进行分析,快速确定网络流量时间序列的最优滞后阶数;然后根据最优滞后阶数对网络流量数据进行重构,输入到LSSVM学习,采用遗传算法GA对LSSVM的参数进行优化,建立网络流量的最优预测模型;最后通过具体实例对模型性能进行验证。

1 地统学和最小二乘支持向量机概述

1.1 地统计学

GS是一种基于区域化变量理论的统计学方法,采用变异函数描述变量结构性与随机性双重特征[9]。对于观察时间序列数据Z(xi),i=1,2,…,n,变异函数值γ(h)的计算公式为:

γ(h)=12Ν(h)i=1Ν(h)[Ζ(xi)-Ζ(xi+h)]2 (1)

式中,Z(xi)和Z(xi+h)分别为Z(x)在xixi+h上的观察值。

在二阶平稳假设条件下,协方差函数可表示为:

C(h)=E[Z(x)Z(x+h)]-m2 (2)

对不同的时间间隔距离h,根据式(2)可以计算出相应的变异函数值γ(h),以h为横坐标,γ(h)为纵坐标可得变异函数曲线图(如图1所示)。

从图1可知,随着h的增大而γ(h)增大,当h超过一定距离后,γ(h)稳定在一个极限值附近,此处的变异函数值称之为基台值,用C0+C表示,此时的间隔距离称为变程,用α表示。变异函数曲线在y轴上的截距称为区域不连续性值,用C0表示。

1.2 最小二乘支持向量机

支持向量机的复杂度与输入空间的维数无关,而依赖于样本数据的个数,因此样本数目越大,求解相应的二次规划问题越复杂,计算速度越慢,限制支持向量机的应用范围[10]。Suykens等在标准支持向量机的基础上提出了最小二乘支持向量机(LSSVM),将标准支持向量机型中的损失函数设定成误差平方和,把不等式约束改成等式约束,减少待定参数,又将求解二次规划的问题转化成线性KKT(karush kuhn kucker)方程组的求解,降低了求解的复杂性,拓宽了支持向量机的应用空间。

对于训练样本集{(xi,yi)},i=1,2,…,nxiyi分别表示样本输入和输出,xiRn,yiR,通过非线性映射函数φ(·)将样本映射到高维特征空间,从而获得最优线性回归函数:

f(x)=wTφ(x)+b (3)

式中,ω为特征空间的权值向量,b为偏置量。

根据结构风险最小化原则,式(3)问题求解的LSSVM回归模型为:

minw2+12γi=1nζi2 (4)

s.t. yi-wTφ(x)+b=ei (i=1,2,…,n)

式中,γ为惩罚参数,用于平衡训练误差和模型复杂度;ei为实际值与回归函数间的误差。

通过引入拉格朗日乘子将上述约束优化问题转变为无约束对偶空间优化问题,即:

L(w,b,ζ,α)=minw2+12γi=1nζi2+i=1nαi(wΤφ(x)-b+ei-yi)(5)

式中,αi为拉格朗日乘子。

根据Mercer条件,核函数定义如下:

K(xi,xj)=φ(xi)Tφ(xj) (6)

本研究选择径向基函数作为LSSVM核函数,径向基函数为:

k(xi,xj)=exp(-xi-xj22σ2) (7)

最后LSSVM回归模型为:

f(x)=i=1Ναiexp(-xi-xj22σ2)+b (8)

其中,σ表示径向基核数宽度。

1.3 最小二乘支持向量机的参数优化

LSSVM在实际应用中的泛化推广性能,相当程度上取决于参数(γσ)的选择。误差惩罚参数γ的作用是在确定的数据子空间中调节学习机器置信范围和经验风险的比例,以使学习机器的推广能力最好,不同数据子空间中最优的γ不同。在确定的数据子空间中,γ的取值小表示对经验误差的惩罚小,学习机器的复杂度小而经验风险值较大;反之亦然。前者称为“欠学习”现象,而后者则为“过学习”。σ不敏感损失函数的大小决定了支持向量的个数。σ越大,支持向量的个数越少,函数估计的精度越低;σ越小,则支持向量的个数越多,函数估计的精度越高。但是σ也不是越小越好,因为虽然精度提高了,但是算法所需要的时间也变长了。所以,必须选择最合理σ,以保证LSSVM的速度和精度,只有正确选择参数,才可以使LSSVM回归估计得到很好的拟合效果。

如何合理选择LSSVM的参数,目前尚未有有效的方法。一般通过交叉验证试算或梯度下降法求解,这些方法或者人为因素太多,或者要求函数连续可导,易陷入局部极小。遗传算法(GA)是一种启发式搜索算法,具有很强的全局搜索能力,通过遗传算子模拟自然界生物遗传过程中的复制、交叉和变异等现象,对种群个体逐代择优,从而最终获得最优个体,因此本研究采用GA对LSSVM参数进行优化。

GA对LSSVM参数优化的基本步骤如下:

(1) 设种群规模为P。随机生成含P个个体的初始种群W=(W1,W2,…,Wp)T,给定一个选定的数据范围,采用线性插值函数生成种群中个体Wi的一个实数向量w1,w2,…,ws作为GA的一个染色体,为了得到高精度的γσ值,采用实数编码方法。

(2) 确定个体的适度度函数。给定一个LSSVM参数,将步骤(1)中得到的染色体进行解码,得到LSSVM的γσ值,将训练样本输入到LSSVM进行训练,达到设定的精度得到模型的训练输出值,以训练误差平方和作为种群W中个体Wi的适应度。

(3) 采用轮盘赌法选择算子,即基于适应度比例的选择策略对每一代种群中的染色体进行选择,选择概率为:

pi=fi/i=1Ρfii=1,2,,Ρ (9)

式中,f为适应度值的倒数,P为种群规模。

(4) 由于个体采用实数编码,交叉操作方法同样采用实数交叉法,第k个基因wk和第l个基因wlj位的交叉操作分别为:

式中,b为[0,1]间的随机数。

(5) 变异操作,选取第i个个体的第j个基因位进行变异操作,即:

式中,wmax和wmin分别为基因wij取值的上下界,r为[0,1]间的随机数,r2为一个随机数,g为当前迭代次数,Gmax为最大进化代数。

(6) 将GA得到的最优个体分解为LSSVM的γσ,以此作为LSSVM预测模型的γσ值,LSSVM预测模型经训练后,输出网络流量时间序列的最优预测值。

2 GS-LSSVM的网络流预测模型

2.1 GS和LSSVM相结合的思路

在基于LSSVM的网络流量预测模型滞后阶数确定过程中,通过GS描述网络流量数据之间的时间相关性,凡落在变程α范围内的数据都具有时间相关性,且随着数据点之间的时间间隔增大相关程度降低,从而可以根据α值快速确定网络流量预测模型最优滞后阶数,然后根据最优滞后阶数对网络流量样本进行重构,最后将重构样本输入到LSSVM的进行学习,从而建立了网络流量预测模型。具体过程如图2所示。

2.2 数据归一化

受到多种因素影响,网络流量变化范围比较大,对LSSVM学习速度产生不利影响,为消除该不利影响,提高学习效率,对网络流量值进行归一化处理,归一化公式为:

xi=xi-xminxmax-xmin (12)

式中,xi为网络流量的原始值,xi为归一化后的网络流量值,xmax和xmin分别为网络流的最大值和最小值。

2.3 基于GS的LSSVM模型阶数确定

网络流量具有明显的时间结构特点。当前的网络流量与前多个时间点的网络流量相关联,时间较近的数据相关性强,而时间较远的数据相关性往往相关弱,因此网络流量具有滞后、后效性特征。滞后阶数n对网络流量预测结果具有很大的影响:阶数太小,虽然能够体现数据之间的相关性,但易造成数据信息缺失;若阶数太大,能够选择更多的相邻数据,但可能包含过多的冗余信息,因此滞后阶数不能选择太小,也不能选择过大。基于GS的网络流量预测模型滞后阶数确定过程如下:

设有nZ(xi),i=1,2,…,n。设(p<n)为待测点,那么取前p-1个样本作为分析数据,取小时作为时间间隔,即Δh=1;各样本间距离hi,j=j-i,为保证每组距离对数N(h)充分大,可依GS分析要求规定:h12max(hi,j)

根据样本距离h及其半变异函数值γ(h)构建半变异函数曲线图,观察尺度范围内最大γ(h)值对应的h,即为变程α。根据GS原理可知,距待测点α时间内的样本与待测点具有相关性,即α时间内的样本数据对待测样本值存在较大的影响,模型滞后阶数即为α

2.4 LSSVM对重构后网络流进行预建模

采用GS确定网络流量时间序列的最优滞后阶数,并根据最优阶数对网络流量数据进行重构;然后将重构后数据分成为训练集和测试集两部分,将训练集输入到LSSVM进行学习,采用GA对LSSVM参数进行优化建立最优网络流量模型,最后采用建立的模型对测试集进行预测,得到网络流量预测结果,并对预测结果进行分析。

3 GS-LSSVM在网络流量预测中的应用实例

3.1数据来源

实验数据来源于网络流量文库:http://newsfeed.ntcu.net/~news/20011/,收集了主节点路由器Incoming articles从2011年1月1日起,共208天的网络每小时访问流量,共采集到4992个数据,具体如图3所示。从图3可知,网络流量具有较强的非线性、时变性。将数据分成两部分,其中最后1000个数作为测试集,其余数据作为训练集。

3.2评价指标和对比模型

为了评价GS-GA-LSSVM模型性能的优劣,选择GS-LSSVM(LSSVM参数采用网格搜索)、GA-LSSVM(滞后阶数采用文献[11]方法)和传统LSSVM(不定阶,LSSVM参数采用网格搜索)算法作为对比模型。模型性能评价指标体系为:采用均方误差MSE(Mean squared error)和平均绝对误差百分率MAPE(Mean absolute percentage error)。MSE和MAPE分别定义如下:

式中,yi为实际值,为模型预测值,n为测试样本数。

3.3模型实现

首先采用GS对网络流量数据进行分析,前100个数据变程的分析结果如图4所示,从图4可知,网络流量数据的最优滞后阶数为3,这表明,预测点的网络流量受到前3个时间点网络流量影响,这就意味着将前3个点的网络流量作为LSSVM的输入来预测当前时刻的网络流量,用该方式对网络流量进行重构,组成一个多维的网络流量时间序列。

在Matlab 7.0平台下,自编程调用LSSVM和GA工具箱来实现LSSVM算法,核函数为高斯函数,将训练集输入到LSSVM进行训练,并采用遗传算法对LSSVM参数进行优化,得到的最优参数γ=29.15和σ=0.75;然后采用最优参数对训练集重新进行学习,建立最优网络流量预测模型;最后采用建立的预测模型对测试样本集进行预测,得到的预测结果如图5所示。

3.4与对比模型的性能比较

LSSVM、GS-LSSVM、GA-LSSVM和GS-GA-LSSVM对测试样本集的预测结果MSE和MAPE如表1所示。

对表1对比结果进行分析,可以得到如下结论:

(1)无论是MSE还是MAPE,GA-LSSVM的预测性能均要优于LSSVM,这表明GA对LSSVM的参数进行优化,能够找到最优LSSVM参数,提高了网络流量预测精度。

(2)同时,GS-LSSVM的预测精度高于LSSVM,这表明采用GS快速确定网络流量的滞后阶数,能够很好地反映了数据的时间相关性,充分挖掘了隐藏于网络流量数据之间的信息。

(3)在所有的预测模型中,GS-GA-LSSVM的预测精度最高,表示对于非线性、时变的网络流量时间序列进行预测时,不仅要考虑数据间之间相关性,同时要考虑非线性预测模型的参数优化问题。

综合上述可知,GS-GA-LSSVM融合了时间序列分析和回归分析的优点,能够很好地反映了数据的时间相关性,具有结构风险最小,非线性,避免过拟合、维数灾和局极小,泛化推广能力优异等许多优点,使模型预测性能更高、稳定性更好。

4 结 语

将用于分析数据相关性的GS和全局搜索能力强的GA引入到网络流量测中,分别通过变程来确定模型的滞后阶数和最优参数,并充分考虑网络流量的非线性变化特点,引入非线性预测能力强的LSSVM模型,以提高网络流量预测精度。实例验证表明,相对传统网络流量预测方法,GS-GA-LSSVM提高了网络流量的预测精度,该模型可以推广到非线性预测领域。

本研究仅对网络流量的一维时间序列进行预测,而实际上,网络流量与多种因素密切相关,是一种典型多维时间序列,因此随着预测时间的延长,GS-GA-LSSVM模型的预测精度必会受到影响,因此,需要考虑多因素影响且及时补充新的数据来修正预测模型,从而提高网络流量的预测精度,这是需要进一步研究的内容。

摘要:网络流量是一种典型的时间序列数据,具有很强的滞后性和后效性。针对当前滞后阶数确定方法存在局部最优,耗时长等缺陷,提出一种网络流量组合预测方法(GS-GA-LSSVM)。首先采用地统计学(GS)快速确定网络流量的最优滞后阶数,然后根据滞后阶数对网络流量进行重构,最后采用遗传算法(GA)优化最小二乘支持向量机LSSVM(least square support vector machine)对网络流量进行建模预测。仿真结果表明,GS-GA-LSSVM对网络流量的预测精度优于参比模型,更能反映网络流量复杂的动态变化规律。

关键词:网络流量,地统计学,最小二乘支持向量机,遗传算法

参考文献

[1]Nguyen T T,Armitage G.A survey of techniques for internet trafficclassification using machine learning[J].IEEE Communications Sur-veys and Tutorials,2008,10(4):56-76.

[2]高波,张钦宇,梁永生,等.基于EMD及ARMA的自相似网络流量预测[J].通信学报,2011,32(4):47-56.

[3]雷霆,余镇危.一种网络流量预测的小波神经网络模型[J].计算机应用,2006,26(3):526-528.

[4]Jin Yi,Zhou Gan.Theoretical mean-variance relationship of IP networktraffic based on ON/OFF model[J].China Ser F-Inf Sci,2009,52(4):645-655.

[5]王升辉,裘正定.结合多重分形的网络流量非线性预测[J].通信学报,2007,28(2):45-50.

[6]叶苗,王勇.基于支持向量回归学习机的网络流量预测[J].桂林工学院学报,2007,27(2):282-284.

[7]向昌盛.基于支持向量机的时间序列组合预测模型[D].长沙:湖南农业大学,2012.

[8]Este A,Gringoli F,Salgarelli L.Support vector machines for TCP trafficclassification[J].Computer Networks,2009,53(14):2476-2490.

[9]Qi H L,Zhao H,Liu W W,et al.Parameters optimization and nonlin-earity analysis of grating eddy current displacement sensor using neuralnetwork and genetic algorithm[J].Journal of Zhejiang University Sci-ence A,2009,10(8):1205-1212.

[10]王俊松,高志伟.基于RBF神经网络的网络流量建模及预测[J].计算机工程与应用,2008,44(13):6-11.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【组合神经网络】相关文章:

神经网络组合预测模型06-13

图形组合05-10

交易组合05-14

组合规律05-27

支架组合05-31

课堂组合06-02

组合效应06-09

产品组合06-12

元素组合06-14

组合设备06-14

上一篇:厂房结构论文下一篇:利普刀宫颈锥切术论文