调整预测范文

2024-08-31

调整预测范文(精选5篇)

调整预测 第1篇

带宽按需分配(BoD)是自动交换光网络(ASON)提供的一种特色业务,是在不影响现有业务的同时,根据需要自动增加或者减少带宽,实现带宽“按需分配”[1]。BoD业务自动带宽触发调整的实现方式分为两种:一种是定时调整带宽,适合流量具有明显规律,不同的时间段有着不同的带宽需求的业务。另一种就是根据流量的自适应带宽调整,自动检测、收集和统计BOD业务的流量变化,分析业务流量变化规律,得到业务流量变化的趋势,从而制订相应的策略触发带宽调整。实现基于流量变化的动态BoD理论上能够最大限度地利用网络带宽资源,是智能光网络新业务的发展趋势。因此对业务流量进行精确的预测对于实现动态BoD业务具有重要研究意义。

数据业务流量是一组非线性时间序列,其固有的自相似、高突发和重尾特性等复杂特性给预测带来了很大困难。而且各种业务模型复杂多变,甚至无法预知。因现有的预测方法,如自回归模型(AR)、自回归滑动平均混合模型(ARMA)和自回归求和滑动平均模型(ARIMA)等线性预测算法会产生较大误差,反而降低了带宽利用率,增加了时延。神经网络是由大量处理单元(神经元)互联而成,通过对样本的学习,拟合出复杂的非线性关系。根据Kolmogorov定理,任何一个时间序列都是由一个非线性机制确定的输入输出系统的近似,该理论保证了神经网络用于时间序列预测的可行性。微粒群优化(PSO)-BP神经网络具有预测速度快、预测精度高等特点,并能根据预测误差实时调整权值适应变化了的业务模型,对于数据业务流量实时预测具有优越性。文献[2]提出了用神经网络预测视频业务数据流量。

本文架构了PSO的3层BP神经网络在线3步预测智能光网络BoD业务流量模型,描述了PSO算法改进思路和过程,分析对比了传统PSO算法和改进后的PSO算法性能,提出了在线预测的步骤和带宽调整机制。通过实验仿真,分析了预测精度和业务阻塞情况。

1 PSO算法的改进

1.1 标准PSO算法

1995年Kennedy和Eberhart提出了一种新的进化计算方法[3],即PSO算法。该算法是一种利用群体协作来达到目的的群智能算法,具有全局寻优能力。设一个包含M个粒子的微粒群在D维空间飞行,微粒群可用如下参数来表示:Xi=(xi1,xi2,…,xiD)为微粒i的位置, Vi(t)=(vi1,vi2,…,viD)为微粒i的速度,Pi=(pi1,pi2,…,piD)为微粒i的局部最优位置,Pg=(pi1,pi2,…,piD)为微粒群全局最优位置。微粒i在第d维子空间中的飞行速度和位置按下式进化:

vid(t+1)=w×vid(t)+c1×r1×[pid(t)-xid(t)]+c2×r2×[pgd(t)-xid(t)],(1)xid(t+1)=xid(t)+vid(t+1),(2)

式中,i=1,2,…,M;d=1,2,…,D;w为惯性权重;c1和c2为加速常数;r1和r2为[0,1]之间的随机数;t为迭代次数。

1.2 PSO算法的改进

PSO算法存在收敛速度慢和早熟收敛的缺点,对此已有很多改进算法。文献[4]提出保证种群多样性的改进思路,文献[5]提出双群交叉进化优化算法,但这些算法运算复杂,不能适应BoD实时在线预测。

从微粒群的行为分析可以看出,质量较差的微粒搜索到最优点的概率较小,对整个微粒群的贡献很小,因此改善较差微粒的质量有助于提高微粒群搜索效率,避免陷入局部最优点。本文汲取了遗传算法(GA)的变异选择和模拟退火算法(SA)随机概率的思路,对适应值最差的部分微粒施加随机扰动,促使其向更好的位置移动。为了保证收敛效率,参与扰动的微粒数目和扰动的幅度需要随迭代次数递减。由于扰动是随机的,微粒可能出现进化或者退化,这就需要对扰动进行评估。如果微粒进化则接受扰动,如果微粒退化则进行多次扰动直至进化,经过最大扰动次数Kmax次扰动后没有进化的微粒以一定概率接受退化的扰动。为了避免微粒过度退化,退化幅度越大时接受退化的概率应该越小。随机概率退化机制在微粒“集中”的同时有一定 “扩散”,保证了种群多样性。通过对较差微粒进行优化,改善了微粒群收敛特性。

N为参与随机扰动的最差微粒数,M为微粒总数,Kmax为最大扰动次数,t为迭代次数,T为最大迭代次数,rand(0,1)为[0,1]之间的随机函数,Δft+1为扰动后微粒适应值变化量,Δf0为扰动前适应值与微粒局部最优适应值之差。扰动过程分为3个阶段:(1) 当tT/3时,N=M/2;(2) 当T/3<t≤2T/3时,N=M/4;(3) 当2T/3<tT时,N=M/8。随机扰动公式为

vid(t+1)=vid(t)+vmax(1-t/Τ)×rand(0.1),(3)

接受退化的条件为

Δft+1/Δf0rand(0,1)(4)

改进后的微粒群进化过程如下:

步骤1:初始化微粒群,设置最大扰动次数Kmax。

步骤2:按照进化方程(1)和(2)进化,计算适应值,并记录下N个最差的微粒。如果满足终止条件,则输出结果,终止迭代;否则转到步骤3。

步骤3:对N个最差的微粒按方程(3)施加随机扰动,评估扰动的结果。如果微粒适应值进化了,则接受干扰,更新微粒的位置;如果微粒适应值退化了,则转到步骤4。

步骤4:如果扰动次数达到最大扰动次数Kmax,按退化条件公式(4)接受干扰,更新微粒位置,否则转到步骤3。

步骤5:如果满足终止条件,则输出结果,否则转到步骤2重新进化。

2 BoD业务在线预测与带宽调整

BoD业务带宽是通过SDH虚容器(VC)虚级联实现的(例如n个VC级联VC-n),多个虚级联组成一个虚级联组(VCG)。BoD业务的带宽容量就相当于一个VCG,而BoD业务带宽调整粒度是一个虚级联(例如VC-4),通过增加或者减少VCG中虚级联的数量来调整BoD业务的带宽。BoD业务流量通过用户网络接口(UNI)来监测,如果业务流量变化超过一个虚级联则触发带宽调整,通过UNI-C接口发出带宽修改请求,结合网络侧设备的链路容量调整机制(LCAS)共同完成网络业务带宽的调整。为了避免突发业务阻塞和频繁的调整带宽,需要分段预测和分段调整带宽。预测一段时间内的业务流量,并根据最大预测值为这段时间内的业务分配带宽。文章把3个监测间隔分为一段,同时预测未来3步业务流量。

数据业务固有的非线性特征会给线性预测带来较大的误差,神经网络具有非线性拟合能力,通过大量的样本训练,可以预测复杂的数据业务,并通过在线学习修正参数,适应突发、多变的BoD业务预测。本文架构了3层神经网络的3步预测模型。由于BP训练算法复杂,且容易陷入局部最优点,文章使用改进后的PSO算法来训练神经网络,提高了预测速度和精度。针对数据业务高突发的特点,取3步中最大值作为未来带宽的需求。m阶非线性预测模型如图1所示,其中xt、…、xt-m-1为刚过去的m个时间段的业务流量,xt+1、xt+2、xt+3是未来3个时间段的业务流量,x^t+1、x^t+2、x^t+3是xt+1、xt+2、xt+3的预测值,预测误差为e=[(xt+1-x^t+1)2+(xt+2-x^t+2)2+(xt+3-x^t+3)2]/2。基于预测的BoD带宽调整算法流程图如图2所示。

3 实验结果与分析

为了验证PSO算法的改进性能,本文分别使用改进后的算法和标准PSO算法训练BP神经网络对传统泊松业务模型进行预测,Ρ(λ)=λxx!e-λ,取λ为20。通过实验确定输入层为3个神经元,隐藏层5个神经元,输出层为1个神经元,预测阶数m为7。仿真实验通过Matlab 7.0编程实现,实验结果如图3所示。

虽然开始阶段改进的PSO算法较标准PSO算法下降慢,但在630代的时候标准PSO算法接近收敛,连续30代没有出现下降;而这时改进的算法仍在波动地下降。最终标准PSO收敛于局部最优,改进后的PSO算法虽然增加了收敛代数,但收敛于接近全局最优。

本实验从校园网中每隔5 min采集一次网络流量数据,输入神经网络训练。通过实验确定了神经网络输入层为10个神经元,隐藏层为30个神经元,输出层为3个神经元,预测阶数m为10。其中一段预测结果如图4所示,预测结果虽然有延后误差,但基本上跟踪了业务流量的模型。BoD业务带宽需求预测值即为3步预测中最大值,如图5所示。取最大值后,带宽需求预测值基本上都处在业务流量曲线上方,并接近业务流量曲线,带宽预测值满足了业务的需求,充分利用了带宽资源,具有较小的业务阻塞率。

4 结束语

文章创新之处是通过对较差微粒施加随机扰动

改善了微粒群的质量,从而改进了PSO算法,在收敛后期有明显的优势。建立了PSO的BoD业务预测模型,提出了3步预测取最大值作为未来带宽需求的方法,解决了突发业务阻塞和频繁调整带宽问题。通过神经网络在线学习修正权值,适应了突发性、多样性的BoD业务流量预测,实现了在线预测功能,这对于提供基于流量的动态BoD业务有重要的意义。

参考文献

[1]李健,张杰,顾婉怡.ASON中BoD业务的实现[J].电信技术,2005,(10):48-53.

[2]Doulamis A D,Doulamis N D,Kollias S D.An A-daptable Neural-Network Model for Recursive Nonlin-ear Traffic Prediction and Modeling of MPEG VideoSources[J].IEEE Transaction on Neural Networks,2003,14(1):150-166.

[3]Kennedy J,Eberhart R.Particle Swarm Optimization[A].Proceedings of IEEE International Conference onNeural Networks[C].Perth,Austria:IEEE,1995.

[4]Pant M,Radha T,Singh V P.A Simple DiversityGuided Particle Swarm Optimization[A].IEEE Inter-national Conference on Evolution Computation[C].Singapore:IEEE,2007.3 294-3 299.

调整预测 第2篇

学习率有限监督调整BP网络在黄河下游水质预测中的应用

本文采用学习率有限监督调整BP网络,对黄河干流小浪底至高村河道间主要水质污染物指标NH3-N和COD的传播输移规律进行了模拟和预测,历史数据模拟和预测检验结果的精度评价表明,该方法模拟与预测精度可靠,能够为生产实践中的`预测预报提供依据.

作 者:李成林 李鸿雁 鲍新华 苗立峰  作者单位:李成林,苗立峰(水利部松辽水利委员会,吉林,长春,130021)

李鸿雁,鲍新华(吉林大学环境与资源学院,吉林,长春,130026)

刊 名:东北水利水电 英文刊名:WATER RESOURCES & HYDROPOWER OF NORTHEAST CHINA 年,卷(期): 26(12) 分类号:X824 关键词:学习率   有限监督调整   BP网络   水质预测  

调整预测 第3篇

预测模型层出不穷, 归结起来可以分为两类:一是纵向依据房价的历史数据预测;二是横向依据影响房价的因素, 如地价、收入、居住指数、人口、利率等, 对房价进行预测。其实, 笔者认为房价应该是由这两方面共同作用的结果。本文从这两个角度出发, 首先利用GM (1, 1) 对房价进行基本预测, 然后在GM预测的基础上, 将实际房价与预测房价的误差看做是房价其他因素的影响结果, 建立多元模型。其实这相当于将对房价的预测进行了两次调整, 在普通灰色模型的基础上再进行一次误差调整, 如此使精确度更高, 更准确地预测房价。

2 预测模型的建立

2.1 GM (1, 1) 的建立

GM (1, 1) 建模是灰色系统理论中一种动态序列处理方法, 设

x (0) 为非负序列:x (0) ={x (0) (1) , x (0) (2) , …, x (0) (n) }, 其中x (0) (k) >0, k=1, 2, …, n

x (1) 为x (0) 的一阶累加 (1-AGO) 序列:x (1) ={x (1) (1) , x (1) (2) , …, x (1) (n) }, 其中undefined

z (1) 为x (1) 的背景值生成序列, z (1) ={z (1) (2) , z (1) (3) , …, z (1) (n) }, 其中z (1) (k) =0.5x (1) (k) +0.5x (1) (k-1) , k=2, 3, …, n

GM (1, 1) 的一级白化微分方程为undefined, 式中参数undefined用最小二乘法求解:undefined, 其中:

undefined

,

undefined

将a, b代回原微分方程, 可得:undefined

求x (1) 的模拟值, (1) ={ (1) (1) , (1) (2) , …, (1) (n) }, 还原可求出x (0) 的预测值为:

undefined

设误差为ε, 且ε (k) = (0) (k) -x (0) (k) , 则

undefined

2.2 多元线性回归模型的建立

建立undefined的指数模型, x1, x2, …, xn分别代表影响房价的地价、人口、人均收入、居住指数、利率等。

undefined

2.3 综合2.1、2.2即为从纵横两方面综合考虑影响房价的因素所建立的模型undefined

3 实证分析——以保定市为例

以保定市2002-2010年房价作为建模实例具体预测步骤如下:

(1) 按照上述方法, 得基本灰色GM (1, 1) 模型

(0) (k+1) =59572.47356 (1-e-0.032788196) e0.032788196k, k=0, 1, 2, …, n

(2) 按照上述方法, 得指数模型:

undefined

undefined

(3) 结果对比分析, 如表2:

4 结论

本文通过将灰色预测模型与多元模型相结合, 首先根据房价各期的历史数据, 利用灰色预测模型进行基本预测;然后利用影响各期房价的其他因素, 对灰色的误差值进行调整, 从而得到精确度更高的预测值。最后以保定市多年来房价为例, 通过上述模型进行预测, 并将结果与传统的灰色模型预测结果进行对比, 更加有力证明了模型在预测房价上的可靠性与精确性。

摘要:除了各期房价历史数据, 各对应期市场上其他因素 (如地价、人均收入、居住指数、人口等) 的变化, 对房价的高低也有一定的影响。本文将灰色与多元预测模型相结合, 从纵横两个方向对房价进行预测。即利用灰色模型进行基本预测的基础上, 再对误差值利用多元模型进行调整, 使预测结果精确度更高。

调整预测 第4篇

1 季节调整方法

气象要素是随时间变化的, 对它的观测形成一组有序数据, 称这种数据为时间序列。对时间序列处理的方法大体有2种:一种是从“时域”角度进行分析, 称为时间序列分析或时序分析;另一种是从“频域”角度进行分析, 称为频谱分析或谱分析。一个时间序列可以包括上面4个部分中的全部或者几个部分。

在实际应用中, 一般使用以下2类模型:一是加法模型:Y=T+C+S+e;二是乘法模型:Y=T×C×S×e。文中采用乘法型季节模型:Y1=f (t) ×Fj, 其中, f (t) 是序列长期变动趋势项;Fj是季节因子, 它表示季节性变动幅度的大小, j=1, 2, ……k, 如月度为周期则k=12, 季度为周期则k=4。

季节调整的主要步骤如下:第一步, 估计趋势项T, 然后得到季节项和误差项的乘积S·e=Y/T;第二步, 去掉残差项, 估计季节项S, 把与不同季节对应的数字称为季节因子, 对季节因子进行规范化;第三步, 从原始数据中去掉季节项Y/S, 得到没有季节项的新的时间序列。对新时间序列进行趋势估计, 建立合理的趋势模型, 根据趋势模型预测趋势, 然后让趋势乘以季节指数, 得到未来的预测[1,2]。

2 实际应用分析

首先用季节调整方法对临汾市1962~2006年逐月气温、降水资料进行趋势分析, 利用得到的趋势方程对2007年数值进行预测。为了检验该方法的准确性, 用线性回归方法对气温和降水资料进行预测, 将2种方法进行比较。气温、降水的趋势采用一次线性方程表示, 即:y=a0+a1t。式中, y为平均地温 (最大冻土深度) ;t为时间;a1为线性趋势项。由于温度、降水存在月差异, 在用线性回归方法进行趋势分析时, 对12个月的数据分别进行趋势分析, 利用得到的12个线性方程对2007年的月数据进行了预测;季节调整步骤如前所述。

得到的误差结果如表1所示。在气温预测方面, 2种方法的最大误差均出现在冬季12月~翌年2月, 季节调整方法的误差是线性回归方法的2倍;春、夏、秋季, 季节调整方法的误差小于线性回归方法, 其中季节调整方法的最大误差出现在11月 (23%) , 线性回归方法的最大误差出现在3月 (73%) , 4~10月2种方法都保持在较小的误差, 最大误差均为10%。降水预测方面, 降水的不确定性使得2种方法对降水的预测都存在很大的误差;1月由于无降水, 所以未进行误差分析;2种方法的最大误差出现的时间与气温不同, 均出现在4月、5月、11月, 季节调整的误差较大, 而其余月份线性回归方法的误差较大。

(%)

注:“-”表示未做比较。

笔者对临汾地区16个县1976~2006年逐月气温进行季节调整后, 再进行预测发现, 地域也表现出不同的误差特征, 虽然最大误差都出现在冬季, 但有个别冬季月份误差在10%以下;其中古县、浮山、霍州除冬季外, 各月也保持较大的误差, 基本在20%以上, 其余县除冬季外, 各月误差均保持在20%以下, 但时间段又有不同, 侯马、曲沃、洪洞除冬季外各月误差均保持在20%以下;永和、隰县、翼城只有4~10月误差保持在20%以下;其余县只有4~9月误差保持在20%以下。

3 结语

季节调整方法的不足在于有序列长度变短造成的数据损失及滑动阶数确定的主观人为性, 其精度不仅与方法本身有关系, 也与数据的性质有关[3,4]。因此, 在实际应用中要结合专业知识, 并从使用目的和具体情况来考虑是否选用该方法。

摘要:采用时间序列方法, 对临汾市气象要素时间序列进行了季节调整, 结果表明该方法不仅对要素表现出不同的特征, 对地域也有区别;通过与线性回归比较, 发现该方法也能达到较好的精度, 但在实际应用中要结合专业知识, 根据使用目的与具体情况考虑是否使用。

关键词:气象要素,时间序列,季节调整方法,应用

参考文献

[1]黄嘉佑.气象统计分析与预报方法[M].北京:气象出版社, 2004.

[2]潘红宇.时间序列分析[M].北京:对外经济贸易大学出版社, 2006.

[3]孙春薇, 王旭磊, 辛永训, 等.几种关于时间序列季节调整方法的研究[J].青岛农业大学学报 (自然科学版) , 2007, 24 (2) :149-153.

调整预测 第5篇

在工业现代化进程中, 钢铁工业一直处于基础产业的定位, 而冷轧带钢的生产又是钢铁工业发展中的重要课题之一。冷轧带钢一般厚度为0.1~3 mm, 宽度为100~2 000 mm, 产品规格繁多、尺寸精度高、表面质量好、机械性能及工艺性能均优于热轧板带钢[1]。因此, 通过引用智能方法和先进的自动化技术生产出高精度优质的冷轧薄带钢成为许多研究人员孜孜不倦的追求。

要获得高品质的板带材, 对板形质量的控制是必不可少的环节。目前多采用瑞典ABB公司的分段辊式与英国DAVA公司的空气轴承式板形检测仪在带钢冷连轧机生产线上对板形实施在线监测, 将测量得到的板形缺陷数据信息经过识别后, 提取出控制系统各回路的控制量由板形控制系统进行实时的调控, 保证生产出的板带材精度高、品质好。因此, 对于实测板形数据的识别与预测的研究有着十分重要的意义。

2 实测板形缺陷数据识别方法概述

由于板形检测装置提供的检测数据是一个综合板形信息, 在板形控制中无法直接应用, 因此需要根据执行机构的要求, 采取适当的板形模式识别方法求出被执行相应的调节量。

60年代末70年代初传统的基于最小二乘法的多项式拟合法 (回归方程) 在BISRA系统中对轧机轧制过程中板形测量得到的一组离散张应力分布值进行识别, 之后基于最小二乘法的不完全普通多项式拟合法和正交多项式回归法分别在宝钢2 030 mm五机架冷连轧机和武钢1 250 mm单机可逆式冷轧机的板形自动控制系统得到应用[2]。

基于多项式的板形模式识别方法虽能够有效地分解实测板形数据, 但其致命的弱点是抗干扰能力差, 为此, 研究学者又提出了基于加权海明 (Hamming) 距离的模糊识别方法。该方法算法简单, 具有一定的抗干扰能力, 结合数学中的单纯形法对识别结果进行优化, 仍可以得到较精确的结果[3]。在板形模式识别中是一类比较有潜力的识别方法。

国内外许多研究人员, 借助神经网络所具有的鲁棒性、容错性强, 计算速度快, 具有自学习、自组织、自适应性, 可以处理不确定系统并且充分逼近任意复杂的非线性关系, 以及其很强的信息综合能力, 将其与模糊理论、遗传算法、粒子群算法、支持向量机等智能学习方法相结合, 相互取长补短应用在板形模式识别中, 并取得了一定的研究成果[4,5,6]。本文就对两种建立在改进的BP神经网络模型基础上的板形识别与预测进行对比分析。

3 改进的双隐层BP神经网络模型

1986年, Rumelhart和McClelland提出了一种利用误差反向传播训练算法的神经网络 (Back Propagation) , 简称BP神经网络, 系统地解决了多层网络中隐含单元连接权的学习问题[7]。只要有足够多的隐含层和神经元个数, BP网络便可以逼近任意的非线性映射关系。因此, 为了提高BP神经网络的预测精度, 本文建立了双隐层BP神经网络模型, 并且有效地解决了由于该网络结构复杂带来的训练速度慢的问题。

3.1 双隐层BP神经网络

双隐层BP网络是在三层前馈神经网络的基础上, 增加一个隐含层。隐含层节点的确定采用试差法, 即当第一个隐层节点数增加到最大值同时网络误差不会再减小时, 增加第二个隐层, 直至网络误差达到最小, 得到一个大小合适的神经网络模型。本文经过以上方法得到神经网络的结构为6-15-5-3, 其网络模型如图1所示。

尽管三层前馈网络的收敛性不受权值的初始值影响, 但是三层以上 (含两个隐含层) 前馈网络其权值的初始值不能全为零或者全部相同, 因此, 本文采用随机数作为该网络初始权值。

3.2 Sigmoid函数的改进

隐含层、输出层各个节点的输出都离不开激活函数, 线性阈值函数不可导, 难以找到有效的学习算法, 因此, 本文中所建立的双隐层BP神经网络输入层到隐含层、隐含层到隐含层均选择Sigmoid函数:

g (x) =11+exp[- (x+θ1) /θ0] (1)

而隐含层到输出层选择线性函数, 这是因为线性函数可以任意的取值, 这样可以提高网络的收敛性。经过研究Sigmoid函数对网络收敛速度存在一定的影响, 固定形状的Sigmoid函数不利于网络的快速收敛, 在学习过程中合理地调整Sigmoid函数的形状可加速网络的学习进程[8]。θ0的作用是调节Sigmoid函数的形状。较小的θ0值使Sigmoid函数逼近阶跃限幅函数, 能有效地加快网络的收敛进程。而较大的θ0值将导致一个变化较为平坦的Sigmoid函数, 保证网络的稳定性。

3.3 改进的双隐层BP神经网络算法设计

(1) 根据实际问题, 初始化一个双隐层BP神经网络模型;

(2) 预处理样本数据, 归一化到[-1, 1]范围内, 输入神经网络中。为了消除样本输入顺序对网络训练性能的影响, 本文采用批处理学习方式;

(3) 在[-0.1, 0.1]之间产生随机数赋值给初始权值阈值矩阵, 选择参数θ0:1-δθ0≤1+δ, δ为一小正数;

(4) 计算网络的输出及误差E (i) (i=1, 2, 3, …, N) ;

(5) 判断E (i+1) -E (i) <0是否成立且满足一定次数N, 是则适当减小θ0值, 否则记录此次训练误差;

(6) 判断训练误差是否达到要求, 是则算法终止;否则, 修正权值, 返回 (4) 。

4 基于BP网络和Levenberg-Marquardt (L-M) 算法的模型

BP网络由于收敛速度慢、易陷入局部极小值的缺点使得其在线处理数据时的应用受到限制。为此, 本文还提出了基于L-M又称阻尼最小算法的一种最快速收敛的LMBP神经网络模型识别板形数据的方法。

L-M算法是一种利用标准的数值优化技术的快速算法, 是梯度下降法与高斯牛顿法的结合[9]。采用L-M算法可以在以近似二阶训练速率进行修正网络连接权值时避免直接计算Hessian矩阵, 从而减少了训练中的计算量和节省训练时间。BP网络的误差性能函数采用平方和误差E (w) 的形式表示:

E (w) =p=1ΝEp (w) =12p=1Νk=1L[tpk (w) -opk (w) ]2=12p=1Νk=1L[epk (w) ]2 (2)

式中:N——样本对数;L——网络输出节点数;epk——第p次输入时第k个节点的输出值与期望值的误差。此时, Hessian阵可以近似表示为:

H=JTJ (3)

梯度的计算表达式为:

g=JTe (4)

权值的修正公式可更新为:

wk+1=wk-[JTJ+μI]-1JTe (5)

式 (3) ~式 (5) 中, H是包含网络误差函数对权值和阈值一阶导数的Jacobian矩阵, e是网络的误差向量。由此看出, μ值的改变最终影响着网络权值的修正方法。牛顿法逼近最小误差的速度更快, 更精确, 当每次迭代后误差性能减小时, 则使μ值减小;梯度法是沿着梯度最陡下降方向修正权值, 误差减小的速度最快, 因此, 当网络误差增大时增加μ值。这样, 使得BP网络的误差性能始终在减小, 不仅提高了训练速度, 同时保证了网络的收敛性。

由于μ值是随着每次迭代产生的误差不同而不断变化的, 本文采用下面的做法自适应的调节μ值。初始值设置为μ=0.001, 使用式 (5) 后会出现两种情况:

(1) E (wk+1) -E (wk) <0, 则保留wk+1, μ=0.1μ, 重复此步骤;

(2) E (wk+1) -E (wk) >0, 则维持wk, μ=30μ, 然后按式 (5) 计算wk+1。

5 仿真与分析

对于本文提出的两种板形识别的方法, 在Matlab平台上分别进行了仿真实验。

实验1 理想样本训练LMBP神经网络

首先选取80组理想样本训练LMBP神经网络, 用30组测试样本对其进行测试。其中输入层节点数六个, 隐含层16个, 输出层三个, 误差目标goal=1e-9, mu_inc=30。训练性能如图2所示, 测试结果如表1所示。

实验2 加噪样本训练LMBP神经网络

为了提高网络的泛化能力, 在此选取加入噪音的样本数据训练网络, 用rand函数给理想的训练样本加噪, 如:

得到80组训练样本, 同样用上述的30组测试样本进行测试。其中输入层节点数六个, 隐含层16个, 输出层三个, 误差目标goal=1e-5, mu_inc=30。训练性能如图3所示, 测试结果如表1所示。

实验3 加噪样本训练改进的双隐层BP神经网络

利用由实验2得到的80组样本进行训练, 30组样本作为测试。其中输入层节点数六个, 第一个隐含层节点数为15, 第二个隐含层为五, 输出层节点数为三, 误差目标取goal=1e-3, 学习率η=0.003, 动量项因子α=0.9, 在 (-0.1, 0.1) 范围内随机产生初始权值。训练性能如图4、图5所示, 测试结果如表1所示。

由以上三个实验得到的神经网络模型分别对下面单个样本:

Y=-0.3×Y1+0.3×Y3+0.4×Y5

进行测试, 预测得到的归一化后的板形缺陷如图6所示。

通过以上三个仿真实验表明, LMBP神经网络训练时间短, 对于理想样本预测精度很高, 而处理加噪样本时测试均方差较大, 从图6看出, 预测板形与实际板形之间存在一定幅度的波动;双隐层BP神经网络在训练加噪样本数据时则表现出了较好的性能, 识别出来的板形数据更接近于实测值, 但训练次数多、时间长, 而改进后的双隐层BP神经网络在保证网络预测性能的前提下, 使训练时间明显缩短。

6 结束语

本文提出了一种基于Sigmoid函数参数调整的的双隐层BP网络对板形实测数据进行处理的方法, 与L-M算法优化BP网络的方法进行了对比。从结果看出, 该方法处理加噪的数据时, 网络学习泛化能力远远优于LMBP神经网络, 加之改进后的双隐层BP网络的训练速度得到明显提高, 为板形缺陷的在线识别提供了新的研究思路。

摘要:提出一种改进的BP神经网络处理板形缺陷数据的方法, 建立双隐层BP神经网络模型, 并对Sigmoid激活函数的形状进行调节。将其应用到冷轧的板形缺陷识别中, 与利用Levenberg-Marquardt规则训练的BP神经网络预测结果作对比, 表明该方法不仅有效地减少双隐层BP网络的学习时间, 同时改善了网络的泛化能力, 有利于板形缺陷在线识别。

关键词:板形识别,双隐层BP神经网络,Sigmoid函数,L-M优化算法

参考文献

[1]孙一康, 童朝南, 等.冷轧生产自动化技术[M].北京:冶金工业出版社, 2006:4.

[2]邸洪双, 张晓峰, 刘相华, 等.冷轧薄带板形检测信号正交多项式分解及数学模型[J].钢铁, 1995, 30 (9) :33-36.

[3]乔俊飞, 郭戈, 柴天佑.板形模式的一种模糊识别方法[J].钢铁, 1998, 33 (6) :37-40.

[4]王焱, 孙一康.变尺度混沌遗传算法及其在冷轧参数优化中的应用[J].化工自动化及仪表, 2002, 29 (2) :24-27.

[5]HE Hai-tao, LI Yan.The Research on Flatness Pattern Recogni-tion Based on CMAC Neural Network[J].Machine Learningand Cybernetics, 2007, (5) :2745-2748.

[6]HE Hai-tao, LI Nan.An RBF Network Approach to FlatnessPattern Recognition Based on SVM Learning[J].MachineLearning and Cybernetics, 2006, (8) :2959-2962.

[7]李国勇.智能控制及其MATLAB实现[M].北京:电子工业出版社, 2005:20-21.

[8]吴小培, 费勤云.一种提高BP算法学习速度的有效途径[J].安徽大学学报:自然科学版, 1998, 22 (3) :64-67.

上一篇:理解课文下一篇:PACS的应用与维护