支持向量回归范文

2024-09-05

支持向量回归范文(精选10篇)

支持向量回归 第1篇

统计学习理论和支持向量机建立了一套较好的有限样本下机器学习的理论框架和通用方法,既有严格的理论基础,又能较好地解决小样本、非线性、高维数和局部极小点等实际问题,因此成为目前国际上机器学习领域新的研究热点。

支持向量机是从统计学习理论发展而来的,设给定训练样本集其中表示第i个d维向量,称为输入特征向量。yi∈R,表示输出,i=1, 2, 3...,n。通过训练学习寻求Rd上的函数f (x) ,使得训练样本集要满足对任意xi,存在yi=f (xi) ,对于xn+1, xn+2, ...的数据,也同样存在这样的f (x) 。

回归问题,是输入变量和输出变量通过函数关系表示,并以此函数为规则,通过输入新的变量,得到新的输出作为预测值。

依据结构风险最小化准则,用数学语言表达,支持向量回归机要求解的问题是:

其中,常数C (C>0)用来调整训练模型,用于平衡结构风险和置信风险。

2、交叉验证原理

参数的取值对支持向量机有很重要的影响,选择合适的参数,能够使支持向量机既有好的学习能力,又有好的泛化能力。

交叉验证是度量SVM回归结果的首选方法,并且它具有指导参数选择的能力。其原理是将训练样本分成数据量相同的k个子集,记性训练算法k次。对于每个子集i,在第i次训练时,要用除去第i个子集后的k-1个子集作为训练集训练模型,用第i个子集作为测试计算模型预测的误差。最后将k次预测模型的平均误差值作为模型的近似误差值。

3、实例研究

本文以麦克-格拉斯混沌微分方程为对象进行研究。麦克-格拉斯混沌微分方程:

计算时,取1200个点,如图1所示:

用数组记录方程中的点:a是1200个点的数组。

应用-支持向量机进行回归研究,以a对支持向量机进行训练,训练中,以交叉验证的方法确定最优的参数值,并做预测。图2是预测结果:

均方误差MSE=0.0715相关系数R=0.4981。

为了取得更好的效果,训练中对数组a进行归一化处理,预测后再进行反归一化,预测结果如图3所示:

均方误差MSE=0.1024相关系数R=0.8627。

3. 结论

根据预测结果可见,对训练样本进行归一化处理后,预测结果要优于未进行归一化处理的结果。不过不是所有的情况均适用归一化处理,有时候归一化后结果反而比较差,需要具体数据进行分析。

摘要:支持向量机在非线性回归中, 有着成功的应用。本文通过-支持向量机进行回归的实例研究, 通过交叉验证确定最优的系数, 为研究者提供参考。

关键词:非线性回归,ε-svm,交叉验证

参考文献

[1]金桃等.基于SVM的多变量股市时间序列预测研究, 计算机应用与软件, 2010.6, 27 (6)

[2]邓乃扬, 田英杰著.数据挖掘中的新方法――支持向量机.科学出版社, 2004, 6

支持向量回归 第2篇

回归型支持向量机在发动机参数测量分析中的应用

发动机参数的.测量与分析处理是发现发动机故障隐患的重要方法.记述了回归型支持向量机的原理和基于回归型支持向量机的诊断方法,实现了传感器故障隔离与信号重构,利用发动机参数测量的实验数据对支持向量机进行训练,并进行了仿真验证.结果表明:基于回归型支持向量机的传感器故障诊断具有很高的预测精度.

作 者:王永华 孙涛 蒋科艺 王秀霞 作者单位:海军航空工程学院,飞行器工程系,山东,烟台,264001刊 名:实验技术与管理 ISTIC PKU英文刊名:EXPERIMENTAL TECHNOLOGY AND MANAGEMENT年,卷(期):201027(7)分类号:V231.3关键词:发动机 传感器 故障诊断 回归型支持向量机

支持向量回归 第3篇

关键词计学习理论;支持向量回归;加权系数;加权支持向量回归

中图分类号TP文献标识码A文章编号1673-9671-(2011)042-0212-02

支持向量机(Support Vector Machine,SVM)是20世纪90年代中期由AT&T贝尔实验室的Vapnik等人提出的一种新的机器学习算法,它是以统计学习理论(StatisticalLearning Theory,SLT)为基础的,因此支持向量机具有很强的理论基础和泛化能力。

统计学习理论是建立在结构风险最小化原则基础上的,该理论为机器学习问题建立了一个良好的理论框架,较好地解决了小样本、非线性和局部极小点等实际问题。支持向量机就是专门针对小样本情况下的机器学习问题而建立的一套理论体系。它的核心思想是对于一个给定的具有有限数量训练样本的学习任务,如何对其准确性和机器容量进行折衷,以得到最佳的推广性能。

设计支持向量机最初的目的是为了处理模式识别分类问题,即首先在训练集中寻找支持向量,然后在其上构造决策函数,使其具有良好的分类性能。

支持向量回归则是Vapnik在定义了ε-不敏感损失函数的基础上提出来的(以下简称ε-SVR)。并广泛应用到非线性回归估计和曲线拟合中;在非线性系统辨识、预测预报、建模与控制等领域都有潜在的广泛应用。

但是,支持向量回归机算法也存在着一些明显的缺憾。

1)在ε-SVR中,该算法在构建原始问题的时候,对所有样本采用的是相同的惩罚参数C和回归精度ε,即对不同样本的误差惩罚和精度的要求是平等的。但在实际应用中,有些数据比较重要,要求的训练误差较小;相反有些数据则容许有一定大小的误差。因此当样本中存在噪声或野点时,导致SVM在这些点较为敏感,由此产生过拟合现象。

2)ε-SVR算法在求解大规模问题时存在学习速度过慢的问题。因此,如何减少计算时间、存储空间及避免过学习问题成为回估计的学习算法的研究点。针对这种情况,本文在此引入权值,根据每个样本偏离数据域程度的不同赋予不同的权值系数,使噪声点的权值接近于一个很小的实数,以减小对回归函数的影响。在确定权值系数的训练中,拟采用线性规划下的一类分类方法。

1改进的回归型支持向量机算法

1.1支持向量回归机的改进算法简介

针对回归问题时样本中出现噪声或野点的情况,提出的加权支持向量回归算法,主要有:

1)模糊支持向量机,2002年Lin.C.F等将模糊隶属度的概念引入到SVM分类中,将输入样本集模糊化,提出了模糊支持向量机(fuzzy support vector machine—FSVM)的概念。该方法提高了SVM抗噪声的能力,尤其适合于未能完全揭示输入样本特性的情况。

2)基于数据域描述的模糊支持向量回归,其基本思想是:首先得到数据域描述模型,然后根据每个样本偏离数据域的程度的不同赋予不同的隶属度。

3)加权稳健支撑向量回归方法(WR-SVR)。其基本思想是:首先由SVR方法得到一近似支撑向量函数,基于这一近似模型给出给定数据的损失估计。软剔除即以加权的方式剔除奇异值:数据偏离模型愈远,损失函数的权重愈小,其对模型参数估计的影响亦愈小。

目前对权值系数的确定还没有一个统一的方法,本文所做的工作主要是对(2)中提出的方法进行调整研究和实践,采用线性规划下的一类分类方法,根据每个样本偏离数据域程度的不同赋予不同的权值,从而使噪声点的权值接近于一个很小的实数,以减小对回归函数的影响。

1.2加权支持向量回归算法

设给定的训练集T={(xi,yi),…,(xl,yl)}∈(x×y)l,xi∈x=Rn,yi∈Y=R,i=1,…,l。

基于支持向量机的最优回归函数是指满足结构风险最小化原理,即极小化优化问题:

min

(1)

其中,第一项是使函数更为平坦,从而提高泛化能力;第二项为减小误差,常数C为惩罚系数,对两者做出折中;ε为一正常数,控制回归精度。

由上节叙述可知,引入Lagrange函数及核函数后,得到优化问题的对偶形式,即改进的加权ε-支持向量回归机,其算法可描述为:

1)设已知训练集,T={(xi,yi),…,(xl,yl)}∈(x×y)l,xi∈x=Rn,yi∈Y=R,i=1,…,l;

2)选择适当的正数ε和C>0;选择适当的核K(x,x');

3)构造并求解最优化问题

(2)

得到最优解;

4)构造决策函数

=ρ (3)

其中按下式方式计算:选择位于开区间中的

(4)

2权值系数的确定

对于权值系数的确定,采用线性规划下的一类分类算法。定义权值如下:

(5)

其中:fmax=max( f(xi)|xi∈X),fmin=min( f(xi)|xi∈X),σ<1为足够小的正实数;f(xi)为样本xi的决策函数,表达式为:

(6)

从上述定义可以看出,当ρ≤f(xi)≤fmax时,说明xi是区域内的样本,在支持向量回归中,该样本在回归间隔附近;当fmin ≤ f(xi)<ρ时,说明xi是区域外的样本,其权值接近于一个很小的实数。

3实验验证与分析

本文以某水处理实验机构采集的60组实验数据,这里首先随机抽取40个样本作为训练样本,再抽取20个样本作为测试样本,分别采用标准的支持向量回归机与改进算法的加权支持向量回归机,对其进行训练与预测仿真,来验证改进算法的有效性。

3.1实验参数设定

1)对于训练出来的模型的优劣,本文使用均方误差(Mean Squared Error—MSE)的大小来衡量。MSE越小,则表明训练出来的模型越好。

其中:MSE有以下定义式给出:

; (7)

式中:l表示样本个数,yi为xi对应的测量真实值,f(xi)为对应的预测值。

2)对于核函数的选择,本文采用比较流行的RBF-Gauss径向基核函数,其定义式如下:

(8)

其中:σ为高斯核函数的宽度,反应了边界封闭包含的半径。

3)本文采用台湾大学林智仁教授开发的LibSVM工具箱,并针对本文的改进算法进行了相应的改进。运行平台为MATLAB-7.0。其丰富的脚本文件和函数及与C++语言的优良兼容性,为SVM技术的工程化、实用化提供了一个良好的环境。

3.2实验过程与数据分析

首先对输入样本进行训练,取C=45,g=10,利用线性规划得到ρ=480.31,fmin=456,fmax=520,则确定权值为:

(9)

分别采用标准的支持向量回归机与改进算法的加权支持向量回归机,对其进行训练及测测仿真由所得仿真数据分析,可得如下表格:

由此,我们得出结论:标准支持向量回归在样本中无噪声点时,具有很好的学习和泛化能力;但当样本中存在噪声或野点时,回归间隔偏向噪声点移动,从而出现过拟合现象,回归产生误差。针对这一现象,本文引入权值系数,根据样本偏离决策超平面的距离,对不同的样本采用不同的公式计算其权值。实验表明,该方法与标准支持向量回归算法相比,减小了回归误差,提高了支持向量机的抗噪能力即泛化能力。

参考文献

[1]Hornik K.M.,Stinchcombe M.,White H.Multilayer feedforward networks are universal approximators[J]. NeuralNetworks,1989. 2.

[2]Vapnik V.N.An Overview of Statistical Learning Theory[J].IE Neural Networks,1999,10.

[3]HuangHP,Lin YH.Fuzzy suport vector machine for paRem recognition and data mining[J].In Journalof Fuzzy Systems,2002,4(3):826-835.

[4]CF Lin,S D Wang.Fuzzy support vector machines with automatic membership setting[J].StudFuzz,2005,177:233-254.

[5]邓乃扬,田英杰.支持向量机[M].北京:科学出版社,2009.

[6]李国正,王猛,曾华军.支持向量机导论[M].北京:电子工业出版社,2005.

基于支持向量回归机的电能质量评估 第4篇

近年来随着电力工业和电力电子技术的迅猛发展,电力用户采用了大量时变控制的非线性设备,电网中接入了大量的冲击、非线性负载及不平衡负荷,引起了日益严峻的电能质量问题。同时,智能电网建设及新能源的发展又对电能质量提出了更高的要求。对电能质量进行科学地评估是提升电能使用效率、电能商品按质计价和电能质量治理等的重要保障,已成为电能质量研究中的热点问题。电能质量评估属于多指标非线性评估问题,在评估过程中指标权重确定的是否科学合理直接影响到评估结果的合理性和有效性,文献[1,2,3,4,5,6,7]分别采用改进雷达图法、模糊集对分析法、模糊层次分析法、灰色关联度和理想解法相结合的方法、区间数理论、云物元分析理论和可拓云理论对电能质量评估问题进行了深入研究。上述研究方法分别采用主观赋权法、客观赋权法或主客观相结合的组合赋权法确定各评估指标的权重值,由于不同的权重确定方法计算出的指标权重差异较大,仅从评估结果的合理性很难推断出各种权重确定方法的有效性。为了避免权重计算的复杂性和不确定性,文献[8,9]分别采用模糊神经网络和自组织特征映射网络的智能评估方法研究电能质量评估问题,克服了传统评估方法在权重确定方面的不足,并取得了较好的效果。

虽然神经网络具有良好的非线性逼近能力和较强的泛化能力,但神经网络方法自身存在着许多不足,如学习效率不高、样本需求量大、收敛速度慢和网络结构难确定等问题。支持向量回归机(Support Vector Regression,SVR)是支持向量机在回归领域的具体应用,具有泛化能力强、训练时间短、全局优化和抗干扰能力强等优点,因其出色的预测效果,被广泛应用于解决小样本、非线性预测问题[10]。文献[11]采用神经网络和支持向量机相结合的方法对110 k V高压电网的电能质量评估问题进行研究,取得了较好的评估结果。鉴于此,本文尝试采用支持向量回归机对380 k V高压电网的电能质量评估问题进行研究。

1 电能质量评估指标体系

关于电能质量标准,我国分别制定了供电偏差、电力系统频率偏差、三相电压不平衡度、电压波动和闪变、公用电网谐波、公用电网间谐波、暂态过电压和瞬态过电压等电能质量国家标准体系,依据这些标准体系和电能质量评估有关文献,本文选用电压质量、频率质量、可靠性和服务质量四个维度作为电能质量评估的一级指标,四个一级指标下的二级指标如图1所示。

本文评估的电能质量考虑的电压等级是380 k V,按照国家制定的电能质量标准,将电能质量划分为5个等级,分别为优质、良好、中等、合格和不合格[5,6],这里分别用1,2,3,4,5代替,各评估指标所对应的电能质量等级如表1所示。

2 支持向量回归机原理

支持向量机最初是用来做分类的,为了能够解决回归估计问题,需要借助ε不敏感损失函数实现[7,12]。首先考虑用线性回归函数f(x)=(w⋅x)+b估计训练样本集D={(xi,yi)},i=1,2,⋯,n,xi∈Rd,yi∈R。假设所有训练数据在精度ε下无误差地用线性函数拟合,即:

则优化目标为:

考虑到允许拟合误差情况,引入松弛变量,则式(1)变为:

式(2)的优化目标变为:

式中:第一项是为了提高学习的泛化能力,第二项则为减少误差,常数C>0对两者做出折衷,表示对超出误差ε的样本的惩罚程度。根据ε不敏感损失函数的定义可知,当f(xi)=(w⋅xi)+b与yi的差别不大于ε时,不计误差,即为零;当大于ε时,误差为|f(xi)-yi|-ε,也可以看出此时得到的最优化问题也具有稀疏特性。以上的数学问题是一个凸二次规划问题,为了求解,构造Lagrange函数:

式中:

对w,b,ξi*和ξi求导数,整理后可得:

因此,根据Wolf对偶的定义,在KKT条件下,得到Lagrange的对偶形式为:

得到的回归函数为:

对于非线性问题,可通过非线性变换转化为某个高维空间中的线性问题,即用核函数K(xi,xj)替代原来的内积运算(xi⋅xj)就可以实现非线性函数拟合:

核函数K(x,y)的形式有多种,常用的有sigmoid感知核函数、多项式核函数、径向基核函数和二次曲面核函数等。

3 基于SVR的电能质量评估模型

通过电能质量评估指标体系的建立和支持向量回归机原理的介绍,构建基于SVR的电能质量评估模型,模型的具体实现步骤如下:

步骤1:建立电能质量评估指标体系,确定支持向量回归机的输入输出参数。依据前面的分析,本文选用电压偏差、电压波动、电压闪变、谐波畸变率、三项不平衡度、暂态压降、频率偏差、供电可靠性和需求侧服务作为电能质量评估模型的输入参数,电能质量等级作为评估模型的输出参数。

步骤2:对训练样本和校验样本数据进行规范化处理,训练样本取自各个电能质量的等级区间。本文选用公式对电压偏差、电压波动、谐波畸变率和三项不平衡度的样本数据进行规范化处理,ximax分别取7,2,5,2;用公式对频率偏差的样本数据进行规范化处理。

步骤3:选择合适的支持向量回归机核函数。通过对比分析,选用在众多领域预测效果较为理想的径向基核函数。

步骤4:利用基于SVR的电能质量评估模型对训练样本进行训练,不断调整正则化参数C、不敏感值ε和径向基核函数的宽度参数σ,直到训练误差满足精度要求为止。

步骤5:通过校验样本检验预测模型的泛化能力。利用基于SVR的电能质量评估模型对校验样本的电能质量进行评估。

4 应用实例

这里以文献[4,5,6,7]中的评估数据为例,对构建的电能质量评估模型的有效性进行验证,其中5个观测点的实测数据如表2所示。

首先利用计算机在1,2,3,4四个电能质量等级区间随机各选取3个训练样本,按照评估模型的规范化方法规范化后的样本数据如表3所示。在计算机上利用Matlab 7.0软件编写基于SVR的电能质量评估模型算法,通过对规范化训练样本的训练,将支持向量回归机的参数设置为:C=1 000,ε=0.001,σ=10。以后5个训练样本为例,评估模型预测的电能质量等级分别为3.000 1,3.000 1,4.000 1,3.999 9和3.999 9,从中可以看出,评估模型预测的等级误差极小,训练效果较好。

为了检验所建立评估模型的推广能力,对表2中的5个观测点的电能质量数据进行规范化处理,利用基于SVR的电能质量评估模型进行预测,得到的电能质量评估结果和文献[4,5,6,7]的评估结果见表4。

从表4中可以看出,本文的评估结果与其他方法得出的评估结果相一致,这里以观测点1为例进行说明。按照电能质量的等级区间,观测点1的电压闪变、谐波畸变率、三项不平衡度、频率偏差和需求侧服务5个评估指标为2级,电压偏差、电压波动、暂态压降和供电可靠性4个评估指标为3级,但电压偏差和暂态压降2个评估指标值均处于3级的下界即向2级的上界靠近,所以总体上评估为2.32级较为合理。

5 结论

针对传统电能质量评估方法在指标权重确定方面存在的不足,以及基于神经网络的电能质量评估方法存在的网络结构不好确定、容易陷入局部极值和处理小样本推广性欠佳等问题,提出了一种新的基于支持向量回归机的电能质量评估方法。最后给出的应用实例结果表明,本文建立的基于SVR的电能质量评估模型具有较强的泛化能力,得出的评估结果更加合理具有较强的说服力,该评估模型具有一定的理论意义和实用价值。

摘要:针对传统方法和神经网络方法在电能质量评估方面存在的不足,提出了一种新的基于支持向量回归机的电能质量评估方法。依据电能质量标准和有关文献建立了电能质量评估指标体系,给出了电能质量评估指标的等级区间。基于支持向量回归机的原理和电能质量评估指标,建立了基于支持向量回归机的电能质量评估模型。应用实例的仿真结果表明,所建立的评估模型具有较强的推广能力,得出的评估结果与其他评估方法相比更为合理可信。

关键词:电能质量,评估模型,支持向量机,支持向量回归机

参考文献

[1]乔鹏程,吴正国,李辉.基于改进雷达图法的电能质量综合评估方法[J].电力自动化设备,2011,31(6):88-93.

[2]刘俊华,罗隆福,张志文,等.基于模糊集对分析法的电能质量综合评估[J].电网技术,2012,36(7):81-85.

[3]翟兴丽,文福拴,林振智,等.基于模糊层次分析法的电能质量综合评估与灵敏度分析[J].华北电力大学学报,2013,40(5):48-53.

[4]李正明,施诗,潘天红,等.基于灰色关联度和理想解法的电能质量综合评估方法[J].电力系统保护与控制,2014,42(6):14-19.

[5]王宗耀,范莉,苏浩益.基于区间数理论的电能质量综合评估模型[J].电力系统保护与控制,2012,40(3):41-46.

[6]夏非,范莉,苏浩益,等.基于云物元分析理论的电能质量综合评估模型[J].电力系统保护与控制,2012,40(11):6-10.

[7]李如琦,苏浩益.基于可拓云理论的电能质量综合评估模型[J].电力系统自动化,2012,36(1):66-70.

[8]周林,栗秋华,刘华勇,等.用模糊神经网络模型评估电能质量[J].高电压技术,2007,33(9):66-69.

[9]付学谦,陈皓勇,蔡润庆.基于自组织特征映射网络的电能质量综合评估[J].华南理工大学学报(自然科学版),2014,42(6):7-11.

[10]方瑞明.支持向量机理论及其应用分析[M].北京:中国电力出版社,2007.

[11]王丽,王红梅,吴振洲.基于神经网络和支持向量机的电能质量组合评价[J].华北水利水电学院学报,2009,30(3):61-64.

支持向量回归 第5篇

支持向量机用于液体火箭发动机的故障诊断

支持向量机(Support Vector Machine,简称SVM)是一种基于机器学习的模式分类算法,其在解决小样本、非线性及高维模式识别等问题中都表现出许多特有的优势.用SVM对液体火箭发动机的故障数据进行检测和诊断.通过对发动机仿真模型的9种故障数据的学习,能检测出18组故障数据中的17组,但有4组出现误报.对误报故障进行二次学习和再检测,能对这4种故障正确检测.经过对C75试车4种故障数据的`学习.能正确检测其故障类型.进一步验证了该方法的正确性和可行性.

作 者:何浩 胡小平姜志杰 刘伟强 He Hao Hu Xiaoping Jiang Zhijie Liu Weiqiang 作者单位:国防科技大宇航天与材料工程学院,湖南,长沙,410073刊 名:火箭推进英文刊名:JOURNAL OF ROCKET PROPULSION年,卷(期):34(3)分类号:V434关键词:支持向量机 液体火箭发动机 故障诊断 模式识别

支持向量回归 第6篇

在计算机视觉领域,随着图像处理技术的不断发展,人们开始尝试使用数字图像处理技术来提高图像分辨率。图像的分辨率越高,细节表达就越清晰,从而提供的信息就越精确。图像的超分辨重建研究成为图像处理领域里的一个研究热点,研究学者致力于使用超分辨率重建技术对输入的低分辨率 (LR)图像进行处理,以得到一幅或多幅高分辨率 (HR)图像。经过处理后得到的高分辨率图像一方面在图像的视觉质量上得到了改善,另一方面也更利于图像特征提取与目标识别。图像超分辨重建是一种图像融合技术,其基本思想是结合一定的先验信息,通过对图像之间的相关或相似信息进行融合来重构出高分辨率图像,弥补了观测图像在信息提供方面的局限性。

目前图像超分辨重建技术已成为获得高分辨率图像的一个实用且有效的方法,它不仅可以克服图像在成像过程中的限制,达到提高图像分辨率、改善视觉质量的目的,同时也能在不改变成像设备的前提下节约经济成本。

支持向量机回归(SVR)是一种基于核函数的回归方法,具有较好的非线性映射能力。在文献[1]中将超分辨率重建看成是一个回归问题, 使用SVR方法在DCT域中解决超分辨重建问题, 随后又提出了一些改进方法[2],但传统SVR方法需要大量的图像来获得训练模型,计算复杂度比较高,而现有图像统计研究[3]表明,图像可以从过完备字典中通过稀疏线性组合很好地表示。当图像块特征用稀疏表示系数表征后, 能够更加简单、明了地对图像块进行表示,从而使计算复杂度降低,同时图像的重建效果还能有一定的提高。

1 传统的基于支持向量回归的算法

传统的基于SVR的超分辨算法主要分两步:训练过程和学习预测过程,具体算法流程图如图1所示。

图1(a)训练过程 (b)预测过程

训练过程中的图像退化模型一般可以表示为:

Y=HFX+V (1)

其中的X是已知的标准数据集的高分辨率图像, H为相应的模糊函数,F是下采样矩阵,V是噪声。

传统的SVR的特征一般是用简单二维高斯分布来确定小图像块中像素的权重。

图像的特征提取的合理与否,对SVR训练的模型将产生巨大的影响,而在预测阶段,通过训练得到模型的优劣很大程度上决定SVR在图像重建时效果的好坏。因此,图像特征表示方法将决定SVR算法对图像超分辨重建的结果。

2 改进的基于支持向量回归的算法

我们提出的改进的不同于传统SVR的算法中, 并不是用传统简单的二维高斯分布来确定小图像块中像素的权重作为特征来进行训练。我们采用分割的小图像块的稀疏表示系数向量作为小图像块的特征用于SVR训练。下面将详细介绍。

(1)在训练阶段时,先将原来已知的训练样本的HR图像X进行模糊和下采样得到相应的LR图像Y, 用Mean-Shift算法提取Y图像的高频部分并标记,再通过插值将LR图像变换成与原来HR一样大小的图像X1,X1图像中将会含有Y中标记的图像块,以用于X1图像中标记高频图像块部分和低频图像块部分分别训练。

(2)特征提取用稀疏表示系数时,不是直接建立LR和HR对应的分割图像块训练对,而是用Dh和D1分别对应低频和高频的图像块对的字典,然后用K-SVD[4]字典算法来得到训练字典。当输入一幅图像时,通过OMP[6]算法来获得图像的稀疏表示系数向量。

(3)下面介绍稀疏表示系数的建立过程。

稀疏表示要解决的问题用公式可以表示为:

其中D1是低频部分的训练字典,d1是低频图像块的稀疏表示向量,F是图像块的特征表示算子,y是低频图像块。

上式零阶范数是一个NP问题,但最近的研究结果表示,只要d1稀疏表示向量是足够稀疏,那么它可以有效地从最小化一阶范数恢复出来,即:

而一阶范数可以用拉格朗日乘子法得到等价的公式:

其中λ用来平衡稀疏结果和图像块y的保真度。上式能比较容易地求解得到特征系数。

高频图像块的特征表示和低频图像块的特征表示过程是一样的。

(4)改进的SVR特征表示不是用传统简单的二维高斯分布来确定像素值的权重作为特征来进行训练。我们分别通过OMP[5]算法根据训练好的字典获得低频图像块和高频图像块的稀疏表示系数向量, 替代原来支持向量回归中用的特征表示方法,用于训练阶段的模型的建立过程。

而在预测过程中也是用同样的稀疏表示系数向量来表示特征的。

(5)在训练阶段,SVR要解决的问题可以表示为:

其中y是一个标签表示在图像块中的心位置;n是训练样例个数;φ (ai)是图像块稀疏表示向量;w表示被学习的非线性映射函数;C是松弛变量ζ , ζ*的平衡因子。

其对偶问题是:

这就变成一个容易计算的凸二次规划问题。训练完成后得到训练模型用于预测输入的低分辨的图像块对应的高分辨图像中的像素值。

(6)在预测阶段,对输入的图像进行与训练阶段一样的预处理后,用OMP[5]算法,分别获得相应低频和高频块的稀疏系数向量用作SVR的预测的输入,通过上面已经训练的模型获得高分辨率图像中对应的低频和高频图像块的中心像素值,至此,高分辨率图像重建完成。

3 实验结果

实验图像来源于南加利福尼亚大学图像数据库 (USC-SIPI),下采样和图像超分辨率重建倍数均为2。SVR是用的LIBSVM[6],其中核函数采用的是高斯核函数,在SVR中的参数是经交叉验证,其中C=363, ε=1.8,高斯核函数的标准差为1。用于训练和测试的图像分别如图1和图2所示。PSNR为峰值信噪比,常用来作为图像重建结果的客观评价指标, 其数学定义形式如下:

其中M,N分别为重建图像的尺寸大小,f表示重建后的图像,f表示原始的高分辨率图像。PSNR的值越大,表示重建图像和原始图像越接近。

训练图像分别为lena,man,tree,lake,truck,house,Elaine,girl

测试图像分别为boat,cameraman,pepper,clock,synthetic,car

PSNR的实验结果如表1所示。

通过PSNR表可以看出,本文提出的方法与已有三种方法相比在重建效果上有一定的提高。由于篇幅 所限仅给 出其中两 幅图像 (boat如图3, cameraman如图4)的重建效果图。

boat (a)原图(b)插值法(c)传统SVR[2]d)稀疏方法[3] (e)本文

cameraman(a)原图(b)插值法(c)传统SVR[2] (d)稀疏方法[3](e)本文

4 结束语

本文提出了一种基于SVR和稀疏表示的图像超分辨率重建算法,是对传统SVR方法的一种改进。算法中用图像块的稀疏系数作为支持向量机的输入, 通过学习低分辨率图像块的稀疏系数和高分辨率图像块的中心像素点之间的关系进行重建,这种SVR和稀疏表示的有效结合实现了图像超分辨率重建质量的提高,实验结果验证了算法的有效性。本文中只是简单的运用了图像块的稀疏表示系数与SVR结合进行图像重建,在未来,SVR的非线性预测能力和稀疏表示对信号的线性逼近能力如何更有效地联合运用是一个值得研究的方向。

参考文献

[1]Ni K S,Kumar S,Vasconcelos N,et al.Single image super resolution based on support vector regression[C]//Acoustics,Speech and Signal Processing,2006.ICASSP 2006 Proceedings.2006,2:II-II.

[2]An Le,Bhanu Bir.Improved image super-resolution by support vector regression[C]//Neural Networks(IJCNN),The 2011 International Joint Conference on.IEEE,2011:696-700.

[3]Yang J C,Wright J,Huang T S,et al.Image superresolution as sparse representation of raw image patches[C].CVPR,2008.

[4]Aharon M,Elad M,Bruckstein A.The K-SVD:An algorithm for designing of over-complete dictionaries for sparse representation[J].IEEE Transactions on Signal Processing,2006,54(11):4311-4322.

[5]Needell D,Vershynin R.Signal recovery from incomplete and inaccurate measurements via regularized orthogonal matching pursuit[J].IEEE Journal of Selected Topics in Signal Processing,2010,4(2):310-316.

支持向量回归 第7篇

关键词:配网,故障,预测,支持向量机,SVM

近年来社会公众对供电企业供电服务的要求和期望越来越高,电力保障水平和供电服务水平更是广大人民群众最关心的问题。配网抢修业务是体现供电企业服务水平的重要环节,准确的配网故障预测,为超前配置抢修资源、科学开展抢修工作提供了有力依据,在目前供电企业抢修压力普遍较大的情况下,具有重要意义。

目前,国内外对于配网故障方面的研究较少,主要在故障定位[1]、抢修任务分配[2]、抢修流程优化[3]等方面,文献[4]提出了一种基于气象因素和时间序列分析的配电网故障数量预测模型,时间序列模型是一种典型的时序分析方法,其特点就是重点考虑故障的时序相关性,该方法将气象信息以附加模型的方式加入建模,在一定程度上弥补了单纯时间序列方法的不足。

本文提出了一种基于支持向量回归和统计分析方法的配网故障分区预测模型,支持向量回归是不同于传统时间序列模型的新一代智能算法,随着电网采集和监控技术的发展,更多的配网数据可以被收集利用,采用智能算法可以更好地挖掘数据之间的相关性,发现隐含信息,从而更好地实现配网故障的精准预测。

1 支持向量回归模型简介

支持向量机是由Vapnik及其领导的贝尔实验室提出的一种机器学习技术,在很多应用领域中获得目前为止最好的性能。故障预测领域用到的主要是支持向量回归模型。下面简要介绍一下本文用到的ε-支持向量回归模型原理。

对于(1)式的最小化求解问题,可以将其等价为如下优化问题:

由Lagrange理论,(2)式所描述的问题可化为如下对偶问题:

根据(2)问题化为Lagrange问题时需要满足的KKT条件,可以计算得到b,进而可以得到回归拟合函数:

支持向量回归是基于结构风险最小化的,而不是传统意义上的经验风险最小化,在样本不多的情况下仍旧可以保证较好的预测能力,目前被广泛应用于各种类型的预测之中并取得了良好效果。

2 城市配网分区预测模型

模型以支持向量回归算法为核心,将预测日之前一段时期的故障、天气数据作为训练样本,以预测日前2日的故障情况和当日预测天气数据为输入,获得预测日的故障数量预测值。

将预测范围划分为若干个区域,基于历史数据进行统计分析,得出每个区域发生故障数量和类型概率,并将其与总体预测故障数量相结合,即可以得出每个区域发生的故障数量、类型预测值,为抢修计划安排与驻点优化提供有力支撑。

2.1 回归参数选择

支持向量回归的参数选择问题,主要就是核函数K(x,y)及其参数、惩罚因子C的选择问题。核函数K(x,y)的选择没有固定依据,但为了更好地模拟样本非线性,应把样本向量尽量映射到非线性空间中,一般都采用非线性的核函数如多项式核和RBF核。

核函数参数和惩罚因子的选择可通过交叉验证法(Cross-Validation)、引导指令法(Bootstraping)和贝叶斯方法(Bayesian)等;本文采用了文献[8]介绍的网格搜索法(Grid Search)网格搜索法看似简单,但却是简洁实用的方法,其优点是可以保证收敛性和局部优解且寻参时间短。当然,网格搜索范围和步长选择的好坏也直接影响着搜索结果的优劣。

2.2 基于统计分析的分区预测

使用标准网格或其他分区方法将预测配网范围划分为A个区,根据历史故障数据统计可得一段时期内该范围中总故障量为F,第i个分区内的第j类故障数量为Bij(i∈[1,A];j∈[1,R],R为故障类型总数),则第i个分区内的故障发生频率Pi(x)为:

第i个分区内第j类故障发生的频率fij(x)为:

其中λiλij为实际根据区内设备更新状况引入的人工调整系数。这样,就可以将预测故障量具体到分区范围,为配网抢修工作计划提供更

多参考依据。

2.3 预测模型完整流程

基于支持向量回归和统计分析的配网故障分区预测模型整体流程如下所示:

3 算例分析

将基于支持向量回归和统计分析的配网故障分区预测模型应用于华北某市配网算例中,以验证该模型的有效性。输入选择预测前两日故障数量、预测日最高温度、预测日降水状况、预测日风力等输入数据。模型训练样本选择预测日前30日的相应输入值作为历史样本,输出值作为检验目标值。

本文采用华北某市电网2016年5月1日~6月10日共41组数据进行算例分析。其中采用5月1日至5月31日31组数据作为初始训练样本,对6月1日至6月10日10个工作日的数据进行模拟预测,以检验预测精度。算例的核函数采用多项式核,网格搜索法搜索范围为,经搜索,确定参数值分别为、核函数参数g=0.25。以此为基础预测10天的故障总量值如表1:

可以看出,预测准确率在94%以上,总体预测值具有良好效果。将城市划分为9个区域,以6月2日为例,可得9个区域的预测值如表2所示:

由上表可知,分区预测的最大误差绝对值为2,误差量很低,进一步证明了模型预测的效果。

4 结语

本文采用支持向量回归和统计分析结合的方法对城市配网故障进行了分区预测,并结合灵敏度分析、参数选择等方法对模型进行了进一步优化,给出了预测模型建模的完整流程,经算例检验模型具有较强的实用性和可操作性。随着今后数据采集技术的不断提升,数据维度和精度的不断提高,该方法可以将更多维的数据进一步纳入输入输出空间,不断提升预测精度,对配网抢修工作进行更大的支撑。

参考文献

[1]翁蓝天,刘开培,刘晓莉等.复杂配电网故障定位的链表法[J].电工技术学报,2009,24(5):190-196.

[2]杨丽君,张晶,程慧琳等.基于最优效用的配电网多故障抢修任务分配策略[J].电工技术学报,2014,29(6):263-270,289.

[3]周元祺,陈志樑,张麟等.利用故障抢修管理系统优化配电网故障抢修流程[J].供用电,2012,29(3):51-54.

[4]张鹏飞,瞿海妮,肖其师等.基于气象因素和时间序列分析的配电网故障数量预测[J].陕西电力,2016,44(1):68-72.

[5]Nello Cristianini,John Shawe-Taylor,支持向量机导论(中文版),北京:电子工业出版社.

[6]李元诚,方廷健,于尔铿.短期负荷预测的支持向量机研究,中国电机工程学报,2003,23(6):55~59.

[7]Dug Hun Hong,Changha Hwang.Support vector fuzzy regression machines,Fuzzy Sets and Systems,2003,138:271~281.

支持向量回归 第8篇

关键词:证券投资,移动平均线,支持向量机

0引言

随着金融市场的逐步完善,参与证券交易的投资者在不断的增多,研究判断当前市场的运行趋势成为广大投资者密切关注的问题。由于传统的证券分析方法需要投资者有较丰富的金融知识和证券投资经验,并且主观性较强,对普通投资者而言不宜掌握。近年来,国内外学者纷纷采用人工神经网络、支持向量机(SVM)等机器学习方法对证券交易数据进行处理,试图揭示证券交易数据背后所蕴含的意义。典型的如文献[1]应用一种改进的时间序列分析算法对股票走势进行了预测,并取得了不错的预测效果。文献[2]应用Elman递归神经网络建立股市预测模型并进行了实证研究,研究结果说明Elman递归神经网络应用于中国股票市场的预测是可行和有效的。文献[3]运用SVM对韩国的股指进行了预测,结果表明SVM的预测效果明显优于BP神经网络和基于案例学习的预测效果。

在使用SVM对证券投资进行实际研究时,常常涉及增量学习的样本选择和动态模型选择问题。传统的样本淘汰算法是基于支持向量或权重的,但前者应用在证券分析中并不理想,而后者的权重设置也缺乏适当的衡量标准[4,5]。我们认为对于实时动态变化的证券市场而言,SVM模型应随时间的推移而进行动态的调整,其中相关参数的动态优化是非常必要的。另外,为提高预测的实时性,有必要将样本集大小进行适当的控制。本文针对以上问题,提出基于动态边界缩放的PSO优化算法和基于移动窗口的支持向量回归相结合的预测方法,对沪深300指数进行预测[6]。模拟实验证明,该方法提高了模型训练预测的实时性,并一定程度上提高了预测效果,实际效果较佳。

1基于动态边界缩放的PSO和移动窗口的SVM预测方法

1.1基于动态边界缩放的PSO优化算法

PSO粒群优化算法是一种进化优化算法,模拟简单个体组成的群落与环境以及个体之间的互动行为,由Eberhart博士和Kennedy博士提出,其思想源于对鸟群捕食的行为研究,是一种基于迭代的优化工具[6]。算法最初初始化为一组随机解,然后通过不断的迭代搜寻最优值,目前已广泛应用于函数优化、SVM的参数优化和模型选择、神经网络训练、模糊系统控制等应用领域。

设第i个粒子表示为Xi=(xi1,xi2,…,xin),它飞过的最好位置记为Pi=(pi1,pi2,…,pin),称为个体极值pbest。群体所有粒子经历过的最好位置记为gbest。粒子i的速度用Vi=(vi1,vi2,…,vin)表示。对于第i次迭代,其计算公式如下:

其中1≤dD,D为搜索空间维数w称为惯性权重,调整参数w可以针对不同的搜索问题,平衡算法的全局和局部搜索能力。c1和c2为加速常数。rand()为取值在[0,1]范围里的随机函数。与遗传算法中染色体之间互相共享信息不同,PSO中信息的共享是一种单向流动,由gbest传递给其它粒子,整个的寻优过程就是跟随当前最优解的过程。这使得粒子可以更快的速度收敛于最优解。

由于SVM模型的预测精度与参数的选择密切相关,因此通常的做法是在SVM学习前使用PSO算法进行参数优化以提高模型的预测精度。但这种静态优化方法应用在如指数这种时变的序列中却存在一些问题:因为随着时间的推移,训练样本集逐渐发生变化,导致对应的最优参数也随之逐渐改变。一个很自然的想法是在每一次新的模型训练之前,重新进行参数优化。但随之而来的问题一是每次重新搜索的计算开销较大,特别是在证券指数预测这种流数据情况下,究其原因是PSO算法实质上是一种在多维空间中进行优化搜索的算法,搜索空间的大小对其计算开销影响较大。二是新的优化过程无法利用上一次的优化结果,使得参数的优化过程缺乏连续性。基于以上两个原因,我们提出基于粒子边界的动态缩放来实现基于PSO的动态优化从而提高SVR参数优化的效率。

这种策略基于以下推测:假如当前训练集的最优参数为Bestc和Bestg,则增加或减少一个交易日的数据之后,新的最优参数Newbestc和Newbestg应当可以在前最优参数的附近区域找到,毕竟两者的训练集只有一个样本点的差异。显然,如果推测成立,则新的PSO搜索边界可在当前最优参数的基础上乘以一缩放因子获得。这样一是可以大幅缩小搜索空间从而提高优化效率,二是可保持优化过程的连续性和动态特性。通过上百次的测试发现,该算法可行且效果比较理想。以RBF核函数的SVR参数优化为例,其示意代码如下:

其中Bestc、Bestg为当前最优参数值,k1、k2、k3、k4为缩放因子,Cmaxnew、Cminnew、gmaxnew和gminnew为C、g参数新的搜索区间的上下边界。缩放因子的取值按实际情况选定,在我们的研究中,一般取k1=k3=1.5,k2=k4=0.5,测试效果较好。

1.2基于移动窗口的支持向量机回归

设以某种未知概率分布p(x,y)生成的样本集T={(x1,y1),…,(xl,yl)}∈(χ×y),其中xiχ=Rn,xiy=R,寻找一适当的实值函数f(x)=w.ϕ(x)+b来拟合这些训练点,使得期望风险R[f]=∫c(x,y,f)dP(x,y)最小,这就是支持向量回归,其中,c(x,y,f)为损失函数。与支持向量分类机yi∈{-1,1}取值不同,在支持向量回归中yi可以在整个实数范围内取值,即yiR

由于概率分布p(x,y)未知,因此无法直接求解minR[f],因此考虑最小化:

e(w)=12w2+ci=1l|yi-f(xi)|ε (4)

这里第一项表示函数f(x)的复杂性,第二项表示训练集上的总损失。引入参数C来度量平衡函数类的复杂性和训练集上损失的折中关系。这等价于求如下最优化问题:

按拉格朗日乘子法,可推出其对偶形式并最终得到其最优解α¯=(α¯1,α¯1*,α¯l,α¯l*)Τ

由于证券指数是一个动态变化的时间序列,随着时间的推移,样本数据也随之增加,导致训练时间也随之增加,加上参数动态优化的时间,使得回归模型的实时性能降低。因此,在基于SVM的在线学习与预测中,样本集的选择和淘汰策略是必须加以重点关注的。现在常用的样本选择策略是从非支持向量中选择样本进行淘汰,但这种策略对于指数预测而言却并不是十分恰当的,其原因在于:一是在在线学习中,随着新样本的加入,最优分类面会发生轻微变动,原来的非支持向量可能会成为支持向量;二是这种策略没有考虑样本在时间维度上的权重。而对于指数预测而言,样本数据时日的远近对近期指数预测的影响是不同的。有研究指出,当日指数只对随后最多八个交易日的指数产生影响,并且时日相距越远,影响越弱。除此之外,样本集大小的选择对SVM在线训练和预测的时间开销也有较大的影响。选择适当大小的样本集,可以减少训练时间,降低存储消耗,在一定程度上还能提高学习器的精度和准确率。

那么样本集如何确定呢?就理想情况而言,样本集大小应该是可随着市场的变化而动态调整的,类似参数动态优化一样。不过为了将问题简化,我们将样本集大小在整个训练和预测过程中保持不变,并根据证券指数本身的特点来减少样本选择上的时间消耗,样本集的淘汰策略直接采用先进先出的策略。这种策略可以形象地视为一个观察窗口在一个时间序列上的移动,在整个过程中,窗口大小不变,每新增一个样本数据,则淘汰一个最先的样本数据。上述过程用数学语言可简要表述如下:

设每日收盘指数构成的时间序列index=s1,s2,…,sn,以采样周期d生成样本集,其中输入向量和输出向量可以表示为:

xi=(si-1,…,si-d) yi=sii=1,…,l

这里l代表采样后的样本集大小。如设移动窗口大小为w,则由移动窗口策略,第T个交易日对应的训练集为:

Xt=(xt,…,xt-w+1) Yi=(yt,…,yt-w+1) t=w,…,l

对应的最优化问题变为:

min12(w.w)+Ck=tt-w+1|yk-f(xk)|ε (6)

该最优化问题可由前面所述的支持向量回归机算法求解。

2实证分析

2.1实证研究设计

本文采用500个交易日的沪深300收盘指数作为原始数据,以采样周期3生成输入向量,使用移动移动窗口技术和动态边界缩放的PSO参数优化方法,测试不同情况下的预测结果。对于预测结果的评价,我们综合多方面的考虑,采用以下的评判标准:

• 均方误差 其计算公式为ΜSE=1ni=1n(yi*-yi)2。该值衡量回归的拟合程度,得数越小越好,其中yi*表示预测值,yi表示真实值。

• 平均绝对偏差 计算公式为e=1ni=1n|yi*-yi|2。该值越小越好,其中yi*表示预测值,yi表示真实值。

• 预测方向的正确率 计算公式为Rate=1ni=1nwi,其中wi按如下定义:

wi={1(yi*-yi-1*)(yi-yi-1)00

该值表示预测值与实际值方向的一致性。

• 时间开销 每一次窗口移动(一次窗口移动包括参数寻优、训练、预测和训练集调整)或每一个新增样本所花费的时间,其计算公式为time=T/(L-wsize)。其中,T指本次训练所花费的总时间,L代表输入向量集的大小,wsize为移动窗口大小。

测试程序在Matlab 2008环境下编程实现,程序流程如图1所示。

2.2实验结果与分析

实验结果如下述各表所示。其中表1为基于边界缩放的动态优化和移动窗口的在线预测,表2为基于动态优化和移动窗口在线预测,表3为增量学习和移动窗口的在线预测的测试结果,其参数在预测过程中保持不变。从三个表可以看出,基于边界缩放的动态优化和移动窗口的在线预测在三个方面都要优于传统的增量学习和单一移动窗口方法,也优于基于动态优化和移动窗口在线预测。如同样采用移动窗口方法,基于边界缩放的PSO动态优化与传统PSO动态优化相比,其均方误差、平均绝对偏差都远小于后者,时间开销也较小。另外,从表1可以看出,随着移动窗口取值的增大,其测试结果有变差的趋势,特别是处理时间增长较快。多次测试结果显示,窗口的较佳取值范围在25~75之间。

为更直观地比较这几种方法的优劣,我们将部分测试结果绘制成图,如图2所示。

从图2可以清晰看出,基于边界缩放的动态优化并结合移动窗口的在线预测,其预测值和真实值体现出很好的一致性,而其余几种方法波动性较大,其中增量学习算法在一段时间后,预测值和真实值甚至出现急剧分离的现象。

3结语

支持向量机作为一种新的机器学习算法,现在已在包括金融投资等领域得到了广泛的应用。本文针对上证指数研究证券投资的指数预测问题,提出基于边界缩放的PSO动态优化和移动窗口相结合的新方法,取得较好的效果。但如何进一步提高预测的方向准确性,并将之应用于投资实践,是下一步要做好的工作。

参考文献

[1]周广旭.一种新的时间序列分析算法及其在股票预测中的应用[J].计算机应用,2005,25(9):217-218.

[2]林春燕,朱东华.基于Elman神经网络的股票价格预测研究[J].计算机应用,2006(2).

[3]Kim K J.Financial Time Series Forecasting Using Support Vector Ma-chine[J].Neurocomputing,2003,55(2).

[4]Nello Cristianini,John Shawe-Taylor.支持向量机导论(中文)[M].李国正,王猛,曾华军,译.北京:电子工业出版社,2004.

[5]邓乃扬,田英杰.数据挖掘中的新方法—支持向量机[M].北京:科学出版社,2004.

支持向量回归 第9篇

智能交流接触器是一种新型控制电器,采用直流起动、直流吸持的工作方式。在合闸过程优化中吸力与反力的配合关系特性,降低触头和铁心碰撞末速度,减小触头弹跳,具有节能、低噪、长寿命和可靠等优点[1,2,3,4]。近年来,交流接触器在电子控制电路、电磁机构设计与优化、动态特性仿真与分析、控制方法与技术等方面开展深入的研究[5,6,7,8],为交流接触器的智能化工作奠定了理论基础。仅就控制方法与技术而言,国内外学者提出了一些控制新方法,包括分段通断强激磁电路控制、弱磁控制、PWM控制等动态控制策略,其中PWM控制方式是讨论热点之一。文献[3,9]提出了不同的外加电压段(85%~110%额定电压范围内)对应不同的PWM调制占空比的方法,保持线圈供电电压保持不变,稳定接触器的工作性能。该方法在接触器吸合整个过程中维持PWM占空比不变。文献[8]提出了永磁式接触器吸合过程中位移分段PWM控制的策略。即根据接触器工作气隙的大小将动铁心位移分成五段,每段内的PWM占空比固定不变,不同位移分段之间的PWM占空比不同。通过电感位移传感器实时检测接触器吸合过程中位移量的变化,调用不同位移分段内的PWM占空比程序,实现最优运动特性下的吸合控制。该控制策略中没有对PWM控制模型开展研究,不能确定每个位移分段内和位移分段之间的最优PWM占空比取值。况且所采用的控制方法数据处理量大,操动实时性很难保证,所增加的电感式位移传感器改变了接触器的结构,不适合在电磁式交流接触器产品中应用推广。

为了保证控制操作简单和实时性,在此提出接触器吸合过程的PWM分时控制策略及参数优化方法。即根据预期吸合时间将吸合过程分为时间均等的三段(I段、II段和III段),用支持向量回归机(SVR)方法确定不同阶段的PWM占空比参数。该参数存放在微控制单元中,从而合理控制接触器线圈电压,在保证接触器可靠吸合的前提下,使触头闭合末速度和吸合时间最小,从而减小触头弹跳,提高接触器的电寿命和机械寿命。

1 PWM分时控制策略效果分析

选取研究样机为交流接触器CJX2-9511加装控制模块而形成的95A智能交流接触器。根据国家标准GB14048.4-2010规定,设定预期吸合时间为30 ms,并将控制模块吸合过程分成三段(I段、II段和III段),每段用时10 ms。通过实验结果比较分析:在PWM占空比固定的无分时控制方案和PWM分时控制方案下的智能交流接触器吸合动态特性差异(如:位移和速度量)。图1(a)和(b)分别给出了PWM占空比固定(为0.8)的无分时控制方案及PWM分时控制方案(I段、II段和III段分别为1,0.8,0.6)下的智能交流接触器吸合动态特性曲线。

对比图1(a)和(b)可知,采用PWM分时控制方案较PWM占空比固定方案的接触器吸合时间缩短,闭合末速度降低。这是因为PWM分时控制在吸合起始阶段及吸合运动初期,PWM的占空比为1,加载到电磁线圈上的电流大,吸力大,大大缩短了动铁心加速运动的时间。在吸合运动的中后期,PWM分时控制的占空比小于固定PWM控制的占空比,电磁吸力变小,吸合速度降低,闭合末速度较小。因此,在智能交流接触器中应用PWM分时控制策略简单、可行,能优化接触器吸合过程的动态特性。

2 基于SVR方法的PWM控制模型建立

目前,智能交流接触器PWM占空比参数的选取是根据随机试验方式确定[3,9,10],该方法局限于调试者的经验,容易造成局部最小值。本文通过试验手段测量接触器在不同PWM控制组合下的吸合时间和触头闭合末速度。由于吸合时间、触头闭合末速度与PWM控制组合之间存在不确定的非线性关系,传统的学习算法(如神经网络)采用经验风险最小化准则。在训练中最小化样本点误差,不可避免地出现过拟合的现象,而支持向量回归机采用结构风险最小化准则,能克服因最小化样本点误差带来的模型泛化能力降低的缺点,因此选用支持向量回归机的方法建立PWM控制模型,寻找PWM控制组合全局最优值。

2.1 SVR算法原理

支持向量回归机(SVR)是基于统计学习理论而发展起来的学习机器,特别适合于小样本数据的非线性函数拟合。其基本思想为:通过已确定的非线性映射φ(x)将处于低维特征空间R的输入向量x映射到高维特征空间H(Hilbert空间),并在这个空间进行线性回归[11]。给定n组样本数据(xi,yi),其中xi∈Rd(Rd为d维实数),yi∈R;i=1,2,…,n,回归的目标就是找到估计函数f(x)使其在精度ε下能逼近给定数据组{yi}。该回归估计函数可表达为:

其中:ωT∈H,表示拟合函数的法向量;φ(·):R→H;b表示阈值。

并且满足:

式中,yi表示向量输出;xi表示输入向量;ε表示不敏感度,用于控制回归逼近误差管道的大小,其值越大,精度越低,则支持向量越少,通常取值范围为(0.0001~0.01)。

由统计学习理论中结构风险最小化准则,回归估计函数f(x)在最小化时可取得较好的推广能力。因为在实际情况下允许样本存在逼近误差ξ,所以引入松弛变量ξi,ξi*,这样用于函数逼近的支持向量机可以表示为:

式中,C为惩罚因子,C>0,控制对超出误差ε的样本惩罚程度,通常取值范围为(1~1000);ξi,ξi*为引入的松弛因子,拟合曲线上方的松弛因子记为ξi,拟合曲线下方的松弛因子记为ξi*。为了简化非线性逼近求解过程,引入核函数k(xi,xj),并由拉格朗日函数和对偶定理,将式(3)变为:

式中,参数αi,αi*为拉格朗日乘子;核函数k(xi,xj)是对称正实数函数,且满足Mercer条件:范数。求解该式二次规划问题,可得:

常用的核函数包括线性核函数、多项式核函数、径向基核函数(RBF)和Sigmoid核函数[13]。核函数的选择需要一定的先验知识,若不具备先验知识,可优先使用径向基核函数(RBF)。

2.2 PWM控制模型建立

利用支持向量回归机对智能交流接触器PWM分时控制模型建立可分为以下几个步骤:(1)在程序中将接触器吸合过程分为时间均等的三段(I段、II段和III段),每段时间设定为10 ms。(2)设第I段、II段和III段的PWM占空比分别用β1、β2和β3表示,且0≤β1≤1,0≤β2≤1,0≤β3≤1。在(0~1)区间内等差地确定PWM占空比取值,等差间隔选定为0.2,建立大量样本输入向量。(3)根据PWM样本输入向量进行试验,记录接触器的吸合时间t和触头闭合末速度v。(4)建立SVR学习模型。首先设定模型参数,选择SVR的核函数k(xi,xj);其次利用凸优化的对偶理论,将式(4)转换为二次规划问题,求解出(αi-αi*)值,具体如下:

其中,αT=[αnT,αn*T],αnT=[α1,α2,…,αn],αn*T=[α1*,α2*,…,αn*],θn=[1,1,…,1]1×n,εn=[ε1,ε2,…,εn]1×n,Y=[y1,y2,…,yn]T,核矩阵Kn×n,且Ki,j=k(xi,xj)。再次,根据KKT条件,用下式求出b值:

其中,Nsv表示标准支持向量数量,SV表示支持向量集合。最后,根据所求得的(αi-αi*)和b值,拟合PWM分时控制模型。本文采用MATLAB软件编写了SVR程序,实现SVR建模过程。

3 试验结果对比与分析

以加装智能控制模块的交流接触器CJX2-9511为研究对象,使用LK-G500型激光位移测试系统测量接触器触头闭合末速度ve和吸合时间te。表1为220V输入电压,初始相位角为60°时,不同PWM占空比分时控制方案下的测试结果。表1中的PWM占空比组合以0.2为间隔遍历了所有可能的取值空间(为了使接触器性能指标最好,一般在接触器触动阶段加载全电压,即PWM占空比为1,所以表1中β1≥β2≥β3),采取这种方案的实验数据更具有一般性,适合作为训练样本,同理采用类似的方法选定测试数据样本。用2.2节所述方法建立SVR模型,通过优化设计,确定SVR模型中的参数:不敏感系数ε为0.01,惩罚因子C为300。SVR模型中的核函数选择径向基函数,即:k(xi,xj)=exp(-‖xi-xj‖2/(2σ2)),σ取值为5.2。由图2可知,所建立的SVR模型与训练样本之间吻合程度较好。

注:表1中“———”表示该组控制方案不可行,即接触器不能完成正常吸合动作

运用SVR模型对表2中测试样本数据进行预测,并与实际测试结果进行对比,如图3所示。其中vf表示接触器触头闭合末速度预测值,tf表示吸合时间预测值,ev和et分别表示触头闭合末速度和吸合时间预测的误差大小。由图3可知,该SVR模型能反映出接触器吸合动态参量值与PWM控制组合之间的内在规律。从试验结果来看,为了减小吸合时间和降低触头闭合末速度,可优先选取起始占空比大的组合方案。

4 结语

为了优化智能交流接触器的吸合动态特性,本文提出了PWM分时控制策略。根据预期吸合时间将吸合过程均分为三个时间段,每个阶段由不同PWM占空比控制,通过试验手段论证了PWM分时控制策略的可行性。为了克服PWM占空比参数选择的随机性,采用支持向量机回归方法研究不同PWM控制组合对触头闭合末速度和吸合时间影响的内在规律,建立PWM分时控制模型并优化模型控制参数。利用该模型对预测样本进行评估分析,对智能交流接触器控制方案的优化设计具有参考价值。

参考文献

[1]刘颖异,陈德桂,纽春萍,等.带电压反馈的智能接触器动态特性及触头弹跳的仿真与研究[J].中国电机工程学报,2007,27(30):20-25.

[2]汪先兵,林鹤云,房淑华,等.无位置传感器的智能永磁接触器弱磁控制及合闸动态特性分析[J].中国电机工程学报,2011,31(18):93-99.

[3]Shu L,Wu G,Zhu X,et al.Nonlinear magnetic field analysis for 3D electromagnetic contactors[J].International Journal of Applied Electromagnetics and Mechanics,2013,42(2):237-248.

[4]舒亮,吴桂初,朱翔鸥,等.基于偏微分弱解式方程的三维电磁力计算及其在接触器中的应用研究[J].中国电机工程学报,2013,33(6):176-182.

[5]许志红,张培铭.智能交流接触器动态吸合过程研究[J].中国电机工程学报,2007,27(18):108-113.

[6]纽春萍,陈德桂,李兴文,等.交流接触器触头弹跳的仿真及影响因素[J].电工技术学报,2007,22(10):85-90,108.

[7]郑鹏,张国钢,施磊,等.智能交流接触器动态仿真和实验研究[J].低压电器,2009(15):8-12.

[8]汪先兵,林鹤云,房淑华,等.永磁接触器位移分段PWM控制及吸合过程动态特性分析[J].中国电机工程学报,2010,30(3):113-118.

[9]米栋,尹泽勇,钱正明,等.基于试验设计及支持向量机的向心叶轮结构优化设计方法[J].航空动力学报,2012,27(10):2336-2341.

[10]孙林,杨世元.基于正交试验和支持向量机的参数设计方法研究[J].中国机械工程,2011,22(8):971-975.

支持向量回归 第10篇

自1997年云南省第一台300MW汽轮发电机组投厂以来, 省内所有300MW机组的阀门特性曲线一直延用汽轮机厂出厂时制定的特性曲线, 由于机组大修中各发电企业都对汽轮机的阀门进行检修, 阀门行程多少都有调整, 造成了阀门的流量特性出现改变, 但都没对特性曲线进行试验修正, 继续使用原来的特性曲线。上述情况都易引发汽轮机调速器失稳事故发生。2008年发生在云南电网的“4.2 1”电网低频振荡事故即是一起典型的发电机调速器失稳引发系统功率振荡。因此, 需通过对阀门原有的配汽曲线进行校正, 使阀门开度指令与蒸汽流量呈线性关系, 一方面保证了机组一次调频品质, 避免了一次调频时可能出现负荷突变和调节缓慢的问题, 另一方面避免了机组在单顺阀切换过程中因出现负荷波动而导致电网低频振荡事故发生。

本文里, 机组的阀门运行数据取自云南省威信电厂新建2*600MW火电机组的阀门历史数据, 因为这些数据来自于机组升负荷试验过程的历史库数据, 因此它反应了运行状况的真实性, 对本文接下来要做的阀门原有配汽曲线的辨识与校正提供了有力的数据支撑。

2 LS-SVM的统计学原理[1]

最小二乘支持向量机 (LS-SVM) 用于解决分类和函数估计问题, LS-SVM的回归算法是LS-SVM在回归学习中的应用, 它的优点是简化了运算算法, 提高了学习速度, 增强了数据拟合精度, 但是它是以支持向量机解的稀疏性损失和鲁棒性下降为代价的[7]。

考虑一般的情况, 用非线性的回归函数

来估计训练样本集

其中, xk∈Rn为输入数据, yk∈R为输出数据, w为权向量, b为偏差量。

LS-SVM的函数估计问题可以转化为求解下面问题:

其中, ek∈R, 为误差变量;γ>0为规则化参数, 能够使训练误差和模型的复杂度之间取一个折中, 以便使所求的的函数具有较好的泛化能力。

训练样本集D中所有的N个样本 (xk, yk) 都应当满足一下约束条件:

式中, ϕ (•) :Rn→Rh是将原始空间映射到一个高维Hilbert特征空间的核空间映射函数, 它的目的是从原始空间中抽取特征, 将原始空间中的样本映射为高维特征空间中的一个向量, 以解决原始空间中先行不可分的问题。

根据式 (2) 和 (3) 定义拉格朗日函数:

式中, αk≥0为朗格朗日乘子。

分别对w, b, ek, αk求偏导数, 并另它们等于0, 有

消除变量w和e, 可得以下矩阵方程:

式中,

如果是可逆的, 则参数a和b的求解公式为, 根据Mercer条件, 存在映射函数ϕ (•) 和核函数K (•, •) [8], 使得

因此, 将式 (4) 和 (5) 代入式 (1) , 得到LS-SVM的回归函数为:

3 汽轮机高调门的原有配汽曲线的系统辨识

3.1 配汽原理[2,3]

威信发电机组汽轮机的高调门指令形成控制原理如图1所示, 流量指令FDEM可在机组负荷控制时由运行人员手动给定, 也可由功率调节器运算产生。单阀方式下, 流量指令均分至4只高压调节阀上, 顺阀方式下, 汽轮机的流量指令 (FDEM) 经过背压修正、比例偏置修正、CV流量修正、CV流量开度函数修正后, 产生各个CV的开度指令。为提高机组负荷响应能力, 机组采用顺序阀进行, 阀门开启顺序设置为CV4开启后, CV2、CV3 (曲线参数设置相同) 同时打开, 最后开启CV1的顺序依次开启各阀门, 关闭顺序与此相反。

在这里, 我们不妨将上述配汽过程简化做一个具有非线性特性的整体 (如图2所示) , 其输入为流量指令 (总阀位给定) , 经过配汽曲线后按阀门开启顺序将阀位指令分配至每只高压调节门上, 其输出为实际的主蒸汽流量。

3.2 数据采样

我们选取机组从0负荷升至满负荷过程的阀门数据库历史数据, 采样间隔以1 0 M W为宜, 采样数据重点选择以下测点:蒸汽流量、功率、总阀位给定、4只高调门的阀位反馈、主汽压、主汽温、调节级压力。由于采样点众多, 只选取部分数据 (如表1所示) 。

3.3 验证阀门非线性

为验证阀门非线性 (即流量指令-蒸汽流量具有非线性特性) , 我们用最小二乘支持向量机 (LS-SVM) 的回归算法回归其非线性特性 (如图3所示) 。

由图3可以看出, 阀位给定在70%之前, 曲线呈非线性关系, 机组调整较为缓慢, 无法达到快速性的要求, 另外, 该区段的负荷主要应由CV4和CV2/3贡献, 而CV4和CV2/3开度较缓是造成该区段负荷对总阀位指令的响应较缓慢的主要原因;阀位指令在70%~92%之间时, 曲线呈现良好的的线性关系, 但坡度较大, 在此区段机组调整可以满足快速性的要求, 但稳定性不好, 容易引起负荷抖动。

3.4 阀门原有配汽曲线的系统辨识

将图1所示的配汽过程当做“黑箱”, 其输入为流量指令 (总阀位给定) , 输出为4个高调门的阀位反馈, 通过表1多次测量得到的系统的输入输出数据来求得一个与所测系统等价的模型, 即阀门原有的配汽曲线, 这里我们用最小二乘支持向量机 (LS-SVM) 的回归算法回归其配汽过程 (如图4所示) 。

4 汽轮机高调门的原有配汽曲线的校正

4.1 校正原理

前面已经验证了阀门的非线性特性, 为消除其非线性特性, 我们在图2的基础上加入非线性补偿环节[6] (如图5所示) , 由补偿环节叠加原有配汽曲线之后形成阀门新的配汽曲线。

4.2 数据处理

从上图可以看出, 我们是用加入的补偿环节将阀门系统原有的非线性特性补偿为线性特性的。具体补偿过程如下:以图3中的起点 (8.9 3 9, 0) 和终点 (9 2.3 1 2, 1 7 3 8.4 5 2) 两点为顶点, 在此区间根据线性化方程y=kx+b对总阀位给定做线性化处理[4,5]。

由222.216=kx+b, 得到蒸汽流量y为222.216t/h时, 将修正前的总阀位给定x=60.186%补偿为=19.596%

由264.39=kx+b, 得到蒸汽流量y为264.39t/h时, 将修正前的总阀位给定x=62.554%补偿为=21.619%

由731.551=kx+b, 得到蒸汽流量y为731.551t/h时, 将修正前的总阀位给定x=78.13%补偿为=44.023%

经过上述对全程总阀位给定做线性化处理, 得出修正后的总阀位给定对应主蒸汽流量及各阀门反馈的关系 (如表2所示) 。

4.3 阀门新的配汽曲线的系统辨识

表2中, 修正后的总阀位给定对应各阀门反馈的关系正是阀门校正后的新的配汽曲线, 通过最小二乘支持向量机 (LS-SVM) 的回归算法再次回归其配汽过程之后, 得到阀门新的配汽曲线 (如图6虚线所示, 实线为原有配汽曲线) 。

根据图6, 不难看出, 校正后的曲线有如下改动:

(1) CV4、CV2/3、CV1阀门开启较优化前早, 在低负荷段都参与了功率调节。

(2) 在高负荷段, 4只阀门的开启幅度较优化前减小了, 一定程度上避免了高负荷段的主蒸汽流量及负荷发生突变, 使功率调节满足快速性的同时, 也是机组调整更为平稳。

5 结束语

目前国内对阀门流量特性曲线的优化重视不够, 开展阀门流量特性曲线优化试验的案例不多, 试验的内容也不全面, 基本以查找后开的调节阀门重叠度为主要内容。另外, 需要特别注意的是, 因单阀/顺阀切换过程中各调门线性化计算及处理的复杂性, 在几大汽机厂设计的D E H控制逻辑中, 均存在着非线性化环节的问题, 需完善之处。本文通过对威信电厂升负荷试验中产生的阀门历史数据进行分析并处理, 提出了在阀门管理程序里加入非线性补偿环节的方法, 对原有的阀门流量特性曲线进行校正, 调整了阀门管理程序里的特性曲线与实际相符, 提高了阀门管理的线性化水平, 优化调节系统品质的同时也提高机组运行经济性和稳定性;另外机组负荷、主汽温度、主汽压力、振动等参数变化量更小, 保证了机组安全稳定地运行。

参考文献

[1]邓乃扬, 田英杰.数据挖掘中的新方法-支持向量机[M].北京:科学出版社, 2004:23-34.

[2]胡文斌.300MW汽轮机DEH系统阀门管理的研究[J].上海电力学院学报, 2003, 19 (3) :17-20.

[3]武海澄, 施壮, 张兴.DEH单顺阀切换控制参数的试验研究[J].吉林电力, 2010, 38 (4) :20-23.

[4]高亚杰, 阚玉英.基于历史数据分析的汽机调门曲线优化[J].华北电力技术, 2012, 28 (10) :35-40.

[5]赵卫正.多工况条件下汽轮机DEH阀门控制性能分析及优化[D].上海交通大学, 2012:41-60.

[6]朱蓬勃.某600MW汽轮机DEH系统阀门管理环节的改进[D].东北电力大学, 2007:7-37.

[7]张浩然, 韩正之, 李昌刚.基于支持向量机的未知非线性系统辨识与控制[J].上海交通大学学报, 2003, 37 (6) :927-930.

上一篇:嵌入式计算机系统模块下一篇:电子屏蔽设备