非线性自适应控制

2024-07-05

非线性自适应控制(精选9篇)

非线性自适应控制 第1篇

本文总结了Backstepping设计方法的基本理论, 并对当前利用Backstepping控制思想对非线性时滞系统控制的研究、存在的不足及未来发展方向加以具体综述, 同时给出了简短评述。

1 自适应Backstepping控制

Backstepping控制思想的出现在20个世纪七八十年代, 但形成一种系统的控制器设计方法却是在90年代, 以Kokotovic等人的著作[2]为代表, 它主要用来解决一类不再满足“匹配条件”的所谓下三角结构系统的控制问题。下三角结构系统的典型代表是如下所述的严格反馈系统[2]:

其中, x, y, u分别表示系统状态、系统输出和控制输入, 为光滑函数, 为光滑增益函数。Backstepping控制理论的核心思想可简述如下[12]:对系统中的第i个方程, 构造合适的Lyapunov函数, 继而设计稳定化函数αi, 其作用是让式中前i个方程稳定, 这样在第n步, 可以得到让n个方程稳定的控制器u, 也就是使整个闭环系统稳定的控制器。

作为一种新型的控制理论, Backstepping控制方法一经提出, 就受到广泛的关注。这种方法有两个特点, 一个是它的出现, 克服了非线性控制中所谓的“匹配条件”的约束, 因而成为非线性控制史上的一个重要突破;另一个是这种方法具有系统化的控制器构造方法和Lyapunov函数构造方法, 克服了以往在应用Lyapunov稳定性理论时, 不易寻找到合适Lyapunov函数的困难。许多的实际系统本身就具有这种结构, 如倒立摆系统、CSTR (连续搅拌反应釜) 等, 此外, 很多非线性系统经过一定的微分几何条件, 可以转化为这类系统, 因此, Backstepping控制的应用范围是相当广的。

由于对控制要求的不断提高, Backstepping设计方法也在不断进步中。如文献[3]将[2]的结果推广到了对象高频增益gi (x i) 符号未知的情形;[4]讨论了当存在未建模动态和外干扰时该方法的鲁棒性问题;[5]将此方法推广到时变系统, 并对闭环系统稳定性进行了讨论;[6]则对线性时变系统设计了一类鲁棒自适应Backstepping调节方法;[7]将此方法推广到多变量 (MIMO) 系统, 给出了收敛性和稳定性的证明, 但能否改善系统的跟踪误差品质还需进一步研究。结合Backstepping控制与传统规范化方法的优点, 文献[8]提出了一种新的自适应Backstepping方案。较之[2], 该方案控制律稍显简单, 并获得了类似的性能结果。此前, 一般认为Backstepping控制可改善过渡过程性能恰恰在于放弃了规范化自适应律, 但[8]的研究却表明它们并非相互排斥, 从而指出了另一条可能的研究途径。

2 非线性时滞系统的自适应Backstepping控制

在自动控制问题中, 当受控对象状态发展变化的趋势不仅依赖于当前的状态, 还依赖于过去的历史状况时, 时滞就会出现在系统模型中。长期以来, 时滞系统的建模和控制问题的研究一直受到人们的关注。可用Backstepping设计思想处理的一类典型的时滞非线性系统可用下式表示:

由于系统中存在时滞, 因此针对时滞系统设计出来的控制器就可能是依赖于时滞的, 即有记忆性的。文献[9]采用了依赖于时滞的状态观测器, 研究了一类非线性时滞系统的输出反馈控制问题。控制器的记忆性, 体现在控制量u同现在时刻以前的状态有关, 但往往我们并不能知道u应该同以前多长时刻的状态都有关系, 比如时滞未知的情况, 因此需要构建不依赖于时滞, 即无记忆的时滞控制器。

构建无记忆时滞控制器的一个有效的办法是进行变换。因为目标函数是已知的, 我们可以设法将未知函数的时滞转换为目标函数的时滞。举个例子来说, 假使系统中的时滞函数ih仅与系统输出1y=x有关, 即时滞函数为 ( () ) iih y t-τ。我们可以将时滞 ( () ) if y t-τ项转换为 ( () ) rif y t-τ, 在构建控制器的时候, 采用信号 ( () ) rif y t-τ而不是 ( () ) if y t-τ。由于 () riy t-τ可以由目标轨线ry直接在线获得, 因此设计的控制器是无记忆的。

然而上述变换之后, 系统中会留下另外的一个时滞项Λ=f (y (t-τi) ) -f (y r (t-τi) ) , 如何处理这个时滞项成为时滞系统控制器设计的关键和难点。依现有文献来看, 一般是在自适应Backstepping设计过程中, 在构造的Lyapunov函数中增加一个定积分项∫tt-τS (σ) dσ, 在Lyapunov函数求导的过程中用于抵消时滞项。Λ这时, 构建的Lyapunov函数因其中含有上述积分项, 而被称为Lyapunov-Krasoviskii泛函。文献[10-15]均依据上述方法, 对含有时滞的系统进行了研究。

文献[10]针对一类严格反馈非线性时滞系统提出了一种镇定算法。但结果证明是有误的[11]。在非线性函数满足Lipschitz条件的假设下, 文献[10]中的问题得到了解决[12]。不过当文献[10]的思想用于输出反馈非线性时滞系统却是成功的[13,14,15]。然而以上文献[10,11,12,13,14,15]都对时滞函数做了一些限制条件, 例如, 时滞项被已知的上界函数界定[10,14,15], 时滞项满足Lipschitz条件[12], 时滞已知[13]。文献[14]针对一类具有仿射系统结构的非线性时滞输出反馈系统, 设计了无记忆的自适应控制器, 但要求时滞函数矩阵的第一行为零。文献[15]将Backstepping设计方法延伸到了一类未知非线性时滞关联大系统中。

3 目前存在的问题和研究方向

从上述的讨论可以看出, 尽管在非线性时滞系统控制, 已经取得了诸多成果, 但仍然存在许多需要完善的地方, 主要包括以下几个方面。

(1) Backstepping方法在被控对象阶数增加的时候, 其非线性控制律的复杂性会大大增加, 在飞机、导弹等多变量的非线性控制研究中, 其计算量往往是机载计算机难以承受的。文献[16]通过在控制律中引入过滤器的方法, 使得Backstepping控制律的复杂度有所降低。如何将这一方法引入到不确定非线性时滞系统中, 也是一个很有现实意义的课题。

(2) 现有的研究结果对系统中仅含输出时滞的情况, 可以得到较为有效的控制器。但是, 如果系统的状态中含有时滞, 或部分状态中含有时滞, 则较难处理, 现有结果往往是基于对系统中的非线性函数做出种种限制。如何消除这些限制, 是当前这一领域研究的难点之一。

4 结语

非线性自适应控制 第2篇

讨论了飞行器纵向攻角控制方法.攻角的状态方程中存在时变参数和外部扰动不确定性.基于自适应反演控制技术的.迭代设计方法可以保证闭环系统一致最终有界.仿真结果证明了此方法的良好效果.

作 者:郭法涛 王晓予 关成启 Guo Fatao Wang Xiaoyu Guan Chengqi 作者单位:郭法涛,关成启,Guo Fatao,Guan Chengqi(中国航天科工集团公司第三研究院,北京,100074)

王晓予,Wang Xiaoyu(第二炮兵装备部,北京,100085)

非线性自适应控制 第3篇

自1982年Billings等提出NARMAX模型[1]以来,针对于NARMAX模型的辨识和控制问题的研究已形成Billings学派,因人工神经网络可逼近任意非线性系统,已提出许多控制算法,采用多模型逼近NARMAX模型的多模型自适应控制算法,我国学者韩志刚,侯忠生提出的无模型控制,各种采用时变线性模型逼近NARMAX模型的控制算法,采用动态切平面逼近NARMAX模型的控制算法等。文献[2]给出的基于一步时滞情形的NARMAX模型的最小预测误差自适应预测控制器的准则函数具有局限性,致使算法存在稳态偏差,文献[3]对文献[2]的准则函数进行改进,所提出的控制算法无稳偏,文献[4]研究了NARMAX模型的多重时滞情形,文献[2,3,4]的算法只适用于确定性情形,本文研究多重时滞随机性NARMAX模型的自适应预测控制问题。

2 一类非线性随机系统的NARMAX模型

Billings等提出NARMAX模型:

y(t+d)=f[Y(t+d-1),Y(t),U(t),U(t-1),ξ(t+d),θ]其中:y(t)为系统输出,y(t)∈R1;U(t)为系统的m维输入,U(t)∈Rm;ξ(t)为系统干扰量,ξ(t)∈R1;Y(t+d-1)为系统t+1时刻至t+d-1时刻输出的集合;Y(t)为系统到t时刻为止的输出的集合,U(t-1)为系统到t-1时刻为止的输入的集合;ξ(t+d)为系统止t+d时刻的干扰量的集合;θ为未知参数;d为系统时滞,f(…)表示一般的非线性函数。因ξ(t)一般是无法测量的,故其在f(…)中出现的形式难以确定,所以上式NARMAX模型实用性差,这里将NARMAX模型的各种随机干扰等效在系统的输出端,当等效的干扰为平稳随机序列时,基于文献[5]线性滤波和谱分解定理及成型滤波器原理构成一非线性随机系统模型:

其中:η(t)为平稳随机序列,且

其中:e(t)为零均值,方差为σ2的白噪声序列,而

这里假设n2,nc已知,A2(q-1)和C(q-1)为稳定多项式。

3 四个假设条件

假设1:系统(1)式输入输出可观测的,可控制的,即对某一系统有界的期望输出信号,存在有界的可行控制输入信号,使得系统在此控制输入信号的驱动下,其输出等于系统的期望输出。

假设2:f(…)关于Y(t+d-1)及U(t)的偏导数是连续的,且各偏导数有界。

假设3:由泰勒展开公式,在工作点Y0(t+d-1),U0(t)处用线性的动态切平面去逼近一般的非线性系统式(1)时,假设有:

其中:

这里,假设3中的y0(t),U0(t)一般可为:

其中:0≤α≤10≤αi≤1i=1,2,…,m假设4:d、n2、nc,已知。

假设1-3对多数非线性系统成立的分析见文献[4]。

4 动态切平面逼近非线性系统

在工作点Y0(t+d-1),U0(t)处对式(1)的非线性系统用动态切平面逼近,由一阶泰勒展开公式得:

其中:

整理写成,

其中:

这里,D(t)在t时刻是一个已知的量。

将式(2)代入式(8)整理得:

A(q-1)y(t+d)=A2(1)D(t)+A2(q-1)准uT(t)U(t)+C(q-1)

其中:

5 广义最优预测

对于式(12),定义辅助输出s(t+d)为,

其中:

定义s赞(t+d/t)为基于时刻及其以前的信息对t+d时刻s(t+d)的预测,令预测误差s軇(t+d/t)为:

可用如下引理阐述广义最优预测:

引理1:广义最优预测,满足预测误差方差,

为最小的最优预测s赞(t+d/t)和最优预测误差s軇(t+d/t)分别为:

其中:G(q-1)、F(q-1)满足以下阿斯特罗姆恒等式,

式中:

ng=max{na-1,nc+np-d}

证明:参考文献[6]可证。

6 自适应预测控制算法

6.1 预测控制算法

控制输入准则函数为,

J[U(t)]=E{[P(q-1)y(t+d)-R(q-1)y觶(t+d)]2

其中:y觶(t+d)为系统期望的输出,而

定理1:对于非线性随机系统式(1),满足假设条件1-4,基于式(24)控制输入准则函数的预测控制器算法为:

其中

证明:参考文献[2、3、4、6]证明如下:

上式等价于如下准则函数:

由式(19)得:

整理得:

得:

可得:

参考文献[7]的矩阵反演公式得:

6.2 自适应预测控制算法

当式(1)模型参数未知时,可采用文献[8]的非线性参数估计算法估计其值,结合引理1的广义最优预测算法和定理1的预测控制算法,构成自适应预测控制。

7 仿真研究

已知系统的形式为:

其中:θ1,θ2,a1的真值为:

U0(t),y0(t)选取如下:

参考输入为:

白噪声,

e(t)~(0,1/402)参考文献[3,4]的鲁棒控制策略,使系统无稳偏,且控制输入收敛于以原点为中心的变化域内,

切换条件:ε=0.2,δ=0.2

采用文[8]的参数估计算法,仿真结果如图1、图2、图3所示。由图1可知系统的输出响应曲线在0≤t≤100时不理想,这是由于算法开始时系统未知参数偏离其真值过大造成的,但系统能稳定运行,说明算法的鲁棒性好。

8 结束语

文中研究了一类非线性随机系统的控制问题,所提出的模型较Billings等提出NARMAX模型具有实用性,控制算法适用于时变随机系统,且系统无稳态偏差,控制输入收敛于以原点为中心的变化域内,具有应用参考价值,进一步可研究其自适应广义预测控制算法和多变量情形。

摘要:根据线性滤波和谱分解定理及成型滤波器原理构成一非线性随机系统模型,结合在工作点处用线性的动态切平面逼近一般非线性系统的方法,基于准则函数和广义最优预测算法,采用NARMAX模型的非线性递推参数估计算法辨识未知参数,提出一种自适应预测控制算法,仿真研究验证了算法的有效性。

关键词:自适应控制,非线性随机系统:预测控制,广义最优预测,动态切平面

参考文献

[1]Billings,S.A.,and Leontaritis,I.J.Parmeter estimation tech-niques for nonlineat systems[J],6th IFAC Symp.Ident,and Syst.Par.Est.,1982:427-433.

[2]侯忠生.非参数模型及其自适应控制[M].北京:科学出版社,1999,98-101.

[3]侯晓秋.非线性确定性系统的鲁棒自适应控制器[J].黑龙江科技学院学报,2003,13(2):54-57.

[4]侯晓秋.多重时滞非线性系统的自适应预测控制[J].黑龙江科技学院学报,2008,18(2):137-139.

[5]韩曾晋.自适应控制[M].北京:清华大学出版社,1995.70-76.

[6]Clarke D W,Gawthrop P J.Self-tuning controller[J].Proc.IEE,1975,122(9):929-934.

[7]方崇智,萧德云.过程辨识[M].北京:清华大学出版社,1994.146-147.

自适应控制学习心得 第4篇

在八周的自适应控制学习中,我了解了自适应控制的基本概念和定义,自适应控制的原理和数学模型以及发展状况。其中,老师重点给我们讲了李亚普诺夫稳定理论设计MRAC系统和MIT方案,波波夫超稳定理论设计MRAC系统和MIT方案和自校正控制系统。虽然这些理论知识掌握的不是很牢固,理解的也不够透彻,但是这为我以后的学习和实践奠定了一定的基础。

自适应控制的定义:(1)不论外界发生巨大变化或系统产生不确定性,控制系统能自行调整参数或产生控制作用,使系统仍能按某一性能指标运行在最佳状态的一种控制方法。(2)采用自动方法改变或影响控制参数,以改善控制系统性能的控制。

自适应控制的基本思想是:在控制系统的运行过程中,系统本身不断的测量被控系统的状态、性能和参数,从而“认识”或“掌握”系统当前的运行指标并与期望的指标相比较,进而做出决策,来改变控制器的结构、参数或根据自适应规律来改变控制作用,以保证系统运行在某种意义下的最优或次优状态。

按这种思想建立起来的控制系统就称为自适应控制系统。自适应控制是主动去适应这些系统或环境的变化,而其他控制方法是被动地、以不变应万变地靠系统本身设计时所考虑的稳定裕度或鲁棒性克服或降低这些变化所带来的对系统稳定性和性能指标的影响。好的自适应控制方法能在一定程度上适应被控系统的参数大范围的变化,使控制系统不仅能稳定运行,而且保持某种意义下的最优或接近最优。

自适应控制也是一种基于模型的方法,与基于完全模型的控制方法相比,它关于模型和扰动的先验知识比较少,自适应控制策略可以在运行过程中不断提取有关模型的信息,自动地使模型逐渐完善。

李亚普诺夫稳定理论设计MRAC系统和MIT方案的学习中,如果要设计一个关于李雅普诺夫函数的MRAC系统。首先构造出系统的李亚普诺夫函数,然后用李雅普诺夫稳定性理论的设计方法,能够成功地设计稳定的模型参考自适应系统。在这一章的学习中,理解李亚普诺夫稳定性理论和构造系统的李亚普诺夫函数是重点。

超稳定性概念是波波夫于六十年代初研究非线性系统绝对稳定性时发展起来的。当时,波波夫对某种类型的非线性系统的渐近稳定性问题,提出了一个具有充分条件的频率判据,对研究的这类非线性系统的稳定性提供了比较实用的方法。波波夫所研究的这类非线性系统,是由线性时不变部分与非线性无记忆元件相串联而构成的反馈系统。波波夫超稳定性理论来设计模型参考自适应系统,它可以给出一族自适应规律,并且有一整套设计理论。因此,有利于学习掌握这种自适应控制的设计方法和结合实际系统灵活选择适当的自适应控制规律。

自校正控制系统又称为参数自适应系统,它源于随机调节问题,该系统有两个环路,一个环路由参数可调的调节器和被控系统所组成,称为内环,它类似于通常的反馈控制系统;另一个环路由递推参数估计器与调节器参数计算环节所组成,称为外环。自校正控制系统与其它自适应控制系统的区别为其有一显性进行系统辨识和控制器参数计算(或设计)的环节这一显著特征。自校正控制的思想是将在线参数估计与调节器的设计有机的结合在一起。自适应控制常常兼有随机性、非线性和时变等特征,内部机理也相当复杂,所以分析这类系统十分困难。目前,已被广泛研究的理论课题有稳定性、收敛性和鲁棒性等,但取得的成果与人们所期望的还相差甚远。

在传统的控制理论与控制工程中,当对象是线性定常、并且完全已知的时候,才能进行分析和控制器设计。无论是采用频域方法还是状态空间方法对象一定是已知的。这类方法称为基于完全模型的方法。在模型能够精确的描述实际对象时,基于完全模型的控制方法可以进行各种分析、综合,并得到可靠、精确和满意的控制效果。因此,在控制工程中,要成功设计一个良好的控制系统,不论是通常的反馈控制系统或是最优控制系统,都需要掌握好被控系统的数学模型。

然而,有一些实际被控系统的数学模型是很难事先通过机理建模或离线系统辨识来确知的,或者它们的数学模型的某些参数或结构是处于变化之中的。对于这些事先难以确定数学模型的系统,通过事先鉴定好控制器参数的常规控制难以应付。

面对这些系统特性未知或经常处于变化之中而无法完全事先确定的情况,如何设计一个满意的控制系统,使得能主动适应这些特性未知或变化的情况,这就是自适应控制所要解决的问题。

自适应控制技术在20世纪80年代即开始向产品过渡,在我国得到了较好的推广应用,取得了很大的经济效益。且理论研究也有一些开创性的成果。但总的来说推广应用还很有限,主要是由于其通用性和开放性严重不足。

虽然现已能设计出安全、有效、稳定、快速且现场操作比较简单的自适应控制系统,但今后较长一段时期内,相对简单实用的反馈、反馈加前馈或其他一些成熟的控制技术仍将继续占据实际应用的主流。

自适应控制理论必须有新的突破,才能在工程应用中对PID控制等传统方法取得显著的优势,结合人工智能技术,尤其是神经网络技术与模糊理论,或许是最终实现这一远景的可能途径。

非线性自适应控制 第5篇

自适应控制的基本思想是:在控制系统的运行过程中,系统本身不断地测量被控系统的状态、性能和参数,从而认识或掌握系统当前的运行指标并与期望的指标相比较,进而做出决策,来改变控制器的结构、参数或根据自适应规律来改变控制作用,以保证系统运行在某种意义下的最优或次优状态。自适应控制系统主要由控制器、被控对象、自适应器及反馈控制回路和自适应回路组成。与常规的反馈控制系统比较,自适应控制系统有三个显著特点:控制器可调,增加了自适应回路,适用对象。因设计的原理和结构的不同,自适应控制系统大致可分为如下几种主要形式:变增益控制、模型参考自适应控制系统、自校正控制系统。本文研究针对非线性控制中出现的一些问题,提出一种基于单位分解的变结构自适应控制,利用单位分解作为万能逼近器的设计思想逼近非线性系统的未知函数,有效地减少自适应律个数和解决系统变量个数增加而导致的维数灾难问题。这种设计方法一方面有效抵消的外部干扰,另一方面也较好解决了传统模糊自适应控制带来的维数灾难问题。

1 问题描述

考虑如下n阶非线性系统:

在稳定性理论,最优控制,实现理论以及逼近性问题等工程方面Lyapunov矩阵方程有着重要作用[2]。设矩阵对(A,B)可控,存在1×n阶矩阵K使A-BK是Hurwitz矩阵,且对于任意给定的正定矩阵Q,如下Lyapunov方程有惟一正定矩阵解P:

系统干扰d(X,t)存在未知上界D:

对∀x∈Rn,有g(X,t)≠0。不失一般性,假定g(X,t)>0。参考信号是连续有界的,即:

本文的设计思路是将单位分解的理念用于自适应鲁棒控制设计中,首先使闭环系统的所有变量一致有界,其次系统输出与有界参考信号的跟踪误差收敛到零点附近的一个很小范围内,即:

2 基于单位分解的自适应跟踪控制设计

式中:

针对非线性系统(1),提出如下控制律:

令ω为系统的最小逼近误差:

根据单位分解的万能逼近性原理,可以得到最小逼近误差存在上界[4,5],记是Ω的估计值。

给出比例-积分反馈结构

通过PI反馈控制器克服由抖动现象带来系统不稳定的问题。具体分为两个阶段,当系统的状态不在滑模面时(|ETPB|>Φ)时,利用变结构控制迫使使系统状态进入滑模面;当系统的状态落在滑模面|ETPB|�Φ,PI自适应控制器生效,使得系统的状态变量跟踪上参考信号[6]。

考虑系统(1),如果假定式(1)~式(4)成立,则非线性控制器式(7)和自适应律式(12)~式(15)的共同作用下,闭环系统的所有变量一致有界,输出跟踪误差渐近收敛到零点的一个小领域内。其中常数ri>0,i=1,⋯,4。

3 仿真

考虑下列2阶倒立摆系统[7]:

式中:x1,x2分别为倒立摆的角度和角速度,x1=θ(单位:rad),x2=θ̇(单位:rad/s);加在小车上的控制力为u(单位:N);g为重力加速度,g=9.8 m/s2;小车的质量mc=0.1 kg;支杆的质量m=0.1 kg;支杆的长度l=0.5 m;d(t)是系统的外部干扰。

在该仿真中,选取的参考信号为xd=(π/30)sin t,系统的外部干扰为d(t)=αcos(2πbt),其中增益α=4,10和频率b=25。

其中自适应律的初值随机在区间[0,1]上选取。

仿真1:仿真系统在干扰项d(t)=4 cos(50πt)的情况下,两种控制算法的仿真结果如图1,图2所示。

图2是图1的局部放大图,从图2中,可以看到在6.5~8 s这段时间内,PU控制的收敛速度明显优于FLS控制。

仿真2:外部干扰选择d(t)=10 cos(50πt),其仿真结果如图3,图4所示。

干扰的强度比前面有所增加,但单位分解自适应控制器同样保持较好的跟踪能力,同样图4是图3的局部放大图,从仿真的结果可以看出PU控制仍然保持较快的收敛速度。

4 结语

本文针对传统模糊自适应控制的维数灾难问题,提出了一种基于单位分解的的自适应控制方案。方案选用单位分解逼近非线性系统中的不确定项,用较少的开覆盖完成控制目标,是自适应机构在一定程度上得到简化,节省了控制算法的计算量。同时,该控制方法解决了由于变结构控制带来的抖动问题,以及有效地抵抗了外部干扰。倒立摆控制的仿真结果表明了所提出方案的实用性和有效性。

摘要:为了处理闭环系统遇外界强干扰时出现不稳定的问题,提出一种非线性系统自适应跟踪控制设计方案该设计方法。主要利用比例和积分结构,这种结构将系统中不确定项由单位分解逼近,同时这种结构的鲁棒跟踪控制器也使系统在干扰波动影响下保持很好的跟踪效果。其结果使闭环系统所有的状态与跟踪误差收敛到原点的一个很小的范围,通过仿真实验表明这种控制器设计可行并且有效。

关键词:单位分解,非线性系统,PI控制,模糊逻辑,自适应跟踪控制器

参考文献

[1]CHEN Z,HUANG J.Attitude tracking and disturbance rejection of rigid spacecraft by adaptive control [J].IEEE Transactions on Automation Control,2009,54(3):600-605.

[2]HOU M.Estimation of sinusoidal frequencies and amplitudes using adaptive identifier and observer [J].IEEE Transactions on Automation Control,2007,52(3):493-499.

[3]罗亮.基于单位分解的非线性不确定系统模糊自适应镇定与跟踪控制分析[D].广州:广东工业大学,2011.

[4]唐功友,马慧.具有正弦扰动的时滞系统前馈-反馈次优控制:灵敏度法[J].自动化学报,2006,32(5):722-729.

[5]WANG Y N,YUAN X F.SVM approximate-based internal model control strategy [J].Acta Automatica Sinica,2008,34(2):172-179.

[6]LI L J,SU H Y,CHU J.Generalized predictive control with online least squares support vector machines [J].Acta Automatica Sinica,2007,33(11):1182-1188.

[7]WANG M,CHEN B,LIU X P,et al.Adaptive fuzzy tracking control for a class of perturbed strict-feedback nonlinear time-delay systems [J].Fuzzy Sets and Systems,2008,159(8):949-967.

[8]王宝忠,薛玮珑,许林军.基于模糊PI的异步电机矢量控制系统仿真[J].现代电子技术,2011,34(7):186-189.

非线性系统的自适应模糊控制器设计 第6篇

1 模糊控制器的设计

n阶非线性系统

式(1)中,u是系统的输入;y是系统的输出,且有u,y∈R,f(·)和g(·)均是未知的连续函数。(x1,x2,…,xn)T属于Rn,是系统的n维状态向量,且假设是可测量的。

1.1 输入输出变量及模糊语言描述

根据式(1)中的非线性系统,控制器的输入变量是误差e和误差变化率ec,输出变量为控制变量u。其中e代表跟踪误差,是yd与y的差值。ec是e的一阶导数,代表误差的变化率,u是系统输出的变化量。由于在实际的系统控制过程中,误差e、误差变化率ec和控制变量u是不断变化的,因此需要在模糊量和精确量之间建立一种转换关系。为提高系统的稳态精度,把e分为8个等级,其模糊集为{NB,NM,NS,N0,P0,PS,PM,PB},ec和u的模糊集为{NB,NM,NS,0,PS,PM,PB},其中这8个模糊语言变量分别为,PB(正大),PM(正中),PS(正小),P0(正零),N0(负零),NS(负小),NM(负中),NB(负大)。

1.2 控制器的模糊规则设计

模糊控制的目的是,消除输出对于设定值的偏差。在选择控制量时,其原则是当误差e比较小时,要以系统的稳定性为主,选择控制量是要防止系统超调;当误差e比较大时,选择控制量时主要以尽快消除误差为主。所以根据上述消除偏差的规则,控制规则可以得到,如表1所示。

该控制器的模糊规则也可以使用模糊条件语句来描述,如下所示:

1.3 模糊变量的赋值

根据上述模糊控制器的模糊条件语句,以及精确量与模糊量之间的转换关系,假设误差e的变化区间为[-6,6],那么误差e的论域为{-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6}。误差变化ec和误差e的论域相同,控制变量u的变化区间为[-7,7]。确定了模糊变量误差e、误差变化率ec和控制变量u的论域,相当于确定模糊语言变量相对应的隶属度。3个模糊变量,针对其中一个误差e举例,的赋e值表如表2所示。

1.4 模糊控制表的确定

根据模糊条件语句可以确定相应的模糊关系,如果第一条语句的模糊关系为

由模糊变量的隶属度,得到控制量为

其中,分别是对应的i、j元素的隶属度。由此可得其余语句的模糊关系,那么模糊控制量集合为

通过最大隶属度法将模糊量进行非模糊化,即选取的控制量为模糊子集中隶属度最大的元素。这样就可以得到由模糊量转化为精确量的控制量,从而得到模糊控制表。

通过上述4个步骤便可以设计出简单的模糊控制器。

2 自适应模糊控制器的设计

模糊自适应控制器,是在模糊控制器的基础上加入自适应控制,其主要的目的是,得到一个自适应律和一个反馈控制,使得系统具有全局稳定性。定义自适应模糊控制器的模糊逻辑系统为

其中,是高斯型隶属函数,且

其中,ki=1,2,3,…,Mi,θf∈R和θg∈R是自适应律,且为常数用来调节参数。

基于式(5)和式(6)模糊逻辑系统的控制律u,其无法满足李雅普诺夫的稳定理论要求,所以加入一个边界控制ud,且为

其中,当大于指定常数,则有I*=1,否则为零。

使得系统状态在一个限定的范围内并满足李雅普诺夫的理论稳定性。那么控制律为

其中,uc是等效控制,即为模糊逻辑系统的输出。将式(5)代入式(1)得到的误差方程为

其中,

在E的等式中,T=(tn,tn-1,…,t1)T∈Rn是多项式

其解的系数项。

本文采用的自适应律为

为简单起见,定义一个ξ(x)为

根据李雅普诺夫稳定性理论验证该控制器相对这个系统的稳定性。

证明考虑如下的李雅普诺夫函数

设其中的,由式(7),式(11)~式(13)可得

证明完毕。

由证明过程可得,设计出来的自适应律满足李雅普诺夫稳定理论。所以通过以上步骤设计出来的模糊自适应控制器可以使得系统在闭环状态下处于全局稳定。

3 实验结果

根据上述自适应模糊控制器的设计步骤,应用到经典模型二级倒立摆系统上[10]。在简单模糊控制器的基础上加入自适应算法。通过Matlab软件进行仿真实验,结果如图1所示。通过传统简单的模糊控制器进行对二级倒立摆系统稳定控制,Matlab软件仿真结果如图2所示。

根据图1和图2的仿真结果可以看出,自适应模糊控制和简单模糊控制都可以使二级倒立摆处于稳定状态。由仿真结果也可以看出,自适应模糊控制的结果,在平衡位置的振幅相对简单模糊控制较小,向稳定状态的过渡时间相对较短,所以结果表明自适应模糊控制的可行性,并且能够有效改善控制器的控制精度和动态性能。

4 结束语

针对非线性系统,在简单模糊控制器的基础上加入自适应控制,构造出自适应模糊控制器。为验证控制器的有效性,将该控制器应用到二级倒立摆系统上,通过Matlab仿真,结果表明该控制器的有效性。并与简单模糊控制器在二级倒立摆系统的应用做比对,结果表明,自适应模糊控制器在平衡位置的振幅较小,稳态过度时间较短,有效的改善了控制器的控制精度和动态性能。由此可见本文提出的自适应模糊控制满足系统的稳定性控制,并获得了良好的控制效果。

摘要:针对非线性系统,为获得更好的控制控制效果,设计了模糊自适应控制器。在模糊控制器的基础上根据反馈控制和调整参数向量的自适应律的求解,综合李雅普诺夫稳定理论设计了模糊自适应控制器,以满足系统的稳定性和控制效果。为验证控制器的有效性,将该控制器应用到二级倒立摆系统的稳定控制,仿真结果表明该控制器的控制效果良好,并与传统的控制方法相比较,其控制效果更佳。

关键词:自适应,模糊控制,李雅普诺夫稳定理论,倒立摆

参考文献

[1]曾光奇,胡军安.模糊控制理论与工程应用[M].武汉:华中科技大学出版社,2006.

[2]李士勇.模糊控制、神经控制和智能控制论[M].哈尔滨:哈尔滨工业大学出版社,1996.

[3]李士勇.模糊控制[M].哈尔滨:哈尔滨工业大学出版社,1996.

[4]韩力群.智能控制理论及应用[M].北京:机械工业出版社,2007.

[5]王立新.模糊系统与模糊控制教程[M].北京:清华大学出版社,2003.

[6]王立新.自适应模糊系统与控制设计与稳定性分析[M].北京:国防工业出版社,1995.

[7]董宁.自适应控制[M].北京:北京理工大学出版社,2009.

[8]方勇纯,卢桂章.非线性系统理论[M].北京:清华大学出版社,2009.

[9]Spooner J T,Passino K M.Stable adaptive control using fuzzy systems and neural networks[J].IEEE Transactions on Fuzzy Systems,1996,4(3):339-359.

非线性自适应控制 第7篇

关键词:广义不确定性,非线性系统,自适应模糊控制,反演控制

在工程应用中,对带有广义不确定性非线性系统建立精确的模型常常较为困难,甚至于是不可能的。因此,研究在广义不确定条件下对非线性系统的控制问题具有重大的实际意义。

在非线性系统存在不确定性的情况下,一些文献研究了应用鲁棒自适应控制理论进行控制系统设计[1],但是都存在一个共同的缺陷,即对系统的不确定性都有严格的条件限制。文献[2]研究参数化不确定性的反演滑模控制问题。滑模变结构控制是一种较为有效的方法,也出现了许多研究成果,而且滑模变结构控制具有良好的跟踪性能, 但它要求系统的不确定性满足匹配条件[3]。此外,控制系数矩阵未知情况下的设计问题目前仍然是一个难点问题。文献[4]采用积分型李亚普诺夫函数并利用神经网络的逼近特性解决了单输入单输出系统的控制系统矩阵未知情况下的设计问题,但是这种方法难以推广到多输入多输出系统。

反演控制设计方法是在非线性控制领域提出的一种新方法,其基本思想是将复杂的非线性系统分解成不超过系统阶数的子系统,引入虚拟控制作为中间变量,然后为每个子系统确定李雅普诺夫函数,并设计虚拟控制变量,一直“后退”到整个系统,直到完成整个控制律的设计[5]。反演法在处理系统不确定性方面有很大优势,因此在各类飞行器控制系统设计中有着成功的应用,而且还在不断地扩展到其他越来越多的领域中[6]。但是,反演设计法通常需要假定非线性系统中的未知参数具有线性参数化的形式,并且系统中的非线性函数必须精确已知,而且此法在实际上存在“计算膨胀”问题,这在实际中很难满足。因此,为了解决这一问题,必须将反演法与其他控制方法相结合。Lee[7]采用神经网络和反演控制相结合的方法研究了导弹飞行控制系统。胡云安[8]等将自适应控制与反演控制相结合研究了BTT导弹自适应反演控制。朱凯[9]等将反演控制与自适应滑模控制相结合研究了BTT导弹控制律设计。

本文将自适应控制、模糊控制和反演控制的方法相结合,针对具有广义不确定性的非线性系统,设计了一种自适应模糊反演控制律。

1 非线性系统描述

存在广义不确定性的严格块反馈型非线性系统描述如下:

{X˙1=f1(X1)+g1(X1)X2X˙2=f2(X¯2)+g2(X¯2)X3X˙n=fn(X¯n)+gn(X¯n)u(1)

式(1)中,X¯i=[X1ΤXiΤ]Τ;fi(X¯Ti)、gi(X¯Ti)为系统中含有不确定性的函数;Xi=[xi1xini]Τi=1,,n;ni为第i个子块的阶次;uRp。根据实际情况将其分为标称值和不确定项之和:fi(X¯i)=fi0(X¯i)+Δfi(X¯i)gi(X¯i)=gi0(X¯i)+Δgi(X¯i)gi(X¯i)是行满秩的,其中fi0(X¯i)、gi0(X¯I)为系统的名义值,Δfi(X¯i)、Δgi(X¯i)为存在的不确定项。

2 模糊系统控制规则

考虑一个由下列模糊规则:

IF x1 is F1jand x2…xn isFnj, Then y is Bj(j=1,…,N)。

所构成的单输出模糊系统(多输出系统总可以分解为多个单输出系统)。

其中:Rj表示第j个模糊规则;j=1,2,…,N是模糊规则数;x=(x1,x2,…,xn)∈Rn是模糊系统的输入;i=1,2,…,n是系统输入的个数;yR为模糊系统的输出;FnjBj是定义在论域上的模糊语言值。

假设该模糊系统使用一元模糊化、乘运算、加权平均反模糊化及隶属函数为高斯函数。则模糊系统的输出为[8]:

y(x)=j=1Νϑji=1nμij(xi)j=1Νi=1nμij(xi)(2)

式(2)中μij(xi)是隶属函数μij,ϑj=maxyRBj(y)。令ξ(x)=[ξ1(x),ξ2(x),…,ξN(x)]T,ϑ=[ϑ1,ϑ2,…,ϑN]T,则y(x)=ξT(x)ϑ。

模糊万能逼近定理[10]:如果f(x)是定义在紧致集Ω上的连续函数,则对于任意常量ε>0,都存在一个如上式所示的模糊系统,满足:

supyΩ|f(x)-y(x)|ε

3 基于模糊控制的反演控制律设计及稳定性分析

控制系统设计的目的是设计一个自适应模糊反演控制律,能够消除广义不确定性对系统的影响,在保证所有信号有界的前提下,使得非线性系统收敛性满足跟踪性能指标的要求。

假设1:存在控制律u使得系统

{X˙1=f1(X1)+g1(X1)X2X˙2=f2(X¯2)+g2(X¯2)X3X˙n=fn(X¯n)+gn(X¯n)u(3)

最终一致有界。

3.1反演控制律设计

在非线性系统中引入新的误差状态向量ziRni,

zi=Xi-Xidi=1,,n(4)

式(4)中,Xid为系统期望的状态轨迹。

由式(4)可得误差状态方程为

z˙i=fi(X¯i)+gi(X¯i)Xi+1-X˙id(5)

通过确定系统的虚拟控制量和实际控制量u,使系统稳定且能够跟踪期望轨迹。

第1步:考虑系统表达式(5),可得:

z˙1=f10(X1)+g10(X1)X2-X˙1d+Δf1(X1)+Δg1(X1)X2=f10(X1)+g10(X1)X2-X˙1d+Δ1(6)

式(6)中,Δ1=[Δf1(X1)+Δg1(X1)X2]为由广义不确定性的影响而引入的项。

X2d看作式(6)的虚拟控制量,由式(4)可得X2=z2+X2d,则

z˙1=f10(X1)+g10(X1)z2+g10(X1)X2d-X˙1d+Δ1(7)

对式(7),选取李亚普诺夫函数为

V1=12z1Τz1(8)

V˙1=z1Τz˙1=z1Τ[f10(X1)+g10(X1)z2+g10(X1)X2d-X˙1d+Δ1]=z1Τ[f^1+g10(X1)(z2+X2d)]+z1ΤΔ1(9)

式(9)中,f^1=f10(X1)-X˙1d

由于g10(X1)行满秩,所以g10(X1)可逆,令X2d=-g10-1(X1)[k1z1+φ1],k1>0为设计参数;φ1为用于逼近非线性函数f^1的模糊系统,则

V˙1=-k1z1Τz1+z1Τg10(X1)z2+z1Τ(f^1-φ1)-z1ΤΔ1 (10)

第2步:考虑系统z˙2=f2(X¯2)+g2(X¯2)X3-X˙2d,则

z˙2=X˙2-X˙2d=f20(X¯2)+g20(X¯2)z3+g20(X¯2)X3d-X˙2d+Δ2(11)

式(11)中,Δ2=[Δf2(X¯2)+Δg2(X¯2)]

X3d看作式(11)的虚拟控制量,考虑如下的李亚普诺夫函数为:

V2=V1+12z2Τz2(12)

V2求导可得:

V˙2=V˙1+z2Τz˙2=V˙1+z2Τ[f20(X¯2)+g20(X¯2)z2+g20(X¯2)X3d-X˙2d+Δ2]=V˙1+z2Τ[f^2+g20(X¯2)z3+g20(X¯2)X3d]+z2ΤΔ2(13)

式(13)中,f^2=f20(X¯2)-X˙2d

又由于g20(X¯2)可逆。令X3d=-g20-1(X¯2)[k2z2+g10(X1)z1+φ2]k2>0为设计参数;φ2为用于逼近未知非线性函数f^2的模糊系统,则

V˙2=-k1z1Τz1-k2z2Τz2+z1Τ(f^1-φ1)+z2Τ(f^2-φ2)+z1ΤΔ1+z2ΤΔ2+z2Τg20(X¯2)z3(14)

i步:考虑系统z˙i=fi(X¯i)+gi(X¯i)Xi+1-X˙id,有

z˙i=X˙i-X˙id=fi0(X¯i)+gi0(X¯i)zi+1,d+gi0(X¯i)Xi+1,d-X˙id+Δi(15)

X(i+1)d作为虚拟控制量,则有Xid=-gi0-1(X¯i)[kizi+g(i-1)0(X¯i-1)zi-1+φi]ki>0为设计参数;φi为用于逼近未知非线性函数f^i的模糊系统,则

n步:考虑系统z˙n=fn(X¯n)+gn(X¯n)u-X˙nd,有

z˙n=fn0(X¯n)+gn0(X¯n)u-X˙nd+Δn(17)

选取李亚普诺夫函数为

Vn=Vn-1+12znΤzn(18)

求其导数可得

V˙n=V˙n-1+znΤz˙n=V˙n-1+znΤf^n+znΤgn0u+znΤΔn(19)

因为gn0(X¯n)可逆,令u=-gn0-1(X¯n)[knzn+gn-1,0(X¯n-1)zn-1+φn]kn>0为设计参数;φn为用于逼近未知非线性函数f^n的模糊系统,则有

V˙n=-j=1nkjzjΤzj+j=1nzjΤ(f^j-φj)+j=1nzjΤΔj(20)

所以,由以上分析可得设计的控制律为:

u=-gn0-1(X¯n)[knzn+gn-1,0(X¯n-1)zn-1+φn](21)

3.2基于反演控制的自适应模糊控制律设计

由于fi0(X¯)中含有未知部分,所以采用φm=ξΤ(X¯)ϑ逼近未知函数f^iϑ*为最优逼近向量。针对f^i的模糊逼近,采用分别逼近f^i(i=1,2,,n)的形式,相应的模糊系统设计为:

φm(X¯)=j=1Νϑmji=1nμij(X¯i)j=1Νi=1nμij(X¯i)=ξmΤ(X¯)ϑm;

m=1,2,…,n (22)

定义

式(23)中,

ϑ=[ϑ1ϑn]Τ

假设2:对于光滑函数f(x)和模糊系统,存在使逼近误差最小的最优常量参数ϑ*。其中最优参数的常量定义为:ϑ*=argminϑΩ0[supxΩ|f(x)-ϑΤξ(x)|],Ω0和Ω是ϑ和x的有界集。

对于最优逼近向量ϑ*,给定的任意小的常量σ(σ>0),有如下不等式成立:||f^-φ*||σ。令ϑ=ϑ*-ϑ˜,采用控制律式(21),设计的自适应控制律为

ϑ˙i=riziξi(X¯)-2λiϑii=1,2,,n(24)

式(24)中r为设计常数,且r>0。则所有闭环系统的信号有界,且对于给定的衰减系数ρ>0,非线性系统的跟踪性能指标满足:

i=1n0Τzi2(s)ds1d0V(0)+1d0Τb0+i=1n12d00Τρ2Δi2dtΤ[0,](25)

式(25)中r>0,λ>0,b0和d0是正的常量。

3.3稳定性分析

对整个非线性系统,取利亚普诺夫函数为

V=12z1Τz1+12z2Τz2++12znΤzn+j=1n12rjϑ˜jΤϑ˜j (26)

V˙=V˙n+j=1n12rjϑ˜jΤϑ˜j=-j=1nkjzjΤzj+j=1nzjΤ(f^j-φj)+j=1nzjΤΔj+j=1n12rjϑ˜jΤϑ˜˙j-j=1nkjzjΤzj+j=1n|zjΤσj|+j=1nϑ˜jΤ(zjΤξj(x)-1rjϑ˙j)+j=1nzjΤΔj(27)

Η=-j=1nkjzjΤzj+j=1n|zjΤσj|+j=1nϑ˜jΤ(zjΤξj(x)-1rjϑ˙j)+j=1nzjΤΔj(28)

aj=kj-12-12ρ2(29)

kj=aj+12+12ρ2(30)

将式(30)代入式(28)可得:

Η=-j=1najzjΤzj-12j=1nzjΤzj-j=1n12ρ2zjΤzj+j=1n|zjΤσj|+j=1nϑ˜jΤ(zjΤξj(x)-1rjϑ˙j)+j=1nzjΤΔj(31)

由于-a22+ab12b2-12a2b2+bc12a2c2(32)

联立式(24)、式(31)和式(32)可得

Η-j=1najzjΤzj+j=1nλjrj(2ϑj*Τϑj-2ϑjΤϑj)+12j=1nσj2+j=1j12ρ2Δj2(33)

因为

V˙-j=1najzjΤzj+j=1nλjrj(-ϑjΤϑj-ϑj*Τϑj*)+j=1n2λjrjϑj*Τϑj*+12j=1nσi2+j=1n12ρ2Δj2(35)

又因为-ϑΤϑ-ϑ*Τϑ*-12ϑ˜Τϑ˜,所以

V˙-j=1najzjΤzj-j=1nλj2rjϑ˜Τϑ˜j+j=1n2λjrjϑj*Τϑj*+12j=1nσj2+j=1n12ρ2Δj2(36)

ki12+12ρ2,使aj>0,并令a0=min{aj,kj,j=1,2,…,n};b0=j=1n2λjrjϑj*Τϑj*+12j=1nσj2,则

V˙-a0(j=1nzjΤzj-j=1n12rjϑ˜jΤϑ˜j)+b0+j=1n12ρ2Δj2=-a0V+b0+c0(37)

其中Δj2cjc0=j=1n12ρ2cj

解方程式(37),可得:

V(t)(V(0)-b0+c0a0)exp(-a0t)+b0+c0a0V(0)exp(-a0t)+b0+c0a0V(0)+b0+c0a0(38)

定义紧致集Ω0={X|V(X)≤C0},其中C0=V(0)+b0+c0a0,由式(26)可得闭环系统的所有信号均有界。

d0=min{ai;i=1,2},则由式(36)有:

V˙-j=1najzjΤzj-j=1nλj2rjϑ˜jΤϑ˜j+j=1n2λjrjϑj*Τϑj*+12j=1nσj2+j=1n12ρ2Δj2-d0j=1nzjΤzj+b0+j=1n12ρ2Δj2(39)

对式(39)在[0,T]内积分,可得:

0ΤV˙dt-0Τd0j=12zjΤzj(s)ds+Τb0+j=1n0Τ12ρ2Δj2dt(40)

整理式(40)可得

j=1n0ΤzjΤzj(s)ds1d0(V(0)-V(Τ)+Τb0+j=1n0Τ12ρ2Δj2dt)(41)

-1d0V(Τ)0代入式(41),则收敛结果为

i=1n0Τzi2(s)ds1d0V(0)+1d0Τb0+i=1n12d00Τρ2Δi2dtΤ[0,](42)

4 仿真分析

为了验证本文所设计控制律的有效性,以某型BTT导弹的模型为例,对导弹控制系统的性能进行仿真和分析。定义x1=[αβγ]Τx2=[ωxωyωz]u=[δxδyδz]。则BTT导弹可描述为如下具有广义不确定性的“标准块控制型”非线性系统:

其中Δ1、Δ2是由广义不确定性的影响而引入的不确定项;f1(x1)、f2(x1,x2)、b1(x1)、b2、Δ1、Δ2见文献[9]。

选取模型参数如下:速度V=1 302.47 m/s,高度H=13 416.79 m,马赫数Ma=4.412 3。状态初值为:γ=5,α=5,β=0(deg),ωx=0,ωy=0,ωz=0(deg/s);各舵面的初始值为0(deg),k1=22,k2=30。仿真三通道的响应曲线如下图所示,图中实线为命令曲线,虚线为跟踪曲线。

由上述仿真图可知,当系统存在气动参数摄动和外部干扰等不确定性时,基于自适应模糊逼近模型思想设计反演控制律可使系统具有较好的动态和鲁棒性能。应用本文方法设计的控制律,使带有广义不确定性非线性系统具有良好的动态品质和跟踪性能,仿真结果也表明本文的设计方法是合理有效的。

5 结论

本文结合自适应控制、模糊控制和反演控制方法,针对具有广义不确定性的非线性系统,设计了一种自适应模糊反演控制律。针对反演控制的不足之处,采用模糊控制来逼近系统中的非线性函数,并且在此基础上设计了自适应控制律,利用李亚普诺夫方法证明了系统的稳定性和收敛性,在保证所有信号有界的前提下,使得非线性系统的收敛性满足跟踪性能指标的要求。仿真结果表明本文所设计的带有广义不确定性非线性系统控制律具有良好的动态品质和跟踪性能,能够消除不确定性对非线性系统的影响,使得非线性控制系统具有很强的鲁棒性和自适应性。

参考文献

[1] Freeman R A,Krstic M,Kokotovic P V.Robustness of adaptive non-linear control to bounded uncertainties.Automatica,1998;34:1227—1230

[2] Zhou Yanxia,Yuxiang Wu,Yueming Hu.Robust back-stepping slid-ing mode control of a class of uncertain MIMO nonlinear systems.In2007 IEEE International Conference on Control and Automation.Guangzhou,CHINA 2007

[3]高为炳.变结构控制理论基础.北京:中国科学技术出版社,1996

[4] Zhang T,Ge S S,Hang C C.Adaptive neural network control forstrict-feedback nonlinear systems using back-stepping design.Auto-matica,2000;36:1835—1846

[5] Krstic M,Kanellakopoulos I,Kokotovic P.Nonlinear and adaptivecontrol design.New York:A Willy Interscience Publication John Wi-ley&Sons,NC,1995

[6]郑敏捷,徐世杰.航天器姿态控制系统的退步设计方法.飞行力学,2005;23(4):63—66

[7] Lee T,Kim Y.Nonlinear adaptive flight control using back-steppingand neural networks controller.Journal and Guidance,Control andDynamics,2001;24(4):675—682

[8]胡云安,晋玉强,查旭,等.BTT导弹块模型的鲁棒自适应设计.宇航学报,2004;23(2):225—229

[9]朱凯,齐乃明,秦昌茂.BTT导弹的自适应滑模反演控制设计.宇航学报,2010;31(3):769—773

非线性自适应控制 第8篇

关键词:开关磁阻电机,自适应线性单元,滑模控制,滑模学习算法,直接转矩控制

0 引言

在电机发展史上,开关磁阻电机(SRM)的发明要早于感应电动机(IM)和永磁同步电机(PMSM)[1]。相对于感应电动机和永磁同步电机而言,SRM有诸多优势,例如成本低廉,结构简单,更好的鲁棒性和更宽的调速范围[2]。尽管SRM有着众多优点,但到目前为止,它仍然没有感应电动机和永磁同步电机应用得那么广泛。其原因主要有如下3点:首先,SRM的双凸极结构和高磁饱和特性使其模型具有很强的非线性。其次,至今为止还没有一个解析模型能够完全描述其特性。最后,SRM的噪音问题和转矩脉动也比其他传统电机严重[3]。这些原因都限制了SRM的应用领域。文献[4,5,6]提出了许多获得SRM模型的方法,其研究主要集中在估算磁链、电感或者磁链关于转子位置和电流的关系上[7]。然而,这些方法或多或少都需要用到SRM的模型信息。本研究基于滑模学习算法(SMLA)的自适应线性单元(Adaline),发现了一种不需要电机模型信息的SRM速度控制方案。

在众多神经网络中,Adaline神经网络是最简单的一种,它只有单层自适应线性神经元[8]。由于Adaline结构简单,降低了权值学习算法计算复杂度,使得这种方法能够适用于在线系统辨识和自适应控制。在Adaline神经网络的应用中,如何获得神经网络的最优权值是一个热门问题。

目前,SMLA已被应用到神经网络的训练之中。文献[9]首次运用SMLA进行Adaline权值训练,该文献中提出的方法简单,鲁棒性好,且能在有限时间内达到零学习误差。文献[10]通过引入自适应不确定界限辨识方法延伸了这一结果。这一方法需要整合误差信号的绝对值,并且可能会导致估计界限无法限制,使系统不稳定。文献[11]研究了控制系统滑模平面和Adaline控制器参数零学习误差之间的关系,并在类人机器人中测试了这种方法。之后,Topalov基于SMLA对神经网络进行了深入研究,并将这种方法分别应用于非线性控制系统,PMSM的速度控制,和防抱死系统之中。文献[12,13,14]中提出的方法都取得了良好的控制性能。现有的很多文献已经将滑模控制理论应用于SRM控制[15,16,17]。但它们都局限于滑模控制控制器和观测器的设计。本研究采用滑模控制来对Adaline进行权值训练,文中的Adaline主要作用有两个:①Adaline用来辨识电磁转矩和磁链,它能够离线训练并用于在线辨识;②Adaline结合PD控制器能够提升SRM速度控制的鲁棒性和快速性。本研究提出的方法结合了PD控制器、Adaline和滑模控制技术,并且兼有三者的优点。

本研究首先介绍基于SMLA的Adaline和权值训练规则,然后介绍四相8/6极SRM电磁转矩和磁链的测量和辨识,接着给出仿真结果和分析,最终进行总结并给出一些结论。

1 基于SMLA的Adaline

基于Adaline的辨识系统结构框图如图1所示。

图中:Adaline的输入状态向量为xi=[x1,x2,...xn,b]T,参考信号为yd,输出为y,偏置常量b>1,权向量Wi=[W1,W2,...Wn,Wn+1]T由SMLA进行训练。输出信号y可用如下等式计算:

式中:xT—向量x的转置。

其学习误差被定义为:

要注意的是,输入变量为x1,x2,...xn,权值为W1,W2,...Wn,Wn+1,输出信号为y,参考信号为yd,学习误差为e,它都是时变的。在设计SMLA前先给出如下几点假设:

假设1:如图1(a),假设状态向量x,其对时间的微分向量和权向量Wi都是有界的,即:

式中:Mxi,,MWi—正常数。

假设2:如图1(a),假设参考信号yd及其对时间的微分是有界信号,即:

式中:My,—正常数。

假设3:如图1(b),假设控制输入Tr及其对时间的微分是有界信号,即:

式中:Mr,—正常数。

1.1 辨识方案的SMLA设计

根据滑模控制理论,滑模的设计可以分为两步:第一步选择滑模平面,第二步设计滑模控制律[18]。

在基于SMLA设计辨识器时,选取滑模平面为学习误差ei:

为了获得有效的控制律,在滑模平面上的滑模运动必须满足下式:

定理1:如果用如下自适应律对Adaline的权值进行训练:

式中:sign(x)—signum函数,ki满足式(11):

式中:ηi—设定为常数。可以得到如下结论:

(1)学习误差e能在有限时间tir内收敛到零,到达时间tir可由下式计算:

(2)当t>tir时,可以保证滑模运动一直保持在滑模平面之上。

证明:辨识系统的Lyapunov函数可以设计为:

结合式(2)和式(10),Lyapunov函数Vi的微分计算如下:

根据文献[19],当ei≠0的时候,Lyapunov函数Vi<0,滑模运动满足式(9),并且到达时间tir满足式(12)。

1.2 控制系统的SMLA设计

如图1(b)所示,为了将基于SMLA的Adaline应用于控制系统并达到速度跟踪零误差,需要设计两个滑模平面。一个滑模平面用来训练Adaline权值,一个用来对系统进行控制。第一个滑模平面设计为:

式中:Ta=WcTxc—Adaline的输出,Tc—PD控制器的输出。

Adaline可以补偿系统非线性并且提高学习过程中的控制性能。第2个滑模平面设计为:

式中:λ—滑模平面的斜率,是一个正常量。

为了实现滑模平面Sa上的滑模运动,有如下两个定理。

定理2:如果Adaline的权值采用如下自适应率进行训练:

其中

,并且假设xc≤Mxc,,并且Wc≤MWc。参数kc满足下式:

式中:ηc—正常量。则可得到如下结论:

(1)学习误差ec能在有限时间tcr内收敛到零,到达时间可由下式计算:

(2)当t>tcr时,可以保证滑模运动一直保持在滑模平面之上。

证明:取第一个滑模平面sa上控制系统的Lyapunov函数如下:

考虑式(15)和式(17),Lyapunov函数Va的微分计算如下:

当sa≠0时,Lyapunov函数Va<0,到达时间tcr满足式(19)。

第一个滑模平面sa和第二个滑模平面sc有直接的联系。取第二个滑模平面的坡度λ=kp/kd,其中kp和kd分别是PD控制器的比例系数和微分系数。其联系如下:

根据滑模平面sa和sc的关系,很容易得到如下定理:

定理3:根据式(17)的自适应律,式(18)中的系数,以及相应的假设界限,滑模平面sc在有限时间内可达且能够保证sc上的滑模运动。

证明:控制系统的Lyapunov函数可以设计为:

其对时间的微分为:

由滑模平面sa和sc之间的关系可知,它们的收敛性是一样的。

2 SRM的辨识

2.1 SRM的参数测量

由于没有一个能完全描述SRM特性的解析模型,使得SRM的测量数据对其研究和分析显得尤为重要。本研究采用了文献[20]提出的测量电路,该电路如图2所示。

所测的四相8/6极SRM的数据如表1所示。

文献[20]中,使用动态测量方法测得电压和电流数据,这些数据受定子电阻、涡流和磁滞损耗的影响。本研究使用稳态测量方法,先测出电机的电磁转矩,再根据转矩数据计算出磁链。本研究的方法比文献[20]的方法精度更高。笔者把0°定义为对齐位置,把30°定义为非对齐位置。

电磁转矩曲线和磁链曲线如图3、图4所示。

2.2 转矩和磁链的辨识

本研究将SRM的测量数据作为参考模型。其模型如图5所示。

本研究选取电机的定子电流和转子位置为输入变量,对电磁转矩和磁链进行辨识。为了测试提出方法的有效性,本研究将SMLA和梯度下降算法(GDA)进行比较。电流为2 A时基于SMLA的Adaline的转矩辨识结果如图6所示。

为了与GDA进行比较,与图6相同情况下基于GDA的转矩辨识结果如图7所示。

电流为2 A时基于SMLA的Adaline磁链辨识结果如图8所示。

GDA的磁链辨识结果如图9所示。

对比SMLA和GDA进行电磁转矩和磁链辨识的结果,可以得到如下3点结论:

(1)基于SMLA的Adaline能够实现对SRM电磁转矩和磁链的辨识;

(2)基于SMLA的Adaline辨识能力与基于GDA的Adaline相比,精确度更高,快速性更好;

(3)基于SMLA的Adaline良好的辨识能力使得这一方法适合于高性能辨识和SRM的控制。

3 仿真与分析

3.1 系统结构分析

SRM控制系统的结构框图如图10所示。

其结构主要由4个部分组成:

(1)第一部分包括PD控制器和Adaline,这部分主要负责速度控制;

(2)第二部分以电流和转子位置作为反馈量对SRM进行电磁转矩和磁链的辨识;

(3)第三部分是直接转矩控制部分,包括磁链计算单元,滞环控制单元,扇区计算单元以及开关表单元;

(4)第四部分包括SRM,功率变换电路和电机负载。其中功率变换电路采用的是传统的不对称半桥电路,用于驱动SRM。

四相8/6极SRM总磁链和每相磁链的关系可用下面3个式子描述:

式中:ψA,ψB,ψC和ψD可用Adaline辨识。

文献[21]对扇区计算单元和开关表单元做了详细的介绍,本研究不做过多介绍。

3.2 系统结构分析

基于SMLA的Adaline实现SRM速度控制时,本研究在辨识和控制方案的设计中引入了signum函数,导致了滑模控制固有的抖动现象。通常可以用sigmoid函数来近似signum函数,使得signum函数连续来避免抖动,如下式所示:

其中:ε取0.02。仿真时,辨识参数ki=500,控制参数kc=1 000,偏差b=bc=2,比例系数P=20,微分系数D=0.15。

为了测试本研究提出方案的有效性,本研究对阶跃和正弦两种输入进行仿真,并将本研究提出的控制器与PD控制器比较。

第一种情况模拟了阶跃参考信号下的速度响应。速度给定为ωd=1 500 r/min,0.05 s时加负载TL=1 Nm。仿真结果如图11所示。

在图11(a)和11(b)中,Adaline代表Adaline和PD控制器的结合,而PD只代表PD控制器。

第二种情况模拟了正弦参考信号下速度响应。速度给定为ωd=500 sin(20πt)r/min,负载转矩为TL=0.5 Nm。仿真结果如图12所示。

通过对仿真结果进行分析,可以得出如下结论:

(1)Adaline与PD控制器的结合能够对SRM进行有效的速度控制,比仅用PD控制器拥有更好的快速性,精确度和鲁棒性;

(2)对电磁转矩和磁链的辨识拥有高精确度和快速收敛性。这种辨识方法尤其适用于SRM的直接转矩控制,且转矩脉动低;

(3)在不同条件下,SRM速度控制都能获得良好的控制性能。进行SRM控制过程中,只有进行SMLA的Adaline离线训练时用到了电机模型信息。

4 结束语

本研究将基于Adaline的SMLA应用到SRM的速度控制和参数辨识,获得了高性能的SRM速度控制。本研究主要工作可以总结为如下4点:

(1)本研究将基于SMLA的Adaline成功应用到SRM的转矩和磁链辨识,获得了SRM速度控制的高辨识精度和快速收敛性;

(2)将Adaline与PD控制器结合,提升了SRM的速度控制性能,鲁棒性和自适应性都有提升;

(3)本控制器的设计不需要SRM的模型信息,大大降低了控制参数的调节难度;

非线性自适应控制 第9篇

随机早期检测RED[1]算法最早于1993年由Floyd和Jacobson提出。RED算法是最典型的主动队列管理(AQM)算法,其基本思想是路由器通过检测队列的平均长度来判断网络是否发生拥塞,并在队列平均长度达到一定阀值时,随机地选择部分新到达的包进行丢弃或者标记,并通知源端减小拥塞窗口,降低分组发送速率,从而缓解网络拥塞。RED算法能有效地提高链路带宽利用率和减小队列平均长度。随着RED应用的增多,研究者提出了许多形式的RED算法的改进策略[3,4,5,6,7,8,9],如ARED、FRED、SRED、BLUE等。这些算法都在不同角度对RED算法进行了改进,并且达到了一定的效果。本文结合RED算法的主要思想,提出了一种改进的算法——IARED,利用模糊分布中的升半哥西分布的隶属函数代替原来的线性增加丢包率函数。并利用平均队列和目标队列长度自适应调整参数Pmax,提高了链路的利用率和吞吐量,减小了分组的丢弃概率,进一步提高网络传输性能。

1 RED算法

1.1 RED算法原理

RED算法采用基于时间的平均队列长度,并随机地选择正在进入路由器的包进行丢弃。RED算法主要由两个独立的算法组成,第一部分计算平均队列长度,第二部分计算包丢弃/标记的概率,以决定在当前拥塞程度下路由器该以多大的概率对数据包进行丢弃/标记。原理如图1所示,RED 算法有以下几个重要参数, 平均队列长度Qav,队列长度两个门限QmaxQmin , 系统设定的分组丢弃的最大概率为Pmax和计算平均队列长度权值Wq

RED 算法具体实现分组标记/丢弃的策略如下所示:

1.2 RED算法分析及改进算法

RED 在平均队列长度超过了最大门限值后就丢包,从而有效地控制了平均队列长度,限制了平均时延的大小。在发生拥塞时,RED 标记某个流的数据包的概率基本上和该流在路由器中得到的带宽成比例,并且均匀地间隔丢包,避免了由于连续丢包导致的全局同步现象。总而言之,RED 是 IETF 推荐的一种基于路由器的有效的拥塞避免机制,其和传输协议的合作能有效地控制网络上发生的拥塞。虽然该算法是一种有效的拥塞控制机制,但是其仍然存在一些问题。例如参数设置敏感问题,不能有效估计拥塞的严重性、公平性等问题。

针对上述RED算法的缺陷,研究者采用基于网络流量变化情况,自适应调节参数,控制分组的标记或丢弃的概率,形成了ARED、SRED、Gentle—RED、BLU E 等几种主要的改进算法。其中SRED通过概率统计的方法获得连接数,然后基于连接数目调整分组丢弃的概率;BLUE采用基于链路空闲和缓存占用的情况,链路空闲,减少丢弃概率,缓存溢出,增大丢弃概率;ARED 如图2(a)所示,是一种自适应的RED 算法,根据网络拥塞情况自动调节Pmax,当Qav接近Qmin时,就减小Pmax的值,当Qav接近Qmax时,就增大Pmax的值,当Qav大于Qmax时,p=1。Gentle—RED, 是在 RED 基础上引入了一个2Qmax值, 使Qav等于2Qmax时分组丢弃概率为1,扩大了RED 算法的作用范围。

2 改进的RED算法——IARED

2.1 IARED的基本思想

队列管理算法的目标是为了使传递拥塞指示的速度刚好使得源端的发送速度等于或略小于瓶颈带宽。从性能指标上来说,也就是要提高吞吐量,降低延时和丢包率。但是,在增大吞吐量时,队列中处于排队的数据包数量势必会增加,容易导致延迟的增加,同时丢包率也会增加;如果降低了丢包率,吞吐量又达不到理想的效果。虽然RED算法在传统队列管理算法的基础上有了很大的提高,但是它的缺点也很明显,当平均队列长度在最小阈值附近时,容易产生较高的丢包率,但此时网络并不处于严重拥塞状态;而当平均队列长度在最大阈值附近时,产生的丢包率又不够高,但此时网络已经处于严重的拥塞状态[8]。

本文提出了IARED算法对RED进行改进,如图2(b)所示,由于Qav大于Qmax时,路由器中还有剩余的队列,不应使p立即变为1,所以IARED算法引入了Bufsize参数,当Qav接近Qmin时,丢包率增长速率缓慢,当Qav接近Bufsize时,丢包率增长速率迅速增加。同时IARED算法还利用平均队列长度和目标队列长度来动态的调整参数Pmax的值,使算法适应不同的网络环境。

2.2 IARED的具体策略

根据IARED的基本思想,利用模糊分布中的升半哥西分布的隶属函数代替原来的线性增加丢包率的函数。丢包率计算采用升半哥西分布函数,利用平均队列长度来求得,实现了丢包率变化的平滑化。

升半哥西分布隶属函数如下所示:

β取值为2或3最佳,本文取值为3,取uQav,αQmin代入式(1)并和RED丢包率函数联立得到式(2)。

根据RED平均队列长度Qav取最大阈值Qmax时丢包率为Pmax,可以求出a的值:

a=Pmax/((1-Pmax)(Qmax-Qmin)3)

将参数a值代入式(2)即可得到基于升半哥西分布函数的包丢弃概率分布函数:

pb={0QavQminΡmax(Qav-Qmin)3(1-Ρmax)(Bufsize-Qmin)3+Ρmax(Qav-Qmax)3Qmin<Qav<Bufsize1QavBufsize(3)

IARED具体的分组丢弃/标记策略如下所示:

其中(k1,k2)为目标队列长度的取值范围,k1=Qmin+0.4(Bufsize-Qmin);k2=Qmin+0.6(Bufsize-Qmin)。abPmax的动态调整参数,a的取值为(Qav-k2)/(Bufsize-Qmin),b取值为1-(k1-Qav)/(Bufsize-Qmin)。

3 实验仿真及性能分析

3.1 仿真模型及参数设定

该文仿真实验在Linux操作系统下利用NS2[10]进行的,实验的网络拓扑如图3所示。

其中,S1、S2、S3均为发送端节点,R1、R2为路由节点,D1、D2、D3为接收端节点。将发送端节点与R 1路由节点以及接受端节点与R2路由节点的链路带宽设置为15Mbps,延时分别为10ms和30ms;R1与R2之间的瓶颈带宽为1M bps,延时为20ms,队列缓冲区长度设置为50 packets。仿真时间为100s,Qmin=10,Qmax=40,Pmax=0.1,Wq=0.003,Bufsize=2Qmax

3.2 仿真结果分析

经过仿真,表1显示了RED、ARED、IARED的丢包率情况,IARED算法在控制丢包率方面,明显优于RED算法和ARED算法。与RED算法相比,IARED算法的丢包率降低了43.2%,与ARED相比降低了19.4%。图4为三种算法的在吞吐量方面的比较,IARED算法的性能明显优于RED算法,与ARED算法相比,吞吐量也有一定的提高。图5为三种算法下平均队列长度的比较,由于IARED算法在吞吐量性能方面的提高,平均队列长度要大于RED算法和ARED算法下的平均队列长度。

4 结 语

本文对RED算法进行了简单的介绍,并指明了其优点以及存在的缺陷。利用升半哥西分布的隶属函数对RED算法的丢包率函数进行了非线性平滑,提出了改进RED算法——IARED。通过NS仿真实验,改进的 NLRED算法在丢包率、吞吐量等性能有很大的提高。尤其在丢包控制方面有很大优势,同时对Pmax进行动态的调整, 有效地适用于网络环境的变化。

参考文献

[1]Floyd S,Jacobson V.Random early detection gateways for congestionavoidance[J].ACM/IEEE.Transactions on Networking,1993,1(4):397-413.

[2]Floyd S.RED:Discussions of Setting Parameters[J].IEEE Journalon Selected Areas in Communications,1999,17(6):1159-1169.

[3]Floyd S,Gummadi R,Shenker S.Adaptive RED:all algorithm for in-creasing the robustness of RED's active queue management[EB/OL].2001-08.http://www.Icir.org/floyd/papers/adaptiveRed.pdf.

[4]Feng W,Kandlur D,Saha D,et al.Blue:A New Class of ActiveQueue Management Algorithms[R].Technical Report,U.MichiganCSE-TR-387-99,1999.

[5]Feng W,Kandlur D,Saha D,et al.Blue:A New Class of ActiveQueue Management Algorithms[R].Technical Report,U.MichiganCSE-TR-387-99,1999.

[6]李金东,马东堂,李卫,等.基于RED算法的非线性拥塞控制[J].计算机工程,2008,34(20):91-92.

[7]杨云,徐佳,王秋平.一种动态参数的随机早期检测算法DRED[J].计算机应用研究,2006(7):29-31.

[8]王志,吴卫东.应用Logistic方程的RED改进算法[J].计算机应用,2010,30(6):1472-1474.

[9]邓晓衡,陈志刚,王建新,等.NARED:一种非线性自适应RED拥塞控制机制[J].小型微型计算机系统,2005,25(6):891-895.

上一篇:青少年业余篮球运动员下一篇:无法抗拒的爱情