差分模型范文

2024-05-17

差分模型范文(精选9篇)

差分模型 第1篇

关键词:给水管网,漏失系数,模型校核,差分进化算法

给水管网水力模型的校核分为宏观校核和微观校核两大步骤。宏观校核是为了确保管网模型数据的准确性,同时还应包括对仪表准确性、实测数据可信度的核查。微观校核是指在宏观校核的基础上对管网中管段摩阻、节点流量等不确定参数进行校核,通过不断的状态估计和参数估计使管网模型与实际管网运行达到最大程度的吻合,这是一个不断修正的复杂过程。

在调节节点流量时,要考虑多方面的因素,在用户用水量曲线校正后,节点漏失水量的校正成为影响模型精度的主要因素。在本文中笔者提出,应用差分进化算法校正各节点的漏失系数,达到提高模型精度的要求。

1 给水管网校正模型

模型校正的方法:在多工况下,通过调整漏失系数λ使得给水管网中的实测值和计算值之间的误差平方和最小。

目标函数:minF=i=1nn|Ηci-Ηmi|Ηmi+i=1mm|Qci-Qmi|Qmi

St:i=1Laij´qi+Qj+λ(Ηj-Ζj)1.18=0

hij=Hi-Hj=Sijqijn

i=1Lhij-ΔΗk=0

2 差分进化算法

2.1 算法描述

DE方法是一个自组织最小化方法,用户只需很少的输入,它的关键思想与传统ES不同。传统方法是用预先确定的概率分布函数决定向量扰动,而DE的自组织程序利用种群中两个随机选择的不同向量来干扰一个现有向量,种群中的每一个向量都要进行干扰。如果新向量对应函数值的代价比它们的前辈代价小,那么它们将取代其前辈。DE利用一个向量种群,其中种群向量的随机扰动可独立进行,因此是固有并行的。DE算法同其他进化算法一样,也是对候选解的种群进行操作,DE的自参考种群繁殖方案与其他进化算法不同,它通过把种群中两个成员之间的加权差向量加到第三个成员上来产生新参数向量,该操作称为“变异”。然后将变异向量的参数与另外预先确定的目标向量参数按一定规则混合来产生试验向量,该操作称为“交叉”。若试验向量的代价函数比目标向量的代价函数低,试验向量就在下一代中代替目标向量。最后的操作称为“选择”,种群中所有成员必须被作为目标向量操作一次,以便在下一代中出现相同个数的竞争者。在进化过程中对每一代都评价最佳参数向量,以记录最小化过程,这样利用随机偏差扰动产生新个体的方式可以获得一个收敛性非常好的结果。

2.2 算法的实现

该算法是在一定约束条件下对给水管网的随机搜索技术,它根据一定规则(如选择、交叉、变异等)对λ值进行操作,然后按照确定的各设计工况,调用水力计算模块进行水力计算,并通过适应度函数值对目标函数进行操作,最终搜索出最优λ值组合,使管网模型合理。

给水管网模型校核设计计算步骤如下:

1)确定DE控制参数和所采用的具体策略,DE控制参数包括:种群数量NP、变异算子、交叉算子、最大进化代数、终止条件等。

2)随机产生初始漏失系数种群,进化代数k=1。

3)对初始种群进行评价,即调用EPANET进行水力平差,并计算初始种群中每个个体的目标函数值。

4)判断是否达到终止条件或进化代数达到最大。若是,则进化终止,将此时的最佳个体作为解输出;若否,继续。

5)进行变异和交叉操作,对边界条件进行处理,得到临时种群。

变异:

对于每个目标向量Xi,G,i=1,2,…,NP,产生变异向量如下:

vi,G+1=xr1,G+F(xr2,G-xr3,G)。

其中,随机选择的序号r1,r2,r3互不相同,且r1,r2和r3与目标向量序号i也应不同,所以须满足NP≥4。变异算子F∈[0,2]是一个实常数因数,控制偏差变量的放大作用。

交叉:

为了增加干扰参数向量的多样性,引入交叉操作。则试验向量变为:

ui,G+1=(u1i,G+1,u2i,G+1,…,uDi,G+1)。

ui,G+1={vji,G+1if(randb(j)CR)orj=mbr(i)xji,G+1if(randb(j)CR)orjmbr(i)(i=12ΝΡ

;j=1,2,…,D)。

其中,randb(j)为产生[0,1]之间随机数发生器的第j个估计值;mbr(i)∈1,2,…,D为一个随机选择的序列,用它来确保ui,G+1至少从vi,G+1获得一个参数;CR为交叉算子,取值范围为[0,1]。

边界条件的处理:

在有边界约束的问题中,确保产生新个体的漏失系数在可行域中。将不符合边界约束的新个体用在可行域中随机产生的参数向量代替,即:若uij,G+1<xjLuij,G+1>xjU,那么:

uji,G+1=randj[0,1](xj(U)-xj(L))+xj(L)(i=1,2,…,NP;j=1,3,…,D)。

6)对临时种群进行评价,调用EPANET进行水力平差,并计算临时种群中每个个体的目标函数值。

7)进行选择操作,得到新种群。

选择:为决定试验向量ui,G+1是否会成为下一代中的成员,DE按照贪婪准则将试验向量与当前种群中的目标向量xi,G+1进行比较。如果目标函数要被最小化,那么具有较小目标函数值的向量将在下一代种群中赢得一席地位。

8)进化代数k=k+1转步骤4)。

根据以上流程,用C++编写了模型校核计算程序。

3应用案例

计算管网选用JavierAlmandoz1的Leakage Assessment through Water Distribution Network Simulation一文中的管网,其拓扑结构如图1所示。

在应用时节点3,节点4和节点6设为测压点,水源1设为测流点,用于校核的工况分别选取2:00,8:00和14:00,种群数量选为100,变异算子取0.5,交叉算子取0.5,最大进化代数选为200,终止条件为minF≤0.002。

计算结果显示:经校正后,管网的节点水压测量值与实际值之间误差已被调整到一个合理的范围内,各测压点的压力误差控制在1%以内,非测压点数据在2%以内。计算结果符合模型校核的标准,能很好地反映实际管网的供水工况。

4结语

实践证明DE算法对实际管网的校核计算求解更加理想,特别是提高了计算速度和快速搜索到问题的近似最优解,这样能很好的保持模型的保真性,从而很好地完成对管网的水力分析计算、工况建模、优化设计和优化调度等。这一计算方法对复杂的中小型城市给水管网系统的建立和校核有很好的指导和借鉴作用。

参考文献

[1]周艳平.差分进化算法研究进展[J].化工自动化及仪表,2007,34(3):1-5.

[2]赵光权.带局部增强算子的微分进化改进算法[J].电子学报,2007,35(5):849-853.

[3]江军.基于遗传算法的市政管网优化设计的开发应用[J].山西建筑,2007,33(10):224-225.

差分模型 第2篇

振动杆有限差分模型的一类特征值反问题

1引言 杆是重要的工程构件之一,具有分布质量的杆的纵向振动由下面的偏微分方程描述: e/ex(E(x)A(x)eu(x,t)/ex=p(x)A(x)e2u(x,t)/et2,00, (1) 其中L是杆的长度,A(x),p(x)分别是杆的`横截面积和单位体积的质量,E(x)是材料的弹性模量.

作 者:毛晓彬 戴华 Mao Xiaobin Dai Hua 作者单位:南京航空航天大学理学院,南京,210016刊 名:高等学校计算数学学报 ISTIC PKU英文刊名:NUMERICAL MATHEMATICS A JOURNAL OF CHINESE UNIVERSITIES年,卷(期):30(2)分类号:O241.6关键词:

差分模型 第3篇

【摘 要】本研究的目的在于研究如何用SAS的proc mixed过程拟合线性代数差分模型。所用数据来源于148个集约经营火炬松人工林。直接拟合了一个胸高断面积的收获模型,而非代数差分生长模型。模型拟合过程如下:i).同时确定随林分变化的参数和最优拟合的方差结构模型;ii).依据AIC、BIC和极大似然比检验化简期望模型;iii).用代数差分法将拟合的收获模型转化为代数差分生长模型。

【关键词】线性代数差分模型;mixed过程;模型筛选;林分生长与收获预估

0.前言

在林分生长与收获预估的模型中,差分生长模型得到了广泛的应用。线性差分模型基本上为Schumacher模型的变型,广泛应用于林分蓄积、胸高断面积的建模,以及单位面积株数和优势木树高生长模型。

差分生长模型拟合方法有“直接最小二乘估计法”和“分类变量回归法”[1]。一般认为后者可以获得近似无偏的估计,而前者则导致检验统计量如RMSE的失真[2]。传统上差分生长模型的拟合主要是直接拟合差分生长模型,然后根据拟合统计量如RMSE、R2等确定最优拟合模型。与传统方法不同,本文直接拟合生长模型,在获得参数估计值后,再用代数差分法导出相应的代数差分生长模型。这样做的优越之处在于非常便于对期望模型和方差结构模型进行筛选。更为重要的是,可以通过模型拟合识别最适合的随林分变化参数。

本文详细讨论了如何用“分类变量回归法”和SAS的mixed过程拟合代数差分生长模型,可简述如下:i).直接以生长收获模型为对象,同时确定一个随林分变化的参数和最优拟合方差结构模型;ii). 保持方差结构模型不变,根据拟合统计量逐步化简期望模型;iii).在确定最优拟合的期望模型后,运用代数差分法导出相对应的代数差分生长模型。所有拟合与筛选均用SAS的mixed过程完成,并给出了详细的SAS代码和代码解释。

1.方法与材料

1.1数据

数据来源于148个集约经营的火炬松实验人工林逐年观测的固定样地数据(样地约0.152公顷)。SAS的数据集basal的内容如表(1)。

表1 模型拟合的基本数据结构

Table 1 data structure for mode fitting

age=林分年龄;fert=经营措施,分别取值为H=施加除草剂以控制竞争植物、F=施肥以增加土壤肥力、HF=除草剂和施肥并用、C=对照;code=样地代码,每个样地有一个唯一代码;logba=样地胸高断面积的自然对数值;logdh=样地优势木树高的自然对数值;iage=林分年龄的倒数;logtpa=样地株数的自然对数值。共有148个样地数据,1491个记录。

1.2数学模型

所考虑的胸高断面积收获的数学模型为

E(lny)=α+αlnN+αlnH+α+α (1)

这里lny、lnH和lnN分别对应logba、logdh和logtpa;1/t对应iage,其余为模型参数。通过不同假设,以上模型可以导出很多广泛应用的差分生长模型。例如假设α0为随林分变化的参数,运用代数差分法可以导出Pienaar和Shiver (1986)的胸高断面积模型[3];假设α4=0且α0为随林分变化的参数则可导出Forss等人(1996)提出的差分生长模型[4];假设α4=0和α2=0且α3为随林分变化的参数,则可以导出Souter (1986)的模型[5]。

1.3参数估计方法

从以上代数差分法的讨论中,总是假设模型(1)中有一个参数随林分变化而变化,因而使用“分类变量回归法”以便考虑这一特点。如果用SAS的reg过程,必须构造特殊的数据结构。用SAS的reg过程拟合线性差分生长模型有两点不足之处:1).需要构造复杂的数据文件。以本研究的为例,数据文件中需要增加额外的148个变量;2).reg过程无法考虑重复观测数据的自相关性和异质方差结构。由于所考虑的胸高断面积模型均为线性模型,而且数据为典型的重复观测数据,因而模型的拟合与筛选均用SAS的proc mixed过程。

1.4模型筛选和筛选指标选用

模型筛选包括期望模型和最优拟合的自相关与异质方差结构模型的筛选。Ngo和Brand(1997)推荐了两种模型选择方法[6]。一种方法就是首先列出所有可用的数学期望模型和所有可能的方差结构模型,拟合二者间的所有组合,然后根据模型拟合指标选择最优拟合模型。另一种方法为Wolfinger和Diggle提出的方法,即首先考虑最复杂的期望模型,并保持期望模型不变,然后选择最优拟合的方差结构模型。一旦选出最优拟合的方差模型,保持方差模型不变,再逐步简化期望模型。模型筛选指标较多,但常用的指标为极大似然比检验(LRT)、AIC、BIC(或称为SBC)。LRT用于嵌套的模型,而AIC和BIC用于非嵌套模型。

2.结果与分析

2.1残差的方差结构模型

为考虑经营措施对胸高断面积生长过程的影响,将模型(1)改写如下:(2)

这里参数?为不同经营措施对截距和各项回归系数的影响,下标k分别取值为C、F、H和HF,对应四种经营措施;由于差分生长模型需要确定一个随林分变化而变化的参数,因而模型拟合的首要任务就是识别该参数。假设“1/t”的回归系数随林分变化而变化,那么模型(2)则可以表示如下:

这里βi为随林分变化的参数。

根据以往的研究,所考虑的方差模型为:CS模型(同一林分不同年龄的观测值方差相同,而且相关系数为常数)、AR(1)模型(不同年龄观测值的方差相同,但相关系数为一阶自相关模型)、ARH(1)模型(相关系数为一阶自相关模型, 但不同年龄观测值的方差相异)和ARMA(1,1) 模型(不同年龄观测值的方差相同,但相关系数为一阶自相关移动平均模型)。

由于模型(2)中共有5个参数可以考虑为随林分而变化的参数(b0~b4),因而相对应地共有5个期望模型,加上所考虑的4个方差结构模型,所有组合共计为20个模型。首先拟合这20个模型,根据拟合统计量AIC、BIC确定随林分变化的参数及最优拟合的方差结构模型,这部分与Ngo和Brand的方法一致;然后保持方差结构模型不变,根据LRT、AIC、BIC剔除回归效果不显著的因子,包括经营措施效果等,即化简期望模型。而这一部分则与Wolfinger和Diggle的方法一致。方差结构筛选的基本SAS代码如下:

以上代码及以后代码中的粗体字为SAS系统关键词。class语句声明了3个分类变量,分别为fert、code及age。model语句中既包含离散型的分类变量,又包含连续型变量(如logba、logtp等,即未在class语句中声明的变量)。以上代码的model语句意义如下:

i).代码中model语句中的分类变量表示该变量对回归模型截距的影响。例如model语句中fert表示不同经营措施下的logba的回归模型的截距不同,随fert变量的取值变化而变化。

ii).如果一个连续型变量与一个分类变量的乘积出现model语句中,且仅以该形式出现,如code*iage,则表示该连续型变量的回归系数随分类变量的取值变化而变化。code是一个分类变量,每个取值对应一个样地,而iage为一个连续型变量,那么code*iage则表示每个样地的iage项的回归系数均不相同,各有其取值。

iii).如果一个连续型变量与一个分类变量的乘积出现,而且该连续型变量同时独立出现在模型中,同样表示该连续型变量的回归系数随分类变量的取值变化而变化,但与ii)的意义有所不同。例如logdh和fert*logdh同时出现在model语句中,表示logdh的回归系数随fert取值的变化而变化,而且每个fert取值的回归系数均表示为两个分量之和。一个分量为参照回归系数,另一个分量为与参照回归系数相比的增量(可负可正)。mixed过程按照英文字母的排列顺序,以fert的最后一个取值(即HF)为参照,其回归系数即为参照回归系数。而fert其它取值的回归系数则表示为参照回归系数(即HF)和与之相比增量之和。

以上model语句的对应的数学模型如下:

以上四个模型分别对应经营措施C、F、H和HF的回归模型。参数α0、α1、α2、α4为在HF经营措施下,林分胸高断面积的回归系数(参照回归系数);参数φi,k为k经营措施的第i个回归系数与HF相对应的回归系数相比之增量(k取值为C、H和F)。以对照C的lnH的系数为例,其回归系数为α2+φ2,C。这里φ2,C就是C的lnH的回归系数与HF的lnH的回归系数相比的增量。以上代码中,fert*logtpa、fert*logdh及fert*logdh*iage分别对应各项回归系数与HF的回归系数相比的增量,即φ;logtpa、logdh及logdh*iage则对应参照回归系数,即HF的回归系数α0、α1、α2和α4等。

依据模型拟合统计量AIC和BIC值(其值越小,拟合效果越好)选择模型,指定1/t的回归系数为随林分变化的参数和arh(1)为方差结构模型时,AIC和BIC均取得了最小值,分别为-3629.9和-3585.0。因而arh(1)为最优拟合的方差结构模型,并且可以确认1/t的回归系数为随林分变化的参数。

2.2最优拟合的期望模型

保持arh(1)结构不变,根据AIC、BIC及极大似然比检验的p值进行期望模型的筛选。模型(3)的拟合结果表明,经营措施H和HF各个参数差异并不显著,φ0,H、φ1,H、φ2,H 和φ4,H是否为0的t检验p值均大于0.05,说明经营措施H的各项回归系数与HF并无显著差别。将二者的回归系数合并为一,仅保留截距不同,可拟合如下模型:

(4)

这里bi,k=αi,k+φi,k(i=0,1,2,4;k=C,F,H和HF);b1,p、b2,p、b4,p为经营措施H和HF的回归系数,b0,H和b0,HF则分别为二者的截距。模型(3)便于比较不同经营措施的效果异同,而模型(4)则便于化简期望模型,即判断一个回归因子对胸高断面积的影响是否显著。注意模型(3)和(4)的唯一区别仅在于将模型(3)中第3个和第4个模型合并为一个而已(仅截距不同)。为拟合以上模型,新引进了一个分类变量“f”,其取值分别为C、F和H,其中经营措施H和HF的样地“f”变量值均为H。拟合模型(4)的SAS代码如下:

模型(4)的AIC、BIC的值均小于模型(3)的AIC和BIC值,LRT检验p值为0.1573,表明模型(4)与模型(3)拟合效果基本相当,但模型(4)更为简洁。由于参数的t检验结果表明仅对照C的lnH/t参数与0相比差异显著,因而剔除F、H和HF的lnH/t项(相应的模型称为模型5)。相对应地,在SAS的数据文件中引入了一个新变量“check”,当且仅当林分的经营措施为C取值为1,其它情形均取值为0。对应的SAS代码如下:

与模型(4)的SAS代码相比,仅用check*logdh*iage 取代了f*logdh*iage。模型(5)的参数t检验结果表明H和HF的回归模型中lnH的回归系数b2,p与0比较差异不显著(p值为0.1181),但剔除该项后的模型拟合的LRT检验平值、AIC、AICC、BIC表现出一种相互矛盾的结果。AIC和AICC表明两个模型拟合效果基本一致,而BIC和LRT检验结果则倾向于选择化简后的模型。本研究最终以模型(5)为最优拟合模型,部分SAS输出的参数估计值见表(2)。

表2 模型(5)的参数估计值

Table 2 parameters estimates for model (5)(下转第164页)

(上接第109页)*仅列出参数估计值部分,与code值相对应148参数估计值未列于此表。

2.3代数差分生长模型的导出

根据表(2)的模型结构,HF对应的回归模型为:

ln=+lnN+lnH+β (6)

假设t=t1时ln1已知,求解关于βi的表达式可有βi=t1(ln--lnN-lnH);代入模型(6)中可得当t=t2时的lny2的估计式,即:

ln=lny+++

其中ln1用lny1代替。其它经营措施的代数差分模型的导出基本相似,在此略过。

3.讨论与结论

本研究的模型筛选方法与以往研究不同。以往对差分生长模型筛选方法为:拟合选取的差分生长模型,让后根据拟合统计量如RMSE、R2选择最优拟合模型。本文从生长收获模型入手,而不是从差分生长模型入手。首先确定最优拟合的方差结构模型,同时确定最适合作为随林分变化的参数。然后保持方差结构模型不变的前提下,通过AIC、BIC及极大似然比检验的p值逐步化简期望模型。所有模型拟合和筛选均用SAS的proc mixed过程。该过程不仅非常便于拟合有分类变量的回归模型(例如经营措施),而且可以非常方便地拟合方差结构模型。本文所讨论的差分生长模型的拟合方法、筛选方法和拟合过程,均可以应用于其它林分因子如蓄积、优势木树高的线性差分生长模型。对于非线性模型,除了需要构造特殊的数据文件外,其它内容也基本相同。 [科]

【参考文献】

[1]倪成才,刘春梅,丁俊峰,潘晓茹.差分生长模型预测误差的分析[J].北京林业大学学报,2009,31(4):1-6.

[2]NI C,ZHANG L.An Analysis and comparison of estimation methods for self-referencing equations[J].Canadian Journal of Forest Research,2007,37:1472-1484.

[3]PIENAAR L V, SHIVER B D.Basal area prediction and projection equations for pine plantations[J].Forest Science,1986,32(3):626-633.

[4]FORSS,E.,GADOW,K.V.and Saborowski,J.1996.Growth models for unthinned Acacia mangium plantations in South Kalimantan,Indonesia[J]. Journal of Tropical Forest Science,8(4):449-462.

[5]SOUTER,R.A.1986.Dynamic stand structure in thinned stands of naturally regenerated loblolly pine in the Georgia Piedmont.Ph.D.Thesis,University of Georgia,Athens,GA.

差分模型 第4篇

本文对非线性模型参数估计问题进行了研究, 主要是借助DE算法的强大寻优能力来完成的。差分进化 (Differential Evolution, DE) 算法[1], 和其它进化算法相比, 有许多自身的优点, 它是一种基于群体差异的智能优化算法, 由Rainer Storn和Kenneth Price研究出。

1 非线性模型参数估计问题描述

非线性模型的一般描述为:

其中e是均值为0、方差为δ2的白噪声, θ为待估计的模型参数, y为系统输出, x为系统输入。非线性模型参数的估计问题就是根据已知的输入输出观测数据, 在模型结构确定的情况下。

(xi, yi) , i=1, 2, …, n, 求解偏差平方和为最小的θ值。其实质就是采用传统的优化方法难以求解, 将模型参数估计问题转化为非线性函数优化问题。

2 差分进化算法

DE算法是基于实数编码的演化算法, 它的基本思想是从某一随机产生的初始种群开始, 按照一定的操作规则进行迭代, 并根据个体的适应值, 淘汰差的个体, 保留优的个体, 引导搜索过程向最优解逼近。算法在迭代过程中保持种群规模不变, 假设种群规模为N, 令xi (t) = (xil (t) , xi2 (t) , …, xi D (t) ) , i=1, 2, …, N表示第t代种群中的第i个个体, D为空间维数, 在DE算法中, 主要包含变异、交叉和选择操作, 分别描述如下。

1) 变异操作。对个体xi (t) 实施变异, 生成ui (t+1) , 常用的变异操作如下:

其中, r1, r2, r3∈[1, N]互异且与i不同, F为缩放因子, 用于控制差向量的影响大小。

2) 交叉操作。交叉操作主要是为了增加种群的多样性, 具体操作如下:

其中, rand (j) 为[0, 1]之间均匀分布的随机数, CR∈[0, 1]为[1, D]交叉因子, 为之间的随机整数。

3) 选择操作。为了决定vi (t+1) 是否成为下一代的成员, 向量vi (t+1) 和向量xi (t) 按下式进行选择操作:

3 仿真试验和结果分析

菌体种子接入发酵罐以后, 在整个发酵期间, 若无杂菌和噬菌体的侵袭, 就在罐内按自然规律生长繁殖, 菌体在发酵罐内的自然生长繁殖过程, 罐内外没有大规模菌体迁移, 可以用Verhulst方程来描述:

在工业生产的实际过程中, 菌体的增殖有一段时间的滞后τ1, 鉴于接入发酵罐中的菌体有一个适应环境的过程, 为此, 将上式改写成:

对上述的微分方程进行求解可得:

式 (8) 即可作为菌体在发酵罐内的生长模型。r, a, k为待定模型参数, t为菌体生长时间, y (t) 为菌体浓度。

DE算法适应度值函数采用如下偏差平方和形式:

其中n为用于模型参数估计的样本个数, 为菌体浓度的模型估计值, yi为菌体浓度的实际观测值。

DE算法参数取为:种群规模为20, 最大迭代次数为100, F=0.5, CR=0.8。因本文针对系统模型的三个参数进行估计, 待估计参数r, a, k的取值范围由先验知识得均为[0, 5]。根据表1中的观测数据, 利用DE算法进行参数估计。表2给出了本文方法与其它四种方法的模型参数估计结果。为了验证本文方法的有效性, 将表2中的五种方法得到的估计值分别作为模型参数, 以表1中的实际观测数据作为检验样本, 进行模型拟合度的比较。

4 结论

本文对于用DE算法以谷氨酸菌体生长模型参数估计为实例进行了验证, 对解决非线性模型参数估计问题进行了探讨。

参考文献

[1]冯培悌.系统辨识[M].杭州:浙江大学出版社, 1999.

[2]蔡煜东, 陈常庆, 周斌等.用人工神经网络辨识发酵动力学模型参数[J].生物数学学报, 1994, 9 (4) :103-107.

差分模型 第5篇

本文首先以传送带上运动的物料袋为研究对象, 针对帧差法和背景减法在性能上互补[8]的特点, 提出了一种融合五帧差分与高斯模型的运动物料袋快速检测方法。首先以传送带和物料袋为研究对象, 采用改进的五帧差分法提取目标区域, 以减小环境光照的影响;同时以物料袋为研究对象, 利用单高斯模型进行背景的更新, 将中间帧图像与背景图像做差, 得到目标区域, 通过运动策略分析, 最后将两个目标区域进行形态学“与”运算, 从而消除了传送带在物料袋检测过程中的影响。

1 改进的五帧差分算法

设Fk (x, y) 、Fk+1 (x, y) 分别表示第k帧和k+1帧的图像, Hk (x, y) 为差分结果, 即:

式中 (x, y) 表示像素值的坐标。帧间差分算法中通常用一个阈值T分离运动目标与背景区域, 当差分值大于T时, 像素值取为1, 相反则为0, 从而将检测区域分为黑白两个区域。设Rk (x, y) 表示运动区域, 则:

原始的帧差算法中阈值T是一个固定值, 采用固定的阈值往往由于光线的变化容易产生噪声, 对环境变化的适应能力差, 从而影响检测效果。常见的阈值分割方法有3σ法则、自适应阈值法、最大间类法等。本文针对参考文献[9]的方法进行了改进, 相对于均值的方法, 采用中值更能适应环境的变化, 随着循环次数的增加, 对运动区域局部信息的检测也更加精确。T值的具体计算过程为:

(1) 首先确定灰度图像灰度值的最大值Max1和最小灰度值Mink, 则初始值Tk定义为:

(2) 根据Tk值将图像分割成目标和背景两个区域, 求前后两部分区域图象像素灰度值的中值XF、XE。

(3) 求阈值Tk+1:

(4) 当Tk=Tk+1时, 结束运算;否则k=k+1, 转到步骤 (2) 。

2 基于单高斯模型的背景更新

单高斯模型是一种经典的基于统计学的背景提取方法, 假设图像中每个像素都是独立的, 并服从一维正态分布, 于是:

式中xi表示图像的灰度值, μ表示图像在xi附近的均值, σ2表示图像在xi附近的方差, P (xi) 表示灰度值等于xi的概率。单高斯模型采用如下具体公式更新背景, 具体为:βt=aIt+ (1-a) βt-1 (6) 式中a为更新系数, 其中βt、βt-1、It分别表示当前背景、前一帧背景和当前输入图像。本文采用基于单高斯模型的背景更新, 更新方法如下:

(1) 设Fk-2、Fk-1、Fk、Fk+1、Fk+2为连续的五帧图像序列, Fk为NumFrm=k, NumFrm为帧数, 当k=3||k%5==3时, 进行背景更新, 否则继续。

(2) 为了补偿背景更新对其他图像帧的影响, 采用图像加运算的补偿方法, 当帧数满足 ( (k-1) %5==0) || ( (k+1) %5==0) 时, 保存该图像帧, 再对该帧相邻帧图像进行加运算, 其中NumFrm=k, NumFrm为帧数, 最后得到前景图像。

3 物料袋检测算法及描述

首先从视频流中获取五帧视频, 判断中间帧是否满足上述条件, 然后利用改进的五帧差分算法提取初步的物料袋图像;同时对获取的中间帧进行单高斯模型背景更新, 再用背景减法获得物料袋图像, 针对帧差法和背景差法互补的特点, 最后获取物料袋前景图像。

由于存在时间间隔与延迟, 从而使某些帧信息丢失。为此, 本文对该视频帧进行了统计分析, 如图1所示。结果显示, 当帧数满足 ( (nFrmNum-1) %5==0) | ( (nFrmNum+1) %5==0) 时, 检测到较为完整的物料袋, 而相邻帧图像出现了局部空洞图像, 如图1 (d) 所示。针对非刚体物料袋表面绝大部分具有相似性的特点, 本文通过完整物料袋图像的表面图像来补偿相邻帧不完整的图像最终得到了完整的物料袋目标图像, 如图1 (e) 所示。

4 实验结果及分析

实验所采用的视频来源于成都某食品公司的仓库, 视频中的物料袋为玉米袋, 视频内容为玉米袋装车时在传送带上的运动情况, 视频中包含了本文研究所包含的各种影响因素, 具体包括:运动的人、光线的变化 (明暗变化) 、复杂的背景等。实验中计算机的配置:CPU为Pentium T4400, 主频2.21 GHz, 内存2.00 GB;硬盘空间320 GB。实验中视频格式为AVI, 分别采用单包、连包情况下的3段视频进行试验, 视频设为I、II、III, 时长分别为1′17"、46"、1′5"。其中单高斯模型的更新系数为a=0.05。

图2所示为采用视频I, 并对传统的混合高斯模型 (GMM) 、单高斯模型 (SGM) 、五帧差分法 (FFD) 、以及本文算法 (Proposed Algorithm) 进行对比研究的结果, 其中图2 (a) 、图2 (b) 、图2 (c) 分别表示对视频第459帧、第732帧、第895帧的原始帧 (Original Frame) 图像及其检测效果。结果显示, 虽然各种算法针对的运动物体的检测条件不同, 而当选择传送带跟物料袋为整体研究对象时, 本文算法具有非常明显的优势。视频中人体局部在运动, 并且光照在时明时暗的变化条件下, 对检测结果影响不大。图中第459帧中的光线较其他帧图像强, 第895帧光线变暗。

图3所示为采用视频II和视频III对横向连包和纵向连包情况下的物料袋检测结果。图4所示为前景图像中白色区域的面积随时间的变化关系, P (t) 表示前景图像中像素点的实时分布概率。结果显示, 图4 (a) 对横向连包的检测结果比较明显, 曲线与横坐标所围的面积约为单包时的2倍。视频III中, 由于受传送袋上散落玉米粒的影响, 在66.7 ms~133.3 ms时间段内出现了两个峰值, 图4 (b) 中连包时峰值与相邻极小值所围的面积约为单包的2倍。

本文对传送带上运动的物料袋进行了研究, 针对帧差法与背景减法互补的特点, 提出了一种运动物料袋快速检测方法。该方法对环境变化有较好的鲁棒性, 实验结果得到了较好的检测效果, 因此可以应用于基于计算机视觉技术的物料袋在线检测、统计等相关研究与应用中。但是, 当传送带发生剧烈晃动时, 本文方法检测效果不太理想, 检测结果会出现局部面积较小的空洞。

参考文献

[1]赵延军, 徐丽明.基于机器视觉的苹果果袋检测方法[J].中国农业大学学报, 2006, 11 (1) :87-90.

[2]陈英, 廖涛, 林初靠, 等.基于计算机视觉的葡萄检测分级系统[J].农业机械学报, 2010, 42 (3) :169-172.

[3]丁筠, 殷涌光.蔬菜中大肠杆菌的机器视觉快速检测[J].农业机械学报, 2012, 43 (2) :134-139.

[4]陈浩, 王景中, 姚光明.基于类园分割的棒材计数图像识别[J].工程图学学报, 2004 (4) :89-103.

[5]李衡宇, 何小海, 吴炜, 等.基于计算机视觉的公交车人流统计系统[J].四川大学学报 (自然科学版) , 2007, 44 (4) :825-830.

[6]章东平, 童超, 芦亚飞.基于粒子视频的高密度人群主流运动检测[J].电子技术应用, 2012, 38 (4) :123-125.

[7]WREN C R, AZARBAYEJANI A J, DARRELL T J, et al.Pfinder:real-time tracking of the human body[C].Photonics East′95.International Society for Optics and Photonics, 1996.

[8]郝毫刚, 陈家琪, 远博, 等.基于五帧差分和背景差分的运动目标检测算法[J].计算机工程, 2012, 38 (4) :146-148.

差分模型 第6篇

关键词:运动目标检测,三帧差分,混合高斯模型

近年来,在计算机技术与数字视频技术的带动下,视频监控技术也日趋智能化,网络化,其中运动目标检测是智能视频监控的基础与关键。在固定单一摄像头的应用中,常用的运动目标检测方法包括四种:相邻帧差法,光流法,边缘检测法与背景差法[1]。相邻帧差法的基本思路是将前后两帧图像对应像素点的值相减,像素值变化大于设定阈值的区域则认为是运动目标,相邻相邻帧差法对于动态环境有较好的鲁棒性,但一般会丢失部分目标像素点,对于速度慢的运动目标,内部容易产生空洞现象。光流法其优点在于可以直接对场景进行目标检测,并且在摄像机运动的条件下,同样能检测独立运动的物体,但光流法大都计算复杂,耗时长,很难实现实时视频监控[2,3]。边缘检测法通过检测算法提取目标边缘特征,对背景噪声鲁棒性很大,但其算法复杂度也相对较大。背景差法的基本思想是将输入图像与背景模型比较,通过判定灰度值等特征变化来分割目标。近年来,基于混合高斯模型的背景差法因其良好的检测效果得到了学者们的广泛关注。

混合高斯模型是基于像素级建立高斯模型,对复杂场景的适应性较好,但其收敛速度较慢,对于场景中光照变化检测效果不佳,易将光照变化部分检测为前景目标。针对这些缺点,大量学者对此进行了改进[4,5,6,7]。基于此本文提出了结合三帧差分与改进型混合高斯模型运动目标检测方法,通过将三帧差分得到的背景图像更新到混合高斯模型的背景模型中,改善了混合高斯模型固有的光照变化检测不佳的问题,并且改进了经典混合高斯模型,提高了检测准确度。

1 三帧差分法

三帧差分法是利用前后三帧图像作差分处理得到两幅差值图像,再将两幅差值图像对应像素进行相乘处理,利用噪声在时间域上难以连续出现的特点,将两幅差值图像相乘就能消除由噪声影响产生的孤立噪点[8]。三帧差分法的具体运算公式如下:

其中Ik(x,y),Ik-1(x,y),Ik+1(x,y)分别表示当前帧图像,前一帧图像与后一帧图像。Dk(x,y)表示差值图像,1表示为前景目标,0表示为背景目标。由上述公式可以看出,阈值T的选取对于目标检测灵敏度有重要影响,若T值取得过大则部分运动目标被当成背景图像,T值取得太小则背景中的细微变化如光照与噪声会被检测成前景目标。在此我们参考混合高斯模型中的匹配条件,将T值取为μ+3σ,其中μ与σ为混合高斯模型主背景分布的均值与方差。

2 混合高斯模型

混合高斯模型法(Gaussian Mixture Model,GMM)又称之为统计背景模型法。最初由Stauffer和Grimson提出采用K个高斯分布(K取3~5)的混合模型表示背景像素的分布规律[9]。它的核心思想是:在一段时间的视频图像中,对于每一个像素点,用一个混合高斯分布模型来描述其样本灰度值序列的分布情况是合理的。因为每一个像素点的混合高斯模型参数都是不同的,所以混合高斯模型能准确反映各个像素点不同的分布情况。

2.1 模型定义

由K个高斯分布分量的加权和定义了混合高斯分布模型,其中K是固定不变的。其密度函数为

其中模型函数为;ωi是第i个高斯分布分量Ci的权重,且,μi和 σ12分别是Ci的均值和方差;η(xΘ)是Ci的密度函数。

2.2 模型匹配

算法运行时,每读入一帧样本,都要对样本进行模型匹配,若存在分布Ci与样本xj相匹配,即满足xj∈[μi-2.5σi,μi+2.5σi],则更新该分布的分布参数,若无任何分布与样本匹配,则增加一个新分布。

2.3 模型参数更新

由模型匹配结果可知,更新的具体方式分为两种:在模型匹配阶段,若找到已有分布与样本相匹配,说明该样本对应的分布在过去出现过,则更新现有的分布参数,增加其权重,改变其均值与方差,更新的公式如下:

其中Mi,t对于匹配的分布时为1,不匹配的分布为0。α为用户根据不同情况定义的更新率,ρ=α/ωi,t。若找不到任何分布与样本相匹配,说明该样本在过去一段时间内从未出现过,为了能够准确描述场景的实际变化,增加一个新模型分布Ck。考虑到新模型刚刚出现,样本灰度值尚不稳定,所以把均值初始化为其样本灰度值,即 μk=xj,权重 ωk按经验取较小的值,方差 σk按经验取较大的值。同时为了保持K值固定不变,需要丢弃权值 ωi最小的分布。

2.4 背景提取

一般而言,背景像素值变化较小,背景分布在时间占有率上具有较大的值。反映时间占有率的指标主要有权重 ω 与标准差 σ,其中 ω 越大,σ 越小则时间占有率越大,因此背景分布的权重 ω 应取较大值,而标准差 σ 应取较小值。在传统混合高斯模型中,将每个像素点的K个高斯分布按照 ω/σ 的比值由大到小进行排序,取大于阈值T的前B个分布作为背景模型(T一般取经验值0.85),剩下的作为前景模型。

传统混合高斯模型选取大于阈值T的前B个分布作为背景分布,但阈值T是用户根据经验选取的固定值,无法适应场景的变化而改变,当场景发生复杂变化时,该方法就不再适用。针对上述问题,本文提出另一种背景提取方法。

对于B个背景分布来说,他们的差异一般是由背景像素值的细微变化造成的,相互之间的差别并不大,基本都位于同一个灰度区域中[10]。如前所述,背景分布在时间占有率上应具有较大的值,所以其反映分布时间占有率的权重 ω 应取较大的值,而体现稳定性的标准差 σ 应取较小的值。在此假定 ω/σ 值最大的分布必然表示背景,因为该分布 ω/σ 值最大,所以选取其为主背景分布。然后搜索其余的分布,若满足| μb-μi| ≤2.5σi(其中 μb表示背景分布的均值,μi表示非背景分布的均值,σi表示非背景分布的标准差),说明该分布与背景分布处于同一个灰度区域,将其加入到背景子集中,不断循环下去,直到无法找出满足条件的分布,就终止搜索。

最后将当前样本像素点值按照模型匹配条件与前B个分布进行匹配,若找到分布与样本相匹配,则该像素点判定为背景点,找不到则判定为前景点。当样本所有像素点都完成了判定,就成功分割了前景图像与背景图像。

如图1 所示,上面三幅图像分别表示原始图像,传统GMM与改进GMM算法的检测效果图,从图中我们可以看出传统GMM算法与改进GMM算法对于室内简单场景检测效果都比较好,都能够检测出运动目标,但是改进GMM算法对于检测运动目标的整体轮廓要优于传统GMM算法,准确度要高于传统GMM算法。

3 结合三帧差分与改进混合高斯模型

上一节将传统混合高斯模型算法作了改进,提高了其对目标检测的准确度,但是面对场景遭遇环境突变等干扰时,其检测效果还不够好,对动态环境的鲁棒性有待提高[11]。基于此,提出将三帧差分与改进的混合高斯模型结合起来,利用三帧差分能快速检测出运动目标,对环境变化也有较好的鲁棒性的特点,来加快GMM算法的收敛速度,提高其对环境突变的抵抗力。算法的详细步骤如图2 所示:

(1)首先利用三帧差分法快速检测出前景运动区域,然后将当前样本减除前景运动区域,得到由三帧差分法检测得到的背景区域。

(2)将(1)中得到的背景区域以一定的比例更新到改进的混合高斯的主背景分布中,即:

其中 β 表示用户自定义的学习率,其大小反映对动态环境的适应程度,越大表示对三帧差分背景区域的学习程度越高,β 应取0 到1 之间,当 β=1 时,则算法检测的背景区域即为三帧差分检测得到的背景区域,算法退化成三帧差法法;当 β=0 时,则算法检测的背景区域即为改进的混合高斯模型检测得到的背景区域,算法退化成改进型混合高斯模型法。

因此需要选择合适的 β 值,使改进的算法既能保持GMM算法检测准确度高的特点,同时加快算法的收敛速度,使算法适应复杂环境的变化。本文取 β=0.4。

(3)重新读入样本,按照前面所述的改进的混合高斯模型算法进行样本匹配,分布参数更新,并提取最终的背景区域与前景目标。

4 实验结果与分析

本实验在普通PC(pentium 2.1G)机上进行,视频分别来源于一户外场景的监控录像和一交通监测录像,图像大小均为320*240 像素,视频流帧速率为24 帧/秒。本实验对算法的准确性与鲁棒性进行考察,并与三帧差分与改进混合高斯模型法进行比较。同时为了便于分析观察,我们将分割结果图像二值化,用白色表示非背景点,用黑色表示背景点。实验中三帧差分背景学习率 β=0.4,常数L=100, 新增分布初始 ωk=0.01,σk=50,检出率=(已检出像素点)/(所有运动目标像素点),误捡率=(检出的非目标像素点)/(所有非运动目标像素点),实验结果如图3 所示:

图3 是视频的测试结果,其中(a)(b)是原始图像帧,(c)是三帧差分法的检测效果,(d)是本文改进的混合高斯模型法的检测效果,(e) 是结合三帧差分与改进的混合高斯模型的检测效果。表1 是对视频240 帧检测后取得平均值数据。从算法鲁棒性与准确性来看,(c)中三帧差分算法前景图像内部出现空洞现象,检出率较低,但对噪声抑制效果明显,误检率低,说明算法准确性差而鲁棒性好。(d)中改进的GMM算法虽然提高了运动目标检出率,但是将部分噪声与光照变化部分误认为前景,误检率较高,说明算法准确性好而鲁棒性差,无法适应于环境变化大的场景。(e)中由于结合了三帧差分法与改进混合高斯模型法,对图像的光照变化与噪声抑制效果明显,提高了检出率的同时降低了误检率,算法的准确性与鲁棒性都得到了提高。从实时性能来看,本文背景建模算法达到了15 帧/ 秒的处理速度,基本能满足实时视频监控需求。

5 结束语

本文提出结合三帧差分与改进型混合高斯模型的运动目标检测方法,该方法先通过三帧差分快速获取一副背景图像,然后将该背景图像按一定比例更新到混合高斯模型主背景分布中,再按照改进的混合高斯模型进行背景提取,最后得到前景目标。主要工作内容包括两方面,其一改进了混合高斯模型的固定T阈值背景提取法,利用背景图像的特点,提出合理条件建立背景分布子集并提取前景点,较传统混合高斯模型提高了算法准确度。其二通过将三帧差分得到的背景加入到混合高斯模型背景分布中,利用了三帧差分法环境适应性好的特点改善了混合高斯模型光照变化检测不佳的缺陷。

参考文献

[1]周航.运动目标检测及跟踪技术研究[D].重庆:重庆大学,2013.

[2]李慧春.智能监控系统中运动目标检测方法研究[D].吉林:吉林大学,2012.

[3]Ye M.Robust visual motion analysis:piecewise-smooth optical flow and motion-based detection and tracking[D].University of Washington,2002.

[4]Haritaolu I,Harwood D,Davis L S.W4:Real-time surveillance of people and their activities[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):809-830.

[5]Leed S,Hull J,Erpl B.A Bayesian framework for Gaussian mixture background modeling[C].Proceedingsof IEEE International Conference on Image Processing,2003:973-976.

[6]Zoran Zivkovic.Improved adaptive Gaussian mixture model for background subtraction[A].In:Proceedings of the International Conference on Pattern Recognition[C].Amsterdam,Netherlands,2004:23-26.

[7]Wang Chao,Hou Li-min.A new parameter estimation algorithm of Gaussian mixture model[J].Journal of Shanghai University(Natural Science Edition),2005,11(5):475-480.

[8]吕国亮,赵曙光,赵俊.基于三帧差分和连通性检验的图像运动目标检测新方法[J].液晶与显示,2007,(1):87-92.

[9]Stauffer C,Grimson WEL.Adaptive Background Mixture Models for Real-Time Tracking[C].In:Proc.of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition,1999,2:246-252.

[10]钱晋.基于背景差法的视频车辆检测算法研究[D].上海:上海交通大学,2007.

差分模型 第7篇

关键词:风电,风速预测,时间序列,自回归滑动平均,差分自回归滑动平均

我国风力资源丰富, 风电产业的发展具有良好的资源基础, 风电己经在节约能源、缓解我国电力供应紧张、降低发电成本、减少能源污染、以及温室气体减排等方面崭露头角, 开始有所作为[1]。据《2012中国风电发展报告》统计, 到2011年底全国累计装机为62.36 GW, 并网容量47.84 GW, 并网率为76.7%[2]。为了应对风电的随机性、间歇性和不可控性, 系统在运行中必须加大供电系统的旋转备用容量, 以保证风电出力不足时能够正常向用户供电, 但是旋转备用容量的增加在一定程度上会间接的对风电运营的整体成本造成影响, 所以, 对风力发电场的风速进行中长期的预测, 尤其是短期预测是一般大型风力发电场并网运行的先决条件[3], 否则, 有效的风能资源不能得到充分的利用, 风电场的有效装机容量会受到巨大的制约, 风电场风速预测的准确性直接关系到电网的供需平衡, 直接影响着并网系统的运营成本[4]。

对风电场的风速进行预测是风电场规划、设计中的一项重要的工作[5]。风电场风速预测的方法较多, 如常规的持续法[6]、卡尔曼滤波法[7]、指数平滑法[8]、支持向量机回归法[9]、小波分析法[10]、神经网络法[11]、时间序列法[12]等。时间序列分析法是目前处理动态数据的一种行之有效的参数化时域分析方法, 时间序列分析法是依据获取的众多的历史数据进行建模, 构建出一个数学模型, 该模型能够描述所研究的时间序列, 从而达到预测目的。该模型具有以下优点:无须对时间序列信号产生的背景进行深入研究, 只需要根据时间序列自身的时序性、自相关性等, 再结合所获取的有限的时间序列样本, 就可以构建较高精度的数学模型。在分析AR、MA、ARMA、ARIMA模型的基础上, 现分析了预测模型的选用、模型的识别、模型的定阶和参数识别, 最后给出了预测结果。

1 风速时间序列模型

时间序列预测模型有几种形式, 它们是 (1) 自回归模型 (auto regression, AR) , (2) 滑动平均模型 (moving average, MA) , (3) 自回归滑动平均模型 (auto regression moving average, ARMA) , (4) 差分自回归滑动平均模型 (auto regression integrated moving average, ARIMA) , 其中, AR、MA和ARMA这三种模型为平稳的时间序列模型, 而对于ARIMA则是一种非平稳时间序列模型。GE.P Box和GM.Jenkins等人在20世纪70年代提出了用简单的ARIMA模型来对时间序列的相关资料进行分析, 并用它来进行相应的预测、控制[13]。进而ARIMA就开始比较广泛地在时间序列的预测中进行应用, 如电力负荷、气象参数等, 而且都取得了良好的预测效果。风电场的风速预测, 可以描述为:依据获取的历史风速数据, 构建相应的时间序列数学模型, 用它不仅可以描绘出随机变量———风速在变化过程中的统计学规律, 而且可以在此模型基础上建立风速预测的相应数学表达式, 从而可以有效的对未来某些时间进行相应的风速预测。

1.1 AR (n) 模型

自回归模型AR (n) 描述的是序列{xt}在某一时刻t和前n个时刻序列值之间的线性关系, 可以表示为

式 (1) 中, εt是一个随机干扰量, 构成一个零均值、方差为σa2的正态白噪声过程, 即εt∈N (0, σa2) , φ1, φ2, …φn为模型自回归参数, n为模型的自回归阶数, xt为时间序列的当前值。

1.2 MA (m) 模型

滑动平均模型的现在值由其现在和过去的干扰项的有限项加权和来表示为

式 (2) 中, m为模型滑动平均阶数, θ1, θ2, …, θm为滑动平均参数。

1.3 ARMA (n, m) 模型

ARMA (n, m) 它是一种了综合了自回归模型AR以及滑动平均模型MA的数学模型, 该模型的当前值可以看作是过去值的有限项的加权和及其现在与过去的干扰量的有限项加权和的叠加, 即

在该模型中, 用线性差分方程描述{xt}和{εt}这两个序列不同时刻之间的线性关系, 因此是一种线性时序模型, 如果序列{xt}是平稳、零均值的, 且t时刻的白噪声与当前时刻的xt (t>0) 不相关, 即

这一模型就称为n阶自回归和m阶滑动平均混合模型, 简称ARMA (n, m) 模型[14]。

1.4 ARIMA (n, d, m) 模型

在ARIMA (n, d, m) (差分自回归滑动平均模型) 中, 变量n和变量m为自回归和滑动平均部分的阶次, 变量d则为差分运算的阶次, 实际应用中的d一般不超过2[15], ARIMA (n, d, m) 模型是在ARMA模型的基础上建立、发展而来的, 其目的就在于:将获取的非平稳性时间序列进行相应次数的差分, 进而可以获得到平稳序列, 而后对平稳的时间序列构建ARMA (n, m) 模型。

对于一个非平稳的时间序列{xt}, 对其进行一阶差分的公式为:

因此, 一个d阶差分后的时间序列就可以写为

式 (7) 中, B为延迟算子, =1-B为引入的有序差分算子, d为差分次数。

在ARIMA (n, d, m) 模型中, 如果差分阶次d为零, 则ARIMA (n, 0, m) 就变成了ARMA (n, m) 模型, 由于AR (n) 模型和MA (m) 模型又均为ARMA (n, m) 模型的特殊形式, 所以, 如果已知一个随机的时间序列, 首先可以判断该时间序列的平稳性, 如果该序列平稳, 那么就可以直接建立其相应的ARMA模型;如果该序列不平稳, 那么可以通过若干次的差分其平稳化, 进而构建相应的ARMA模型, 因此建模过程可以统称为ARIMA建模过程[15]。

2 模型的识别

在获取了序列的自相关函数 (AC) 和偏相关函数 (PAC) 以后, 依据这两个函数判断序列用AR、MA或者ARMA中的哪一个模型来描述最为恰当[16]。

自相关函数用ρk来表示, 它描述的是和序列xt相邻近的诸多数据之间存在的相关性的程度, 偏相关函数用φkk表示, 它描述的是:在给定序列xt-1, xt-2, …, xt-k-1的条件下, 元素xt和元素xt-k存在的相关性的程度, 如式 (8) 、 (9) 所示。假定序列{xt}的自相关函数 (AC) 为ρ1, ρ2, …, ρm, …, 如果在k>m以后, 恒有ρk=0, 则称自相关函数 (AC) 具有截尾性;若不管k取多大值, 自相关函数ρk恒不为0, 但是它却逐渐衰减, 并且被负指数函数控制, 这种性质称之为拖尾性。

模型判定准则[15]如表1所示, 如果偏相关函数φkk在n步截尾, 而自相关函数ρk呈现拖尾性, 据此可以判断该序列比较适合AR (n) 模型;如果自相关函数ρk在第m步截尾, 并且偏相关函数φkk呈现拖尾, 而且呈现负指数衰减趋势, 据此可以判断该序列比较适合于MA (m) 模型;如果ρk和φkk两者都表现出了拖尾的性质, 则可以判断该序列比较适合与MRMA (n, m) 模型。

3 模型的定阶

模型定阶可以描述为:如何选取n、m, 使得构建模型的拟合性能能够达到最优。一般可以通过准则函数法来确定所构建的数学模型的阶次, 通常用的定阶准则函数主要有:AIC准则法、BIC准则法、FPE准则法等, 在此选取AIC准则。

AIC准则有个假设前提, 那就是:如果模型的阶次升高了, 那么模型对于逼近真实系统的准确性也就会相应的提高, 这是其比较有利的一个方面;但是, 模型阶次的升高也就是意味着模型相应的参数增多了, 进而就会导致相应的计算误差会进一步增大, 这是其不利的一个方面。所以, 综合有利方面和不利方面的影响, 二者应该可以存在一个比较恰当的阶次, 与此阶次相对应的模型就是比较合适的模型, 此即为AIC准则的思想。

定义准则函数:

模型参数最大似然估计时:

模型参数最小二乘估计时:

式中:N为样本数, σ2为拟合残差平方和, n、d、m为模型参数。

如果能够构建一个模型, 使其AIC准则函数值极小, 那么该模型就是一个最佳模型。通常风速序列的ARMA模型的阶次相对的比较低, 在建立其数学模型的时候, 首先设定好它的模型阶次的上限, 进而将n、m这两个模型的阶数从某一个比较小的数值选取, 然后依次增加, 估计所构建的ARMA模型的参数和残差方差, 并求出其相应的AIC准则函数值, 最后选择能够使AIC准则函数取极小值的模型阶次和参数作为最佳拟合模型。

4 参数的估计

一旦完成模型的识别, 那么模型的类别和阶数就基本上确定了, 接下来就是对已经定阶的模型进行参数的估计。对于ARMA建模来说, 最关键的部分就是参数的估计, 因为参数估计会直接影响到模型的拟合性能。

对于ARMA (n, m) 模型在对参数φi、参数θj以及参数σ2a进行估计时, 可以选用先后估计法, 这种方法的思路可以描述为:利用已经求得的自协方差函数Rk对滑动平均模型的截尾特性, 分别对自回归参数φi和滑动平均参数θj进行估计, 先估计出φi, 然后再对θj进行估计[17]。

进行参数φi的估计时, 依照自协方差函数Rk的递推算式, 可由下式估计φ:

式中, Rk是风速时间序列的自协方差函数, 可由式算出, 需要注意的是自协方差函数的下标, 当k<0时, 因为Rk具有偶函数的性质, 所以存在R-k=Rk。分别令k=m+1, m+2, …, m+n, 即可得到式 (10) 中的矩阵方程。式 (10) 即为修正以后的Yule-Walker方程。式 (10) 中, RB存在逆矩阵, 因而可以求解方程, 进而可以估计出自回归参数φi

在得到参数φi的估计值以后, 接下来再对参数θj进行估计。

在ARMA (n, m) 模型中,

则有:

鉴于前已估计得到的参数值φi, 就可以按照式 (12) 计算出序列{yt} (t=n+1, n+2, …, N) 。对序列{yt}进行线性运算以后, 它仍是一个平稳的时序。那么下一步需要做的就是对序列{yt}拟合一个MA (m) 模型。经过化简可以得到如下方程组

在方程组 (13) 中, 左边的变量Ry, k表示的是{yt}的自协方差函数, 该函数可以{yt}估计得出;而参数θj和参数σa2为未知参数, 所以, 可以通过求解该方程, 得出θj以及σa2这m+1个参数。在这里需要注意的是, 由于Ry, k是序列{yt}的分布特性, 但它却不是观测时序{xt}的Rk, 即Ry, k需要由序列{yt}算出。式 (13) 是关于参数θj和参数σa2的一个非线性方程组, 本文采用Gauss-Seidel法[5]进行方程组的求解。

5 预测实例与分析

选取山东某风电场某风力发电机的历史风速为例进行验证。风机记录时间为2012年1月1日0点至2012年6月30日23点。对每个月采取单独建模, 共计6组独立时间序列, 建模结果如表2所示。在此以5月份的数据为例对建模的过程进行说明, 对于其它月份, 其相应的建模过程类似。选取5月份获取的风速序列的前300个数据进行模型的建立, 首先求出序列的AC和PAC, 依据这两个系数, 可以得出原始序列的自相关图以及偏自相关图。依据获得的这两个图就可以原始序列进行判定, 可以判定为该序列为非平稳性时间序列, 必须进行数据的预处理。经验证, 在进行完二阶差分以后, 序列的AC和PAC迅速衰减到零, 所以, 在进行完二阶差分以后, 风速序列就变为一个平稳的序列了, 就可以采用ARMA进行相应的建模。在进行模型的定阶, 在[0, 12]范围内依次选取全部整数分别作为相应的AR、MA的系数, 并对所有组合进行拟合, 进而计算出在该AR、MA系数下AIC准则函数的对应系数, 最后, 选取使AIC准则函数系数最小的模型作为合适模型。基于已经建立起来的AIC最小的ARMA模型, 利用Rk对滑动平均模型MA (m) 的截尾特性, 对φi和θj这两个参数分别进行估计, 先估计出φi, 然后再估计出θj。

在进行风速预测的过程中, 通常用均方根误差和百分比误差作为预测误差的指标。对于这两个误差指标, 本文选用均方根误差作为衡量指标。使用已建立的ARIMA模型, 分别对2012年1~6月6个月份的风机分别进行1~6 h的预测, 计算出相应的预测均方根误差, 结果如表3所示。

在现代的预测技术中, 通常都把持续法作为一个比较的基准, 来评价所采用方法的精确度。因此, 这里也将持续法作为一个比较的基准。图1给出了ARIMA模型法与持续法的预测结果对比。

由图1可以看出, 预测的误差随时间的增长呈现上升趋势, 也就是说误差逐渐增大, 在第1~3 h内, 预测误差基本是在同一个误差范围以内, 大约1~2 m/s, 并且误差的波动相对较小;从第4个小时开始, 预测误差明显增大, 所构建的ARIMA模型在短期预测过程中的均方根误差在3 m/s左右。在风速平缓时, 误差比较小, 由此可知, ARIMA模型更适合于1~3 h的超短期预测。在风速比较平缓以及超短期预测时, 持续法具有明显的优势, 预测的结果在可以接受的范围以内, 相比于持续法, ARIMA模型的预测精度整体上要优于持续法, 并且随着预测时间的增长, ARIMA模型的优势越加凸显。

当然, 如果利用功率曲线将ARIMA模型预测的风速转换到相应的功率, 即可进行对应时间段内的风电功率输出预测。图2给出了对应时间段内的风电输出功率预测, 图中的直接功率预测是利用ARIMA模型直接预测的功率, ARIMA转换预测功率则是用功率曲线把ARIMA模型预测得到的风速转换至对应功率。

6 结论

差分模型 第8篇

当前, 流转税和所得税是我国税制结构中的主要税种, 流转税中又以增值税为主。1994年分税制改革确立了增值税在我国税制结构中的重要地位, 由于当时国家面临经济过热和严重的通货膨胀, 基于这一背景采取了生产型增值税, 即企业购进固定资产支付的进项税额不允许抵扣。生产型增值税在当时的经济环境下起到了很好的调控作用, 但随着市场化程度的提高, 各种弊端日益显现, 主要体现在生产型增值税存在重复征税, 导致市场调控经济的功能被扭曲。我国政府从2004年开始在东北三省和大连市开始增值税改革试点, 随后在2007年和2008年两次扩大改革试点范围, 在成功试点后, 2009年1月1日起在全国推广。关于增值税转型政策的研究, 在宏观层面, 现有文献多从产业的角度分析政策对经济、就业的影响。聂辉华等 (2009) 利用1999年至2005年国家统计局的工业企业调查数据, 采用双重差分模型研究增值税转型对企业行为和绩效的影响时发现, 增值税转型增加了企业的固定资产投资, 提高了企业的资本劳动比, 减少了企业的雇佣人数, 但增值税转型并没有提高企业的技术创新能力。陈烨、张欣等 (2010) 构建CGE模型模拟分析增值税转型对宏观经济和就业的影响时发现, 增值税转型对实际GDP的刺激作用非常有限, 却可能造成四百多万人失业。娄洪、刘跃峰等 (2012) 采用统计年鉴的季度数据实证分析增值税转型对国家税收收入的影响发现, 短期内增值税转型对税收的影响存在时滞, 且不同的税种影响效果不同, 长期来看会促进税收的增长。在微观层面, 现有文献多基于上市公司的数据分析增值税转型对绩效和融资的影响。回顾已有的文献不难发现, 关于增值税转型影响企业研发投资的文献很少, 聂辉华等 (2009) 的研究是基于规模以上企业的调查数据, 现有文献缺少基于上市公司层面的实证研究。本文利用中小板上市公司的数据来分析增值税转型对企业研发投资的影响, 选择中小板上市公司的理由在于, 在所有A股上市公司中, 中小板上市公司披露的研发投入产出信息是最完整的 (陆国庆, 2011) 。本文的创新主要体现在以下两个方面:第一, 本文基于上市公司层面来评价增值税转型的效果, 具体分析增值税转型对企业研发投资的影响, 在研究内容上丰富了已有文献, 同时为增值税转型的效果评价提供了上市公司层面的经验证据;第二, 采用双重差分模型估计方法, 更好地反映了政策的执行效果。双重差分模型分析方法是近年来学术研究中评价公共政策 (特别是税收政策) 的主要方法 (聂辉华, 2009) , 在西方被用于评价税收、劳动法案等是否有效。该方法既可以反映同一公司在增值税转型前后研发投资的差异, 也可以反映在某一时点上增值税试点企业和非试点企业研发投资的差异, 和普通的回归分析相比较, 双重差分模型能够分离出政策实施的“净效应”, 即增值税试点企业在试点前后研发投资的变化。

二、研究设计

(一) 制度背景与研究假设

1993年国务院颁布的《增值税暂行条例》规定, 我国增值税实行价外税, 增值税的缴纳采取抵扣制, 企业当期应纳增值税是销项税额减去进项税额以后的部分。由于当时我国经济面临投资过度和通货膨胀的问题, 出于调控经济的需要我国增值税采取的是生产型增值税模式, 即企业购进固定资产支付的增值税进项税额不得在缴纳增值税前扣除, 这实际上相当于对企业购买的固定资产进行重复征税。增值税改革试点首先从东北地区开始, 2004年9月14日财政部和国家税务总局印发《东北地区扩大增值税抵扣范围若干问题的规定》, 规定指出自2004年7月1日起, 在辽宁、吉林、黑龙江三省和大连市首次试点增值税转型改革, 初次试点的行业包含装备制造业、汽车制造业、石油化工业、船舶制造业、冶金工业以及农产品加工业, 首次试点采取的是增值税的增量抵扣制度, 即纳税人当年准予抵扣的进项税额以当年新增增值税为限, 当年新增增值税额不足抵扣的, 未抵扣部分可以结转下年继续抵扣。由于增量抵扣方式下很多企业并未享受到增值税转型带来的优惠, 2004年底, 由于实际发生的增值税抵扣远低于东北地区150亿元的减税预期, 2004年12月27日, 财政部、国家税务总局下发《关于进一步落实东北地区扩大增值税抵扣范围的紧急通知》, 通知指出, 为了体现增值税的减税效应, 如果试点企业有增值税欠税, 直接用固定资产进项税抵减增值税欠税, 不再受新增所得税的限制。如果纳税人在2004年7月1日到11月30日之间发生的固定资产进项税额抵减后仍有余额, 可以在纳税人2004年实现并已经缴纳的增值税中计算退税, 如果还有未抵扣的固定资产进项税则结转下年继续抵扣, 即政府临时实行增值税全额抵扣。全额抵扣政策实施的时间很短, 2005年2月, 财政部、国家税务总局下发通知将增值税抵扣政策调整为增量抵扣。继2004年东北地区增值税转型改革试点成功后, 2007年财政部、国家税务总局进一步出台《中部地区扩大增值税抵扣范围暂行办法》, 办法规定从2007年7月1日起, 在中部6省26个老工业城市扩大增值税转型试点改革, 此次试点除了范围扩大外, 行业也增加到8个 (装备制造业、冶金业、汽车制造业、农产品加工业、电力业、采掘业、石油化工业和高新技术产业) 。两次成功试点后, 2008年试点范围增至内蒙古东部和汶川地震灾区。2008年11月, 国务院审议通过了修订后的《中华人民共和国增值税暂行条例》, 暂行条例规定自2009年1月1日起, 在保持增值税税率不变的情况下, 增值税一般纳税人可以抵扣其购买设备中所含的进项税, 当期没有抵扣的进项税可以结转下期抵扣。实行生产型增值税时, 企业购入固定资产的进项税直接计入资产成本, 不能在当月缴纳增值税时抵扣销项税额, 此时企业成为该项固定资产增值税的最终承担者。由于固定资产的价值通常比较大, 特别是用于研发的精密设备, 实行生产型增值税无疑是在企业购买研发设备时附加一项金额为资产价值17%的税负, 对于资金紧张的企业而言这无疑是一笔很大的支出, 使得原计划的研发设备购买或技术更新项目变得不可能, 从而大大降低了企业研发投资的积极性。1994年我国税制改革确立的生产型增值税是为了抑制当时的投资过热和通货膨胀, 在当时的历史条件下起到了积极的调控作用。但随着我国市场制度的完善和经济增长模式的变化, 企业日益成为技术创新的主体, 经济增长不再是资本或投资驱动型, 而是创新驱动型, 所以制定有利于企业技术创新的税收政策是当前一项重要的任务。西方发达国家的增值税政策表明, 市场经济条件下, 企业是技术创新的主体, 消费型增值税更有利于促进企业增加研发投资。当生产型增值税转型转为消费型增值税时, 企业不再是购买固定资产增值税的最终承担者, 消费型增值税允许抵扣购进固定资产的进项税, 按照流转税的原理, 与固定资产有关的增值税继续向后流转, 由产品或服务的最终消费者来承担, 这相当于原来由企业承担的固定资产增值税现在转移给最终的消费者, 从而减轻了企业的税收负担, 企业内部留存的资金增加, 为其开展技术创新活动提供了足够的资金支持。基于上述分析, 提出本文的研究假设:

假设1:我国增值税由生产型转为消费型有利于企业增加研发投资

(二) 双重差分模型简介

如果一项政府政策对经济体系中部分对象产生影响而对另外一部分对象没有影响或者影响非常小, 此时政府政策的实施与自然科学研究中的自然实验非常相似。根据自然实验的研究方法, 通过比较受到政策影响对象的执行效果与不受政策影响对象的执行效果便可分析出政策的作用。然而, 社会经济问题无法像科学实验那样设定严格的外在条件, 更难以保证不受其他因素的影响。也就是说, 如果不存在增值税试点改革这样一个外生事件, 因变量仍可能受到其他因素的影响而发生差异。以本文研究的问题为例, 如果仅仅分析试点企业增值税转型前后研发投资的差异, 则无法来评判增值税转型的研发促进效应, 原因在于, 即使增值税转型前后试点企业研发投资存在差异也仅仅表明增值税转型与企业研发投资存在一定的相关性而不是因果关系, 因为企业研发投资在试点前后还会受到其他政策和各种经济因素的影响。为了分离出政策产生的“净效应”, 必须扣除试点前后其他因素的影响方可确定, 即试点企业在试点后是否增加了企业的研发投资。使用双重差分模型有一个重要的前提条件就是政策必须是外生的, 这一假定主要是为了保证研究样本进入处理组和对照组是随机的。所谓处理组是指受到政策影响的样本, 例如本文研究中有些企业进行了增值税试点, 被认为是处理组, 对照组是指没有受到政策影响的样本组。通常有两种情况会对双重差分模型的估计效果产生影响:第一, 如果存在某一不可观测的因素影响因变量同时影响样本是否进入处理组, 那么没有受到政策影响的样本此时已经不能作为对照组, 因为这种情况下处理组和对照组因变量未来发展趋势不同, 进一步造成政策“净效应”的估计结果偏大或偏小;第二, 如果政策实施后某些研究样本可以自我选择进入控制组或处理组, 即政策本身产生了一些内生的反应, 出现这种情形时使用双重差分模型是不正确的。本文研究的增值税转型政策不存在上述问题, 对中部6省的26个老工业城市而言, 2007年增值税扩大试点政策是一个完全外生的事件, 此外本文的研究样本中也不存在研究年份企业变更注册地的情形, 适合采用双重差分模型进行分析。与普通最小二乘回归分析方法相比较, 双重差分 (difference in difference, 以下简称DID) 模型具有以下两个突出的优点:一是DID方法可以有效解决政策变量的内生性, 即政策变量和因变量之间的相互作用效应;二是DID方法可以得到政策作用的“净效应”, 这种“净效应”综合了截面维度和时间维度的综合影响, 既体现了某个时间点上试点企业和非试点企业的差异, 也体现了试点企业在试点前后的差异。双重差分模型估计结果反映的正是在控制了一些共时性政策因素以及试点企业和非试点企业的事前差异后的“净效应”。双重差分模型估计的净效应如图 (1) 所示, 处理组 (treatment) 受到政策的影响, 控制组 (control) 没有受到政策的影响, t1和t2表示政策试点前后的观测时间点, 对处理组而言, 其在政策影响前后的差异为 (Yt2-Yt1) , 但这并不是政策产生的净影响, 因为如果不存在政策干扰, 仍有可能存在其他因素对因变量产生影响, 接下来根据控制组在政策影响前后的差异 (Yc2-Yc1) 来近似反映这一影响, 假定不存在干扰时处理组和对照组的时间变化趋势相同, 则政策最后产生的净效应为 (Yt2-Yt1) - (Yc2-Yc1) 。

(三) 数据、变量与模型

为了准确地获取研发投资数据, 本文的研究样本来自于深市中小板上市公司。我国中小板于2004年设立, 增值税转型的初次试点也是在2004年, 难以使用2004年试点的样本公司进行双重差分估计, 因为无法获取2004年以前的数据。2008年试点的范围较小, 且集中在经济不发达地区, 本文的样本公司包含的试点公司非常少, 同时由于2009年在全国推广, 如果用2008年试点的企业, 则观测样本中仅仅含有试点一年的数据, 不能有效反映政策的执行效果。以2007年中部地区进行的增值税试点来分析增值税转型对企业研发投资的影响。在样本公司中, 2004年和2008年试点的企业各有一家, 这里将这两家公司剔除。在剩下的140家企业中, 有11家为增值税转型试点企业, 剩下的在2009年之前未试点的企业作为对照组。最后基于数据的可得性, 为了尽可能增大研究样本, 选取了140家中小板上市公司2006~2008年的数据为研究样本, 对于2007年上市的企业, 2006年的研发强度数据有些披露在2007年或2008年年报中 (大部分年报的董事会报告中披露的是连续三年的研发强度数据) , 有些取自于招股说明书, 2006年的控制变量数据用2007年的年初数表示, 这主要是为了消除会计准则变动的影响, 保持数据的一致性。在使用双重差分模型分析时, 需要定义以下变量:政策影响变量test, 如果企业是增值税试点企业取1, 否则取0;时间变量time, 如果属于2007年和2008年试点期间取1, 属于2006年取0;交叉变量dtt为政策变量test和时间变量time的交乘项, 用来反映政策的“净效应”。因变量采用董事会报告中直接披露的研发强度来衡量, 控制变量除了规模、行业、市场竞争程度、企业年龄、人力资本因素、资产负债率、营业利润率和所有权性质外, 还专门加入一个反映所得税政策变动的虚拟变量dincometax, 其定义方式为:2008年执行新企业所得税法取1, 2006年和2007年取0, 这样做的目的是为了排除所得税政策变更的影响。变量定义如表 (1) 所示。本文使用的实证模型如下:rdit=α0+α1time+α2test+α3dtt+α4control+εit。

注:*、**、***分别表示在10%、5%、1%的水平下显著

采用上述模型分析增值税转型政策对企业研发投资行为的影响时, 重点关注交乘项系数的显著性, 也就是说如果上述模型中α3系数显著则表明增值税转型政策对试点企业研发投资有显著影响。

三、实证检验分析

(一) 描述性统计

表 (2) 的数据显示, 420个观测样本研发强度均值为3.95%, 其中试点企业11家, 占全部样本的7.86%, 民营企业100家, 占全部样本的71.43%, 高科技企业59家, 占42.14%。分析试点的11家企业在试点前后研发强度是否存在差异, 由于每家企业有试点两年的研发强度数据, 先求出每家企业试点后2007和2008年研发强度均值, 然后再将其和2006年进行均值差异T检验, 结果如表 (3) 所示, 试点企业在试点前后研发强度均值不存在显著差异。还分析了试点后 (指2007年和2008年) , 试点企业和非试点企业研发强度均值的差异, 结果如表 (4) 所示, 试点企业与非试点企业研发强度均值差异也不具有统计上的显著性。

(二) 回归分析

表 (5) 是回归分析的结果, 各估计系数均经过White (1980) 异方差稳健标准误调整, 交乘项估计结果的T值仅有-0.13, 不具有统计上的显著性, 表明增值税转型没有起到促进试点企业增加研发投资的作用, 与本文的预期不一致, 这一实证结果与聂辉华等 (2009) 的研究结论一致。进一步分析发现时间趋势变量也不显著, 而反映企业个体特征的变量除所有权性质不显著外, 其他变量均高度显著, 说明规模、行业、人力资本状况以及盈利能力等因素影响企业研发投资强度, 没有发现增值税转型对企业研发投资存在显著的促进作用。上述交乘项系数不显著表明增值税转型并未对企业研发投资产生影响, 可能的原因在于:第一, 相对于企业技术创新面临的技术风险和市场风险而言, 企业购进固定资产享受的增值税优惠是很小的一部分, 增值税转型在分散企业研发投资风险方面起的作用不大, 自然也没有促进企业增加研发投资。另外, 增值税转型可能对一些重工业, 比如装备制造业产生显著影响, 因为这些行业的技术改造和研究开发需要购入大量价值很高的固定资产 (卜伟等, 2011) , 但本文的样本没有这些类型的企业。第二, 在知识经济时代, 企业研发投资的投入要素中, 人力资本是非常关键的一部分, 表5的回归结果显示, 人力资本因素与企业研发投资显著正相关。随着电子计算机在生产中的使用, 在高新技术领域, 企业研发成功的关键往往取决于人力资本, 而在这些行业中固定资产投资小于人力资本投资, 自然增值税转型也没有显著影响。

(三) 稳健性检验

为了进一步探究增值税转型政策对企业研发投资的影响, 采用以下两种方式进行稳健性检验:第一, 改进对照组样本的选取。前述选取对照组时直接将非试点企业作为对照组, 考虑到本文的研究样本以制造业和信息技术业为主, 而试点企业均为制造业和信息技术业, 所以剔除了对照组中的7家非制造业和信息技术业公司后再次进行实证分析, 回归结果显示交乘项的系数依然不显著, 限于篇幅, 没有列示结果。第二, 增加数据的时间跨度。我国中小板2004年成立, 研究的是2007年增值税试点的企业, 基于数据的可得性, 上述分析中为了尽可能地增加研究样本, 数据的时间跨度为2006-2008年, 其仅仅包含了试点前一年的数据, 进一步扩大时间跨度, 选取2006年12月31日前上市且在董事会报告中连续披露了研发强度的65家上市公司为研究样本 (均为制造业和信息技术业) , 其中试点企业6家, 数据的时间跨度为2005-2008年。需要说明的是, 对于2006年上市的企业, 其2005年的数据通过查找招股说明书获取, 对于少部分没有在招股说明书披露研发强度数据的样本, 用2006年和2007年相邻两年的平均数代替。利用65家上市公司2005-2008年的260个观测样本再次进行实证分析, 结果仍然发现交乘项的系数不显著, 限于篇幅未列示结果。总的说来, 上述两种稳健性检验的回归结果均没有证实增值税转型对企业研发投资有显著的促进作用。

本文以140家在董事会报告中连续披露研发强度的深市中小板上市公司为研究样本, 采用双重差分模型分析我国增值税转型政策对企业研发投资的影响, 研究发现, 我国增值税转型政策对中小板上市公司研发投资没有显著影响。原因可能在于两个方面:一是增值税转型带来的税负减免在分散企业研发投资风险方面起的作用不大;二是在知识经济时代, 研发投入要素以人力资本为主, 增值税转型对人力资本投资没有直接的影响。

摘要:我国自2004年进行增值税改革试点, 2009年在全国推广。本文以140家在董事会报告中披露研发强度的深市中小板上市公司为研究样本, 采用双重差分模型分析增值税转型对企业研发投资的影响, 研究发现, 增值税转型对企业研发投资没有显著影响。

关键词:增值税转型,研发投资,双重差分模型

参考文献

[1]聂辉华、方明月:《增值税转型对企业行为和绩效的影响—以东北地区为例》, 《管理世界》2009年第5期。

[2]陈烨、张欣、寇恩惠、刘明:《增值税转型对就业负面影响的CGE模拟分析》, 《经济研究》2010年第9期。

[3]万华林、朱凯、陈信元:《税制改革与公司投资价值相关性》, 《经济研究》2012年第3期。

[4]陈丽霖、廖恒:《增值税转型对企业生产效率的影响》, 《财经科学》2013年第5期。

[5]卜伟、乔文俊、蔡慧芬:《增值税转型对我国装备制造业研发投入影响的实证研究》, 《北京交通大学学报:社会科学版》2011年第4期。

差分模型 第9篇

运动目标检测是从视频图像序列中检测和识别出运动目标的关键技术。运动目标检测对于提高数码监控系统的智能化程度、减轻监控人员的劳动强度、减少漏报警和误报警等有着重要意义[1]。在智能交通、安全监控、医疗诊断等领域有着广泛的应用[2]。

目前, 现有的运动目标检测方法主要有帧间差分法、背景差分法和光流法[3]。帧间差分法不足之处是不能检测出物体的准确位置, 且对帧的选择要求较高。光流法准确率高, 但是实时性差不适于实际应用。背景差分法原理简单易于实现, 并且可以较好的提取运动目标的信息。但是, 该方法对于背景环境要求高, 容易受光照和背景更替等因素的影响。

文献[4]提出一种基于帧间差分法与背景差分法相结合的算法, 这种算法不能消除背景更换造成的误判。文献[5]提出一种结合实时的背景差的三帧差分法, 这种方法没有讨论目标由长时间静止再次变为运动的情况。本文针对这两种算法存在的问题, 根据连续两帧图像的背景差分图像之间的关系来更新背景, 采用最大类间方差法来提取阈值, 减少环境光线变化和背景更替对检测结果带来的影响。

1 基于背景差分法和三帧差分法的运动目标检测

1.1 基于单高斯建模的背景差分法

本文算法是应用背景变化缓慢的场景, 所以采用高斯建模算法[6]。在场景背景比较简单的情况下, 基于单高斯模型和混合高斯模型的检测效果都很好, 但是混合高斯模型运算量比较大处理速度较慢, 所以采用单高斯模型。

其中Ft 是当前的像素值, P为在为在(0, 1)范围内的更新率。

1.2 三帧差分法

三帧差分法是连续取三帧图像, 相邻的两帧做差分, 在将两次差分的结果进行“与”运算, 从而得到运动目标的轮廓信息。

三帧差分法详细步骤可写为:

(1) f?x, y?为图像序列, 计算与相邻图像的差分图像。

(2) 将得到的两幅差分图像进行二值化处理, 得到两幅二值图像。

(3) 将得到的两幅差分二值图像进行逻辑相与, 得到目标二值图像。

1.3 自适应阈值的提取

合适的二值化阈值T不仅能够减低噪音的影响, 而且能减少运动目标的误检率。传统的背景差分法是人为设定固定的阈值, 不能很好的适应环境的变化。

图像大小为M×N, 当运动目标和背景的二值化阈值为T时, 图像中前景像素个数记为N 0, 所占比值记为 ? 0。背景像素个数记作N1 , 所占比值为 ?1 。前景的平均灰度为 ? 0, 背景的平均灰度为 ?1 , 图像的总平均灰度记为 ? , 类间方差记为则有:

最后采用遍历的方法, 使类间方差 ? 最大的阈值即为所求的最合适的阈值。

2 算法实现

基于背景差分和三帧差分法的运动检测算法流程图如图1所示, 具体步骤如下:

(1) 对当前帧进行背景差分得到一幅目标图像, 并进行二值化处理。

(2) 利用当前帧和相邻帧进行三帧差分得到一幅目标图像, 并进行二值化处理。

(3) 将两幅目标图像的二值化图像通过或运算, 并进行形态学处理后得到最终目标图像。

(4) 根据最终目标图像中目标像素的个数判断是否报警。

3 实验结果与分析

实验选用两段不同场景下的监控视频作为测试视频, V1为室内环境下的监控视频, V2是有多个运动目标的监控视频, 实验对比结果如图2所示。

从实验结果可以看出基于帧间差分法得到的运动目标存在空洞现象, 而利用背景差分法得到的运动目标并不完整, 本文算法较好的解决了这些问题取得了较好的效果。

本文算法是在vs2010下, 借助于OpenC V, 实时对监控视频进行运动检测的, 监控检测界面如图3所示。

图3中a为实时监控画面, b是为了直观观察背景更新情况而创建得到背景窗口, c是用来显示检测到运动目标的图像数量的窗口。

4 结论

本文采用三帧差分法和单高斯背景建模的背景差分法相结合的算法, 并提出一种新的背景更新机制。本文算法主要是针对简单监控场景, 并没有考虑复杂场景, 需要进一步的研究。

摘要:为了提高运动目标检测算法的准确性和对背景变化的适应性, 本文采用了三帧差分与基于单高斯模型背景差分法相结合的算法, 并通过最大类间方差法提取自适应阈值。引入一个新的背景更新机制, 当运动物体融入背景或者背景中物体移除时, 将背景更新为当前视频帧。实验结果表明, 本文算法在对运动目标进行检测时, 不易受背景光线变化及运动物体融入背景等因素的影响, 适用于无人监控环境。

关键词:背景差分法,三帧差分法,背景更新,运动目标检测

参考文献

[1]Serdar Ince, Janusz Konrad.Occlusion-Aware Optical Flow Estimation[J].IEEE Transactions on Image Processing, 2008, 17 (8) :1443-1451.

[2]杨学超, 刘文萍.视频图像序列中的运动目标检测技术[J].计算机应用与软件, 2011, 25 (1) :215-218, 2008.

[3]丁磊, 官宁生.基于改进的三帧差分法运动目标检测[J].电视技术, 2013, 37 (1) .

[4]陈文会, 张晶, 樊养余, 马爽.一种基于背景减法和帧差法的运动目标检测算法[J].电子设计工程, 2013.

[5]彭接力, 刘岩.物体融入背景情况下的目标检测方法[J].电子科技, 2012 (11) :102-104.

上一篇:高中英语词汇教学研究下一篇:构建高效的复习课堂