识别理论范文

2024-07-15

识别理论范文(精选10篇)

识别理论 第1篇

超(特)高压电网发生故障,保护装置必须可靠、快速地切除故障元件,否则就可能带来设备损坏甚至系统稳定性破坏等严重事故[1]。因此,提高保护装置的快速性和可靠性是继电保护工作者奋斗的目标。

传统工频电气量的保护原理[2,3,4,5]可靠、灵敏、应用广泛,发挥了重要作用。由于只利用了有限的故障信息,工频电气量的保护原理通常依赖于限制性的系统模型假设,且受故障暂态过程影响较大。单端量保护如距离保护,以牺牲灵敏度、延时开放来克服暂态超越;双端量保护如电流差动保护,动作性能受长线电容电流影响,需要滤波、计算补偿电容电流,保护动作速度很难进一步提高。

为提高保护动作速度,诸多学者相继提出了能量保护[6,7]、暂态量保护[8,9,10]、行波保护与测距[11,12]等,这些新原理都在利用故障暂态信息提高保护性能方面做了有益尝试,尤以行波测距在现场应用较为成功。

文献[13-16]提出的参数识别保护原理,利用全频域的故障信息计算识别被保护元件的参数,构成保护判据,理论上不受故障暂态的影响,可靠性高、动作速度快。实际由于故障网络的复杂性,准确识别具体元件参数往往归结为一个非线性问题的求解,从而增加了判据计算的复杂度,降低了保护的动作速率甚至可靠性。

为了避开参数识别可能遇到的非线性问题,基于模型识别的保护原理[17,18,19,20]得到了重视和发展。模型识别保护通过分析被保护元件区内、外故障特征,分别建立合理简化的区内故障模型和区外故障模型,无需求解具体的元件参数,只计算比较模型误差,确认与实测故障信号相匹配的故障模型,从而实现故障判别。传统的故障分量保护通常基于工频,需要滤波或延时躲过暂态影响,而模型识别保护原理采用全频域的故障信号实现保护,无需滤波,故障高频分量更有利于提高保护的灵敏度,模型误差采用时域中的短数据窗计算,保护动作速度更快。另一方面,随着传变特性更好的光电互感器的推广应用,模型识别保护原理对故障信号准确传变的高要求也有望得到解决。

本文重点分析模型识别用于继电保护的可行性,以及利用故障信号进行故障模型识别的本质特征,从而为以后模型识别系列保护原理的改进和实用化提供理论指导。

1 模型识别的原理

基于模型识别的保护原理,首先分析被保护元件的区内、区外故障特征,通过合理简化建立相应的低阶数学模型方程,再分别计算两种模型与实测电气量的匹配程度,从而区分内外部故障。同参数识别保护一样,模型识别也是利用全频域信息在时域中计算判据,实现保护原理的,但模型识别原理不具体求解元件参数,而只需计算模型误差。

对于任一被保护元件,分析其区外故障状态特征,总可以将其看作一个等效的RLC线性网络;同理,分析其区内故障状态特征,也可以将其等效为一个RLC线性网络。两种网络模型如图1所示。

根据电路原理,可得区外故障网络的电路模型方程如式(1):

定义式(1)电路模型方程对应的区外故障模型误差为:

同理,分析得到区内故障网络的电路模型方程如式(3):

通常区内故障模型方程(3)与区外故障模型方程(1)具有不同的阶数,即m≠p,n≠q。

定义式(3)电路模型方程对应的区内故障模型误差为:

要计算式(2)、(4)的模型误差,需要已知电路模型方程系数,而它们是由实际元件参数(RLC)决定的,有些参数可能无法准确测得,所以实际计算模型误差时,我们采用一定的数据窗实时识别出模型方程的系数,再计算该数据窗所对应的平均模型误差,从而大大增强了保护的自适应性。

利用实测故障信号(u,i),分别计算比较两种模型误差即可得到与故障信号相匹配的故障模型,模型识别保护判据一般如式(5):

区内故障时,实测故障信号(u,i)与区内故障模型相匹配,计算区内故障模型误差时,识别出的区内故障模型方程各系数均由真实元件参数所决定,是稳恒的,所以区内模型误差恒为零。若以此区内故障时的实测信号(u,i)计算区外故障模型误差时,识别出的区外模型方程各系数没有任何物理意义,是频率相关而时变的,模型误差很大。

以下我们针对某一被保护元件区外故障的等效网络(如图2所示),给出其相应的模型方程及模型误差。

由图2得输入电压、电流满足模型方程式(6):

模型误差:

由式(7)可见,该网络的模型方程系数是元件参数(RLC)的非线性方程,参数识别原理无法快速可靠地求解出各元件参数,而模型识别只需求解线性方程的系数,通过计算模型误差实现判据,从而避免了参数识别的非线性问题,而又保留了参数识别保护的所有优点。

2 模型误差分析

模型识别的保护判据归结为模型误差的计算,如果某故障模型与实测故障信号相匹配,计算出的该模型误差很小;反之,则很大。

以下假设某被保护元件进行故障分析后,得到其区内故障模型可等效为一电感模型,模型方程如式(9)所示;区外故障模型可等效为一电容模型,模型方程如式(10)所示。若当前发生区内故障,则实测到的故障信号(u,i)应满足式(9),电感模型是当前故障信号的匹配模型,电容模型则是不匹配模型。

区内故障的电感模型:

区外故障的电容模型:

假设电流i=Isin(ωt+ϕi),由于实测故障信号与电感模型相匹配,可得电压u一定满足:

实际计算识别出的电感模型方程系数有,是由被保护元件的各参数所决定的,真实存在且唯一稳恒。

区内故障模型误差:

计算区外故障模型误差时,先识别模型方程系数为:

显然模型方程系数C是频率相关的,则区外故障模型误差为:

此时,对与实测故障信号相匹配的故障模型(电感模型),识别出的模型方程系数(L)是真实存在且唯一稳恒的,模型误差恒为零;对于不匹配的故障模型(电容模型),识别出的模型方程系数是没有物理意义的,且数值上是频率相关的,模型误差非平稳而不恒为零。

上述推导中假设了故障信号(u,i)为单一频率分量的周期信号,实际电网故障时,故障信号(u,i)频谱极为丰富,可近似看作无穷多个周期分量信号的叠加。对与实测故障信号相匹配的故障模型,(u,i)中所有分量均满足其模型方程式,模型误差稳恒为零;对于不匹配模型,由于识别出的模型方程系数是频率相关的,且(u,i)中各频率分量大小不同、衰减快慢迥异,计算出的模型误差远大于零且非平稳波动。

3 ATP仿真实验

本文利用ATP仿真工具进行模型识别的计算实验。以式(9)、(10)所示最简单的电感、电容模型电路为例,验证各种故障信号下,模型方程系数和模型误差的计算结果。仿真模型如图3所示,其中S为电流信号源,C为电容参数取为C=2.7μF。

当取信号源时,进行模型方程系数和误差的计算,结果如图4所示(注:A=500、φ=30°、ω1=50 Hz、ω2=150 Hz、ω3=300 Hz)。

由图4可以看出,由于故障信号来源于电容电路模型,即电容模型为匹配模型,所以识别出的电容模型系数稳恒等于真实参数;而电感模型为不匹配模型,识别出的电感模型方程系数则在0.1~0.5之间波动。电容模型误差恒为0,而电感模型误差则在0.4~0.9间波动。

当分别取单一频率信号源S=Si,i=1,2,3时,进行模型方程系数和模型误差的计算,结果如图5所示。

由图5可见,在任一单频率信号下,电容模型系数都可以准确识别,且恒等于元件真实值,电容模型误差计算为零。另一方面,电感模型误差同样恒为零,且电感模型参数也识别出一个恒定值,所以单一频率信号将无法区分电容、电感模型。但不同频率分量识别出的电感结果差别很大,频率越高识别出的电感值越小,这与式(13)的结果一致。

取信号源S=S1+Si,i=2,3时,进行模型系数和模型误差的计算,并与S=S1+S2+S3的实验结果进行比较,如图6所示。

由图6可见,去掉高频分量S3后,电感模型误差显著变小,识别出的电感系数则会变大;而保留高频分量S3,仅去掉S2,电感模型误差以及识别出的电感系数几乎都无变化。可见,不同于传统保护将高频分量看作干扰,模型识别保护则将高频分量作为有效信息加以利用,在高频分量充足的暂态过程中,模型识别原理的保护将更加灵敏。

在高压电网的故障暂态过程中,不仅有各次谐波还有衰减非周期分量,本文采用图7所示的故障来模拟加入非周期分量S0,其中RC=120 ms。

采用电压、电流突变量信号来进行模型系数的识别和模型误差的计算,结果如图8所示。

由图8可见,衰减非周期分量的加入,对电容模型方程系数的识别及电容模型误差的计算均无影响。但电感参数的波动幅度明显增大,达到了-10~10;电感模型误差却变化不大。这是由于电压、电流信号中的非周期分量不是成对出现的,实际高压电网故障时,电流中衰减非周期分量很大,而电压中几乎无非周期分量;在本例的故障信号中,电压中有很大的衰减非周期分量而电流中则没有非周期分量,若以非周期分量进行电感模型系数识别时,有情况,所以此时L的大小不定,有较大的波动。而在时域中计算模型误差时,其大小取决于模型方程系数的时变效应。从数学上说,时变的模型系数是由于模型方程的非适定造成的;从物理上说,这是因为各频率分量决定的模型系数是不同的,且各频率分量的衰减快慢不同。所以丰富的周期分量会带来模型系数的快速和大幅变化,然而非周期分量的能量主要集中在低频,频谱能量相对集中,所以不会带来模型系数的快速时变,这也可从图8(a)和图4所示的电感参数识别结果对比看出,图8(a)中非周期分量使得电感模型系数变化幅度很大,但变化缓慢;图4中的电感系数虽然变化幅度不大,但时变效应明显。可见,非周期分量会对参数识别方法的实际计算精度有所影响,但对模型识别的保护原理,影响很小。

4 结论

本文详细阐述了模型识别保护原理的本质思想,通过理论分析和仿真实验得到以下结论:

1)通过对被保护元件的故障特征提取,分析简化后建立可识别的区内故障模型和区外故障模型,通过计算模型误差识别出与实测故障信号相匹配的故障模型,从而区分内外部故障。匹配模型的误差恒为零,不匹配模型的误差很大且非平稳波动。

2)不匹配模型的误差源于求解出的模型方程系数具有时变性,这是由于故障信号中不同频率分量定解出的不匹配模型方程的系数是不同的,又各分量衰减时间常数不同,从而识别出的不匹配模型的方程系数是非平稳时变的。

3)模型识别保护原理利用全频域的故障信号进行故障判别,几乎不受故障暂态的影响,避免了参数识别保护的非线性问题却继承了其优点,保护可靠、动作快速。

摘要:通过对被保护元件的区内、区外故障分析,分别建立区内故障模型及区外故障模型,采用时域中短数据窗,分别计算故障实测信号与两种模型的匹配程度,判别内、外部故障,从而构成模型识别的保护新原理。物理分析指出,对与实测故障信号相匹配的故障模型,计算出的模型方程系数由真实元件参数所决定,唯一稳恒,其模型误差恒为零;对不匹配的故障模型,计算出的模型系数没有物理意义,模型误差很大且非平稳波动。数学分析指出,与实测故障信号相匹配的故障模型方程恒成立,模型误差为零;不匹配的故障模型的方程系数则是频率相关的,模型误差很大。ATP仿真实验进一步证明了上述分析结果,利用故障暂态过程中的全频域信息可以实现基于模型识别的保护,该原理可靠性高、动作速度快。

识别理论 第2篇

摘要:运用模糊数学基本理论和方法,以国家地表水环境标准为依据,对5月至7月乌梁素海水质状况进行评价,并将实地水质监测结果与评价结果对照分析.评价结果与实际情况相符,能够比较准确地反映乌梁素海的水质等级变化.证实了模糊模式识别方法应用于湖泊水质评价中的合理性和可靠性,对于湖泊水质评价具有实际意义.作 者:彭芳 任春涛 王丽 郝伟罡 曹有玲 PENG Fang REN Chun-tao WANG Li HAO Wei-gang CAO You-ling 作者单位:彭芳,PENG Fang(内蒙古河套大学,水利系,内蒙古,临河,015000)

任春涛,王丽,郝伟罡,REN Chun-tao,WANG Li,HAO Wei-gang(内蒙古农业大学,水利土木建筑工程学院,内蒙古,呼和浩特,010018)

曹有玲,CAO You-ling(内蒙古水利水电勘测设计院,内蒙古,呼和浩特,010020)

识别理论 第3篇

关键词:计算机智能化;图像识别技术;理论性探究

中图分类号:TP391

计算机智能化图像识别主要是利用计算机系统对输入的图像进行处理和分析从而识别出多种不同模式的对象。计算机技术和信息技术的不断发展使得计算机智能化图像识别技术得到了越来越广泛的应用。信息时代的今天,人们在生产实践的活动过程中已经不再凭借身体的各个器官来接受信息和感知世界的,计算机智能化图像识别技术可以快速地获得所需要的信息从而帮助人们更好地思考和决策[1]。虽然计算机智能化图像识别技术在我国已经获得了相当程度的发展,但是要想赶上时代的步伐应对变化莫测的国际市场就必须对计算机智能化图像识别技术进行理论上的突破。本文在此将重点讨论计算机智能化图像识别技术的相关发展和创新。

1 计算机智能化图像识别系统概述

计算机智能化图像识别系统一般分为五个部分,即对所要识别的图像通过一定的方式将其输入到计算机内,经过计算机预处理和特征提出再对识别的图像进行匹配和分类。作为计算机智能化图像识别的第一步,图像输入主要是将已经采集到的图像输入到计算机内进行处理。计算机预处理过程主要是对将要识别的图像进行图像区和背景区的分离并且将图像进行细化增强图像的二值化,提高计算机智能化图像识别的后期处理的速度和效率。为了能够尽量地还原图像的真实性和减少其虚假特征可以将图像的特有特征用数值的形式表示出来。在计算机智能化图像识别系统中如果需要将输入的图像与已有的图像进行匹配就必须用一种精确的方法将其分配到不同的图像库中减少计算机对图像的搜索时间。在计算机智能化图像识别系统中为了准确地判断出所输入的图像的性质就必须把当前输入的测试图像和之前已经保存的图像进行对比和分析。具体如下图所示:

图1 计算机智能化图像识别系统

一般来说,计算机智能化的图像识别技术常用的方法包括统计识别法、句法识别法与神经网络识别法等三种方法。

(1)统计识别法。由于在实际图像中背景与目标的线性是不可分割的,所以统计识别法是具有最小分类误差的一种方法。其原理主要以数学中有关决策理论的知识为基础,建立统计学的识别模型,并通过此类模型对图像作出分析与统计,寻找图像中认识的规律性,最终利用图像特点中本质特征的提出来实现识别。

(2)句法识别法。此类方法是统计识别法的一种补充,其对图像特性的描述主要依靠的是符号。由于句法识别法学习了语言学内句法层次的结构排列,所以它能够通过分层表述的方式将复杂的图像简化为简单的多层子图像或单层图像,能够有效突出被识别图像结构的信息。

(3)神经网络识别法。所谓神经网络识别法,主要是指利用神经网络中计算的方法对目标图像作出识别的一种方式。由于神经网络存在着能够实现分布式处理与存储、能够大规模实现并行、具有自适应与自组织能力,所以此类方式在处理需要同时对模糊与不精确的许多条件与因素作出考虑的图像进行处理时尤为有效。

2 计算机智能化图像识别技术的研究现状

在对图像进行识别和处理的领域中图像的识别和分割是一个也重要的问题。虽然在相关专家和工作人员的共同努力下取得了相关的发展,但是还是有许多的问题需要解决。传统的图像识别主要经历了文字识别和数字处理以及物体识别三个阶段。在20是50年代的时候文字识别的对象主要是字母和数字以及符号,许多的专用设备都开始广泛地运用了这一技术。在20世纪60年代中期数字图像开始运用于对图像的处理和识别的研究领域,数字化图像处理更加具有存储量大和方便传输和压缩等优势,为图像识别技术的发展提供了非常广泛的发展空间。数字图像处理主要是表现在对物体的识别中的三维数据和图片的感知和认识。物体识别主要是在前两个阶段的基础上借助了人工智能化的特点将其研究和探索的成果广泛地运用到各种行业领域中。

计算机智能化图像识别技术在目前需要提高其对图像的识别能力,在图像的传输过程中充分地运用不同类别空间的映射[2]。作为一种成熟的图像识别和处理技术,计算机智能化图像处理技术在不断地研究和发展,对各种图像的类别和特征进行有效地对比和匹配,提高图像处理后的清晰度和识别度。

3 计算机智能化图像识别技术的特点和优点

3.1 计算机智能化图像识别技术的主要特点

(1)信息量大。计算机对图像信息的处理主要是采用二维信息的方式,因此对计算机的配置和计算机的运行系统的速度以及计算机的存储量都有非常严格的要求。图像信息与语言信息相比所需要的频带较宽,无论是在计算机的成像过程中还是在图像的传输中以及图像信息的存储和处理的过程中都需要一定的科学技术。

(2)相关性大。计算机系统中对图像的各个像素都是具有一定的关联性,所以在计算机智能化图像的识别过程中需要对输入的各种图像信息进行有效地压缩才能够对不同的图像信息进行分类和匹配。尤其是对三维景物的选取上,输入的图像本身是没有再现三维景物的几何信息能力,因此对三维景物的背后所需要反映的部分信息必须进行适当地假设和重新的测量[3]。计算机在对图像进行智能识别的过程中需要对三维景物进行适当地引导以便于解决在计算机智能化图像识别过程中所产生的问题。

(3)人为因素大。计算机智能化图像识别在对图像进行后期处理之后总是由人来进行评价的,因而计算机在对图像进行智能化识别的时候受人的因素影响较大。然而,人的眼睛总是会受到周围环境的影响以及情绪和知识兴趣爱好的影响。因此,为了提高计算机对图像进行智能化识别的质量应该尽量地让计算机模仿人的视觉,充分地模拟人们在对图像进行观察和评价时候的状态。

3.2 计算机智能化图像识别技术的优点

(1)精确度高。因为现在的科学技术水平的限制只能将一幅模拟的图像进行数字化处理转换为一种二维数组,基本的扫描仪都能够对图像的像素转化为32位。因此计算机智能化图像识别能够将任何的图像的精确度满足用户的任一要求。

(2)表现型强。计算机智能化图像处理可以准确地处理影响图像处理的相关因素,例如图像的存储状况和图像的输入过程中出现的问题和故障。计算机智能化图像识别系统能够在任何的情况下对图像进行还原和再现从而保证了图像在经过计算机识别和处理的时候的像素。

(3)灵活性好。计算机智能化图像识别系统在对图像进行识别和处理的时候,可以根据图像的客观情况来将其放大。由于图像的信息总是来自于各个方面,无论是来自生物显微镜下的细胞图像还是对于宇宙中位于天文望远镜下的庞然大物都能够在计算机智能化图像识别系统中进行识别和处理,通过线性运算和非线性处理实现图像的识别功能[4]。在对各种不同的图像信息进行正确地编码之后用二维数据将图像的灰度进行组合在计算机上可以清晰地显示出图像的质量。

4 计算机智能化图像识别技术的理论性突破

4.1 计算机智能化图像识别技术朝着高速化和标准化的方向发展

无论是在生活领域还是科学领域计算机的运行速度都会对生活和工作产生重要的影响。尤其是对图像进行智能识别对计算机具有特别的要求,而现在的计算机在科学技术水平的促进下不断地提高其自身的硬件水平。不仅如此,在计算机的内部配置方面也比以前有了相当大的进步,计算机在进行图像的采集和处理的过程中分辨率都大大地提高了,同时对图像的存储设备的性质也在日益地更新。图像作为一种二维度信息,计算机将其进行识别的过程中将更多的三维信息赋予图像中并且通过各种计算和技术的处理而得到相应地改进[5]。

同时,计算机在对图像所显示的数据进行整理和压缩的时候开始以多媒体的形式对其进行信息化转换,使得计算机智能化图像识别尽量能够按照人的思维和意识来进行从而提高计算机的智能化水平和对图像识别的工作效率。

4.2 计算机智能化图像识别技术朝着多维方向和高科技方向发展

计算机在对图像进行识别的过程中开始从二维角度向三维角度和多维角度发展,因此对各种图像的数据信息处理的更加精确。目前由于硬件水平的逐渐提高,计算机的中央处理器的功能也在不断地提高,因此计算机智能化图像识别的领域越来越广泛。随着新的技术理论和新的科学计算方法的诞生,计算机在对图像的识别和处理过程中更加侧重对其详细的信息进行分类和整理,经过系统的转化后形成高清晰度的图片。

5 计算机智能化图像识别技术的运用

计算机智能化的图像识别技术尽管面临着许多困难与问题,但此类技术依旧得到了较好与较快的发展。就近些年其变化与发展而言,在今后的发展过程中,计算机智能化的图像识别技术将会出现飞速的发展阶段,人工智能与立体视觉同时也将成为计算机智能化的图像识别技术未来发展的方向。由于短时间内图像识别技术实现计算机通用性较大的全自动系统的可能性较小,所以在未来的发展历程中,计算机智能化的图像识别系统需要和不同类型的应用进行结合开发。

5.1 医学生物工程

计算机智能化图像识别技术可以对诸如红细胞和各种染色体进行识别,从而有利于医生更好地了解患者的病情和更好的医学研究。在医院的很多部门例如心电图的分析以及彩超和超声波图像处理都广泛地运用了计算机智能化图像识别技术。

5.2 工程建设方面

计算机智能化图像识别技术在工程项目的建设过程中得到了广泛的应用,尤其是对相关零部件的检测和分类以及对输电线路故障的分析和排查方面都借助计算机的智能化工程得到了有效地解决。在工业生产过程中,施工人员对工程的焊接和装配的过程中都充分地运用计算机对图像进行智能化识别从而减少了施工误差的发生,保障了整个工程项目建设的质量。

5.3 文学艺术方面

文学艺术方面对计算机智能化图像识别技术的使用非常普遍。在广播电视领域,电视要想播出高清晰度、高质量的画面就必须借助计算机对所拍摄的画面进行处理和识别。计算机能够对动态图像进行相应地采集加工合成从而形成电视画面。为了避免图像在播出的时候出现失贞的情况,计算机可以对输入的画面进行智能化处理,尤其是一些人为的失误都能够通过计算机进行自动地调整。在美术方面,计算机智能化图像识别技术可以对每一幅作品的像素和色彩方面进行相关地调整,使其输出后能够更好地反映现实生活的。除此之外,计算机智能化图像识别技术在服装设计与制作和动画制作以及发型设计等方面均发挥了重要的作用。

5.4 商务业务方面

计算机智能化图像识别技术在电子商务和酒店商务方面具有重要的影响,其可以在很多的方面代替人工操作从而节省大量的人力资源。比如,员工每天在进行上下班的时候都可以在经过大门通道的时候进行电子身份签到和认证。同时对于一些重要的商业资料也可以通过计算机智能化图像识别技术进行防伪说明等等。

除此之外,计算机智能化图像识别技术还经常运用于航空航天事业和通信工程事业以及科学研究等领域方面,为我国的经济发展带来了重大的影响。

6 结束语

文中通过对计算机智能化图像识别技术的特点和概念以及其优点等方面进行了简要地分析和阐述,同时对其在理论上的创新和突破进行了讨论。计算机智能化图像识别技术在科学技术的发展下还有很长的路要走,我们必须对其进行高度地重视。随着社会的发展,对图像进行智能化地处理越来越重要。计算机智能化图像识别技术在工业和农业以及科学研究等各个方面将发挥关键的作用。同时,计算机智能化图像识别技术在不断地运用和发展过程中将会越来越成熟。

参考文献:

[1]杨小冬,宁新宝.自动图像识别系统图像分割算法的研究[J].南京大学学报,2009,40(4):424-431.

[2]李建华,马小妹.基于方向图的动态阈值指纹图像二值化方法[J].大连理工大学学报,2008,42(5):626-628.

[3]康剑莉,陈罡,毛金明.基于Cabor小波特征的磨粒图像识别新方法[J].激光与红外,2010,3,35(3).

[4]柳稼航,杨建峰,单新建,尹京苑.一种基于优先搜索方向的边界跟踪算法[J].遥感术与应用,2011,19(3):209-213.

[5]成金勇,范延滨,宋洁.基于小波分析与Snake 模型的图像边缘检测方法[J].青岛大学学报:自然科学版,2012,3:78-81.

作者简介:唐录洁(1977.5-),女,贵州凯里人,本科,讲师,主要研究方向:计算机应用与技术。

识别理论 第4篇

梁杰、刘英男 (2005) 根据SASNO.99中有关规则提出的“舞弊三角”风险测评模式, 结合我国企业的实际情况, 建立了舞弊“三元素”理论。该理论指出:诱因、机会和手段是财务报告舞弊不可或缺的三个元素, 即巨大的利益驱动成为舞弊的原动力, 环境控制的缺乏使舞弊成为可能, 变化多样的欺诈手段促成舞弊的实现。当舞弊的三个因素同时具备的时候, 舞弊就很可能发生。

舞弊三元素并不是孤立存在的, 而是相互关联、相互影响的, 其中诱因是内生动力, 机会与其相互关联性提供外在空间, 而手段则是行为策略的选择, 作为直接工具确保目的达到。各元素相互作用、相互影响共同构成财务报告舞弊的三元素理论体系。因此, 一个全面的舞弊识别模式应当包括这三个维度的基本元素。

二、财务报告舞弊识别模型的构建

(一) 舞弊特征识别卡体系的构建

首先, 基于对舞弊三元素理论及相关研究假设的分析, 建立“公司舞弊特征识别卡”。该识别卡将财务报告舞弊的各项因素按照“三元素”理论分为三大类, 并在此基础上细化为小的特征表现指标。信息使用者可以根据识别卡所列示的特征指标对上市公司的财务报告及相关资料进行“扫描”, 初步识别出有可能舞弊的上市公司。

其次, 根据以上对“三元素”理论的分析, 我们从舞弊诱因、舞弊机会和舞弊手段三个方面构建了舞弊特征识别卡, 并将这三个大的因素细化为26个特征指标。我们同时选取了3家舞弊公司 (浙大海纳、华源制药、S*ST科龙) 和3家非舞弊公司 (长园新材、秦川发展、中航精机) 作为初步检验样本以确定检验的标准。通过检验, 我们发现3家舞弊公司的舞弊特征符合率分别为39.29%、50%和53.57%。3家正常公司的舞弊特征符合率分别为7.41%、7.41%和14.29%。为确保检验的准确性, 我们将舞弊特征标准定为25%, 特征符合率达到或者超过25%的公司均被列为舞弊嫌疑公司, 以便进入下一步模型检验。

注:符合特征选项的填1, 不符合的填0。

最后, 选取制造行业A股上市公司110家的年度财务报告为样本, 其中假设舞弊样本55家、控制样本55家, 将其全部代入到公司舞弊样本识别卡进行识别检验, 结果显示:舞弊样本中有1家舞弊特征识别率为21.43% (符合特征指标6个) , 低于25%;控制样本中有1家舞弊特征符合率为25%, 大于或等于25%。出于样本配对的考虑, 舞弊样本和控制样本同时各去掉2个, 舞弊样本和控制样本各选取53家。

通过识别卡检验, 舞弊样本特征识别率平均值为39.55%, 控制样本舞弊特征识别率为11.82%, 综合平均值为25.68%。这也验证了先前假设25%的检验标准是合适的。

(二) 识别模型的构建

1. 变量的设计和描述。

(1) 变量的设计。基于前一节公司舞弊特征识别卡的思路和原则, 我们设计了样本公司的指标体系, 具体见表2, 然后从指标体系中选取X1、X2、X3、X4、X5、X6、X7、X8、X9、X12、X13、X14、X15、X16共14个指标作为研究变量, 这些变量基本上保证了识别的连续性和互补性。

(2) 变量的描述。将两类样本按0、1分组, 0为舞弊公司, 1为非舞弊公司, 采用SPSS16.0统计软件对数据的均值进行样本配对并进行T检验, 通过检验, 得出舞弊公司样本值和非舞弊公司样本值在财务指标上有较大的差异。

2. 模型的实证结果。

(1) 因子分析。我们运用SPSS16.0对变量进行相关性分析, 通过KMO and Bartlett's Test球形检验, 提取因子及其得分系数, 最终得出因子分数。在对变量进行相关性分析的基础上, 再运用SPSS16.0对因子进行分析, 就可以得到因子得分系数矩阵, 具体见表3 (表3由SPSS16.0自动生成) 。由表3不仅可以得到各个因子原始财务比率的线性表达式, 而且可以确定各个因子的经济含义。

(2) 因子数值计算。由表3可以得到:

同理, 我们可以得到F2~F7相应的表达式。

利用因子分析法将零乱复杂的指标体系进行了结构化处理, 这不仅降低和简化了观测维度, 而且保证了原始数据的信息量。通过上述公式可以计算出每个样本公司各个主因子的得分值, 从而为逻辑回归分析提供了条件。

(3) 逻辑回归。设Fi为第i个公司的因子得分矩阵, 将舞弊公司样本用“0”表示, 正常公司用“1”表示, 则上市公司舞弊的概率Pi和Fi之间存在如下关系:

上述模型的判定临界值为0.5, 因此当上市公司的P值大于0.5时, 可判定该公司存在财务报告舞弊;而当P值小于0.5时, 可判定该公司属于正常公司。

将研究样本的7个因子变量值输入SPSS16.0统计软件中, 选择逻辑回归方法, 运用ENTER (全部引入法) 方法将变量引入回归方程, 就可以通过SPSS回归分析迭代过程得到以下结果, 具体见表4。

由表4可见, 变量F1、F2、F6的显著性值都小于0.05, 变量F5的显著性值约为0.05, 说明其预测能力较强;其余3个变量的显著性值稍大, 说明其预测能力较弱。

将回归结果代入上式, 可得到如下舞弊识别模型:

模型中P值的范围为[0, 1], 该值越大, 表明公司财务报告舞弊的可能性越大, 反之, 则表明公司财务报告较为真实。由于此模型以样本的先验概率0.5作为判别的分割点, 因此当P值大于0.5时, 则判定该公司存在财务报告舞弊;而当P值小于0.5时, 则判定该公司财务报告真实。

(4) 模型回判检验。在实证研究中, 如果研究的样本数量不是太大, 就可以考虑将所有的样本均用于模型的参数估计, 再将样本的指标值回代得出所有样本的预测值, 然后根据模型的准确率或误判率检验模型的预测效果。本文选取制造业样本总数106个, 先采取回判法检验模型的有效性, 利用得出的主因子回归模型对样本组数据进行回判。从回判结果来看, 该模型将53家财务报告舞弊公司中的5家误判为正常公司 (第一类错误) , 将53家正常公司中的1家误判为财务报告舞弊公司 (第二类错误) , 两者相加平均得到总误判率为5.7%, 即判别模型的预测能力达到94.3% (见表5) 。

通过对样本详细的P值预测, 我们发现在所有的样本中, 舞弊样本共有五个P值大于0.5, 而其他样本的P值则趋近0;控制样本中只有三环股份P值小于0.5, 而其他的各个公司P值则趋近1。当上市公司的P值大于0.5时, 可判定该公司存在财务报告舞弊迹象;而当其P值小于0.5时, 可判定该公司不存在财务报告舞弊迹象。

3. 预测样本检验。

模型体系构建的假设之一是公司财务报告舞弊的相关财务指标必然会出现异常。2007年, 我国实行了新的会计准则, 对上市公司财务状况、经营成果产生了深远的影响, 具体表现在对公司债务重组、公允价值变动、金融资产、股份支付、投资收益、股权投资、职工工资福利和所得税等方面的影响。为了进一步验证识别系统的准确度和适用性, 我们按照同一类型、同一时期和同等规模的原则, 采用两步检验法, 选取了24家制造业上市公司2007年度财务报告作为预测样本, 其中12家被注册会计师出具非标准审计意见, 12家被注册会计师出具标准无保留审计意见, 以此再次验证所构建的模型体系的准确度和适用性。

(1) 特征卡识别检验。通过将24家上市公司的特征值引进公司舞弊特征识别卡, 可以得出初步检验结果:12家舞弊样本的舞弊特征符合率全部大于25%, 而12家控制样本的舞弊特征符合率全部小于25%, 验证了上述识别卡检验的结论 (24家上市公司舞弊特征符合检验表已省略) 。

(2) 模型检验。我们将样本数据引入模型, 进行相关的因子分析、回归分析, 得出P值以及回判结果, 见表6、表7。

由表6、表7可以看到, 假设为舞弊样本的12家公司中只有1家公司的财务报告被误判为非舞弊的财务报告, 其他11家公司财务报告的P值都逼近于1。控制样本12家公司中也只有1家公司的财务报告被误判为舞弊财务报告, 从而验证了此前得出的检验体系是比较有效的。

三、模型检验总结

本文通过对我国沪深两市制造业上市公司2004~2007年的财务数据进行统计分析, 建立了双重检验识别体系, 有效地提高了财务报告舞弊识别的效率和效果。

第一步, 公司舞弊特征识别卡可以快速、有效、直观地识别出财务报告舞弊嫌疑公司, 可操作性很强。

第二步, 为了进一步检验模型的准确度, 经过第一步检验过的舞弊嫌疑公司再一次进行模型检验。本文基于17个财务指标构建出财务指标体系, 并进行了相关的因子分析、回归分析以及模型回判检验, 最终建立了基于Logistic方法的识别模型, 通过预测检验, 该模型具有相当高的检测识别能力, 具有较高的实用价值。

摘要:财务报告舞弊一直困扰着广大投资者, 因此提高广大投资者识别财务报告的能力已成为亟须解决的问题。本文基于财务报告舞弊“三元素”理论, 结合我国现有的财务舞弊识别方法, 构建了“公司舞弊特征识别卡”识别法和数学模型识别法相结合的双重识别体系, 能较快捷地识别财务报告舞弊, 方法简易、有效, 可供广大投资者参考。

关键词:财务报告舞弊,三元素,双重识别,识别模型

参考文献

[1].梁杰, 刘英男.会计舞弊行为理论和甄别技术研究.沈阳:东北大学出版社, 2005

识别理论 第5篇

神经网络与D-S理论结合的HRR识别研究

基于D-S(Dempster-Shafer)证据理论,比较和研究了相关数据和不相关数据的融合方法,分析了多传感器数据融合的`算法:集中式融合算法和分布式融合算法.经过实验证明,执行分布式有反馈融合算法时的效果最好.然后利用该算法,提出了和线性内插神经网络相结合的识别方法.利用4种飞机的步进频率雷达的高分辨率一维距离像,将神经网络的识别结果作为证据分别送入传感器进行融合,进行识别研究.实验证明,与单纯利用神经网络的方法比较,目标的正确识别率得到了改善.

作 者:王毛路 李少洪 毛士艺 作者单位:北京航空航天大学电子工程系刊 名:北京航空航天大学学报 ISTIC EI PKU英文刊名:JOURNAL OF BEIJING UNIVERSITY OF AERONAUTICS AND ASTRONAUTICS年,卷(期):28(4)分类号:V243.2关键词:识别 高分辨率 神经网络 多传感器 数据融合

识别理论 第6篇

在水文模拟研究中, 当研究区域的水文模型结构确定后, 如何有效识别模型参数就成为最重要的问题。目前参数识别的一般途径是将模型参数识别看作一个反问题, 通过实测的蒸发、降雨和流量资料反求水文模型参数。在数学上处理这类反问题的常用方法是最优化方法, 代表性的有:Rosenbrock法[1]、单纯形算法[2]、单纯形混合进化算法 (SCE-UA) [3]、遗传算法 (GA) [4]和粒子群算法 (PSO) [5,6]等。但由于水文模型存在高度敏感性参数、参数之间存在高度相关性以及所构造的目标函数具有高维、多峰值、不连续、非凸及带噪声等特征问题, 使得最优化方法求得的最优参数组并非唯一, 从而导致模型预测的不确定性。因此, 在参数识别过程中, 应尽可能从实际问题中挖掘信息, 参数灵敏度分析和相关性分析等就是获取先验信息的重要手段。为此, 本文以新安江模型在湖北省黄柏河流域天福庙水库流域的应用为例, 对水文模型参数的识别方法进行深入研究。

1新安江模型

新安江模型是分散性模型, 它把流域按泰森多边形法分成许多块单元流域, 对每个单元流域作产汇流计算, 得出单元流域的出口流量过程;再进行出口以下的河道洪水演算, 求得流域出口的流量过程;最后把每个单元流域的出流过程相加, 求出流域出口的总出流过程。模型共有15个参数, 包括产流层参数:蒸发能力折算系数 , 上、下层张力水容量WUMWLM, 深层蒸散发系数C, 蓄水容量WM, 张力水蓄水容量曲线方次B, 不透水面积比例IMP;汇流层参数:表土自由水蓄水容量SM, 表土自由水蓄水容量曲线方次EX, 自由水蓄水水库分别对地下水和壤中流的出流系数KGKSS, 壤中流和地下水库的消退系数KKSSKKG, Nash单位线法的2个参数CNCK。表1给出了模型参数的值域。

2参数分析

2.1敏感性分析

敏感性分析定性或定量地评价了模型参数不确定性对模型结果的影响, 包括局部灵敏度分析和全局灵敏度分析。局部灵敏度分析检验单个参数的变化对模型结果的影响程度, 而全局灵敏度分析则检验多个参数的变化对模型运行结果总的影响。由于本文仅需要掌握哪些参数对模拟结果影响显著, 故采用局部灵敏度分析方法对新安江模型参数进行敏感性分析, 具体过程参见文献[7]。

采用人工生成数据对新安江模型参数进行分析, 即假定一组参数为模型参数的真实值, 利用实测的降雨和蒸发资料, 通过新安江模型模拟生成理想的流量资料, 然后再利用这些数据进行模型参数识别。这种方法保证了模型没有结构上的误差, 参数估计的所有误差仅来源于参数识别方法本身。表2为本文定义的参数灵敏度级别, 表3为参数假定真实值和敏感性分析结果, 其中状态变量分别为蒸发量E、产流量R、地表径流量RS、壤中流流量RSS、地下径流量RG和流域出口流量Q。由表3可知, 新安江模型有3个敏感参数KCNCK, 3个较敏感参数SMKGKSS, 2个一般敏感参数WMEX。其中, 产流参数中KSM为敏感参数, 汇流参数中WMEXKGKSSCNCK为敏感参数, 这些参数在模型率定过程中需多次反复调试, 其余不敏感参数则只需选取其经验值或粗略调试即可。

2.2相关性分析

水文模型中常用的参数相关性分析方法有2种:参数相关系数法 (Parameter Correlation Coefficient) 和奇异值分解法 (Singular Value Decomposition, SVD) 。参数相关系数法一般用来识别2个参数之间的相关性, 而奇异值分解法可以有效识别多个参数的相关性, 2种方法都是以参数的平均灵敏度矩阵为基础展开计算的。故本文采用SVD法进行参数相关性分析。首先对平均灵敏度矩阵进行归一化, 然后进行SVD分解, 具体过程见文献[7,8], 结果如表4所示。

由表4分析可知:在最后一行的奇异值中, σ7=σ8=0, σ6/σ1<σ5/σ1<ε=0.001, 说明有效秩为4, 式 (1) ~ (4) 为奇异值最小的后4个分量。由式 (1) 和式 (2) 可知, 参数WM的变化ΔxWM、参数K的变化ΔK、参数SM的变化ΔxSM、参数EX的变化ΔxEX、参数KG的变化ΔxKG和参数KSS的变化ΔxKSS可通过相互调整达到较一致的模型输出结果, 说明参数WM, K, SM, EX, KG, KSS相关, 因此, 产流参数和汇流参数存在相关性。同理, 由式 (3) 和式 (4) 可知, 参数SM的变化ΔxSM、参数EX的变化ΔxEX、参数KG的变化ΔxKG、参数KSS的变化ΔxKSS、参数CN的变化ΔxCN和参数CK的变化ΔxCK可通过相互调整达到较一致的模型输出结果, 说明参数SM, EX, KG, KSS, CN, CK相关, 因此, 汇流层内参数之间也存在相关性。

Δv5=-0.3227ΔxWΜ+0.3152ΔxΚ+0.1178ΔxSΜ+0.5807ΔxEX+0.4723ΔxΚG+0.4714ΔxΚSS (1) Δv6=0.6294ΔxWΜ-0.6327ΔxΚ+0.0601ΔxSΜ+0.293ΔxEX+0.239ΔxΚG+0.2385ΔxΚSS (2) Δv7=-0.5376ΔxSΜ-0.2952ΔxEX+0.249ΔxΚG+0.2485ΔxΚSS+0.5002ΔxCΝ-0.4998ΔxCΚ (3) Δv8=-0.5376ΔxSΜ-0.2952ΔxEX+0.249ΔxΚG+0.2485ΔxΚSS-0.4998ΔxCΝ+0.5002ΔxCΚ (4)

3参数识别的数学模型

3.1二层规划模型

二层规划[9]是近年来应用比较广泛的一种具有二层递阶结构的系统优化方法, 适合于决策变量具有层次结构的系统, 强调的是整体的最优。它包含上层问题和下层问题, 上层和下层均有各自的目标函数和约束条件, 上层问题的目标函数和约束条件不仅与上层决策变量有关, 而且还依赖于下层问题的最优解或最优值。下层问题的最优解又受上层决策变量的影响。二层规划的决策过程是:上层在可行范围内给定一个决策变量, 下层决策者根据自身的利益对此作出合理的反应, 根据下层决策者的反应, 上层决策者对其给定的决策进行修正, 最终找到使上层目标达到最优的决策。

非线性二层规划模型的标准形式如下:

{minxF (x, y) G (x, y) 0minyf (x, y) g (x, y) 0xXRn1, yYRn2 (5)

式中:F, f分别为上下层目标函数;xRn1, yRn2分别为上下层变量;G, g分别为上下层约束函数。

3.2新安江模型参数识别的二层规划模型

水文模型参数优选时存在水量平衡和流量过程线相吻合2个目标难以兼顾, 以及参数间的相关关系难以处理等问题。为使流域出口处的模拟流量与实测流量过程相吻合, 首先应满足整个降雨径流过程的水量平衡, 在产流层水量达到基本平衡的基础上, 然后进行汇流计算, 再将汇流计算结果反馈到产流层进行调节计算。因此, 产流层和汇流层的关系就形成了一个典型的二层决策问题。二层规划的特点是从整体的角度出发, 既考虑局部利益也兼顾全局, 它兼顾了水量平衡和流域出口处流量过程线吻合的目标, 同时将产流参数和汇流参数分开优选, 较好地处理了参数间的相关关系。

本文将新安江模型的产流层和汇流层溶入一个二层规划模型中, 利用二层规划优化技术交互优选出产流参数和汇流参数。在实际预报中, 我们的目标是使汇流过程的实测流量和模拟流量误差应尽可能小, 以此为基础建立上层目标函数;由于产流层控制着流域的总水量, 只有在水量基本平衡的基础上, 才可能使流量过程线尽可能吻合, 产流层的决策不仅影响汇流层的决策, 也部分影响其目标实现, 因而以产流层水量平衡建立下层目标函数。因此, 我们把汇流层作为起主导地位的上层, 产流层作为下层, 构造率定新安江模型参数的二层规划模型。

对任意给定的上层汇流参数, 在满足约束的条件下, 确定下层产流参数y, 使得水量误差最小。设Qobs, i为率定期实测流量序列, Qsim, i为率定期模拟的流量过程, N为实测和模拟流量资料的总个数, 则第1层 (下层) 决策模型为:

{miny|i=1ΝQobj, i-i=1ΝQsim, i|i=1ΝQobj, iylyyu (6)

式中:变量y为产流层敏感参数K, WM;yu, yl为变量y的上下界。

然后, 在可能的范围内确定上层汇流参数x, 使得在整个率定期内实测流量和模拟流量误差尽可能小。对于任意给定的上层汇流参数x, 由式 (6) 得到极值y¯ (x) , 它是在率定期内使水量误差达到最小的下层产流参数值。当x变化时, y¯ (x) 是由式 (6) 确定的极值函数。则第2层 (上层) 决策模型为:

{minx1Νi=1Ν (Qobj, i-Qsim, i) 2xlxxu (7)

式中:变量x为汇流层敏感参数SM, EX, KG, KSS, CN, CK;xu, wl为变量x的上下界。

式 (6) 和式 (7) 构成了识别新安江模型参数的二层规划数学模型, 即式 (8) 。它表示在水量达到基本平衡的条件下, 使实测的流量和模拟的流量误差最小。

{minxF1 (x, y) =1Νi=1Ν (Qobj, i-Qsim, i) 2xlxxuminyF2 (x, y) =|i=1ΝQobj, i-i=1ΝQsim, i|i=1ΝQobj, iylyyu (8)

式中:F1 (x, y) 表示使实测流量和模拟流量的误差达到最小;Fx (x, y) 表示使水量误差达到最小。

利用二层规划理论的优化技术优选新安江模型的产流参数和汇流参数。首先给定上层汇流参数, 根据水量平衡来优选下层产流参数, 然后将优选的产流参数反馈给汇流层来调整汇流参数, 产流层再根据汇流参数来修正自身参数, 不断进行交互式优化直至产流层和汇流层的目标函数达到最优。二层规划问题的求解算法步骤参考文献[10]。与现有的方法比较, 这种优选方法具有以下一些优点:①将产流参数和汇流参数分开进行优选, 很好地处理了不同层次的参数间的非线性补偿作用, 同时将高维问题分解为2个低维的子问题, 减少了计算中的舍入误差, 提高了在搜索空间中寻找最优解的质量。②保证了在水量达到基本平衡的基础上, 使汇流层的实测和模拟流量过程线最佳吻合, 而不像多目标规划方法中一个目标的改善要以牺牲另一个目标为代价。

4实例研究

为了验证基于二层规划理论的水文模型参数优选方法 (Bilevel Programming Based Method, BPM) 对于天福庙水库实测资料的新安江模型敏感参数的优选性能, 选用SCE-UA和PSO算法优化单目标函数式 (9) 进行对比测试, 不敏感参数取固定值 (见表1) 。

f (θ) =1Νi=1Ν (Qobs, i-Qsim, i) 2 (1+|Q¯obs-Q¯sim|Q¯obs) (9)

以水量的相对误差RE和模型效率系数R2作为评价指标。为了避免随机数产生器种子的影响, 分别运行3种方法10次, 结果取平均值。表5给出了3种方法所得到的目标函数值、率定期 (1988-1992) 、检验期 (1995-1996) 的水量相对误差及模型效率系数的计算结果。表6给出了不受初值影响的较好的BPM法识别新安江模型参数值的结果。图1给出了天福庙水库检验期 (1995-1996) 的NBPM法流量实测值与模拟值的比较图。

由图1可以看出, 利用BPM方法优选的参数进行水文过程模拟, 模拟的流量序列和实测流量序列的趋势比较一致。由表5可得出以下结论:①在水量平衡系数方面, 除了SCE-UA在率定期的水量误差超过5%以外, 利用其他方法进行模拟, 所计算的水量误差均在允许范围内。②在效率系数方面, 不论在率定期还是在检验期, BPM方法比其他方法的效率系数高, 但是这些方法的效率系数均没有超过0.8。原因可能有2个方面:①水文数据本身的误差因素。天福庙水库的流域较小, 降雨、径流资料均为日资料, 这可能会影响模拟结果。②不敏感参数的经验取值可能没有完全反映出流域的实际情况。

5结论

水文模型参数识别的一般方法是利用最优化技术来直接求解反参数识别问题, 估计出模型参数值, 这种方法没有考虑水文模型参数间的相关性所带来的模型预测不确定性。针对此问题, 本文以新安江模型在湖北黄柏河流域天福庙水库的应用研究为例, 首先分析了模型参数的敏感性和相关性, 然后在二层规划理论的基础上, 将新安江模型的产流层和汇流层溶入一个二层规划模型, 提出了一种能有效处理高维问题, 并在参数的相互作用和目标函数响应面非凸的情况下具有鲁棒性的新参数识别方法——基于二层规划理论的参数识别方法。这种参数识别方法克服了已有方法的不足, 更符合实际的产汇流过程, 有利于提高模型的预报精度。通过与SCE-UA和PSO算法优化单目标函数的结果比较, 表明了这种方法的有效性和优越性。

参考文献

[1]Rosenbrock H H.An automatic method for finding the greatestor least value of function[J].Computer Journal, 1960, (3) :175-183.

[2]Nelder J A, Meade R A.Si mplex method for function mini miza-tion[J].Computer Journal, 1965, (7) :308-313.

[3]Duan Q Y, Sorooshian S, Gupta VJ.Effective and efficient glob-al opti mization for conceptual rainfall-runoff models[J].WaterResources Research, 1992, 28 (4) :1 015-1 031.

[4]Wang QJ.The genetic algorithmandits applicationto calibratingconceptual rainfall-runoff models[J].Water Resources Re-search, 1991, 27 (9) :2 467-2 471.

[5]江燕, 胡铁松, 桂发亮, 等.粒子群算法在新安江模型参数优选中的应用[J].武汉大学学报 (工学版) , 2006, 39 (4) :14-17.

[6]江燕, 刘昌明, 胡铁松, 等.新安江模型参数优选的改进粒子群算法[J].水利学报, 2007, 38 (10) :1 200-1 206.

[7]王建平.复杂环境模型参数识别的软计算技术及其应用研究[D].北京:清华大学, 2005.

[8]Washantha Lal A M.Calibration of riverbed roughness[J].Jour-nal of Hydraulic Engineering.1995, 121 (9) :664-671.

[9]盛昭翰.主从递阶决策论——Stackelberg问题[M].北京:科学出版社, 1998.

基于物元理论的客户需求识别方法 第7篇

伴随着科学的发展, 全球由卖方市场转向买方市场, 客户的需求也越来越多样化, 这给现代企业的生产提出了更高的要求。在这种形式下, 大规模定制 (Mass Customization, 简称MC) 生产的生产模式应运而生。在大规模定制下, 客户的需求被充分考虑进生产环节, 但是客户的需求多种多样, 所以各个学者都对客户需求分析进行了研究。张跃刚[1]将层次分析法运用于客户需求分析, 理论上避免了由于人的主观性导致权重预测与实际情况相矛盾的现象发生;Govindaluri[2]在基于马尔可夫模型的基础上提出了一种集成权重评价系统, 改善传统客户评价方法的片面性;金菊良等人[3]提出了基于改进层次分析法的模糊综合评价模型, 并研究了用加速遗传算法检验和修正判断矩阵的一致性和计算层次分析法中各要素的权重;祝金凤[4]结合产品基因工程与产品逆向工程, 进行开发客户需求获取与分析技术的关键内容。但是这些方法都比较繁琐, 工作量大, 易出错。所以本文针对客户需求的偏重不同, 结合物元理论和可拓理论, 建立客户需求的物元模型, 确定物元的可拓集合, 以便能更有效, 更快捷的将客户的各种需求转化成生产的约束条件。

1 物元理论

给定事物的名称N, 它关于特征C的量值为V, 以有序三元组R= (N, C, V) 作为描述事物的基本元, 简称物元。一个事物有多个特征, 如果事物以n个特征C1, C2, …, Cn和相应的量值V1, V2, …, Vn来描述, 则表示为

R=[ΝC1V1C2V2CnVn]=[R1R2Rn]

(1)

这时, 称Rn维物元, 简记为R= (N, V, C) 。

其中

C=[C1C2Cn]V=[V1V2Vn] (2)

物元概念为解决客户需求识别问题提供了新的途径和方法。根据事物关于特征的量值来判断事物属于某集合的程度与可拓集合的基本思想是一致的, 而关联函数则使识别方法更为精细化[5]。

2 客户需求的物元识别方法

在大规模定制中, 利用物元对客户的各种需求进行描述, 将客户对产品的需求信息转化为物元模型, 并利用物元的发散性进行分析, 得出客户各需求的最佳权重比, 以快速实现产品的变型或局部变型设计, 所以必须找到最相似物元进行转化设计。以下就是利用物元理论进行最相似物元的识别方法。

2.1 确定经典域和节域

P0为某一客户对产品的某项需求, P为某一客户对产品的总需求, P0为P的一个子集, P0⊂P

R0= (Ρ0CV0) =[Ρ0c1X1c2X2cnXn]=[Ρ0c1a01b01c2a02b02cna0nb0n] (3)

式 (3) 中, c1, c2, …, cnP0的n个不同的特征, 而X1, X2, …, Xn分别是P0关于c1, c2, …, cn的取值范围, 即经典域。

同时有Xi=〈a0i, b0i〉, (i=1, 2, …, n) 。

Rp= (ΡCXp) =[Ρc1Xp1c2Xp2cnXpn]=[Ρc1ap1bp1c2ap2bp2cnapnbpn] (4)

式 (4) 中Xp1, Xp2, …, Xpn分别为P关于c1, c2, …, cn取值的范围, 即P的节域。

同时有Xpi=apibpi (i=12n) ;

显然, XiXpi, (i=1, 2, …, n) 。

2.2 根据距的定义, 计算关联函数值

对要识别的对象p, 把分析结果用物元

R0= (pCv) =[pc1v1c2v2cnvn]

(5)

表示。由距公式

ρ (viXi) =|vi-12 (a0i+b0i) |-12 (b0i-a0i)

(i=12n) (6)

ρ (viXpi) =|vi-12 (api+bpi) |-12 (bpi-api)

(i=12n) (7)

计算关联函数值

Κi (vi) ={-ρ (viXi) |Xi|ρ (viXi) ρ (viXpi) -ρ (viXi) viXiviXi (8)

2.3 确定权系数, 计算隶属程度

确定各个需求的权系数λ1, λ2, …, λn, 计算

Κ (p) =i=1nλiΚi (vi) (9)

Κ (p) 表示p属于P0的程度。

2.4 隶属性判断

{Κ (p) 0pΡ0;-1Κ (p) 0pΡpΡ0;Κ (p) -1pΡ0; (10)

3 实例分析

根据相似性判断条件划分客户需求域。例如:以文献[6]中的客户对鼓风机的需求分析为例, 进行客户需求相似性识别。由于不同的客户对产品的各个方面都有自己个性化的需求, 如:功能需求、经济型需求、可靠性需求等, 而各个需求又可转化为对产品具体的机构、性能、价格、效率、故障性、耐用性、经济性等方面的具体参数。现以某客户对罗茨鼓风机产品的外型最大长度 (mm) 、同压下的进口风量 (m3/min) 、升压 (kPa) 、价格 (元) 这四个方面的需求进行识别判断。各相似要素的综合指数由上述计算方法计算如下, 各综合指数见表1:

3.1 建立物元模型

R0= (Ρ0CV0) =[LΟ129513603.383.67192859306270]

V0为经典域。

Rp= (ΡCXΡ) =[L104413602.663.6712.42854006270]

Xp为节域。

将需要识别的客户需求转化成物元模型为:

R1= (pCv) =[LA13203.49236000]

R2= (pCv) =[LB13003.51165900]

3.2 根据距定义, 计算各关联函数值

由距公式 (6) 计算得:

ρ (v1X1) =-25, ρ (v2X2) =-0.11, ρ (v3X3) =-4, ρ (v4X4) =-70,

ρ (v1X1) =-5, ρ (v2X2) =-0.13, ρ (v3X3) =3, ρ (v4X4) =30

因此, v1∈X1, v2∈X2, v3∈X3, v4∈X4。

v′1∈X1, v′2∈X2, v′3∈X3, v′4∈X4。

此时, |X1|=65, |X2|=0.29, |X3|=9, |X4|=340

ρ (v3Xp3) =-3.6, ρ (v4Xp4) =-370

从而得关联函数值为:

Κ1 (v1) =513, Κ2 (v2) =1129, Κ3 (v3) =49, Κ4 (v4) =734;Κ1 (v1) =113;Κ2 (v2) =1329;Κ3 (v3) =-511;Κ4 (v4) =-340

3.3 隶属程度计算

取特征权系数为λ1=λ2=λ3=λ4=13, 得

Κ (p) =i=14λiΚi (vi) 0.471;

Κ (p) =i=14λiΚi (vi) -1.449

3.4 判断

Κ (p) =0.4710, 所以pP0;

Κ (p) =-1.449-1, 所以p′∉P0。

故客户需求p以关联度0.471属于客服需求P0, 即p为最相似物元。而p′不属于P0, 即为不可取的客户需求。

4 结论

从以上实例可知, 将物元理论运用于大规模定制生产的客户需求分析具有可行性, 并能够快速判断客户需求的合理性, 减少客户主观因素对生产造成的影响。同时运用物元计算方法可以缩短客户需求分析时间, 并易于编写程序, 快速完成生产前期准备工作。

参考文献

[1]张跃刚.基于层次分析法的客户需求分析应用研究.矿山机械2007;7 (35) :8—10

[2]Govindaluri M S.Integrated weight assessment system using a Mark-ovian model for characterizing customer evaluation.IIE Annual Confer-ence and Exhibition2004.Houston:Institute of Industrial Engineers, 2004:1—6

[3]金菊良, 魏一鸣, 丁晶.基于改进层次分析法的模糊综合评价模型.水利学报, 2004;3 (3) :65—69

[4]祝金凤.面向大批量定制的客户需求分析技术.工业控制计算机, 2008;21 (6) :81—83

[5]蔡文.物元模型及其应用.北京:科学技术文献出版社, 1994

识别理论 第8篇

随着我国经济的发展和人们生活水平的不断提高, 物流行业这样一个新兴行业发展迅猛, 使人们之间的交流合作变得频繁, 为人们生产生活提供了极大便利。对物流信息和资料进行处理是物流行业重要的一个步骤, 其处理的质量问题关系着物流整体作用的发挥。

射频识别技术是在20 世纪末发展起来的, 相较于以往传统的物流领域信息和资料收集方式, 其具有非常多的优势, 比如其具有很大的储存空间、而且使用周期非常长、可以用于多种条件下, 这些都使得射频识别技术越来越受到物流领域的青睐。

1 射频识别技术理论概述

1.1 射频识别技术的结构

射频识别技术根据不同的应用条件会有不同的类型, 但是其工作系统一般都遵循着固定的工作程序, 具有较为普遍的结构。射频识别技术在结构上一般包括发射信号的设备、接收信号的设备以及在发射信号或者接收信号时连接二者的天线三部分。

发射信号的设备最具有代表性的就是电子标识, 这个也叫做射频卡。设计者以编码的形式将大量的数字和字母储存在射频卡上, 在无线电信号发射到射频卡上的时候, 射频卡立刻就会产生感应, 并将存储在其之上的数字和字母发射出去。这个射频卡拥有着非常丰富的内存, 其不仅可以将存储的数据和资料保存很久, 对于这些数据和资料一般都不得进行修改、添加或者删除等操作;其也可以存储不用永久进行保存的数据和资料, 对于这部分的数据和资料是可以进行相关的操作的。射频卡本身不仅包括存储芯片, 还包括所需要的线圈。射频卡的类型也是多种多样, 根据是否可以进行修改操作, 可以分为可修改和不可修改两种类型;根据其发射的主动性可以分为主动型和被动型以及或主动或被动型三种类型;根据工作时所需要的无线电频率分为较低频率、较高频率、超高频率和微波等四种类型;根据存储设备种类的不同可以分为只能读数据、能够读数据也能够修改数据以及只能一次修改数据但是可以多次读数据等三种类型[1];根据其是否需要电源, 可以分为需要电源和不需要电源两种类型, 不需要电源的这一类型主要是依靠电磁场来进行相关操作动力来源的。表1是需要电源和不需要电源两种射频卡类型的比较。

由于安装在射频卡上的芯片价格比较昂贵, 而且每次安装所需要的成本也比较高, 因此使用无芯的射频卡具有广泛的应用前景。

第二部分是接收信号的设备, 俗称为阅读器, 这一部分主要是先向射频卡发送无线电信号, 然后待射频卡作出反应, 将信息和资料反射回来的时候, 阅读器负责接收其反射回来的无线电信号, 并通过处理器进行处理了之后得到最后的数据信息和资料。阅读器的功能有很多种, 不仅包括了控制射频卡的操作, 还具有对错误数据进行分析、更改, 在发生错误的时候进行提示等高级功能[2]。

对于既可以读数据, 也可以写数据的射频卡, 还需要一个设备进行编制程序, 一般不需要上网即可以独立完成, 可以直接在射频卡上输入相应的数据和信息资料, 然后在应用的时候直接应用到所需的项目系统之中。

天线在射频卡和阅读器之间起着一个连接的纽带作用, 天线的安装含有一定的技术含量, 因为天线各项具体的指标、天线的形态和安装的地点对数据和资料的发射以及数据和资料的接收都具有非常关键的作用。

1.2 射频识别技术的工作程序

射频识别技术一般需要经过以下几个工作程序才能完成:首先, 由信息接收设备将信息通过一定的编码程序进行处理之后, 运用一定频率的无线电信号通过天线发送给射频卡, 负责相应区域接收信号的射频卡对信号进行接收之后, 再进行具体的解读编码和密码, 对内容进行判断和分析之后, 如果是要修改资料的信号, 则通过提高电流压力的方法对相应的内容进行修改, 如果不属于射频卡的权限范围, 则将这些信息再反射回阅读器, 在将相应的内容进行处理之后, 通过天线再发送给信息接收设备。当然, 射频卡和阅读器之间需要保证一定的距离, 这样才能保证天线能够及时准确地将信息发送到各个设备之中[3]。

虽然各种型号的射频识别设备在数据和信息资料的传送方面以及需要的无线电的频率方面都存在着很大的差异, 但是, 在工作程序和模块方面都具有很大的相似性, 例如, 所有的接收信息的设备都可以包括发射信息的设备和接收信息的设备, 其都用于对发射和接收的信号进行调制和解调;二者之间的距离都非常重要, 影响了双方反应的敏感程度和功率的消耗。

1.3 射频识别技术的标准

射频识别技术的各个组成部分需要符合特定的标准, 才能保证系统工作的正常运行, 这其中有很多标准, 具体包括对数据信息进行编码所需要达到的标准, 射频卡同阅读器之间进行交流所要达到的标准以及无线电所需要的频率标准, 最后一个是其他一些具有应用性的标准。

现今射频识别技术的标准体系有三种, 一种是欧美国家制定的标准体系, 一种是日本等国使用的技术标准体系, 还有一种是国际上通用的标准体系。我国还没有制定相关方面的标准。

1.4 射频识别技术的特点

射频识别技术不同于传统的识别技术, 其可以应用到非常广泛的领域中, 而且识别设备同需要识别的对象之间不会产生摩擦或者其他各种类型的接触, 这样可以防止需要识别的对象对其造成不必要的干扰[4], 并且工作效率也非常高, 每秒可读出非常多的数据信息和资料, 而且便于携带、使用的周期也非常长久、和磁条等识别技术相比较之下, 能够给人们生产生活带来非常多的便利。

2 射频识别技术在物流配送中的具体应用

2.1 物流配送及其配送中心的基本作业流程分析

所谓物流配送中心, 是指物流配送过程中主要从事配送业务的物流产所和组织, 其设立的目的就是为了完成物流配送的任务, 其一般会设置在各个物流节点上, 且以经营组织或实体的方式存在, 设立该种配送中心, 能够达到提高物流配送服务水平和营业额, 减少配送成本以及增加物流配送收益等优点。从理论上看, 物流配送中心可以按照不同的标准分为很多类, 譬如, 按照其功能划分, 可以分别存储型配送中心, 加工型配送中心以及流通型配送中心, 按照其服务的范围大小, 又可以划分为城市配送中心以及区域配送中心两种, 此外, 它还可以按照属性、设立者等标准进行划分。尽管其种类很多, 但基本的作业流程却是一致的, 具体的流程如图1所示。

随着时代的发展, 物流中所配送的产品种类越来越多, 因此, 如何把握物流配送产品信息的准确性和及时性成为物流配送中心需要解决的首要问题, 以往的出库方式相对较传统, 无法实现信息间的高速流转, 面对现实需求的压力, 建议在物流配送中使用电子标签进行拣货, 这种拣货方式不仅可以实现无纸化作业, 还可以实现信息的高效、准确流通, 大大减少用户产品的出库时间, 且已被许多发达国家所应用, 是值得借鉴的一种拣货方式[5]。

2.2 传统物流配送中心存在的一些问题

传统的物流配送中心主要存在着五个问题, 首先, 其订单填写方式很不规范, 不仅存在着许多未正确填写的订单, 还存在这遗漏填写的情况, 以至于经常出现无法将货物运送到目的地的情况;其次, 在存货统计中无法实现准确统计, 因为存储的条码存在着一些人为的错误, 使得数据统计变得很麻烦, 常出现无法准确获知数据或者获知数据不准确的情况, 这种统计失误会大大影响配送中心做出正确的配送决策;配送过程中清点货物的效率低下, 会出现无法及时清点的状况, 且在人员和物资的配备上, 往往会占用大多资源;货物的损耗相当严重, 在配送中心进行货物运送过程中, 可能会因为货物被偷或者货物放置错误等原因造成货物损耗;最后, 物流配送人员的成本较高, 占整个配送成本的30%左右, 增加了行业负担[6]。

2.3 射频识别技术的具体应用

要解决传统物流配送中心存在的这些问题, 运用射频识别技术刻不容缓, 其在物流配送中心的具体运用可以分为四个方面。

2.3.1 进行货物的入库与检验

在使用射频识别技术时, 先将货物贴上射频标签。在贴有该标签的货物进入配送中心入口时, 入口的阅读器会对货物上面的标签进行自动识别, 并将识别到的信息即使更新到存货清单中, 再根据清单的具体需求, 将货物自动派送到指定的发货地点, 该种方式实现了货物验收程序的精简化, 一改过去的复杂检验和清点程序, 省时省力。

2.3.2 对货物进行整理并及时补充货物

移动阅读器及时对运动车中的货物进行整理, 且根据计算机管理中心的要求将货物摆放在正确的地点, 在摆放好货物后, 还可以将货物清单进行更新, 将货物最后摆放的位置更新到计算机管理中心中去。该识别技术还有一个存货补充系统, 能够将存货不足的情况及时向管理中心发出, 提出补货申请, 再根据管理中心反馈的信息, 及时将货物补齐。在对货物进行整理时, 该浏览器如果发现货物摆放位置出现错误, 会及时想管理中心发出警报, 管理中心立即会给出指示, 浏览器在派送运送车将货物摆放到正确的位置上去[7]。

2.3.3 及时填写订单

在射频识别系统中, 实现了管理中心和存货的密切联系, 在管理中心填写好订单后, 会将订单中的发货信息, 出库信息等内容联合成一个整体, 及时更新在存在记录中, 这可以有效降低发送错误存货的可能性。

2.3.4 货物出库运输

在射频识别系统中, 货物运输实现了自动化运输, 在货物离开配送中心时, 设置在配送中心出口的阅读器可以对其标签上的信息进行阅读, 省去了扫描步骤, 这样便能够将货物直接送到零售商那里[8]。由于整个过程都是自动化管理, 因此可以整个货物运输流程简单化, 且可以实现高效率的运输, 此外, 由于省略了扫描步骤, 从而避免了条码不可读所产生的负面影响, 为物流配送中心做出正确的决策提供可能性。

3 射频识别技术在物流领域存在的问题和解决途径

3.1 射频识别技术的成本较高

射频识别技术作为一项新型的技术, 现今价格仍然比较昂贵, 其成本不仅包括射频卡、阅读器和发射或者接收信息所需要的天线的成本, 还包括对这一软件系统进行升级换代的时候所需要的费用, 再加上其他的一些软件和硬件的配套措施以及人员培训、系统维护的费用, 每年物流企业需要投入进去的费用不菲, 而条码纸虽然可以换做用其他的条码技术进行操作, 但是其他的条码技术产生错误读写或者遗漏、添加读写信息的概率非常大, 不能完全代替条码纸。

因此, 应当不断进行射频识别技术的研究, 实行技术革新, 大幅度降低射频识别技术所需要的成本, 促进射频识别技术的普及化。

3.2 射频识别技术标准不够统一

射频识别技术的标准由于各国字母或者数字编码上的差异以及使用频率的不同而存在着不统一的现象, 各国之间订立的协议虽然很多, 但是已经呈现泛滥的趋势, 而且专业术语上难以达成统一意见, 知识产权保护的地域性特点也阻碍了射频识别技术标准的统一化。

根据我国现今发展的实际情况, 作者认为应当参照各个标准中最为科学合理的部分, 制定出体现我国经济发展特点的标准, 从而使射频识别技术规范化, 也使我国能够在国际新兴产业中占据主动地位[9]。

3.3 没有引起政府的高度重视

射频识别技术需要各个方面进行统一的配合和合作, 实现信息资料和数据的共享平台, 但是, 政府并没有在这一方面进行宣传和倡导, 没有投入一定的成本对这方面进行深入的探讨和建设, 因此, 一个完整的射频识别技术系统并没有在物流领域有效地建立起来。

我国应当加强高度重视起来, 加大对这方面的投入, 促进射频识别技术在物流领域的应用, 这样才能促进经济更好更快发展。

3.4 企业自身没有积极性

企业缺乏长远的眼光和战略性的思考, 只看到先期的投入过多, 成本过高, 没有看到在将射频识别技术应用到物流领域将会带来的巨大的利益, 而且对于这种新兴的技术产业不敢进行尝试, 始终处于观望的状态, 同时也没有积极引进相应的技术人才对系统进行严格的操作, 对已有技术人才也没有通过培训或教育的方式更新其原有知识结构和体系[10]。

企业应当具有更为长远的眼光, 积极培养和引进高端技术人才, 对人员投入一定的培训和教育费用, 增加企业的软实力水平。

4 结语

射频识别技术若要在物流领域广泛应用, 政府、企业和人员自身都要投入大量的人力、物力和财力, 充分调动各方面的力量, 才能保证物流企业的经济效益, 使企业长立于市场之林。

参考文献

[1]刘斌, 平锐, 孟德良.RFID的潜在问题初探[J].中国无线电, 2013 (1) :10-12.

[2]慈新新, 曾荣仁, 王韬.2013年RFID应用情况回顾[J].微电脑世界, 2013 (12) :123-126.

[3]闵骐.RFID技术在集装箱运输管理中的应用[J].物流科技, 2013 (2) :14-18.

[4]李根柱, 杜潇潇.基于现代信息技术的物流实体全程实时跟踪系统探讨[J].物流技术, 2013 (1) :24-25.

[5]王志刚, 马雪鹏.物流系统分析及技术发展综述[J].邮电设计技术, 2012 (7) :16-18.

[6]侯凌燕, 尹军琪, 祁庆民.神州数码上海物流配送中心[J].物流技术与应用, 2012 (7) :61-62.

[7]陈子侠.RFID技术的应用与现代物流[J].商业研究, 2012 (6) :98-103.

[8]李波, 刘有源.基于RFID的货场物流自动调配系统的研究[J].物流技术, 2012 (3) :44-46.

[9]陈榕.射频识别技术在物流管理中的应用[J].物流技术, 2012 (9) :108-110.

模糊数学理论在汉字识别中的应用 第9篇

模糊性概念现在用模糊集来进行描述,运用模糊数学的概念可以进行判断、推理、评价、决策以及控制的过程等。例如模糊聚类分析、模糊模式识别等。这些方法构成了一种模糊性系统理论,构成了一种思辨数学的雏形,在气象、医学、心理、地质、石油、环境、生物、林业、农业、经济管理、化工、语言、遥感、控制、体育、教育等方面已经取得了明显的成果。模糊数学的应用领域主要是计算机智能方面,这也是计算机发展的一个主要方向。模糊数学主要研究的内容是三个方面:第一是模糊数学理论的研究,以及它和传统的精确数学、随机数学之间的关系。第二是模糊语言学以及模糊逻辑的研究。这两方面的研究目前还不是很成熟,需要进一步的深入研究。第三是模糊数学的应用的研究,这是模糊数学的主要研究方向。模糊数学的研究对象是不确定性的事物,因此它对于传统的精确数学、随机数学的不足能起到弥补的作用。现已有模糊群论、模糊拓扑学、模糊概率、模糊图论、模糊逻辑学、模糊语言学等分支。

1 模式识别

模式识别的主要任务是让机器模拟人的思维方法,对客观世界中带有模糊特征的事物进行识别和分类。计算机分析各种模式,并对未知模式给出分类和结构描述。模式识别问题是已知事物的各种类别,然后来判断给定的对象是属于哪一个类别的问题,"模式"是指标准的模板。实际生活中,有些事物的类别(即模式)是明确、清晰和肯定的,但也有很多事物的模式带有不同程度的模糊性,对这些具有模糊性的模式借助于模糊理论来刻画。具有"模糊模式"的模式识别问题,可以用"模糊模式识别"方法来处理[1]。

解决模式识别的问题时使用模糊逻辑的方法或思想的方法就是模糊模式识别。模糊技术在统计模式识别及句法模式识别方面均有较好的应用。其主要特点是它能更直接更自然地表达人们习惯使用的一些逻辑含义,模糊数学对于直接的或者高层的知识表示很是适用,这就使得模糊概念的模式识别能成为智能科学前沿领域的研究的有效工具之一。

模糊模式识别通常由传感器部分、预处理部分、特征提取部分、识别分类部分四部分组成的,在模式识别中特征的提取是非常重要的。模式识别的方式有两种:第一种是最大隶属原则(直接方法),这种方法应用相当广泛,象三角形的识别、染色体的识别等都属于这一类,这类问题的难点在于隶属函数的建立。第二种是择近原则(间接方法),择近原则是模式识别中的一种间接方法,目前它已用于计算机识别手写数码及文字。对于文字识别,无论是印刷体还是手写体,让计算机识别时,输入的模型都是选取特征后面的平面格点,它是一个模糊集,而计算机原来存贮的模型也是几个模糊集,这时需要考虑的就是贴近问题。

汉字识别技术是一种高速、自动的信息录入手段,是未来计算机的重要职能接口,同时也是办公自动化、新闻出版、机器翻译等领域的重要的输入方式。当前的OCR(optical character recognition)系统对手写、打印的文本都有很高的识别率,但是对于一些古代文献,特别是由于存放年代久远而变的字迹模糊不清的文献利用OCR很难正确识别,所以就引入了模糊模式识别技术。虽然汉字的数量很浩大,但是根据人们在特定时期用语中词语的搭配规律,以及每个字的搭配习惯就可以缩小该模糊字可能代表的字的范围,利用匹配算法来确定文献中的模糊字。

2 模糊字的识别算法

根据不同时期和不同环境人们有不同的语言习惯的特点,对于某个特定的字,与它前后搭配的字基本上有一定的规律和范围。一般的前连接字就是该特定字前面出现的字,后连接字也就是后面出现的字。根据特定词库资料中统计的字w的各前连接字频率,从大到小选取m个字,定义:wi(i:1…m)为其前连接字列表,出现的频率设定其频率值p(wi,w)(i:1…m);

qi(i:1…m)为其后连接字列表,频率值p(w,qi)(i:…m)。就可得到一个关于w的2×m维向量f(w):

正规化后得到字的前、后连接字的属性向量表示为

2.1 相似度

元素的相似度:两个元素x,y的相似度由其相似程度确定其数值,越是相似,相似度越高。当相同时其相似度为1,完全不同时为0,除此之外其值介于0和1之间。

向量的相似度:向量P=(p1,…,pm),向量Q=(q1,…,pn);当m=n时,P跟Q的相似度等于向量中所有相对应元素的相似度和,假设各单个元素相似度为f(pi,qi),则向量P、Q的相似度记作f(P,Q),即当m>n时,Q和P相匹配,可以在Q向量的任意位置插入空格,如在i位置插入一个空格时记为Q',则Q'=(q1',...,qi',...q'n+1),Q与Q'的对应关系为:Q中任取第j个元素,当ji时qj=q’j+1,一般要求插入的空格数目加n等于m。计算所有可能插入方法的相似度,选取最大的相似度值就是向量P和Q的相似度的值。

2.2 字的匹配度

每个汉字都可根据其笔画顺序生成一个笔画向量。如‘丰’的笔画向量为(‘—’,‘—’,‘—’,‘|’),p1=‘一’,p2=‘一’,p3=‘一’,p4=‘|’生成的向量记为P=(p1,p2,p3,p4),因此字的匹配就可以转换为向量的相似度的计算。笔画完全相同则其相似度为1,笔画完全不同则其相似度为0。其他的值介于0和1之间,设有两个字P,Q,按其笔画生成两个向量P=(p1,...,pm),Q=(q1,...,qn)。相似度记为f(P,Q),那么字P、Q的匹配度就是f(P,Q)。根据每个笔画的相似度设定相似度的值,形成一个笔画相似度矩阵(如图1),进行汉字笔画向量的匹配。

矩阵中Xi表示组成汉字的各种笔画(包括空格),Rij表示两个笔画Xi和Xj的相似度,其值在0和1之间,当Rij=1时,表示Xi和Xj完全相似,当Rij=0时,表示Xi和Xj完全不相似,矩阵中Rij和Rji是对称的,即Rij=Rji。

2.3 语义的模糊匹配

任意连续的几个字,假设其中的某字模糊不清,只能看到一部分。要判断该字是什么字,则可根据其的前连接字列表向量和后连接字列表向量得到它的前连接字属性向量和后连接字属性向量。如果得到的不重复的文字有多个,则分别计算其所有字的符合度。符合度最高的几个文字作为候选的文字。然后把模糊辨认字的笔画向量和前面获得的候选文字的笔画向量进行字的匹配,得到各字的匹配度,最后根据前面得到的符合度和匹配度来权衡得到该字到底是哪个字。

2.4 可行性分析

根据汉字数量确定及语言文字应用有规律这两个特点,可以统计整理生成一个信息库,库中存放各个汉字的前连接字和后连接字。为了减少搜索频率,提高查找速度,选择使用频率比较高的文字,同时汉字的组成笔画数量是有限的,因此笔画向量的长度也不大,这样就不会出现无穷计算现象。由于各种笔画的数量是一定的,所以实现各个笔画之间的相似度的规定是可行的,这些事实保证了算法的有效实行。

3 小结

在自然语言的处理过程中,模糊字辨认还是一个比较困难的事情,因此迫切需要一种高效率的自动的辨认方法。该文提出了一种基于语义的模糊匹配算法,能够很好地解决这个问题,而且具有实际应用的可能。

模糊数学是一门崭新的数学学科,它的产生不仅拓广了经典数学的基础,而且是使计算机科学向人们的自然机理方面发展的重大突破。它在科学技术、经济发展和社会学等问题的广泛应用领域中显示了巨大的力量。它虽然只有二十多年的历史,但已被国内外数学界以及信息、系统、计算机和自动控制科学、人员的普遍关注,它是正在迅速发展中的有着广阔应用前景的一门崭新学科。

参考文献

[1]周拥,张彪,夏宽理.基于语义的模糊匹配在模糊汉字辨认中的应用[J].计算机工程,2002(5).

[2]张忻中.汉字识别技术[M].北京:清华大学出版社,1992.

[3]谢季坚,刘承平.模糊数学方法及其应用[M].3版.武汉:华中科技大学出版社,2006.

[4]梁保松,曹殿立.模糊数学及其应用[M].北京:科学出版社,2007.

识别理论 第10篇

本文提出利用灰色关联算法获得各证据体的BPAF, 然后利用基于证据理论[2,3]对证据进行融合。理论分析和仿真结果表明, 该方法识别率高、可靠性强, 适合于复杂下的通信信号识别。

一、灰色关联分析基本原理

灰色关联分析理论[4]是根据数据列因素之间相似程度来衡量数据列的接近程度。记参考数列为, 其中, j为参考数列中第j个特征, N为参考数列中特征的个数。

假设k时刻有M个比较数列

则, j第个特征的绝对差为

根据特征绝对差的定义, 则可得比较数列Xi (j) 与X0 (j) 目标的关联系数

由于关联系数结果较多, 不便于比较, 因此通常采用关联度这个概念, 记为γ (X0, Xi) 。在计算目标灰色关联度时, 各特征的重要性不同, 分配的权重a (k) 也应不同, 此时可定义加权关联度为:

二、基于证据理论的时空域二级融合算法

证据理论的基本原理见文献[5, 6], 其中两个主要的研究内容就是基本概率赋值的获取和证据组合规则。

证据的组合规则:m1和m2分别是同一识别框架U上的基本概率赋值函数BPAF, 证据融合后的BPAF为:

三、算法的步骤

本文所提出的识别算法步骤如下:

(1) 构造通信信号识别框架U

定义所有通信信号的类型U={R1, R2, …, RN}。

(2) 获取证据的BPAF

计算比较数列与参考数列的灰色关联度, 然后采用式 (7) 计算BPAF。

(3) 证据融合

根据 (3) 式对证据进行融合, 得到一个新的证据, 进而进行判决。

四、仿真实例

通信信号数据中已经建立了5个可识别的目标类, 即Ω={b1, b2, b3, b4, b5}。选择脉冲的载频 (RF) 、脉宽 (PW) 和重复间隔 (PRI) 作为信号的特征信息, 如表1所示。实验中采用通信信号侦查设备、和ELINT和ESM获取特征常量, 模拟数据的数学模型为:

、σij分别为第i类信号的第j指标的均值和方差, randn为均值为0、方差为1的正态随机分布。

假设三种传感器的测量方差如表2所示, 根据表2和式 (5) 可以模拟来自于辐射源b1的观测样本。其中, 信号侦察设备获取三个周期的样本, ELINT系统二个周期的样本, 利用ESM一个周期的样本, 获得的观测样本序列如表3所示。

利用灰色关联算法获得BPAF, 如表4所示。

按照相同侦查设备融合的结果, 如表5所示。

按照不同侦查设备融合的结果, 如表6所示。可见,

本文的方法可以正确的识别出的信号b1。

五、结论

针对复杂环境下的信号识别问题, 本文研究了一种利用灰色关联算法获取BPAF, 利用证据融合模型进行识别的方法。理论分析和仿真结果表明, 该方法可以正确的识别出信号的类型。

参考文献

[1]林象平.雷达对抗原理.西安:西北电讯工程学院出版社, 1985.6:171-175.

[2]Dempster AP.Upper and Lower Probabilities Induced by a Multivalued Mapping[J].The Annals of Mathematical Statistics, 1967, 38 (4) :325-339.

[3]Waltz E, Lilnas J.Multisensor data fusion[M].Boston:Artech House, 1990.

[4]肖新平, 宋中民, 李峰.灰色技术基础及其应用[M].北京:科学出版社, 2005:27-35.

[5]王杰贵, 罗景青, 尹成友.多传感器信息融合机载辐射源识别[J].信号处理, 2002, 18 (1) , 11~14.

[6]郭文艳, 韩崇昭.基于灰度关联的多传感器融合目标识别方法[J].传感器与微系统, 2007, 26 (9) , 115-120.

上一篇:第三人效力下一篇:IOC模式