稀疏表示范文

2024-05-21

稀疏表示范文(精选7篇)

稀疏表示 第1篇

1 人脸识别系统

一般的人脸识别系统包括以下几个步骤:图像获取、人脸检测和定位、归一化处理、特征提取、分类识别。其基本框图如下图1所示。

(1) 图像获取。人脸图像采集主要依靠照相机、摄像机或其它图片的采集设备, 再把图像转化为可供处理的格式。

(2) 人脸检测和定位。首先用人脸检测算法检测是否存在人脸, 再在图像中定位和确定人脸的位置, 并用矩形框标记。

(3) 归一化处理。对人脸归一化即标准化处理人脸, 调整不同人脸的亮度和大小, 使它们达到一致。

(4) 特征提取。对归一化之后的人脸图像用特征提取相关算法来提取出人脸的关键特征, 为下一步人脸的分类识别做好准备。

(5) 分类决策。首先设计好分类器, 通过该分类器利用关键特征对图像进行分类识别, 最后输出识别结果。

2 常用的人脸识别算法

国内的研究方法主要包括三类:基于的几何特征的识别方法, 基于代数特征的识别方法, 基于自动连接机制的识别方法。近年来, Wright[2]等提出稀疏表示算法, 作为人脸识别的新方法, 已经引起了国内外研究者的广泛关注。本文重点介绍此类方法。

2.1 基于主成分分析的人脸识别算法

基于主成分分析 (Principal Component Analysis, PCA) 算法由Pentland和Turk[3]在1991年提出, 它的原理是首先进行K-L变换, 将得到的特征值按从大到小的顺序排列, 然后挑选出相对较大的特征值所对应的特征向量, 得到一个具有关键特征信息的子空间, 即正交基。将高维图像样本投影到该低维子空间中, 可以得到包含人脸图像重要特征, 最后用特征进行分类识别。

(1) 计算训练样本的离散度矩阵

设有N维训练样本图像{x1, x2, , xN}在一个n维的基空间中, 则样本集均值向量μ, 其中xk表示一张训练样本图像。则训练样本的总体离散度矩阵ST被定义为:

(2) 构造特征子空间

在求得ST后, 再计算它的特征值和特征向量, 完成特征子空间的构造。首先把特征值按从大到小降序排列, 其特征向量依次与之对应的排列。选择前m个最大的特征值对应的n维特征向量WT={wi|i=1, 2, , m}, 构成特征向量子空间。因为这些特征向量具有与原始图像相同的形状, 被称为特征图像和特征脸。在ORL人脸库中进行PCA算法实验, 共400个样本, 40人, 测试样本为每人4幅, 训练样本每人6幅。下图为最大10个特征值构成的特征脸。

(3) 分类识别

通过特征矩阵WT, 将测试样本和训练样本都投影到特征子空间并进行比较, 利用最近邻分类准则对测试样本进行分类。

2.2 基于支持向量积的人脸识别算法

支持向量机 (Support Vector Machine, SVM) 由Vapnik等在1995年提出, 是一种基于结构风险最小化 (Structural Risk Minimization, SRM) 原则的模式识别算法。它通过最大化边缘与最小化分类误差而构造最优超平面, 在解决小样本、高维识别具有良好的性能[4]。SVM主要解决二分类问题, 针对两类线性可分样本, 为了构造最优超平面, 样本集中的所有向量应满足以下条件:

(1) 能够被某一超平面准确划分;

(2) 超平面与距离该超平面最近的异类向量距离最大, 即分类间隔最大。

SVM算法识别人脸, 能较好地解决了小样本、高维数、非线性等问题, 并具有较好的鲁棒性。但同时也存在一些缺点, 如SVM算法将灰度值作为特征值。这会使数据特征维数太高, 从而使得算法效率低。所以一般采用将其他分类识别方法与SVM相结合实现人脸识别。

2.3 基于稀疏表示的人脸识别算法

稀疏表示 (Sparse representation, SR) 起源于对信号处理的应用, 以压缩感知 (Compressed Sensing, CS) 为原理, 目的在于以比香农定理更低的采样率来表示信号, 即用尽可能多的零系数来压缩和表示信号。而人脸图像是一种特殊的信号, 它的表示及其压缩也同样具有“稀疏”这一特点, 因此理论上可以将稀疏表示应用于人脸识别[5]。

Wright[2]等提出稀疏表示算法 (Sparse Representation based Classification, SRC) , 将测试人脸用训练图像进行线性稀疏表示, 将求解优化问题得到的稀疏系数对样本判别归类。

设训练图像构成一个样本集, 训练样本有足够多类, 第i类训练样本矩阵为A∈Rn×m为训练样本字典, y∈Rn为测试样本, 则Wright[2]等提出稀疏表示算法模型:

为了寻找高效的算法来解决 (3) 这些问题, 在本文中, 主要探讨梯度投影法 (Gradient Projection, GP) 和同伦算法 (Homotopy Methods, HM) [6]。

2.3.1 梯度投影法

为了解决 (3) 的问题最小问题, 运用拉格朗日算法, λ是拉格朗日乘数。则问题可以转化为:

对于 (4) 式, 用截断牛顿内点方法 (TNIPM) 即L1LS算法, 来解决这个二次规划问题。则目标函数 (4) 转化为不等式约束的二次规划问题:

其中, 约束条件-ui≤xi≤ui误差部分可以由对数栅栏函数构造为:

在 (x, u) 域上, 可以得到最小值 (x* (t) , u* (t) ) 的凸函数为:

其中, 参数t∈[0, ∞) 。上式可以被最小化标准的内点法来计算优化后的搜索梯度方向。

根据这个梯度方向, 很容易利用GP法求得稀疏表示的结果。

2.3.2 同伦算法

在 (3) 式中, 对于一个固定的λ, 当0∈∂F (x) 时取最优解。如果定义χ·={x*λ:λ∈[0, ∞) }, 其中, x随λ的改变而变化:当λ→∞, xλ*=0;当λ→0, xλ*收敛于 (2) 。随着λ的减少, 同伦算法利用一个原理:目标函数F (x) 经历从L2范数约束到在 (3) 式中L1范数的目标。此外, 可以证明解路径x是分段常数λ的函数。因此, 在构建一个递减序列λ, 只需要找出那些导致xλ*支撑集变化断点, 即任一新的非零系数增加或前一的非零系数去除的变化。

在计算∂F (x) 时的主要困难的是, 1范数项是不是全球可微。因此, 可以考虑的次微分定义如下:

该算法以初始值x (0) =0的迭代方式运行。在每次迭代时, 对于一个非零λ, 分配∂F (x) =0:c (x) =ATb-ATAx=λu (x) 。因此, 从定义 (9) , 我们保持稀疏支撑集:然后迭代更新点x (k) , 根据系数和幅度的正/负方向。

图3表示在AR人脸库中进行SRC算法实验, 测试和训练样本各700幅, 共100人, 每人7幅。下图为根据遮挡率的变化, 用L1LS算法和同伦算法解SRC模型的识别率对比图。

3 结语

人脸识别与其他生物特征识别技术相比具有更隐蔽、便利、非侵犯性、实用、友好、追踪能力强等优点, 已经受到各个领域科研人员的广泛研究和关注。但是, 人脸识别仍存在一些需要解决的难点问题:

(1) 实时采集的人脸一般是未配准的, 而基于稀疏表示的人脸识别算法在未对齐的情况下, 其算法鲁棒性会大大下降, 因此如何处理未对齐的人脸图像是待解决的问题, 对算法性能提出了挑战。

(2) 大量研究表明, 人脸的局部图像在识别时所起的作用不同, 因此应该根据人脸不同部分对识别的贡献不同, 赋予不同的权重, 从而提高算法性能。

(3) 在实时的人脸识别环境中, 采集到海量的数据使人脸库巨大。实验结果表明, 当数据库极大时, 人脸识别算法性能会大大下降, 算法复杂度极高。因此如何对数据库进行预处理, 是值得研究的方法。

参考文献

[1]NGOC-SON V, CAPLIER A.Enhanced patterns of oriented edge magnitudes for face recognition and image matching[J].IEEE Transactions on Image Processing, 2012, 21 (3) :1352-1365.

[2]WRIGHT J, YANG A Y, GANESH A, et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31 (2) :210-227.

[3]TURK M, PENTLAND A.Eigenfaces for recognition[J].Cognitive Neuroscience, 1991, 3 (1) :71-86.

[4]WEI P, XIONG Wei-qing, WANG Xiao-quan.A design and complement for face recognition[C]//Proc of 2004International Conference on Mavhine Learning and Cybernetics, 2004:3666-3669.

[5]YANG A-y, SASTRY S S, GANESH A, et al.Fast x2113;1-minimization algorithms and an application in robust face recognition:A review[C]//Image Processing (ICIP) , 2010 17th IEEE International Conference on, 2010:1849-1852.

基于稀疏表示的目标跟踪方法 第2篇

最近几年,受到基于稀疏表示的人脸识别方法的启发,稀疏表示在目标跟踪中也逐渐获得了应用。例如Mei等人在文献[1]中提出的基于L1范式最小化的目标跟踪方法(L1跟踪器),其核心思想是在粒子滤波框架下,将一组目标模板和单位模板(单位矩阵的列向量)作为基函数来线性表示每一个目标候选。当目标候选为跟踪结果时,目标候选能够以较低的重构误差仅由基函数中的目标模板进行线性表示而获得,因而基函数中的单位模板在整个线性表示中的系数接近零,在此可以假设线性表示的系数是稀疏的,并可利用L1范式最小化求解这些系数。每一个目标候选在粒子滤波下的权重可以计算为使用目标模板和对应的系数重构该目标候选时所得到的重构误差,并将具有最大权重的目标候选取定为跟踪结果。

L1跟踪器的一个缺点是对线性表示的稀疏性假设并不是在所有情况下均会成立。尽管当目标候选是当前时刻的跟踪结果时,目标候选能够很好地由目标模板进行线性表示,从而当使用目标模板和单位模板一起对目标候选进行线性表示时,其系数就表现为是稀疏的。但当目标候选是背景区域时,由于单位模板能够线性表示任一图像块,当该目标候选由目标模板和单位模板进行线性表示时,其单位模板对应的系数不再为零,从而使得整个系数向量并不稀疏,此时在求解系数的目标函数中最小化系数的L1范式约束将不再合理。另一方面,当被跟踪的目标发生部分遮挡时,尽管单位模板能够表示由于遮挡而引起的目标外观的变化从而能够对遮挡进行处理,但是当目标被遮挡的区域较大时,单位模板对应的系数也会有较多的非零元素,此时整体的表示系数也不再稀疏。为了避免单位模板表示目标图像而同时又允许其表示目标受遮挡部分的情况,Bao等人在文献[2]中提出通过检测是否有遮挡发生来对单位模板的系数进行约束,即当没有检测到遮挡发生时,在求解系数的目标函数时增加对单位模板系数的L2范式约束。而当检测到遮挡发生时,则去掉对单位模板系数的L2范式约束。Li等人也在文献[3]中指出,当使用L1跟踪器的线性表示框架时,目标跟踪可能并不是一个稀疏表示的问题,因而提出了一种基于非稀疏表示的目标跟踪方法,即在求解线性表示系数时,去除了对系数稀疏性的约束。

L1跟踪器的另一个缺点是计算复杂度高,有两个方面的原因,分析如下:

(1)L1跟踪器需要为每一个目标候选计算一次L1范式最小化。在一个典型的粒子滤波框架下,为了使得目标候选的覆盖范围足够大,而使得当目标发生剧烈运动时仍然能够跟踪到目标或者是,当跟踪器失败时仍然能够从失败中恢复,所以目标候选的个数往往很大,例如在600左右。大量的求解L1范式最小化,必然会增加算法的时间开销,影响跟踪器的实时性。

(2)除了求解L1式的次数较大外,求解每一次的L1范式最小化也比较耗时,因为基函数中单位模板的个数与目标特征的维数相等。对于一个典型的跟踪目标,当使用亮度特征时,特征的维数在103级,因而将使得单位模板太多,从而显著增加了每一次求解L1范式最小化的计算开销。

Mei等人也已经意识到L1跟踪器计算复杂度太高的不足,因而随后提出了改进的方法,就是在文献[4]中提出了一种计算加速的方法。考虑到在粒子重采样阶段,只有权重较大的粒子才会被采样,而较小的粒子则将被丢弃。因此,并不是所有的粒子都必须要使用耗时的L1范式最小化来计算粒子权重。又由于L2范式最小化的重构误差是L1范式最小化重构误差的下确界,同时L2范式最小化的计算相比于L1范式最小化的计算要更快,因而作者利用这一特性,使用快速的L2范式最小化来排除那些不重要的粒子,只为余下的少部分重要粒子使用L1范式最小化来计算权重,这样就大大降低了计算的复杂度。除了上述通过减少L1范式最小化次数的加速方法外,一些研究者也提出了通过降低特征向量的维数以提高计算效率的方法。在文献[5]中,Liu等人提出了一种基于特征选择的方法来降低目标候选或目标模板的特征向量的维数,从而使得在L1范式求解时,算法的计算复杂度得到了降低。在文献[6]中,Li等人提出直接利用随机矩阵或者是哈希矩阵作用在L1范式最小化的两边以达到降维的目的,从而降低了算法的时间复杂度。在文献[3]中,Li等人提出了一种基于非稀疏表示的目标跟踪算法,由于在求解系数的目标函数中没有对系数的L1范式约束部分,就可以直接利用矩阵乘法操作实现系数求解,因而极大地提高了算法的实时性。

尽管本文提出的算法也利用了稀疏表示,但与之前的工作存在3个明显的不同之处,分别是:

(1)先前的方法对每一个目标候选均需要计算一次L1范式最小化,因而在粒子滤波跟踪框架下,总共需要计算大量的L1范式最小化。而本文提出的方法只需计算一次L1范式最小化,因而大大降低了算法的计算复杂度。

(2)先前的方法在稀疏表示时,将单位模板也作为基函数,尽管单位模板能够在目标发生遮挡时对由于遮挡而引起的外观变化进行表示,但基函数的引入也将导致目标跟踪的性能不再稳定。本文提出的算法没有使用单位模板。

(3)先前的方法借助文献[7]中的思想,使用重构误差计算每一个目标候选的权重,而本文提出的算法则直接使用稀疏表示的系数作为目标候选的权重。

1 基于稀疏表示的目标跟踪算法

本节详细介绍了提出的基于稀疏表示的目标跟踪方法。首先介绍了采用的粒子滤波框架,然后介绍了如何利用稀疏表示对粒子进行赋权。

1.1 粒子滤波跟踪框架

设xt表示t时刻的目标状态,yt表示t时刻的视频帧,y0:t表示初始0~t时刻所有的视频帧。目标跟踪的含义是利用直到当前时刻的所有视频帧估计得出当前时刻目标状态的后验分布,即p(xt|y0:t)。粒子滤波框架,主要包含预测和更新两步。首先,在预测阶段,利用上一时刻所有得到的视频帧对当前时刻的目标状态进行更新:

其中,p(xt|xt-1)描述了目标状态在相邻时刻之间的转移,称为转移分布。其次,在当前时刻,利用视频帧yt对后验分布p(xt|y0:t)进行更新:

其中,p(yt|xt)描述了当给定目标状态时得到视频帧的概率,称为似然分布。当使用序列重要性采样技术时,后验分布p(xt|y0:t)可以用一组赋权的粒子加以近似。设邀xti,wti妖i=1:N表示N个赋权的粒子集合,其中,每一个粒子xti均采样自一个重要性分布p(xt|x0:t-1,y0:t),其权重可以计算为:

当选择重要性分布为p(xt|xt-1)时,粒子的权重可以简化为似然概率wti=p(yt|xti)。

1.2 基于稀疏表示的目标跟踪

设Y=[y1,y2,…,yn]∈Rd×n表示t时刻n个粒子所对应的图像区域中提取的特征向量构成的矩阵,其中,yi∈Rd可以由图像的亮度特征构成,也可以由图像中提取的SIFT等特征向量构成。相应地,令y軃∈Rd表示时刻维持的目标模板中提到的特征向量。在理想情况下,当目标在跟踪过程中未发生遮挡,且场景中没有强烈的光照等导致目标外观发生变化的因素时,由于n个目标候选中至少有一个目标候选与目标模板非常相似,因此,目标模板可以由目标候选稀疏表示,即:

其中,α=[α1,α2,…,αn]∈Rn是线性表示的系数向量,可以通过L1范式最小化求解:

如果将n个目标候选当作视觉皮层的神经元细胞,将目标模板当作是外界的输入信号,则当神经元接收到外界的输入信号时,每一个神经元的平均激活率可以计算为:

直观上说,每一个神经元在对外界信息响应的过程中激活率越高,就表明该神经元与外界信息相符程度越高。类比于目标跟踪应用,则表明目标候选与目标模板就越相似。如图1所示,因此,可以利用神经元的激活率作为目标候选对应的粒子的似然概率,也即p(yt|x i t)=ηi。利用最大似然估计,当前时刻的跟踪结果则为具有最大似然概率的粒子,即xt*=xti*,i*=argmaxηi。

2 实验结果

2.1 不同特征对性能的影响

本小节分析了不同特征在david序列上对跟踪性能的影响,包括灰度直方图、LBP纹理直方图和本文使用的下采样亮度特征。图2(a)显示了下采样亮度特征,即当下采样步长为1,2和4时的中心误差,图2(b)和图2(c)分别显示了灰度直方图和LBP直方图当量化步长为1,2和4时的中心误差。由图2中可以看出,当选择下采样步长为4时,下采样亮度特征达到了最低的中心误差。当量化步长均为1时,灰度直方图和LBP直方图均达到了最低的中心误差。

其后,又对三种状况下最低中心误差的性能进行了比较,性能比较结果如图3所示。

2.2 与不同方法的性能的影响

图4和图5比较了本文提出的SR跟踪器与经典的Mean Shift(MS)[8]跟踪器和Particle Filter(PF)[9]跟踪器在human和bottle序列上的跟踪结果。从结果中可以看出,尽管MS和PF跟踪器使用了颜色直方图特征,仍然比本文提出的使用下采样亮度特征的SR跟踪器性能更差。

图6和图7则比较了本文提出的跟踪方法与PF跟踪器和L1跟踪器在singer和face序列上的跟踪结果。需要特别指出的是,L1跟踪器与本文的方法均使用了稀疏表示这一方法,但从结果中可以看出,本文提出的SR跟踪器比L1跟踪器的性能更优。

表1给出了本文提出的SR跟踪器与MS跟踪器、PF跟踪器和L1跟踪器在八个测试序列上的跟踪成功率。从实验结果可以看出,本文提出的SR跟踪器在7个测试序列上均取得了最高的跟踪成功率。

(The first row is obtained by the proposed method,the second and third rows are obtained by the MS tracker and PF tracker,respectively)

3 结束语

本文提出了一种基于稀疏表示的目标跟踪算法。在每一时刻,当假设生成的目标候选包括需要跟踪的目标时,使用所有目标候选来线性表示目标模板,线性表示的系数可以通过稀疏表示来进行求解。所计算的稀疏表示系数可以用来度量每一个目标候选与目标模板相似的程度,与目标模板最为相似的目标候选将被选定作为当前时刻的跟踪结果。实验结果表明,即使利用下采样的亮度特征,所提出的跟踪器相比于传统的基于颜色直方图的跟踪器也获得了更好的性能。另外,与文献中基于稀疏表示的相关跟踪器相比,本文提出的跟踪器也表现了更优良的性能。

参考文献

[1]MEI X,LING H.Robust visual tracking using L1 minimizati-on[C]//Proceedings of the 12th International Conference on Co-mputer Vision,2009:1436-1443.

[2]BAO C,WU Y,LING H,et al.Real time Robust L1 trackerusing accelerated proximal gradient approach[C]//Proceedings ofIEEE Conference on Computer Vision and Pattern Recognition,2012:1-8.

[3]LI X,SHEN C,SHI Q,et al.Non-sparse linear representati-ons for visual tracking with online reservoir metric learning[C]//Proceedings of IEEE Conference on Computer Vision and Pat-ern Recognition,2012:1-8.

[4]MEI X,LING H,WU Y,et al.Minimum error bounded effi-cient邀L妖1 tracker with occlusion detection[C]//Proceedings ofthe IEEE Conference on Computer Vision and Pattern Recog-nition,2011:1257-1264.

[5]LIU B,YANG L,HUANG J,et al.Robust and fast collabor-ative tracking with two stage sparse optimization[C]//Proceedi-ngs of the 11th European Conference on Computer Vision,201-0:624-637.

[6]LI H,SHEN C,SHI Q.Real-time visual tracking using com-pressive sensing[C]//Proceedings of the IEEE Conference on C-omputer Vision and Pattern Recognition,2011:1305-1312.

[7]WRIGHT J,YANG A,GANESH A,et al.Robust face rec-ognition via sparse representation[J].IEEE Transactions on P-attern Analysis and Machine Intelligence,2009,31(2),210-227.

[8]COMANICIU D,RAMESH V,MEER P.Kernel-based objectTracking[J].IEEE Transactions on Pattern Analysis and Mach-ine Intelligence,2003,25(5):564-577.

基于稀疏表示多分类的室内定位算法 第3篇

随着移动设备的广泛使用和背景感知服务的兴起, 位置信息越来越重要[1,2,3]。室内定位无法通过现有卫星系统实现, 基于无线局域网 ( WLAN) 的定位技术由于部署成本低, 拥有广泛的应用前景。目前广受关注的是基于指纹匹配的定位技术, 传统的匹配定位算法有: K最近邻算法 ( KNN) 、支持向量机 ( SVM) [4]以及概率模型估计[5], 由于没有考虑信号强度的统计特性和用户移动的历史轨迹, 其定位结果不准确且跳动明显。本文提出的室内定位算法结合了稀疏表示和卡尔曼滤波, 可以提高定位精度并平滑定位结果。稀疏表示分类算法是利用凸优化实现矢量匹配的算法[6,7], 考虑了指纹集的统计特性, 能够获得更高的匹配精度。卡尔曼滤波利用到用户的历史定位信息, 定位结果更接近真实运动轨迹。

1 基于指纹的室内定位问题描述

基于指纹的室内定位系统包含离线指纹采集和在线指纹匹配2个阶段, 分别用来采集训练样本以及匹配定位。某个位置的指纹就是在该位置上扫描各个接入点 ( AP) 的信号强度, 将这些信号强度以一定顺序排列起来, 就可以作为该采样点的指纹。在离线指纹采集阶段, 首先在定位区域内选择参考点, 建立指纹库来保存每个参考点的位置与对应的指纹信息。在用户在线定位阶段, 用户在线测量当前位置的指纹, 并匹配指纹库中各个位置的指纹, 选择最相似的K个位置, 其重心被估计为用户当前位置。因此基于指纹的定位问题被转换为一个多分类问题。

在待定位区域内部署M个AP, 用户采集M个AP的信号强度形成一个M维矢量作为指纹信息, f = ( s 1 , s 2 , …, s M ) T, 其中f为某个位置的指纹矢量, s i 为第i个AP的信号强度。在某个位置上采集n次指纹, 组成的矩阵可以形成该位置的指纹库, F p = [f 1 …f n ]。在待定位区域内选择N个参考点, 每个参考点上采集n次指纹。所有参考位置的指纹库组合起来成为待定位区域的指纹库, F = [F 1 …F N ]。定位阶段, 用户采集在线指纹f t , 与指纹库F中每个参考位置的指纹进行匹配, 估计出用户位置。

2 基于稀疏表示的室内定位系统设计

基于稀疏表示分类的室内定位系统框图如图1所示, 提出的室内定位算法分为稀疏表示定位算法和卡尔曼滤波算法2部分。首先利用稀疏表示定位算法估计用户的当前位置, 然后根据前次的估计位置对位置进行卡尔曼滤波。稀疏表示定位算法是对当前用户位置的测量, 卡尔曼滤波的目的是结合多次测量的用户位置, 使之更符合真实的运动轨迹。

2. 1 基于稀疏表示的定位算法

稀疏表示分类算法的指纹定位需要2个步骤: 首先求解在线指纹f t 在指纹库F上的稀疏表示, 然后根据每个位置上的指纹库对在线指纹的表示误差来估计在线指纹与该位置的相似度。

本文采用L1范数最小化求解稀疏表示问题[8], 向量f t 在矩阵f t 上的稀疏表示问题可以表示为:

式中, ‖x‖1 表示为矢量x的L1范数, 也就是矢量中各元素绝对值之和。上式的意义是用最稀疏的训练指纹的线性组合表达在线指纹。x为每个训练指纹表达在线指纹的系数, 代表了该训练指纹对重建在线指纹的贡献程度。

每个参考点的训练指纹都可用以表达在线指纹, 而根据稀疏表示获得的系数可以获得每个位置对在线指纹的表示误差。通过计算每个位置的指纹库对在线指纹f t 的表示误差, 获得在线指纹与每个位置的指纹库的相似度。

式中, F p 为第p个的位置的指纹库; x p 为第p个的位置的系数; e p 为第p个的位置的指纹库的表示误差。表示误差越小, 在线指纹与该位置的指纹库的相似度越高。

获得了在线指纹与每个位置的指纹库的相似度, 可以得到在线指纹最可能的K个位置。利用相似度作为权重, 将最可能的K个位置的重心作为估计位置。

式中, 1/e i 表示误差的倒数表征了在线指纹与第i个的位置的相似度。

2. 2 卡尔曼滤波算法

实时定位系统中, 后一时刻的位置是前一时刻位置的迁移。因此利用卡尔曼滤波算法, 可以根据上一个点的定位结果, 估计下一个点的定位结果和误差范围[9]。卡尔曼滤波是一个连续地预测与修正的过程, 通过上一次的定位结果预测下一次可能出现的位置, 然后根据观测值对预测值进行修正。稀疏表示获得的定位结果, 作为卡尔曼滤波算法的观测值。结合稀疏表示和卡尔曼滤波2种方法, 可以进一步提高定位精度, 减少定位异常的点。

卡尔曼滤波器的估计过程采用反馈控制过程, 滤波器根据时间状态做出预测, 然后获取观测值的反馈。卡尔曼滤波的方程分为时间更新方程和观测更新方程, 时间更新方程获得对下一个点的位置的前向预测, 观测更新方程根据稀疏表示获取的定位结果对预测结果给出反馈。

卡尔曼滤波器的线性预测方程为x k = x k -1 + u +w。式中, x k 为k时刻用户的位置, 通过k -1时刻用户的位置x k -1 和用户偏移u估计出来, 估计误差为w, p ( w) ~ N ( O, Q) 。卡尔曼滤波的观测方程为x sr = x + v , 式中x sr 为稀疏表示算法的定位结果, 由真实值x和观测误差v组成, p ( v) ~ N ( O, R) 。

卡尔曼滤波器的时间更新方程如下:

已知k - 1时刻卡尔曼滤波器的输出x k -1 和偏移位置u , 可以根据预测方程计算得到一步预测的结果xk - 。已知k - 1时刻卡尔曼滤波器的滤波误差协方差矩阵P k -1 和预测误差Q , 可以获得一步预测的误差协方差矩阵Pk - 。

卡尔曼滤波器的状态更新方程为:

式中: K k 为第k时刻的卡尔曼增益, 表征了预测值在滤波结果中的置信程度, 由单步预测误差协方差矩阵和观测误差协方差矩阵计算得出, P k 为第k时刻的滤波误差协方差矩阵, x k 为第k时刻的滤波输出; x sr 为通过稀疏表示算法获得的观测值。

3 实验结果与分析

下面结合仿真和实验台实验对算法的性能进行估计。利用仿真实验来指导选择AP的个数, 分别从仿真实验和试验台试验2个角度来分析定位结果。

3. 1 仿真实验

模拟3. 2中实验环境建立仿真模型。考虑室内无线信号的距离损耗、阴影衰落和多径衰落, 建立了室内无线传播模型为:

式中, p 0 为1 m处信号强度, 取经验值 -45 dBm; 距离损耗采用对数距离路径损耗模型模拟, n = 1. 81 ; ξ为阴影衰落, 随位置变化且符合正态分布的随机变量, ξ ~ N ( 0, 5. 2) ; ε为多径衰落, 是随时间变化符合瑞利分布的随机变量。

由于AP的个数决定了指纹矢量的维度, 因此首先对比不同AP个数对定位的影响。可用于定位的AP越多, 定位越精确, 而布置的AP越多, 成本也越高。将AP个数从5增到9, 采用稀疏表示算法实现定位仿真, 结果如图2所示。可见, 可用于定位的AP越高, 定位精度越高。然而AP超过一定数量之后, 所增加的效益也越来越少。综合考虑成本和性能, 采用9个AP用于定位。

3. 2 实验台实验

实验场地为某办公楼内开放办公区, 面积为16 m×17 m, 共有3排工位、4个过道和2个走廊。将9个AP均匀分布于区域内, 放置在离地面3 m处的天花板上。离线采集阶段, 在4个过道和2个走廊上, 以步长为1 m移动, 并保证每个方向都能采集到指纹。在线定位阶段, 以步长为0. 5 m在过道上和走廊上走动, 共获得1 340个测试样本。

统计上述实验环境中的定位误差的累积概率, 如图3所示。提出的算法定位精度高于KNN算法。前者定位误差在2 m以内的概率是45. 3%, 高于后者的33. 0%; 前者定位误差在4 m以内的概率为96. 9% , 比后者的76. 7% 高了20% 。提出的稀疏表示结合卡尔曼滤波实现的定位算法平均误差为2. 22 m, 比KNN算法的3. 37 m降低了34. 1% 。

4 结束语

结合卡尔曼滤波和稀疏表示分类算法, 将稀疏表示分类的定位结果作为卡尔曼滤波算法的测量值, 提高了定位精度且使得定位结果更接近真实运动轨迹。实验证明, 本文提出的基于稀疏表示的多分类定位算法与传统的KNN算法定位相比, 定位精度明显更高, 用户体验更好。此外如何根据建筑结构合理的布设AP也是下一步值得研究的问题。

摘要:为了提高室内实时定位中定位精度不高, 并解决定位结果跳动过快的问题, 提出了一种基于稀疏表示的室内定位算法。针对基于无线信号的定位方法精度不高, 采用稀疏表示多分类算法提高定位精度。针对定位结果过快的跳动, 利用卡尔曼滤波对位置坐标进行滤波处理, 使定位结果更加接近真实的运动轨迹。结合稀疏表示与卡尔曼滤波算法, 并通过仿真实验和实验台实验验证了算法的性能, 算法的定位精度比传统的KNN算法有明显提高, 并且定位结果更加接近真实的运动轨迹。

关键词:室内定位,稀疏表示,卡尔曼滤波,无线局域网 (WLAN)

参考文献

[1]WANG X, FU L, HU C.Multicast Performance with Hierarchical Cooperation[J].IEEE/ACM Transactions on Networking, 2011 (99) :1-5.

[2]RUHRUP S, KALOSHA H, NAYAK A, et al.Messageefficient Beaconless Geo-routing with Guaranteed Delivery in Wireless Sensor, Ad Hoc, and Actuator Networks[J].IEEE/ACM Transactions on Networking, 2010, 18 (1) :95-108.

[3]XIAO B, CHEN H, ZHOU S.Distributed Localization Using a Moving Beacon in Wireless Sensor Networks[J].IEEE Trans.Parallel Distrib.Syst., 2008, 19 (5) :587-600.

[4]朱宇佳, 邓中亮, 刘文龙, 等.基于支持向量机多分类的室内定位系统[J].计算机科学, 2012, 39 (4) :32-35.

[5]陈淼.基于多高斯混合模型的WLAN室内定位系统[J].华中科技大学学报 (自然科学版) , 2012, 40 (4) :67-71.

[6]HUANG K, AVIYENTE S.Sparse Representation for Signal Classification[J].Advances in Neural Information Processing Systems, 2007 (19) :609-612.

[7]WRIGHT J, YANG A Y, GANESH A, et al.Robust Face Recognition via Sparse Representation.Pattern Analysis and Machine Intelligence[J].IEEE Transactions on, 2009, 31 (2) :210-227.

[8]DONOHO D, HUO X.Uncertainty Principles and Ideal Atomic Decomposition[J].IEEE Transactions on Information Theory, 2001, 47 (7) :2 845-2 862.

[9]YANG A Y, GANESH A, SHANKAR S S, et al.Fast L1-minimization Algorithms and An Application in Robust Face Recognition:A Review[C]∥ICIP 2010, 2010:1 849-1 852.

[10]JAEGEOL Y, SEUNGHWAN J, KIYOUNG G, et al.Improvement of Kalman Filters for WLAN Based Indoor Tracking[J].Expert Systems with Applications, 2010 (37) :426-433.

[11]张世哲.基于惯性传感器和WiFi的室内定位系统的设计与实现[D].北京:北京邮电大学, 2012:1-64.

稀疏表示 第4篇

1 人脸表情识别的技术现状

1.1 提取人脸表情特征

由于提取人脸表情特征采取的图像类型不一样,对此我们可以将其分成静态表情的图像特征进行提取以及序列表情的图像特征进行提取这两种。第一种提取的是表情静止时的特征,第二种提取的是表情在运动过程中的特征,对于第一种的提取方法一般为Gabor小波,主成份分析(PCA)以及线性的判断分析(LDA)等的方法;而针对与第二种的提取方法有特征点跟踪,查分图像法以及光流法等。

1)提取静态的表情特征的常用方法

PCA主要是用在抽取原始特征以及降维,这种方法运算的中心思想是把二维的图像转为一维向量,根据从大到小的排列顺序对特征值以及特征向量加以调整,并且通过K-L的变换投影获得正交基,对其加以取舍进而得到人脸的表情特征其子空间。其实际上识别表情的过程就是把测试的样本进行比较投影进表情特征的子空间里,之后再将其跟测试的样本加以比较判定出它的表情类别。Gabor小波这种方法是现在我们比较常用的一种表示特征的方法,它能够有效地将环境噪音加以清除,使提取的图像特征有效加强,主要是通过图像在不同方向不同尺度上的频率信息对图像的特征加以表明。

2)提取变动的表情特征常用的方法

对于序列图像特征加以提取的代表性方法就是光流法。这种方法在1981 年被第一次提出,主要是根据对视频图像里的表情特征光流加以计算进而得到每一个特征点的运动情况,这就是表情特征。

第一种提取特征的方法它采集较方便,计算更快捷,但是不能够对更大时间和空间信息加以探知。而第二种提取特征的方法虽可以对运动的表情信息加以提取,进而使得到的识别效果较好,但这种方法其计算的数据量较庞大,且具有很高的重复率,实际的操作当中比较困难。因此从目前来看,提取表情特征应该朝着将各种提取方法相互融合来对信息加以特征提取。

1.2传统的人脸表情识别系统中存在的问题

对于人类表情识别的研究中可以依据人类对不同的表情加以区别上获得启发,但运用计算机的视觉技术准确地对人脸表情进行识别的系统,实际运用中还有很多难题。

1)不容易建立起理想的人脸表情相关模型

因为人脸是比较柔的,所以把人的表情和情感进行分类,在此基础上再建立一个模型,把人类的表情特征以及情感信息再相对应这就显得十分的困难。

2)表情数据库不完善

现在很多研究的实验结果都是在各自研究团队里研发出来的表情数据库的基础上得到的,我们知道每一个表情库由于噪音或者是光照等环境方面的影响都各不相同,再加上每个表情库里的人脸图像在文化,种族当中都存在着比较大的区别,所以实验的结果应该多次加以重复验证,增加推广能力。

3)学科方法和技术有自身的局限性

尽管我们在对人脸识别的系统中研究工作正在逐步加深,得到了很大的进步,但因为很多的研究者都是自己展开工作,在新技术和新方法将优点充分发挥出来的同时也不可避免地有着自身的局限性,多种技术相互融合上面的工作开展得还比较慢。

2 提取改进LBP的人脸表情特征

局部二元模式(LBP)指的是一个能描述算子的有效图像纹理特征,根据存在于图像中的任意一点和它相邻那点的灰度值中发生的大小关系来判定图像中部分纹理空间构造,从这方面上来看,它有旋转和抗亮度变化的能力。

2.1 原始的LBP算子

LBP一开始先将图像中各个像素点之间的灰度值加以计算,将在各个像素点和跟她相邻的点存在于灰度值上的二值关系加以计算,根据计算后得出的二指关系根据相应规则来形成局部二值的模式,同时将多区域的直方图序列当做这个图像的一个二值模式。

一个基本的LBP算子应该是上图1所示那样,将其定义成3*3的窗口,有8个邻域的像素点,把窗口中心点的灰度值对窗口内的像素点其灰度值执行二值化,再依据不同的像素点位置来加权求和,进而得到这个窗口LBP编码值。

2.2 改进的LBP算子

从上面我们可以知道原始的算法自身纹理描述力是很强的,但在特定的局域内,原始LBP算子只考虑到了存在于中心像素点跟邻域的像素点之间灰度值的差异,把中心像素点作用以及邻域像素点其灰度值之间的互相关系忽略掉了,因而造成在某些情况下把局部的结构特点信息有所忽略。如下图2 就是某种特定的情况。

图2 中所产生的11111111 主要是对暗点以及会读平坦的区域进行检测,可以说是特征检测器。我们在此基础上,对原始的LBP算子进行改进,根据使一位二值编码增加的方式来加以扩展,提出了多重心化的二值模式也就是MLBP,具体的改进过程如图3所示。

由图3 中获得的两个8 位子编码将其当做独立的两个MLBP的自编码,继而对所有模式直方图加以计算,根据这个直方图来加以分类或者是识别。LBP具体的算法公式如下:

在这当中,N,R分别表示的是临域点的个数和半径,gc表示的是像素点,gn表示的是它的临域点。根据这个改进的MLBP算子我们可以看出,它根据使一位二值的编码增加的形式,在将原始LBP算子的优势得到保持前提下,将中心像素点作用和邻域像素点二者间灰度值的关系又加以利用。跟原始的相比,改进的算子并没有时特征模式有所增加,而且还可以将原始的算子中没有考虑到的中心像素点和邻域像素点灰度值间关系产生的结构特点提取出来,让其鉴别能力得到提高。

3 人脸识别系统的设计

3.1 系统构成

该系统主要是被硬件平台以及软件开发的平台这两部分构成。硬件平台指的就是那些采集图像的设备和计算机系统,而软件开发的平台就是本文中所描述到的在上述所说的算法中改进开发出来的一种人脸识别的系统。

3.2 系统软件

系统软件的构造。系统软件可以划分成以下两个部分。首先是获取图像,当进入到主界面中时,点击打开图像或者是打开视频,系统初始化的硬件设备能够根据直接打开的静态表情图像或者是视频等,来对人脸表情图像进行获取并将图像显示出来,之后再对人脸开始进行检测和定位。其次,就是提取相应的表情特征并对其进行识别。

下面为了对该系统在进行识别表情时的效果进行验证,本文进行了几组对比实验。先将Gabor跟采样降维相结合的特征提取方式下得出的不同分类器效果加以比较,再将该系统下的分类跟其他的分类器效果进行比较。具体如下图4所示。

在图4中,横坐标1-7分别表示的是生气、厌恶、恐惧、高兴和瓶颈、伤心以及惊奇,数字8表示的是所有的表情。

结论:

根据图4 我们可看出,在特征提取条件相同情况下,整体实验数据中稀疏表示明显比另两种分类型的性能要好,而且BP神经网络分类效果也非常良好,但是最近邻之间的分类器的精准度没有前两种表现得好。

该文中运用的这种提取特征方法的效果明显比Gabor跟采样降维相结合的方法效果要好。

上面进行的对比实验,充分验证了本文中的分类系统的优越感。下面跟文献中已经有的方案进行对比,具体如下图5所示。

根据图5 所示,我们可以看出,跟其他文献中采用的方法来看,本文采用的方法在表情识别上有着明显的优势。具体的我们还可以从下图6 的人脸表情识别界面中看到本文中设计的人脸识别系统具体应用情况。

3.3简析人脸识别算法

1)优点

这种算法将以前在迭代过程中的迭矩阵计算大大简化,而且在识别的速度上也得到了有效的提升,能跟随光照的变化进行有效的识别,对人脸进行识别的主要困难就是遮挡、单样本等这些问题,而稀疏表示在这些问题的前提下仍然能具备潜在的发展力,我们可以进一步对其加以研究,这也是现在研究的一个重点方向。

2)缺点

在上面实验中我们发现其分类器表现出了良好的使用效果,但这种算法也存在着一些不足之处,由于数据量不断地增加,稀疏表示分类需要的时间也会随之而增加。此外,这种表示方法虽然在速度上明显优于其他,但是其产生的识别率并不是很高,也就是说不能准确地对表情进行有效识别。

4 展望人脸表情识别的系统

这种新型的对人脸表情加以识别的系统利于将人们的生活品质提高。当人们一旦从比较寒冷的地方或者是比较炎热的地方回到室内时,可以根据这个表情识别的系统快速地把人们面部表情与最佳温度中人脸表情相对比,进而让空调自动把室内的温度调转至最佳。此外,在医疗行业中,可以将表情识别运用到电子护士护理中来。尤其是对于那些重症病人,在对其进行治疗的过程中可以根据这个具有表情分析能力的机器人护士对病人实行实时的看管护理。除以上几点外,在对儿童实行教育时也可以将其应用其中,可以根据儿童在某种情形下所产生的表情以及行为进行具体分析和观察,有效挖掘他们潜在的气质和能力,引导我们更好地对儿童实行教育,促进儿童的健康成长。

5 结语

综上所述,对人脸表情加以识别是具有很大挑战的新兴课题,笔者主要对存在于人脸表情识别算法中的问题进行了简要的分析,并在此基础上提出了改进的算法进而提出了对人脸表情加以识别的系统。但从目前来看,我国关于人脸识别的系统研究当中还存在着一些问题,因此,对于我们来说将更加智能化的关于人脸表情识别的系统加以实现还是一个十分艰巨的任务,还需要我们不断的努力。

参考文献

[1]赵晓龙.安防系统中的基于稀疏表示的人脸识别研究[D].西北大学,2014.

[2]朱可.基于稀疏表示的人脸表情识别[D].西北大学,2013.

[3]万川.基于动态序列图像的人脸表情识别系统理论与方法研究[D].吉林大学,2013.

[4]欧阳琰.面部表情识别方法的研究[D].华中科技大学,2013.

[5]王哲伟.基于稀疏表示残差融合的人脸表情识别[D].五邑大学,2011.

[6]张慕凡.基于稀疏表示的人脸识别的应用研究[D].南京邮电大学,2014.

[7]赵晓.基于稀疏表示的人脸识别方法研究[D].北京工业大学,2013.

稀疏表示 第5篇

分辨率是雷达成像的重要指标,对雷达图像解译和目标识别有重要的影响。合成孔径雷达(SAR)和逆合成孔径雷达(ISAR)是目前应用最多的成像雷达,他们通过发射宽带信号来获得距离向的高分辨,利用雷达和目标之间的相对运动实现方位向上的高分辨。

在常规的成像方式下,雷达成像分辨率受发射信号带宽和观测积累角的限制,要获得更高分辨率的雷达图像,需要增加发射信号的有效带宽和观测积累角大小。然而,提高信号带宽会增加雷达系统的复杂性,在大的观测积累角下,目标散射中心可能会出现距离徙动,目标的散射特性也可能会发生变化,对补偿算法和成像算法提出了更高的要求。因此,在不增加现有装备复杂性和观测积累角大小的前提下,利用有限的观测数据来获得更高分辨率的雷达图像,具有重要意义。要实现这个目的,需要充分利用其他的先验信息。

我们知道,高频区雷达目标可以用少数几个散射中心来描述,目标回波可以看作是少数几个散射中心回波的合成[1]。雷达目标成像就是利用观测数据估计散射中心的个数、位置和幅度等参数,实际上是一个信号表示的过程。由于雷达目标的散射中心具有稀疏分布特性,因此可利用稀疏信号表示(Sparse Signal Representation,SSR)方法实现雷达图像的分辨率增强。用稀疏信号表示方法进行雷达目标超分辨成像是一个迭代优化过程,需要研究复杂性较低的算法。本文根据雷达成像系统的结构特点,提出了基于FFT和分块Toeplitz系统的快速成像算法,极大地降低了算法的复杂性。

2 雷达目标回波模型

本文采用文献[2]中所用的雷达目标回波模型,目标用多散射中心描述时基带回波信号为:

undefined (1)

其中(xk,yk)表示第k个散射中心的位置,σk表示第k个散射中心的幅度,k为散射中心个数,f为回波信号瞬时频率,θm(m=0,1,…,M-1)为观测方向,M为观测方向个数,c为电磁波传播速度。由于散射中心的个数、位置和幅度等参数均未知,常规的成像算法是根据式(1)对观测数据作逆傅里叶变换,但图像分辨率受瑞利准则的限制。因此,可在图像域进行加密采样,减小分辨单元的尺寸,从而形成一个过完备的词典。此时,成像问题转化为过完备词典上的信号表示问题。在小角度条件下,由于成像雷达的相对带宽通常较小,因此合并相位项后的基带回波采样可写为:

undefined

其中{gn,m}undefined为谱域观测数据,{σq,p}undefined为加密采样后的高分辨的二维图像,Q=lN,P=lM,l为超分辨倍数。采用行列堆叠过程可将上述观测数据模型写为如下线性系统:

undefined

其中:

undefined

K=[Km,q]M×Q为行列变换矩阵,他是一个包含M×Q个子块的分块矩阵,其中第(m,q)个子块表示仅在(q,m)位置为1其他位置为0大小为Q×M的矩阵,显然,当l>1时T是一个过完备词典。

3 超分辨成像算法分析与设计

根据第2节的回波模型,目标成像实际上就是求解不定系统式(3),显然需要增加额外的信息。事实上,高频区雷达目标可用少数几个散射中心描述,因此可寻求式(3)的稀疏解以实现目标成像,这实际上是一个稀疏信号表示问题,可以将稀疏信号表示引入雷达目标成像过程。

3.1 稀疏信号表示

利用散射中心稀疏分布的先验信息,结合稀疏信号表示问题式(3)得到复高斯噪声条件下成像问题求解的优化模型为:

undefined

其中d(Σ)为稀疏性度量函数,ε∈CNM是方差为σ2的复高斯噪声矢量。

利用稀疏信号表示进行雷达目标成像就是求解优化模型式(4)的过程。利用阀函数法将式(4)变为无约束模型后,借助最优化理论得到成像迭代格式为[2]:

undefined

其中λ是与噪声水平相适应的的正则化参数,可以通过L-曲线准则、交叉验证(Cross Validation,CV)等方法确定[3];undefined是高分辨的二维图像矢量Σ的第i个分量,函数φ(x)由稀疏性度量函数d(x)确定,d(x)=∑φ(x),稀疏性通常用l0-范数‖x‖0来度量,即计算向量x中非零元的个数,但是l0-范数是非凸的,最小化l0-范数会引起优化的混定问题,且l0-范数对噪声非常敏感,在实际应用中不便于处理,因此人们通常考虑用另外的函数来代替,一个有效的稀疏性度量函数应该在某种程度上逼近l0-范数,常用的稀疏性度量函数有lp-范数(0

3.2 TBT系统求解

采用式(5)直接进行成像迭代,不仅要对PQ×PQ大小的矩阵求逆,还要计算该逆矩阵和PQ×1大小的向量的乘积,这对内存和计算时间是一个极大的挑战。如果把式(5)转化为求解线性方程组:

undefined

每一次成像迭代就是求解一个大型线性方程组的过程。如果采用高斯消去法求解,仍要对PQ×PQ大小的系数矩阵进行存储,计算量高达O((PQ)3),为此,需要研究复杂性更低的算法。

实际上,式(5)可以转化为一个Toeplitz-block-Toeplitz系统的求解,从而可以采用Toeplitz矩阵类的快速算法来降低成像迭代的复杂性。令Wundefined=Πk,式(5)变为:

undefined

利用恒等式:

undefined

将式(7)变为:

undefined

式(8)中Wk为对角阵,T为傅里叶词典,只要能够快速地求得向量[λI+T(WkWundefined)TH]-1G的结果,就可以通过FFT和简单的加权来求得成像结果Σk+1。对于向量z=[λI+T(WkWundefined)TH]-1G的计算,其核心在于求解线性方程组:

undefined

系数矩阵λI+T(WkWundefined)TH是一个分块Hermitian Toeplitz矩阵,每个矩阵块也是一个Toeplitz矩阵,具体证明见文献[2]。Toeplitz-block-Toeplitz系统求解有快速算法[4],所需存储单元个数仅为2MN,计算量仅为O((MN)2)。

3.3 算法步骤

通过以上对算法的分析,下面给出本文雷达目标成像迭代算法的步骤。

step1:取初值Σ0∈CPQ,选择迭代精度指标δ>0,选择正则化参数λ>0,选择稀疏性度量函数d(x),设置k=0;

step2:由d(x)=∑φ(x)求得φ(x),计算对角矩阵undefined,利用快速算法求解Toeplitz-block-Toeplitz系统式(9),进一步通过FFT和加权得到第k+1步成像迭代结果Σk+1=(WkWundefined)THz;

step3:计算误差

error=norm(Σk+1-Σk)/norm(Σk),如果error<δ则停止迭代,输出成像结果为Σk+1,否则设置Σk=Σk+1,k=k+1,返回step2。

4 仿真结果

针对典型空间目标“斯波特”卫星,如图1所示建立目标坐标系oxy,oz轴垂直纸面向外,利用高精度的电磁计算软件计算其回波。仿真参数如下:雷达波照射方向与oz轴成80°角,中心频率为2 GHz,带宽为150 MHz,方位向观测角度范围为[-3.1°,3.2°],全频段数据大小为64×64点。观测数据大小为32×32点,分辨率提高倍数分别为l=2和l=4,噪声方差为0.5。

利用本文的方法对观测数据进行超分辨成像处理,选择稀疏性度量函数undefined,则对角矩阵:

undefined

由于本文不研究正则化参数的选择,对正则化参数采用先验策略选择为λ=0.001。成像结果如图2所示,逆傅里叶变换成像作为对比。其中图2(a)为64×64点全频带数据通过逆傅里叶变换成像结果,图2(b)为32×32点观测子带数据通过逆傅里叶变换成像结果,图2(c)为32×32点观测子带数据通过本文算法2倍超分辨成像结果,图2(d)为32×32点观测子带数据通过本文算法4倍超分辨成像结果。

从图2可以看出,对32×32点的观测数据采用逆傅里叶变换成像,难以反映目标的形状和结构,利用本文的算法可以获得更清晰的高分辨率图像,在目标形状和结构方面与64×64点数据的IFFT成像结果十分相似,突显出了散射中心的特征。

5 结 语

本文以稀疏信号表示为基础,充分利用雷达成像系统的结构特点,提出了一种基于FFT和分块Toeplitz系统的雷达目标超分辨成像算法。理论分析和实验结果表明,本文的算法能有效地降低成像过程中的存储量和运算量,并能生成稳定的高分辨率雷达图像。

摘要:雷达目标成像本质上是对雷达目标散射特性进行信号表示的过程。在高频区,雷达目标散射特性可用少数几个散射中心来描述,利用散射中心稀疏分布的先验信息能有效增强雷达图像的分辨率。以稀疏信号表示为基础,针对雷达成像系统的结构特点,提出了一种基于FFT和分块Toeplitz系统的快速成像算法。该算法无需存储系数矩阵,极大地降低了存储量和运算量。仿真结果表明,该技术对雷达目标图像具有良好的分辨率增强能力。

关键词:先验信息,稀疏信号表示,FFT,分块Toeplitz系统

参考文献

[1]保铮,邢孟道,王彤.雷达成像技术[M].北京:电子工业出版社,2005.

[2]杜小勇.稀疏成份分析及在雷达成像处理中的应用[D].长沙:国防科技大学,2005.

[3]王正明,朱炬波.SAR图像提高分辨率技术[M].北京:科学出版社,2006.

稀疏表示 第6篇

f: y → { 正常,异常( 斗殴,恐慌,… ) }

为了求解上述问题,需要重点考虑两个问题: 行为特征的表示和异常事件的判决。

对于行为特征表示,当前国内外的研究主要是考虑视频序列中人群行为的运动特性,如文献[1]行为特征描述子—多尺度光流直方图用来描述视频序列中行为的空间及时间结构。文献[4]通过对局部时空立方体进行建模,然后利用整个时空立方体统计特征来描述整个场景的异常行为。其他行为特征表示方法,还包括基于背景模型的二值化特征[5]、光流直方图特征[6]、时空梯度特征[7]、社会力模型[8]、混沌不变特征[9]、混合动态纹理特征[10]等。

在异常事件判决方面,最近的研究常把它看成一个分类问题来解决,大多数常用算法通过在训练数据上拟合一个概率模型,将概率接近某一类别的测试样本判别为该类行为。文献[11]提取视频场景中的行为特征,训练各类行为样本的隐马尔可夫模型,进而识别人群异常行为。文献[8]利用社会力模型来提取代表人群的粒子所受的力,然后利用词袋来检测异常。其他的分类模型还有诸如混合高斯模型、混合主成分分析[12]、马尔可夫随机场[13]、潜在狄利克雷分布[14]、条件随机场模型[15]等。

近年来,随着压缩感知的发展,基于稀疏表示的方法被广泛应用于各个领域,如超分辨率[16]、图像去噪[17]、视觉追踪[18]、人脸识别[19]等。基于稀疏性的分类模型假设属于同一类的样本位于同一位置子空间中,任意测试样本能够由一个超完备字典中的少量原子线性表示。众所周知,如果相似的测试样本能够得到相似的稀疏表示系数会大大提高样本的识别精度。但是,传统的稀疏表示模型并没有考虑测试样本的局部流形结构,造成了稀疏分解不稳定问题,即相似的测试样本可能会得到完全不相似的稀疏表示系数。而这种稀疏分解的不稳定性大大影响了分类正确率。

受启发于稀疏表示和流形学习[20-21]方法,本文针对人群行为检测问题提出了一种基于局部线性嵌入[22]稀疏表示的异常行为检测方法,充分考虑了行为样本的局部流形结构。通过在稀疏分类模型中加入一个LLE正则项,来解决局部流形结构不稳定的问题。并且利用该模型对视频场景中的人群行为进行检测,实验结果表明: 文中的局部线性嵌入稀疏表示算法能够有效地提高样本的判别能力,并在人群行为检测中得到较好的实验效果。

1 行为特征获取

通常视频场景中的人群行为特征采用人群周围运动区域的运动信息来描述。本文主要利用变分光流算法初步提取人群运动特征,对视频序列中各帧图像分块,在人群运动前景区域中的块内对初步的运动特征进行处理获取维数较低的行为特征,构建行为特征描述符。

1. 1 人群运动区域获取

本文中人群运动区域是通过下面方法获得的,如图1所示。

1) Canny边缘计算: 先对图像做高斯卷积平滑,运用梯度值非最大值压抑细化边缘,并用滞后的阈值将与强边缘相连的弱边缘加入边缘图像。

2) 运动边缘区域求取: 对视频场景图像相邻的两帧的边缘图像做差,以消除静止场景的影响。

3) 运动区域获取: 在对运动边缘区域求取后,可以得到一个封闭的包含运动目标的边缘线。把每一行中第一个和最后一个边缘点之间的线组成的区域称为水平候选区域,同样竖直候选区域、± 45°候选区域也可以得到。通过对这些候选区域求并,并对得到的区域做形态学处理,可以得到基于相邻帧的视频场景运动目标检测结果。如图2 所示。

1. 2 改进变分光流法

本文采用在Brox[23]变分光流基础上改进的光流算法。为了增强光流算法对图像灰度变化的鲁棒性,Brox变分光流算法扩展了梯度一致性假设,并在平滑约束项上,采用分段平滑来代替全局平滑。同时运用多尺度的思想来计算大位移运动的光流。

变分光流算法的能量泛函由数据项和平滑项两部分组成,表示为

式中,u( x,y,t) 和v( x,y,t) 为图像中像素点I( x,y,t) 光流速度。

在改进变分光流算法中,数据项用多通道图像I[k]取代了标值图像I,还通过能见度项r( x,y,t) 来调节

式中: k是图像通道的总和。图像亮度I,绿减红颜色成分,绿减蓝颜色成分,亮度梯度Ix和Iy作为5 个图像通道来对流量的进行估计。

为了解决小图像梯度不连续流动的问题,在平滑项添加约束项来测量流场的变化。

式中: αg是全局平滑因子; αl是一个局部平滑因子,它是被局部平滑b( x,y,z) 所调控的。

根据变分计算法,通过最小化能量函数求解u和v,总的能量函数式先采用固定点迭代转化为线性方程,然后使用逐次超松弛迭代及由粗到细的分层策略可以获取光流场。

1. 3 构建行为特征描述符

通过上述改进的变分光流方法,可以计算运动区域光流的变化从而得到三个特征信息: 位置、速度和运动方向。为了量化位置信息,把分辨率为360 × 240 的视频序列分为尺寸为20 × 20 的小块,并把块的运动方向被量化为5 个方向,当小块中不存在检测到的运动区域时,方向和速度大小都设为“0”。这样视频序列每一帧行为特征维数为18 × 12 × 2,整个视频序列特征集就构成了该种行为的特征描述符。特征的描述能力和学习模型复杂性之间的平衡决定了特征的大小。在这里的视频序列中,这样的块选取也是充分考虑行为时长和样本数据量。如图3 所示为行为特征提取过程。

2 行为特征稀疏表示

传统的稀疏表示模型,没有考虑测试样本的局部流形结构,这会导致稀疏分解的不稳定性。这种不稳定性将会极大的降低检测识别精度。本文提出了一种基于局部线性嵌入和稀疏表示的人群行为检测方法,充分考虑了测试样本集的局部流形结构,有效的提高了检测效率。

2. 1 基于l1范数的稀疏表示算法

本节将首先介绍一下传统的基于l1范数的稀疏表示算法。假设有M个明显差别的类,其中第i类包含Ni个训练样本并用Di=[d1i,…,diNi]∈Rm × Ni表示。同一类的特征假定近似于一个低维子空间。换句话说,就是把测试样本y作为一个m维的特征。如果y属于第i类,那么y就能够用第i类训练样本Di的线性组合来紧凑表示:

式中,αi是y在Di上的紧凑表示。要注意的是,在理想情况下如果y属于第i类,那么就有 αj= 0,j = 1,…,M,j≠i。因此,y能够通过一个由M类D =[D1,…,DM]=[d1,…,dN]∈Rd × N组成的超完备字典稀疏表示。y的稀疏表示可以由式( 5) 求得

式中: α 是y在字典D下的稀疏表示系数; λ 是一个强制稀疏系数。

2. 2 基于局部线性嵌入稀疏表示

局部线性嵌入( LLE) 是一种流形学习算法,是一种从高维空间非线性映射到低维空间的非监督方法。在LLE中,基于流形假设: 如果样本集是从光滑流形中采样得到的,每一个样本在低维空间中可以用其近邻点线性表示,并保持高维中的局部线性关系不变,可以保留数据集的内在结构。给定数据集Y =[y1,y2,. . . ,yn],根据LLE,假设yi能够由在同一流形上的测试样本集最近邻线性表示,则其相应的稀疏表示系数 αi也能由相应的邻居使用相同的权值的线性组合表示。这种假设是成立的,因为只要每个测试样本和其近邻能够沿着流形的局部线性变化,则这一表示就是稳定的。

基于上述假设,LLE的二次约束可以定义为

式中: vij表示的是 αj的重构权重; N( yi) 表示yi的最近邻。yj的选择是根据它是否在yi的k个最近邻样本内。vij可以通过式( 7) 得到

式( 6) 可以化为如下形式

其中,I是单位矩阵,M = ( I - V) ( I - V)T是基于LLE矩阵。V定义为,通过把式( 8) 并入稀疏表示式中,基于局部线性嵌入稀疏表示可以表示为

其中,λ,λ1为正则化参数。

2. 3 稀疏表示系数求解

对于式( 9) 中的每个 αi,可以改写为

假设向量{ αj}j≠i固定,求解 αi可以表示为

式中:; αi(j)表示 αi的第j个分量。

这里采用文献[24]中提出的Feature-sign搜索算法求解模型( 11) 。

算法1求解式( 11) Feature- sign搜索算法

Input: 测试样本yi,字典D,矩阵M,参数K1,λ,λ1

Initialization: α1= 0,θ = 0( θj∈ { - 1,0,1}) 表示sign( αi( j)) ,激活集P = {}

Step1: 激活

从 αi中的0 元素开始,选择

,将j添加到激活集中,即

如果,则令;

如果,则令;

Step2:Feature-sign搜索

令为D的子集,即仅仅包含D中在激活集中的列,分别为对应的αi,hi,θ的子集。

通过式( 11) 求解:

对于解到实施线性搜索,更新;

将中为0的项从激活集中移除,并更新θ=sign(αi)。

Step3:最优条件

检测优化条件:

若条件不成立,则返回2,否则检测下一项条件b。

检测优化条件:,如果条件不成立,则返回1,否则,得到式( 12) 的最优解 αi*。

Output: 最优稀疏表示系数 αi*。

3 人群异常行为检测

上面获得的稀疏表示系数 αi在下面用来确定测试样本的类别。首先定义第i个重构误差,它表示的是测试样本与用第i类重构后的差别,即

其中,αi中非0 系数表示的是对应类中的原子。y的类别就可以通过下式中最小残差来确定

然而,在实际中,对训练样本进行标记是十分困难的。因为行为特征的维数一般较大,而样本的个数相对较少,则式( 5) 就变成了一个超定方程,即: 方程的个数大于未知数的个数,会出现无解现象; 为了使方程转化为常见的欠定方程,一种方法就是增加D的维数,也就是需要并入一个d × d的单位矩阵,则方程( 5) 转化为

式中: B = [D I]∈ Rd × ( N + d); α = [αTηT]T∈ R( N+d),η∈R( N+d)是一个误差矢量。在这里,式( 14) 有两个目的,一是使式( 14) 变为一个欠定方程,二是使模型中允许存在误差。

同样的,加入误差矢量的目标函数可以表示为

y的类别就可以通过求解下式的最小残差得到

上面介绍了基本的稀疏表示的分类方法,但这些稀疏表示分类算法不能够很好地反映样本的局部流形结构。所以为了提高上述算法的分类性能,受流形学习算法的启发,笔者提出了基于局部线性插入稀疏表示方法来提高各类别的区分度。

本文提出的基于局部线性嵌入稀疏表示的人群行为检测算法归纳如下:

算法: 基于局部线性嵌入稀疏表示的人群行为检测算法

Input: 训练样本矩阵D =[D1,D2,…,Dk]∈IRm × n,共有M类; 测试样本y∈[y1,y2,…,ym];

For 1≤i≤m

Step 1: 对训练样本集D = [D1,D2,…,Dk]及测试样本y∈[y1,y2,…ym]进行归一化;

Step 2: 求解基于局部线性嵌入稀疏表示问题,即通过求解模型( 9) 求得稀疏表示系数 αi。

Step 3:计算残差Ri(y)

end for

4 实验结果及分析

由于人群异常行为不像人脸识别及指纹识别有大量固定的数据集,所以本实验的实验数据由Sony HVR-V1C摄像机在校园中拍摄的一组视频,视频中的每一帧图像大小为360 ×240。视频中包含大量人群交互行为,包含正常、打架、恐慌、踩踏这几种群体行为( 见图4) 。

为了验证本文算法的有效性,使用在相同场景下的描述人群正常、跌倒、踩踏和恐慌的视频序列来测试本文的方法。从拍摄的10 个视频中分别各自抽取如表1 中的4 种行为样本。利用上文中的行为特征提取算法分别获得4 种行为特征集,利用稀疏模型训练得到训练字典。对上述的每种行为特征,选取67% 用于训练,剩余的33% 用于测试。

获取稀疏表示字典及测试视频序列的行为特征后,利用局部线性嵌入稀疏分类方法对行为进行分类,这里分别选取200 帧视频序列作为训练样本,这样就可以构成了一个432 ×800 的稀疏字典,另外分别选取4 种行为各100 帧视频序列用于测试。

如图5 为4 种测试视频序列检测结果。从图中可以看出测试样本可以由稀疏字典中的原子特征重构得到,其重构系数( 图5 中的实心点) 主要分布在对应该类在稀疏字典中原子所处的位置。

为了验证提出的基于局部线性嵌入稀疏表示算法的优越性,实验中和传统基于l1范数的稀疏表示算法进行了比较,表2 是两种算法对4 种测试视频的正确识别率,可以看出基于局部线性嵌入稀疏表示算法( LLE-SR) 的正确识别率明显高于传统基于l1范数的稀疏表示( SR) 算法。

5 结束语

本文提出了一种基于图像块运动方向及速度的行为特征描述子,该特征能够有效地反映人群行为的空间结构及运动信息,在构建行为特征描述子前,通过对人群运动区域检测,去除背景中噪声运动对行为特征描述子的影响。同时提出了基于局部线性嵌入稀疏表示分类方法,在稀疏表示分类的基础上通过考虑样本的局部流形结构,来解决相似的样本稀疏分解内在的不稳定性。实验结果表明该算法达到了较好的检测效果。本方法的局限是仅仅使用图像块的方向及速度信息,不易区分一些细小的行为,在以后的工作中,将结合一些其他特征完善该算法,对更高层次的行为语义理解进行研究。

%

摘要:针对人群行为检测中行为特征维数高、数据量大以及特征局部流形结构不稳定的问题,提出了一种新的人群行为检测方法。该方法首先利用改进变分光流算法初步提取人群运动特征,对视频序列中各帧图像分块获取低维行为特征,然后利用局部线性嵌入稀疏表示对其进行分类。基于局部线性嵌入(Locally linear embedding,LLE)的正则项能够有效地保留测试样本的局部流形结构,提高样本的判别能力。实验结果表明所提算法能够有效提高人群行为检测效率。

稀疏表示 第7篇

图像识别技术对接的产品和服务如雨后春笋般出现,例如拍照购物、人脸登录以及有必要使用图像识别技术的相关产品。这些产品和服务想要普及,最终都要回归用户体验身上来[[1]]。对于人脸登录,用户体验需求在于高准确率以及一定的交互性。本文立足于人脸登录的需求与特性,研究相应的基于主元分析和稀疏表示的人脸识别算法。

稀疏表示技术得益于近年兴起的压缩传感技术的发展和应用。具体地,其假设人脸图像存在于多个子空间中,那么同类的训练样本可以被互相线性表示。未知样本在所有训练样本上的线性表示应该是稀疏的。因此,稀疏表示试图去求一个最稀疏的解,以使得非零系数尽可能集中在与未知样本同类的训练样本中,通过稀疏性定位到少量同类训练样本中,以准确预测未知样本所属的类别。

1 基于稀疏表示的人脸识别算法

1.1基于稀疏表示的分类原理

稀疏表示的分类器采用最小的重构残差进行预测:

SRC方法识别效果好于大多数经典人脸识别算法。

2 主元分析PCA

2.1 利用PCA技术进行人脸图像降维与识别

PCA人脸识别是基于最佳正交变换的人脸识别算法,也被广泛用于降维。利用PCA方法:

可以提取人脸内部结构,也就是所谓的”模式”,如果有测试图像需要与训练图像比较,就可以在变换后的主元维度上比较,得出相似度衡量结果。对训练集的人脸图像进行处理,提取其中的主元,可以大致描述人脸的结构信息,称作特征脸[2]。

将n*m的人脸图像,重新排列为n*m的列向量。则训练样本集表示为I=1,2,…,N.通过下列公式计算训练样本集的均值向量和协方差矩阵:

3 人脸登录系统分析

通过PCA技术对字典原子进行降维,在保留主元的情况下能有效压缩人脸图像信息。考虑人脸登录的需求与特性以及SRC采用最小重建残差来决策的情况,对重建残差的信息利用率较低,提出重构残差较小的几张重构图像推荐方法,再根据反馈,辅以特征脸方法进行识别。

4 实验结果与分析

4.1 算法速度

本文算法对保留主元经压缩后的图像进行采样,再形成过完备基,这样过完备字典原子信息得到有效压缩,算法速度大幅提高,同时算法识别率几乎不受影响。图1展示了算法时间特性。

4.2 算法识别率

主流的SRC改进算法利用将错误样本加入冗余样本集并设置权重达到将错误样本与训练样本分离的效果,从而提高识别率。理论分析与实验表明,就算预测失败,该类图像的正确重构图像的重构残差一般不会过大,基于这样的思路,设计登录推荐算法,辅以反馈处理的特征脸方法。表1展示了算法在不同人脸库下的识别效果。

5 结语

将人脸识别技术应用在应用程序自动登录的相关研究解决了登录的快捷性与安全性的问题[3],但通常存在识别度低,鲁棒性差等问题。本文提出人脸登录推荐算法能有效解决识别度低与鲁棒性差的问题,提高用户体验,但仍存在安全性问题,需要其他技术协同保证。

摘要:基于稀疏表示的人脸识别算法有很好的识别效果,然而传统SRC也存在计算量大,在小样本条件下识别率低的问题。考虑到人脸登录可以具有交互性,文章提出了基于SRC的图像推荐方法,从而提高SRC对重构信息的利用。同时利用PCA与SRC的融合,降低原始字典的维数并结合登录推荐改进分类器,加快识别速度,提高系统识别率。在FERET、ORL人脸库上的实验结果表明该方法的有效性。

关键词:人脸识别,应用程序登录推荐,稀疏表示,主元分析

参考文献

[1]王明民.移动设备中的图像识别应用设计[D].西安电子科技大学,2012.

[2]全星慧,于丽,计春悦.基于主元分析的人脸识别方法研究[J].科学技术与工程,2010,24.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【稀疏表示】相关文章:

稀疏矩阵07-15

原子稀疏分解07-10

知识表示07-09

字母表示数05-20

知识的表示方法08-05

知识表示技术研究10-20

表示秋天的诗句05-31

表示尊敬的成语06-04

表示精要的成语07-05

表示动作的句子07-26

上一篇:人员定编下一篇:指尖上的广电