形态学算法论文

2024-07-29

形态学算法论文(精选7篇)

形态学算法论文 第1篇

在CLPR系统中,车牌定位是十分关键的一步,车牌定位是整个识别模块实现的前提,其定位准确率将大大影响整个系统的最终识别性能,而车牌定位历来是车牌识别系统中的难点问题。车牌定位的实质是图像分割,其目标是从原图像中提取牌照区域,以供下一步字符分割与识别。在实际环境下,由于天气变化,光照不均匀,摄像机畸变和电子噪声,以及车牌污迹磨损等客观原因对车牌定位准确率造成影响,因此有必要采取合理的有效的车牌定位算法来克服这些客观因素的不利影响。国内外对于车牌的定位进行了深入的研究,定位的方法多种多样,归纳起来主要有纹理分析法、边缘检测法、神经网络法等,然而由于牌照存在着各种干扰情况,这些方法各有所长,但存在着计算量大或定位准确率不高等问题。近年来,形态学图像处理己发展成为图像处理的一个重要研究领域,本文将一种抗噪型数学形态学边缘提取算子应用于车牌图像边缘提取,使得车牌定位不仅效果好,且适于对有噪声及复杂背景的车牌图像进行分割。

1 数学形态学的基本原理

数学形态学是分析几何形状和结构的数学方法,是建立在集合代数基础上,用集合论方法定量描述几何结构的科学。其基本思想是用一个结构元素作为基本工具来探测和提取图像特征,看这个结构元素是否能够适当有效地放入图像内部[2]。数学形态学的基本运算有:腐蚀,膨胀,开启和闭合四种。

1.1 腐蚀

腐蚀的运算符为“Θ",对于一个给定的图像A,用结构元素B来腐蚀,可以定义为:

AΘB={x:B+x奂A}

由于腐蚀表示某个结构元素对一个图像进行探测,以便找出在图像内部可以放下结构元素的区域,则腐蚀是一种消除边界点的过程,结果是使目标缩小,空洞增大,可以有效消除孤立噪声点。

1.2 膨胀

膨胀的运算符为“茌”,对于一个给定图像集合A,用结构元素B来膨胀。可以定义为:

因而,膨胀的结果使目标增大,空洞缩小,可填补目标物体中空洞,形成连通域。如果结构元素为一个圆盘,那么膨胀可以填允图像中的孔。值得注意的是,结构元素的大小和形状对膨胀的结果会产生不同的影响。

1.3 开启和闭合

开启和闭合运算是膨胀和腐蚀的代数运算、集合操作组成的。开启运算是先对图像进行腐蚀然后再进行膨胀,闭合运算是先对图像进行膨胀再进行腐蚀。若结构元素为B,图像为A,则:

开运算定义为:A○B=(AΘB}茌B

闭运算定义为:A●B=(A茌B}ΘB

因而,开启运算通过消除边缘的突起可以使图像的边界得以平滑,具有滤去小于结构元素的细节的功能。而闭合运算则是通过先膨胀后腐蚀的处理方法填充图像内部空隙并连接邻近的物体,具有填补小于结构元素的细节的功能。

2 基于数学形态学的车牌分割算法

车牌分割算法的处理过程如图1所示。

2.1 图像预处理

车牌原始图像的采集大多是通过摄像机、数码相机等设备来拍摄获取的,一般情况下都是彩色图像,由于彩色图像表示的信息较多,用函数表示复杂,且运算速度慢,则在预处理过程中,本文首先将彩色图像转换为灰度图像,便于处理;由于车牌图像受各种客观因素的影响,使得质量较差,所以对其进行灰度拉伸,使图像明暗更加清晰,增强对比度;再用典型的全局阈值法Ostu对图像进行二值化处理,使图像变为只有黑白二色的二值图像,使得车牌纹理特征更加清晰地突显出来,为后续处理做好准备。预处理过程如图2所示。

2.2 形态学边缘检测

图像的边缘是图像最基本的特征。所谓边缘是指其周围像素灰度值呈阶跃变化或“屋顶”状变化的那些像素的集合。它广泛存在于物体与背景之间、物体与物体之间、基元与基元之间。因此它是图像分割所依赖的重要特征[3]。

在车牌图像中,车牌区域内有多个(一般为7个)基本成水平排列的字符,则在水平方向上会形成一系列的明暗交替,存在丰富的边缘,且笔划中的纵向笔划丰富,而非车牌区域,边缘相对要少得多。这样就可以把边缘作为区分目标与背景的标志,通过对图像进行边缘检测的处理以后,车牌区域得到了加强,非车牌区域在很大程度上被削弱。

物体的边缘是由灰度不连续性所形成的。常用的边缘检测算子有Roberts、Sobel、Prewitt等,它们是在求解二维灰度函数的梯度之后,选取合适的阈值以提取边缘,通常称之为梯度阈值法。这种微分算子运算简单,但抗噪能力差。

在数学形态学中,结构元素对图像作膨胀运算会使二值图像中目标扩大,背景缩小,而腐蚀运算会使二值图像中目标缩小,而背景扩大,形态学膨胀和开运算可以抑制信号中的峰值噪声,而形态学腐蚀和闭运算可以抑制信号中的底谷噪声[4],利用这种特性可得到一种抗噪图像边缘提取算子:(A○B)-(AΘB)。为了检验其边缘检测的效果,本文选取3×3结构元素,用此算子与传统的边缘检测算子对加噪车牌图像进行边缘提取,经对比,表明此形态学抗噪算子,检测出的边缘不但清晰、连续,而且能很好地滤除噪声(如图3)。

2.3 形态学腐蚀去水平噪

由于车牌区域的字符笔划中的纵向笔划丰富,相对于背景图像而言,其具有大量纵向纹理特征。因此,车牌区域中纵向边缘出现概率要比横向边缘出现概率大得多。这样,若加强纵向边缘提取,能够初步消除掉大部分非汽车牌照区域。本文采用纵向线形结构元素3×1,通过形态学腐蚀操作处理,能够有效剔除水平边缘噪声影响(如图4)。虽然在去除水平噪声的同时剔除了车牌区域字符的水平边缘,但能够很好保持车牌区域垂直边缘,对车牌区域定位比较适用。

2.4 车牌分割

车牌的分割就是从车牌图像中提取车牌区域,它是对车牌进行识别的前提。分割的方法多种多样,而车牌原图像经过上述一系列的处理后,其中车牌区域的图像白点较为集中,则本文最后用一种投影积分法[5,6,7]来完成分割。利用水平投影法检测车牌水平位置,即定位车牌的上下边界,然后利用垂直投影法检测车牌垂直位置,定位车牌的左右边界(如图5)。能够实现比较快速而准确的定位。

3 实验结果及结论

以上算法的具体操作是在MATLAB 6.5中仿真实现的,经过各种图像预处理后,先用抗噪型形态学边缘检测算子对图像进行边缘检测,然后,在滤除水平噪声后结合水平垂直投影法来定位车牌区域(如图6,列出三张不同车型车牌分割效果)。为了验证算法的定位效果,把上述讨论的方法应用在150个样本的汽车图片中,这些图片包含了不同尺寸、各种背景,光照条件,和对比度,经测试,准确定位146张,定位率达97%。实验结果表明,此方法,可以在有噪声或背景比较复杂地情况下准确定位车牌的位置,算法简单,具有较好的运用前景。

参考文献

[1]俞伟广.复杂背景下的车牌识别技术研究[D].浙江师范大学,2007:1-3.

[2]王爱玲,叶明生,邓秋香,等.Matlab R2007图像处理技术与应用[M].北京:电子工业出版社,2008.

[3]史长琼等.颗粒图象边缘检测中边界闭合性的研究[J].自动化技术与应用,2003,22(6):28-30.

[4]方磊.基于数学形态学的边缘检测[D].昆明理工大学硕士学位论文.2006:16-28.

[5]周亮,刘云.基于数学形态学的汽车牌照提取算法[J].青岛科技大学学报:自然科学版,2007:70.

[6]周波,李剑锋,王绪本.复杂环境下的汽车图像牌照定位方法[J].电脑与信息技术,2002(4):10-14.

基于形态学方法的虹膜快速定位算法 第2篇

虹膜识别过程主要由虹膜图像采集、虹膜定位、特征提取、特征匹配等几个步骤组成。虹膜定位是在人眼原始图像中获得虹膜内外边缘的中心坐标及半径。由于图像采集阶段获得的图像通常包含整个人眼区域, 所以需要将虹膜分割出来以供后续的识别, 它是虹膜识别系统的重要组成部分, 准确的虹膜定位是实现虹膜身份验证和识别的前提。

虹膜内外边界都具有较好的圆环特性, 因此传统的虹膜定位算法都是采用圆形检测算子定位虹膜内外边缘。经典虹膜定位方法主要有John Daugman提出的圆梯度算子, Richard Wildes提出的Hough变换方法, WANG的最小二乘法, 此外, 还包括基于几何特征的定位方法和主动轮廓线法。但由于采集的虹膜图像质量的不确定性, 上述算法都有一定的适用范围, 圆梯度算子定位精度高, 且不受二值化阈值的影响, 缺点是容易受到局部光源的影响;Hough变换与最小二乘法都是基于二值化边界点的定位方法, 其前提是必须将边界点与非边界点区分开来, 否则不能精确定位, Hough变换方法存在实时性差的问题, 而最小二乘法由于是拟合方法, 定位速度较快, 但其精度不如圆梯度算子和Hough变换方法高;当图像质量不高时, 基于几何特征的定位方法与主动轮廓线法定位精度急剧下降。针对以上算法的局限, 许多文献提出了粗定位与精定位相结合的方法, 既保证了定位精度, 也提高了定位速度。本文利用阈值对人眼图像进行分割提取瞳孔区域, 然后对瞳孔区域进行一系列的形态学运算去除噪声, 粗略定位瞳孔, 最后利用圆梯度算子对虹膜内外边缘进行精确定位。从实验结果来看, 与经典虹膜定位算法相比, 精度差别不大, 而速度有较大提高。

1 虹膜内边缘定位

1.1 图像平滑处理

虹膜图像采集过程中不可避免受到各种噪声的干扰, 使得虹膜图像中存在一定的图像噪声, 为保证本算法的定位精度, 必须去除虹膜边界带上的噪声, 这样使虹膜图像的内外边界上尽可能多的像素点的灰度值趋于一致, 同时又不至于消除内外的灰度差异。本文在定位前使用合适的小尺度高斯低通滤波器G (n1, n2) (式 (1) ﹑ (2) ) 对图像进行2滤2波。2

滤波过程主要是将滤波器中心滑过虹膜图像, 与滤波器中心对应的虹膜图像点的灰度等于滤波器系数与对应像素的灰度值相乘之和。图1为E=0, =1的二维Gaussian分布图, 处理效果要优于均值滤波器, 既可以取得更加柔和的平滑效果又不至于破坏图像中的边沿, 同时还可以消除原始图像的高频噪声。

1.2 内边缘粗定位

本文采用阈值分割法先提取瞳孔区域, 然后对虹膜图像进行形态学开运算, 以消除睫毛﹑光斑等噪声干扰, 然后用直线扫描的方式确定瞳孔初始半径, 根据初始半径利用一系列结构元素对瞳孔区域腐蚀, 最后根据腐蚀结果确定瞳孔粗略半径。

(1) 瞳孔阈值分割。图2 (a) 为一幅典型人眼图像直方图, 从该直方图看出人眼图像灰度分布有一定特点, 瞳孔灰度要小于虹膜灰度, 虹膜灰度要小于巩膜灰度, 且瞳孔灰度集中在狭窄的范围内, 在直方图中显现为尖锐的峰值。采用文献[5]中的阈值分割方法, 二值化阈值选择在第一个峰值的右侧, 按式 (3) 对人眼图像进行阈值化, 其中:I (x, y) 为点 (x, y) 处灰度值, T为分割阈值, BW为阈值分割后图像。图2 (b) 是阈值化后的结果, 我们可以看出, 瞳孔被成功地被分离开来。

(2) 形态学开运算去除噪声。从图2 (b) 看出, 瞳孔区域外有部分睫毛等噪声, 且瞳孔边界不是那么平滑, 而形态学开运算是对图像先腐蚀后膨胀, 腐蚀可以消除比结构元素小的狭窄的间断和细的突出物, 如图2 (b) 中细的睫毛, 再用相同的结构元素进行膨胀则可以复原瞳孔被腐蚀的区域, 而且使边缘更光滑。

BW为阈值二值化图像, B为结构元素, 这里B取半径为5的圆盘型结构元素。 (B) z表示点z对B的平移, B赞表示B的映像。图2 (b) 开运算结果如图4 (a) , 可以看出开运算后瞳孔区域以外的睫毛噪声被消除, 同时瞳孔区域边缘更光滑。

(3) 找到瞳孔初始半径。对开运算后瞳孔区域进行列扫描, 如图3 (b) 所示, 找到水平方向和垂直方向的两条最长弦, 其长度分别为L10和L20, 实际上这两条弦的长度是瞳孔的近似直径, 但由于瞳孔区域边界的不光滑性, 为保证精确性, 在L1和L2附近各再取n条弦, 其长度分别为:{L10, L11, ..., L1n}, {L20, L21, ..., L2n}。则取2 (n+1) 条弦长度的均值为瞳孔的初始直径Lp, 则瞳孔初始半径rp=Lp/2。

(4) 利用系列结构元素瞳孔区域进行形态学腐蚀。运用2m个圆盘形结构元素{B1, B2, …, Bm, …, B2m}对图2 (a) 所示瞳孔区域进行形态学腐蚀, 第j个结构元素Bj的半径rj满足:

随着圆盘型结构元素Bj的半径rj逐渐增大, 形态学腐蚀操作使得瞳孔区域越来越小, 直至消失。如图3 (c) 所示。设当结构元素Bj将瞳孔完全腐蚀, 而结构元素Bj-1腐蚀瞳孔区域后还存在白色像素点区域Aj-1, 则令瞳孔的粗略半径为Rp为结构结构元素Bj所对应的半径rj。定义瞳孔中心 (xp, yp) 为区域Aj-1质心。p (xj, yj) 为Aj-1内一点, Sj-1为区域Aj-1的面积, 对于图像来说即是区域Aj-1所包含的像素数。

利用所得参数对瞳孔粗略定位结果如图3 (d) 。

1.3 内边缘精定位

在虹膜内边缘粗定位基础上, 本文采用Daugman圆梯度方法进一步精确定位。由于瞳孔边缘较明显较周边暗, 所以文献[3]中圆梯度算子对内边缘精定位。

其中I (x, y) 代表虹膜图像在 (x, y) 处的灰度值。该算子以图像上每点 (x0, y0) 为圆心, 随着r的变化, 计算相邻两个圆周之间灰度均值之差, 当输出值达到最大时, 所对应的参数 (x0, y0, r) 就是要寻找的边界。式中*是卷积运算, 是标准差为σ的高斯算子, 起平滑滤波的作用。x0限制在 (xp-10, xp+10) , y0限制在 (yp-10, yp+10) , r限制在[rp-10, rp+10] (xp, yp, rp) 为瞳孔半径粗定位结果, 最后得到内边缘参数 (XP, YP, RP) 。

2 外边缘定位

虹膜外边缘过渡带通常较宽, 灰度变化也没有内边缘强, 另外, 虹膜本身丰富的纹理信息 (如神经圈) 也会影响虹膜外边缘定位, 直接应用以上线积分方法有时并不能准确定位虹膜外边缘。本文采用面积分代替以上线积分对虹膜外边缘定位。

由于虹膜内外边缘虽然不能认为是同心圆, 但存在耦合关系, 其中心距离之差小于d。

本文取d=15, 采用面积分方法定位虹膜外边缘, 参数搜索范围为, x0∈[xp-15, xp+15], y0∈[yp-15, yp+15], 由于虹膜外边缘半径r在一定范围内变化, 其经验值r∈[80, 130]。人眼在正常的凝视状态下, 上下眼睑会覆盖一部分虹膜, 所以积分区域一般限定在[-π/4, π/4]和[3π/4, 5π/4]的扇形区域内。最后得到外边缘参数为 (Xo, Yo, Ro) 。

3 试验结果与分析

实验选用中科院自动化所CASIA (version 1.0) 虹膜数据库, 包括108幅人眼图像, 每幅人眼图像有7个样本, 共756幅图像, 图像为8位灰度图, 分辨率为280×320像素。每幅人眼图像随机选取一个样本图像, 共108幅虹膜图像, 用本文算法﹑Daugman方法和Wildes的方法分别对108幅虹膜图像进行定位, 仿真工具为Matlab 7, 实验平台为Intel Core 2.0G CPU, 定位准确率和所耗费平均时间如表1所示。

从表1实验结果来看, 本文算法与经典虹膜定位算法精确度相差不大, 但定位速度有较大提高。同时利用本文算法分别对清晰、受睫毛干扰、受上下眼皮覆盖的3幅图像 (图4 (a) 、 (b) 、 (c) ) 进行处理, 从图4的定位效果看, 此算法定位速度快, 精度高, 而且对于不同质量的虹膜图像定位鲁棒性强。

4 结束语

实验结果表明, 此算法先利用阈值对人眼图像进行分割提取瞳孔, 经过形态学开运算去除噪声点后, 再对瞳孔区域应用一系列形态操作粗略确定瞳孔边缘;最后利用虹膜内外边缘中心的耦合性这一先验知识, 缩小了圆梯度算子搜索虹膜外边缘中心的范围。通过以上算法, 大大减少了圆梯度算子的搜索范围, 节省了定位时间。通过对CASIA (version 1.0) 100多幅虹膜图像的定位结果表明, 此定位算法快速、准确、鲁棒。不足之处在于, 用椭圆来检测内边缘更精确, 但是相比确定圆的3个参数, 确定椭圆需要5个参数, 计算复杂度增加, 定位速度是个值得考虑的问题, 如何找到实用性算法是下一步的工作。

摘要:为提高虹膜的定位速度, 提出一种粗定位与精定位相结合的虹膜快速定位算法。首先, 利用阈值对人眼图像进行分割提取瞳孔, 对二值化瞳孔区域进行形态学开运算去除瞳孔区域外睫毛等噪声点;然后选用一系列半径递增的结构元素对瞳孔区域进行形态学腐蚀操作, 根据腐蚀结果粗略定位虹膜内边缘;最后利用圆梯度算子对虹膜内外边缘进行精确定位。对CASIA (version 1.0) 虹膜数据库中100多幅虹膜图像进行定位实验, 文中算法平均耗费时间为1.22秒, 圆梯度算子耗时10.8秒, Hough变换方法耗时15.7秒。定位结果表明, 文中算法对不同质量的虹膜图像定位速度快, 精度高, 鲁棒性强。

形态学算法论文 第3篇

关键词:车牌识别,小波变换

1 引言

如何快速、准确地将牌照图像从车身图像中分割出来是车牌识别的前提和基础。而图像分割是将数字图像分成互不重叠的各个区域过程,除了一个称为背景的区域外,其他各个区域称为目标。然后,将待识别的目标从背景中分离出来。在车辆牌照图像分割中,待处理图像往往来自于停车场或高速公路端点处的CCD摄像头,由于车辆、车牌位置不尽相同和车牌自身的污损、变形,以及照明条件、气候等因素的影响,待处理图像往往含有较大的噪声。因此,在对车辆图像作分割以前,要先对它作预处理。针对牌照与车身背景的分割问题,首先,对车牌图像进行小波去噪,然后利用直方图均衡化和对比度增强,再利用数学形态学对去噪后的车牌图像进行阈值分割。实验结果表明:此方法能够从含有较强噪声的车辆图像中获取车牌图像。

2 图像的小波分解

小波变换是一种信号的时-频分析方法[2],它具有多分辨率分析(Multi-Resolution Analysis)的特点,而且在时域和频域都具有表征信号局部特征的能力。通过小波变换可以将图像分解成不同的子波带,其低频部分包含了原始图像的主要信息。

2.1 二维Mallat算法

对于一幅二维图像,有二维Mallat分解算法[2]:

对应的完全重构Mallat算法如下:

图1是图像正交小波分解的示意图,L表示低频,H表示高频,下标1,2表示一级或二级分解,分解的数据传递示意图如图2所示。为方便起见,记Ii 0=LLi,Ii1=HLi,Ii 2=LHi,Ii 3=HLi。

2.2 小波系数分析[2,5]

一个图像经小波分解后,可得到一系列不同频率的子图像。其中,高频子图像上大部分点的数值都接近零,越是高频越明显。通过对小波系数的统计分析可知,随着分解层数的增加,小波系数的范围越来越大,说明较低层的小波系数具有更重要的地位。

3 形态学图像处理技术

数学形态学[4]诞生于20世纪60年代,最初是从处理二值图像开始发展起来的。其基本思想是利用一个称作结构元素的“探针”收集图像的信息。当探针在图像中不断移动时,便可以考察图像各个部分之间的相互关系,从而了解图像的结构特征。将二值的图像处理技术进一步扩展就可以在灰值图像中运用。因此,二值图像的处理成为数学形态学的基础。形态学方法已经成功地应用于计算机文字识别、计算机显微图像分析、医学图像处理、工业检测、机器视觉等诸多方面[3,4]。

3.1 腐蚀与膨胀

数学形态学图像的处理中,最基本的手段就是腐蚀(erode)和膨胀(dilate)。

腐蚀表示用某种“探针”对一幅图像进行探测,以便找出在图像内部可以放下该基元的区域。事实上,所有数学形态学的运算都依赖于这一概念。

膨胀是腐蚀的对偶运算,可定义为对图像的补集进行的腐蚀运算。

集合A被集合B腐蚀表示为AθB,其定义如下:

其中A称为插入图像,B称为结构元素。AθB由将B平移x但仍包含在A内部的所有点x组成,如将B当作模板,那么AθB则由在平移模板过程中所有可以填入A内部的模板的原点所组成。

将结构元素B在图像A(Δ表示原点)中平移,至点(2、1)可以填入A,故点(2、1)在腐蚀后所得到图像的内部。依此类推,即可得到腐蚀后的图像。

膨胀的定义可以表示为:

3.2 开闭运算

开运算的实质就是先作腐蚀然后作膨胀,而闭运算作为其对偶运算,也就是先作膨胀再作腐蚀。

由于开闭运算具有平移不变性和单调递减性,以及非扩展性(扩展性)和等幂性,因此将开闭运算进行各种组合就可能对图像进行去噪和恢复等运算,并且有着良好的表现。

4 车牌图像分割算法

4.1 算法的依据和基本思想

由2可知:通过小波变换将图像f(x,y)分解成不同的子波带,逼近图像Sj(低频部分)中包含了原始图像的主要信息。对于一幅含有噪声的车牌图像来说,图像的轮廓主要体现在低频部分,而噪声成分则包含在高频部分(细节部分)。因此,可以通过对低频分解系数进行增强处理,对高频分解系数进行衰减处理即可达到降噪和增强图像的效果。实际操作中还可以采取直方图增强、对比度增强等措施进一步提高增强效果[6]。

基于小波变换和形态学的车牌图像分割算法的基本思想是:利用小波变换对原始车牌图像进行降噪、增强;然后利用形态学运算对图像进行分割,最终获得感兴趣的部分。一个受到高斯噪声干扰的车牌图像信号的基本模型如下式所示:

其中,e(n)为高斯噪声。小波分解的目的就是要尽可能地减少噪声部分的值,以恢复信号f。

4.2 基本步骤

基于小波变换和形态学的图像分割的实现步骤为:

(1)选择小波和小波分解的层次,对信号s进行N层小波分解。

(2)对第一到第N层的高频系数进行自适应软阈值处理。

(3)依据(1-2)式施行小波反变换,获得降噪并增强的图像信号。

(4)对增强后的车牌图像进行阈值分割[4,5],以消除部分冗余信息。

(5)选用适当的结构元素,对分割后的图像进行腐蚀运算。

(6)选用适当的结构元素,对腐蚀后的图像进行膨胀运算。

4.3 实验及分析

实验中采用数字照相机拍摄的汽车牌照图像,用上述算法实现车牌图像的分割。

实验软件为Matlab 7.0,计算机的CPU为PENTIUM 4,1。70GHZ.

实验步骤(1)中选择“Sym4”小波,小波分解的层次为2。“Sym4”小波属于“SymletsA”小波系,具有近似对称性和较好的正则性。因而常被用于二维信号分析。

实验步骤(2)、(4)中阈值的选择使用MATLAB的thSelect(x,TPTR)函数。该函数的参数x是待消噪信号,参数TPTR确定阈值选择标准。本实验中,参数TPTR取值为“risrsure”,即基于史坦的无偏似然估计原理的自适应阈值选择。

在步骤(3)中利用直方图对图像信号进行增强,使用MATLAB的thisteq(x,hgrqm)函数。这样,增强后的图像的直方图与hgrqm近似匹配,具有length(hgrqm)个条。

在步骤(4)(5)中结构元素的选取是非常重要的。结构元素的形状和大小将对腐蚀和膨胀运算产生决定性的影响。

膨胀具有“扩大”图像的效果;腐蚀具有“收缩”图像的效果。不同的结构元素对图像作腐蚀或膨胀运算所产生的效果是不同的[3]。在文中由于所研究的提取对象以数字为主,因此实验中采用矩形的结构元素。膨胀运算采用(4,2)结构元素,腐蚀运算采用(3,1)结构元素。

实验主要结果示于图1-图4。其中图1为采集的含噪声原始图像,图2为小波消噪并增强后的图像,图3为对阈值分割后的车牌图像用(3,1)结构元素进行腐蚀后效果,图4为对腐蚀后的车牌图像用(4,2)结构元素进行膨胀运算后的效果,即分割效果。

5 结语

针对噪声环境下获取的车辆牌照图像的分割问题,提出了基于小波-形态学方法的车辆牌照阈值分割算法。首先,对车牌图像进行小波去噪,然后利用数学形态学对去噪后的车牌图像进行阈值分割。实验结果表明:此方法能够从含有较强噪声的车辆图像中获取车牌图像,且具有相对于图像的平移、尺度变化和旋转的低敏感性。

参考文献

[1]刘贵忠,邸双亮,著.小波分析及其应用.西安:西安电子科技大学出版社,1992.

[2]杨福生.小波变换的工程分析与应用.北京:科学出版社,2000.

[3]崔屹编著.图像分析与处理——数学形态学方法及应用.科学出版社,2000.

[4]王耀明,严炜,董建萍.图像的数学形态学阈值分割[J].上海师范大学学报,2001,30(1):48-51.

[5]胡昌华,等.基于MATLAB的系统分析与设计-小波分析.西安电子科技大学出版社.

基于形态学梯度差的车牌定位算法 第4篇

车牌照自动识别技术是智能交通系统(ITS)中的重要研究课题,完整的车牌识别系统分为3部分:车牌定位、字符分割和字符识别[1]。其中车牌定位和字符分割是核心技术,直接影响系统的识别率和速度。目前应用于车牌识别的技术方法很多,如颜色分类、神经网络、矢量量化、模板匹配、hough变换[2]、灰度突变等。但是由于存在各种干扰,上述的技术方法或多或少存在缺陷,单用一种方法远远无法满足复杂的现实情况的要求。所以建议在ITS中识别车牌时,罗列出多种算法的结果,用户选取最符合要求的一个再转向字符分割。本文就利用最大梯度差检测可能的文字图像行,经合并后形成文字图像区域的算法进行讨论。以达到分割的目的,为车牌字符的定位、识别提出一个算法分支。

1 算法思路

如图1所示,找到图1的车牌的大概区域,并输出该区域的左上角和右下角的坐标,可以理解成如图所示在图像区域找到车牌区域的左右边界和横上界、横下界。这必然要根据车牌的特征来定位,车牌的特征很多,比如颜色、大小、文字等等,本文根据文字图像区域内文字和背景的强烈对比度,而且文字笔划具有正负梯度交替变化的特征,利用最大梯度差检测可能的行,检测文字图像行经合并后形成文字图像区域,达到分割的目的。

2图像的梯度计算

2.1梯度图示

对于拍摄的灰度图像,计算其相应的梯度矩阵。由于文字图像与背景的对比度强烈,其梯度值较大。图3是预处理后的图像,图4是其某—行文字图像像素的梯度变化曲线图。如图4所示,文字图像区域的梯度绝对值明显大于非文字的图像区域。

2.2梯度差

梯度对应一阶导数,对一个连续图像函数F(X,Y),它在位置(X,Y)的梯度可以表示为一个矢量[3](其中Gx和Gy分别为沿X方向和Y方向的梯度):

ΔF(X,Y)=(GxGy)Τ=[fXfY]Τ

这个矢量的幅度(也常直接简称为梯度)为

ΔF=max(ΔF)=(G2x+G2y)1/2

从背景进入文字笔划处的梯度值Gin,与从笔划进入背景的梯度值Gout符号相反,梯度的绝对值接近相等(见图4)。

在文字笔划的附近选取某一区域,求得区域内的最大梯度值Gmax和最小梯度值Gmin”则这区域内的最大梯度差MGD(Maximum Gradient Difference),即为

Μgd=Gmax-Gmin

设区域大小为M×1。梯度曲线相应的最大梯度差曲线如图5所示。对于I×J的图像,可用D(I,J)矩阵来存贮每个点的梯度差[4]。

3可能文字行检测

3.1设置阈值

如图6为MGD大于40的梯度图,图7为MGD大于140的梯度图,设置阈值T,MGD大于阈值的为可能文字行。

由于噪声干扰和其它图像文字的存在可能性,非文字图像区也可能存在个别MGD大于阈值的行,所以要用大于阈值N的次数来确定文字行[5],设图像大小为(X,Y),用D(J,I)统计每个(J,I)点大于阈值的次数,计算公式如下:

D(J,Ι)={D(J,Ι)+1ΜGD(J,Ι)>ΤD(J,Ι)ΜGD(J,Ι)ΤJ=1,2,,Y;Ι=1,2,,X

次数阈值N的值的设定,经多次实验,大致在40~60之间。

3.2横向定位

找到梯度差大于阈值个数最多的一行,如图5所示的梯度差大于阈值个数最多的行,求解方法为:

maxY=max(Gy)

(1)从图像中梯度差大于阈值个数最多的行max_y开始, 逐行递减,直到D小于个数阈值N的行,记录在此行,定为Y1。

(2)从图像中梯度差大于阈值个数最多的行max Y开始, 逐行递增直到D小于个数阈值N,记录下此行,定为Y2。分割Y1到Y2之间的图像,实验结果如图10。

3.3纵向定位

如图9所示,给车牌区域的纵向定位,相对要简单些,因为此时图像区域大为减少,背景相对简单,当然梯度的特征也相对减弱,高梯度的变化次数减少了很多,次数阈值N定值相应减少,范围在8-20之间。

如图9所示,X1从0始逐步加1,(为减少运算量,也可加其它小于5的常数),当X1列和X1+1列的梯度差同时大于次数阈值NX1小于X时,记录下来,此时可求得车牌区域的左边界X1。同理,X2从X开始逐步减1,(为减少运算量,也可减其它小于5的常数),当X2列和X2-1列的梯度差同时大于次数阈值nX2大于X1时,记录下来,此时X2就是车牌区域的右边界。读取(X1,Y1)到(X2,Y2)区间的图像就是车牌号区域,实验结果如图11,通过X1,X2,Y1,Y2各减一个常数,可以去除铆钉和边界线的影响,如图12所示。

此时,车牌区域完整分割出来了,就可用进行下一步字符分割和字符识别。字符分割和字符识别方法请参见其它相关文献资料。

4小结

梯度分析方法常用于车辆牌照定位, 该方法充分利用文字图像区域内文字和背景的强烈对比度,和文字笔划具有正负梯度交替变化的特征,利用最大梯度差检测可能的行,检测文字图像行经合并后形成文字图像区域,达到分割的目的。在很大程度上解决了因图像模糊、车牌本身倾斜和扭曲等给牌照定位带来的问题, 具有较好的适应性, 但它同样存在阈值参数的选取问题, 若选取不当, 将影响车牌的定位精度。通过对180 幅图像分辨率为360×240 大小的车牌图像的测试, 其中170幅图像可定位出车牌, 定位率达到94%, 这充分说明了本方法的有效性。特别是其中有15幅图像, 用普通的纹理分析方法定位精度较差, 不能进行车牌识别的后续处理, 而通过利用算法可达到自校正效果,这些图像的车牌定位精度明显得到提高。

参考文献

[1]Charl C,Charl B,David W.PC based number plate recognitionsys-tem.Proc IEEE International Symposium on IndustrialElectronics,Pretoria,1998:605—610

[2]梁栋,高隽,付启众,等.基于形状特性和反Hough变换的车牌区域定位与重建.计算机应用,2002;22(5):43—47

[3]卢雅琴,邬凌超.基于数学形态学的车牌定位方法.计算机工程,2005;31(3):224—225

[4]潘石柱,殳伟群,王令群.基于Adaboost的汽车牌照快速定位.计算机工程,2006;32(12):187—188,214

形态学算法论文 第5篇

临床上许多场合需要对心电图进行自动分析,最典型的情况是动态心电图的分析和诊断。心电自动分析中的首要问题是心电信号中R波的准确识别[1]。对于不存在过多干扰的临床常规心电图,R波的识别是相对容易的。因R波的峰值较大,可用幅度检测法;由于R波变化通常比较尖锐,加之心律大多处于50~100范围,差分和R-R间期分析等时域阈值分析都可较好地完成R波的检测[2,3],但检测准确度还需进一步提高。与常规心电图相比,动态心电信号更容易受到外界多种因素的干扰,信号中存在大量的运动伪迹、工频干扰、基线漂移和肌电噪声,而这些干扰通常还无法完全避免,加之不规则病态心电图的存在就更增加了R波实时检测的难度。因此,探索一种可靠性高、运算速度快的心电信号R波检测算法是有重要价值的。基于此,已有许多信号处理方法应用于复杂情况下的R波检测,比如小波变换[4]、希尔伯特变换[5]、经验模式分解[6,7]等,这些方法由于需要对信号进行复杂变换,常常不能达到实时性处理方面的要求。本文提出一种基于数学形态学的运算高效简单、准确率高的心电图R波检测新方法。

1 方 法

1.1 数学形态学的概念

数学形态学最初是为了分析图像纹理而提出的建立在严格数学理论基础之上的学科,通过设计一整套的概念和算法,来描述图像的基本特征。随后数学形态学也成为多维或一维信号分析的工具。Chu H曾将数学形态学用于心电信号的去噪[8],Trahanias PE则将其应用于心电信号QRS波群的提取[9]。

数学形态学中最基本的概念是结构元素。结构元素具有如线段、圆等图形所给出的某种形状,当结构元素在信号图形中移动时,信号的形状信息可以由作用在信号上的结构元素提取出来。采用不同的结构元素分析信号图形会得出不同的结果。

数学形态学中最基本的2个形态学运算分别是膨胀运算与腐蚀运算[10]。在处理一维的信号时,膨胀运算与腐蚀运算可用来设计信号的形态学滤波器。

设一维数字信号序列为A={0,1,2,…,N-1};结构元素为B={0,1,2,…,M-1},且有N>M,则信号A关于结构元素B的形态膨胀运算定义为:

(AB)(m)=maxn=m-Μ+1,,m{A(n)+B(m-n)}(1)

式中:m=M-1,M,…,N-1。

信号A关于结构元素B的形态腐蚀运算定义为:

(AΘB)(m)=minn=0,1,2,,Μ-1{A(m+n)-B(n)}(2)

式中:m=0,1,2,…,N-M

另外,膨胀和腐蚀运算还可组成开(opening,·)、闭(closing,·)、击中、薄化、厚化等几种运算方式。其中信号A关于结构元素B的开运算“·”和闭运算“·”分别定义为:

A[ΚX(][ΚX)]B=(AΘB)BAB=(AB)ΘB(3)

可以看出,形态学运算实际上仅包括加、减以及比较等简单运算,因此运算速度非常快。

1.2 基于数学形态学的R波检测原理

开、闭运算能以不同的方式平滑信号。形态学开运算的结果削平信号的波峰(正脉冲),闭运算的结果填充信号的波谷(负脉冲)[11]。另外,从原始输入信号A中分别减去结构元素B对信号开运算或闭运算的差,就可分别得到信号的波峰信息和波谷信息。心电信号R波的形态学检测算法就是基于峰、谷提取的思想提出来的。波峰提取算子PE和波谷提取算子VE可分别定义为:

ΡE(A)=A-A[ΚX(][ΚX)]BVE(A)=A-AB(4)

对信号进行形态学运算提取波峰或波谷的宽度取决于所选择的直线型结构元素B的宽度M。针对ECG信号中QRS波群的具体特点,选取适当大小的M,利用算子PE和VE对ECG信号进行形态学运算产生的波形中,心电信号中QRS波群的波峰和波谷将被突出出来,通过检测峰谷位置,就可以准确地定位出R波位置。

1.3 检测算法

首先将原始ECG信号经过PE算子运算,生成一个新的信号波形用于突出心电信号中的R波,同时该运算有助于抑制低频噪声、基线漂移等干扰,而后用基于自适应阈值的极大值搜索法检测R波。具体算法步骤如下:

(1) 对原始ECG信号A进行数学形态学PE算子运算得到信号y,设数字信号A的采样频率为fs;

(2) 求出y信号中前1.5fs个点的最大值max(1)。设以0.8max(1)作为阈值,用极大值法检测第1个R波的位置index(1)。若index(1)后0.05fs个点存在大于y(index(1))的值,则用此值的序列号替换index(1)。用同样的方法也可求出第2个R波的位置index(2);

(3) 求出前2个R波的位置index(i-2)与index(i-1)之差,并用其估计下一个R波的间期,设上一个R波的峰值为y(index(i-1)),若index(i-1)>index(i-2)/0.8成立,则用y(index(i-2))*0.7作为阈值,否则用y(index(i-1))*0.7作为阈值。从start=index(i-1)+0.28(index(i-1)-index(i-2))中检测到的极大值作为下一个R波的位置index(i);

(4) 若从index(i)到index(i)+0.05fs存在大于y(index(1))的值,则用此值的序列号替换index(i)。

(5) 重复步骤(3)、步骤(4)直到检测完序列中的所有点。

2 结 果

为了对上述算法的有效性进行检验,选取MIT/BIH标准心电心率变异数据库中的心电数据作为样本进行测试。本研究分别对带基线漂移的心电信号和严重病态心率变异的心电信号进行R波识别检测。设基线漂移数学模型为:

A(n)=A(n)+0.5cos(0.0017nπ)(5)

式中:A(n)为原始心电信号。图1给出了带有基线漂移心电信号、经PE算子运算后和最终R波检测的示意图。从图中可以清楚看出,PE运算可以有效克服基线漂移,提高R波检测的准确性和顽健性。对于有严重病态心率变异的心电信号,从图2可以看出,经过PE运算后,R波明显突出,对检测带来了方便。

3 讨 论

本文验证了一种基于数学形态学的心电信号R波检测算法。由于数学形态学方法仅涉及到简单的加减和最大、最小计算,算法简单,运算速度很快。另外,该算法结合本文提出的基于自适应波峰阈值和R间期阈值的极大值检测法,经过MIT/BIH实际数据验证,对心电信号的R波检测快速有效。

4 结 语

结构元素形状和大小的选取直接影响对信号的处理效果。结构元素的形状一般有直线、三角形和曲线等形状,而直线型结构元素在一维信号处理中应用较多,处理效果也比较理想。另外,直线型结构元素会使得信号处理的运算简单,且结构元素高度对信号处理结果没有明显影响[11],应用较多。因此,在本研究中选择高度为零的直线型结构元素是取得良好检测效果的一个重要原因。

开闭运算可以组合为不同的信号处理流程:开闭运算、闭开运算、并行开闭等。不同的流程对信号处理的结果是不同的[12]。Chu等使用两次并行开闭组合分别进行噪声处理和基线校正,运算量较大[8]。并行开闭组合有利于对信号去高频噪声,然后通过提取信号波峰谷来进行QRS波检测,这种方法对基线漂移等低频干扰以及P波、T波处理效果较好,但在频率稍高的噪声存在时对信号的波峰谷提取则会造成检测准确率降低[9]。吸取上述数学形态学心电信号处理方法的经验,采取PE和VE算子提取心电图的波峰和波谷,研究结果表明,这样的算法是可行的。

本研究涉及的心电信号还是有限的,对存在肌电干扰、工频干扰等噪声的心电信号进行进一步的研究,进一步验证算法的有效性,仍然是必要的。

摘要:为了解决心电信号中R波的检测问题,研究验证一种结合自适应阈值的极大值搜索与数学形态学的R波检测算法。数学形态学算法是基于信号局部特征的,可以有效突出信号的峰谷点。考虑了心电信号特点的自适应阈值极大值搜索算法,可以敏感检测R波的准确位置。通过对MIT-BIH心率变异数据库中多组心电数据的仿真验证研究,实验结果表明,两种分析方法的结合可以有效消除心电信号的基线漂移或异常病态心率对检测的影响,能有效实现心电信号中R波的实时检测,预期本算法在心电信号的自动分析中将会扮演更为重要的角色。

关键词:心电图,R波,数学形态学,自适应阈值

参考文献

[1]KOHLER B U,HENNIG C,ORGLMEISTER R.Theprinciples of software QRS detection[J].IEEE Engineeringin Medicine and Biology Magazine,2002,2l(1):42-57.

[2]朱凌云,吴宝明,曹长修.一种实时的动态心电图R波检测算法[J].中国医疗器械杂志,2004,28(2):89-101.

[3]王恒迪,朱坚民,梁丽,等.一种简单准备的R波检测算法[J].生物医学工程学杂志,2007,24(5):1019-1022.

[4]田学隆,闫春红,俞亚青,等.基于小波变换的R波检测算法[J].生物医学工程学杂志,2006,23(2):257-261.

[5]季虎,毛玲,孙即祥.一种基于Hilbert变换的R波检测算法[J].信号处理,2007,23(3):444-448.

[6]BALOCCHI R,MENICUCCI D,SANTARCANGELO E,et a1.Deriving the respiratory sinus arrhythmia from theheartbeat time series using empirical mode decomposition[J].Chaos,Solitons and Fractals,2004,20(1):171-177.

[7]张道明,郝继飞,谭国俊.基于经验模式分解的R波识别及噪声消除[J].计算机工程与设计,2007,28(1):217-221.

[8]CHU H,DELP E J.Impulsive noise suppression and back-ground normalization of ECG signals using morphologicaloperators[J].IEEE Trans.on BME,1989,36(2):648-655.

[9]TRAHANIAS P E.An approach to QRS complexes detec-tion using mathematical morphology[J].IEEE Trans.onBME,1993,40(2):201-208.

[10]崔屹.图像处理与分析:数学形态学方法及应用[M].北京:科学出版社,2002.

[11]高艳,胡阳.基于数学形态学方法的心电图波形分离技术[J].生物医学工程学杂志,2001,18(1):55-59.

形态学算法论文 第6篇

车牌识别技术LPR(License plate recognition)的研究始于20世纪80年代[1],它的任务是自动采集交通图像,分离出车牌区域,并完成字符的分割与提取。车牌定位、字符分割、字符识别是LPR的三个关键技术,其中车牌区域快速有效的定位,是完成字符分割和识别的基础,定位准确率在整个识别流程中起到至关重要的作用。目前车牌定位的算法主要有基于灰度图的算法[2~4]和基于颜色空间特性的算法[5,6],前者具有时间复杂度小的优点,但遇到光线较暗、光照不均等情况,识别准确率会有所下降;后者利用了颜色通道的特性,受光照等外部环境影响较小,尤其与形态学、小波等数学方法相结合时定位效果较好。

考虑到Lab颜色空间蓝、黄两色分离的特性,本文提出了一种Lab颜色空间下的车牌定位方法。Lab空间b通道存储的是蓝、黄两色的颜色信息,一个像素点的颜色越蓝,在b通道的数值就越小,反之颜色越黄数值越大,这种特性使得选取一个合适的阈值来分割出图像中的蓝、黄车牌能够得以实现。经过大量实验分析,选取一个经验阈值来判断图像中的车牌颜色,对于蓝色和黄色车牌分别限定一个阈值的选取范围,通过迭代确定出最优分割阈值,得到二值图像。不同的原始图像经过二值化和形态学运算后,得到数量不一的车牌候选区域,此时再根据车牌自身特性进行车牌区域的筛选,如面积、车牌长宽比、水平灰度跳变次数等,最终得到唯一的车牌区域。图1为该方法的技术路线。

1 b通道分割阈值的确定

摄像机采集到的图像大多是RGB颜色空间的,故首先应将车牌图像由RGB颜色空间转换到Lab颜色空间[7]。

我国的标准车牌由蓝底白字、黄底黑字、白底黑字和黑底白字4种颜色对组成,其中又以蓝底白字的最多,其次为黄底黑字。在Lab颜色空间中,由于蓝色和黄色分居b分量的两头,因此根据b分量的值可以比较容易地判断出是蓝色还是黄色。利用这一特性,对b通道图像选取合适的阈值进行二值化,能够有效的分离出黄色和蓝色车牌区域。

b通道矩阵的数值范围是-128~127,为了在matlab中正常显示图像,需将矩阵中的数据映射到0~255的范围区间。原始图像和转换后的Lab空间b通道图像分别如图2和图3所示。

对于含有蓝色车牌的图像(以下简称蓝牌图像),车牌区域的像素点蓝色饱和度相对较高,在b通道的图像中,车牌区域显示为一个较暗的区域,且与周围像素的对比度较大。而对于含有黄色车牌的图像(以下简称黄牌图像),在b通道图像中车牌区域显示为一个较亮的区域。据此,分别对蓝牌图像和黄牌图像选取一个适当的阈值th B和th Y进行二值化,即可把车牌区域较好的分割出来。

由于蓝、黄车牌图像具有不同的统计特性,th B和th Y不是像th B=255-th Y这样一种简单的对应关系,应首先将蓝牌图像和黄牌图像区分开来。据此,本文设计了一种区分蓝、黄车牌图像的算法:以一个初始判定阈值th1=50对b通道图像进行二值化,统计二值化图像中黑色像素点的比例,若比例超过了门限值η=0.05,判定此图像为黄牌图像,反之若比例小于门限值η,则判定为蓝牌图像。

此外,为了更好的适应光照、背景条件等环境变化,提高定位精度,本文对分割蓝色车牌阈值th B和分割黄色车牌阈值th Y分别设定了一个选取范围,通过阈值迭代的方法来选定最优阈值。经大量实验分析,将th B的范围定为50~80,th Y的范围定为110~140。

黄牌图像二值化后车牌候选区域为白色,而蓝牌图像二值化后车牌候选区域为黑色,故还要对后者做一次反向操作,以使车牌候选区域统一为白色,背景统一为黑色,从而有利于后续算法的简化。图3两幅图像的二值化及相应的反向操作结果如图4所示。

2 形态学运算

数学形态学的基本思想是用具有一定形态的结构元素去度量和提取图像中的对应形状,以达到对图像进行分析和识别的目的[8],其基本运算包括腐蚀、膨胀、开启和闭合四种。设g为结构元素,f为输入图像,对二值图像其数学描述为:

其中开运算可以消除细小物体,闭运算可以填充物体内细小空洞。

经试验分析,本文针对蓝牌图像得到的二值图像进行的形态学运算步骤为:首先用半径为6的disk(圆盘形)结构元做闭合运算,以消除细小物体和不同物体间的细小连接线;再用半径为2的disk结构元做开启运算,以填充车牌区域小的孔洞或断开的区域,使之连成为一个整体;最后考虑到实验中经常出现的车牌区域横向变短的情况,用大小[2,15]的矩形结构元做一次膨胀运算。针对黄牌图像得到的二值图像进行的形态学运算步骤为:用半径为3的disk结构元依次做一次开启和闭合运算。图4的形态学运算结果如图5所示。

3 车牌区域筛选

经形态学运算后,得到若干个车牌候选区域,为了得到唯一且正确的车牌区域,需要根据车牌特性进行进一步的筛选。我国汽车牌照具有一些相对固定的几何、颜色特征,如车牌长宽比为固定值、字符和背景对比度较大、车牌区域灰度跳变次数多等。为使算法具有较高的筛选准确率,采取面积大小、长宽比及灰度跳变次数来综合判别车牌区域。

面积大小是指各连通域内白色像素点的个数,面积过小或过大的连通域都可排除出候选区域。根据摄像机与采集点距离的不同,面积筛选的范围也有所不同,应根据具体环境选择合适的面积筛选范围。本文选取的范围为1500~4000,大小不在其间的连通域直接被排除。

我国车牌的长宽比相对固定,一般在3~4之间[2],考虑到形态学运算过程中连通域的大小会发生一定变化,故限定筛选范围为2.5~4.5,长宽比不在其间的被排除。

此外,根据车牌字符和背景对比度较大的特性,对经过前两步筛选后剩余的每个连通域依次进行如下操作:1)在原彩色图中剪切出对应区域并灰度化;2)对灰度图进行水平梯度运算;3)选取图像的中间一行检测灰度跳变次数,若大于14则判定为车牌区域,反之排除该连通域。

图5的车牌区域筛选结果如图6所示,最终车牌定位结果如图7所示。

4 实验结果与分析

算法的实验平台为matlab7.0,选取在路边同一地点随机拍摄的89幅车牌图像进行测试(测试前将车牌图像大小归一化为300*400),定位结果如表1所示。

蓝色车牌图像有4幅未定位,其中有2幅是车、牌同色,且车牌没有金属边框,这种情况下在b通道图像中车牌区域和车身连为一体,使得二值化过后车牌区域与周围背景合成一个大的连通域,这样在后续的面积筛选步骤中该区域就被筛选掉了,无法实现准确定位。另有两幅图像未成功定位的原因是车牌区域污染严重,粘着大量泥土导致车牌颜色饱和度降低,且字符与车牌背景的对比度减小,这使得对b通道二值化的过程中在整个阈值选取范围内无法找到最优阈值,并且在灰度跳变筛选车牌区域这一步,有可能使得统计得到的灰度跳变次数不满足要求,从而定位失败。

黄色车牌有2幅未定位,经分析,其原因可认为是照相机曝光参数(光圈、感光度ISO)与拍摄其他图像时的曝光参数不一致,致使无法准确判别是否为黄色车牌图像。显然,针对不同的天气、光照和道路环境,判别蓝、黄车牌的门限值也不尽相同,需根据具体条件进行调整。

5 结论

L a b颜色空间的b通道图像能够很好的区分蓝、黄两种颜色,我国大部分车牌为蓝底白字和黄底黑字,故基于Lab空间的车牌定位算法具有较高的实用性。

该算法优点主要有:算法的实现基于Lab空间的b通道颜色特性,因此受光照条件影响较小;L通道和a通道的数据被忽略,故算法的执行时间较短,大体上与基于灰度图的算法相同;与灰度图二值化得到的图像相比,b通道二值化得到的图像干扰因素较少,大部分图像经面积筛选和长宽比筛选后,即可定位到车牌区域。

当然,算法对于车身、车牌同色,并且车牌没有明显金属边框的情况,在二值化过程中车牌区域与背景容易连接在一起,从而无法实现准确的定位;此外,在不同的光照、道路环境条件下,对于判别蓝、黄车牌的阈值th1的选取并不相同,只能对具体环境下采集到的车牌图像进行统计后得到。车、牌同色的定位和自适应阈值将是进一步研究的重点。

摘要:车牌定位是车牌识别系统LPR的关键技术之一。根据Lab颜色空间b通道特性,本文提出了一种Lab空间下的车牌定位方法。该方法首先针对b通道图像设计了一种判断车牌颜色的算法;之后对不同颜色车牌选取不同的阈值范围进行迭代运算,得到最优分割阈值,并对二值化图像进行形态学处理;最后选取连通域的面积大小、长宽比及灰度跳变次数来筛选出真实车牌区域。实验表明,该方法准确率较高,耗时短,受光照、背景环境影响较小。

关键词:车牌定位,Lab空间,数学形态学

参考文献

[1]李孟歆,吴成东.基于分级网络的车牌字符识别算法[J].计算机应用研究,2009,26(5):1703-1705.

[2]陈虹,陈蕾,蒋毅.基于边缘检测及数学形态学的快速汽车车牌定位[J].交通与运输,2008(12):78-81.

[3]邹晔.基于纹理分析和梯度特征的车牌定位算法[J].科技广场,2009(5):109-111.

[4]韩丽萍,药春晖,张文格,等.基于小波变换与形态学的车牌定位方法[J].测试技术学报,2006,20(1):46-49.

[5]王学伟,薛迎卫.XYZ空间与小波能量特征融合的车牌定位[J].北京化工大学学报(自然科学版),2010,37(1):122-125.

[6]王枚,王国宏,潘国华.基于HSV空间的车牌定位方法[J].烟台大学学报(自然科学与工程版),2007,20(1):48-52.

[7]Lianghai Jin,Dehua Li.A switching vector median filterbased on the CIELAB color space for color imagerestoration[J].Signal Processing,2007,87:1345-1354.

形态学算法论文 第7篇

随着机器视觉技术的快速发展, 织物瑕疵检测在纺织品质量控制方面显得尤为重要。传统的检测方法, 主要靠人工肉眼完成, 生产效率低下且成本较高;基于机器视觉的自动检测系统不仅节约了人力资源, 更提高了生产效率。近十几年来, 自动布匹瑕疵检测已经成为国内外学者的研究热点[1]。由于织物瑕疵具有种类多, 类间相似性, 类内多样性等特点, 使得瑕疵检测也成为研究者面临的一个难题。

目前大多数瑕疵检测算法是基于频谱分析和统计的方法, 而且多种方法的融合结果会优于单个方法。基于频谱分析的瑕疵检测方法, 主要有基于Fourier变换, Gabor变换和小波变换的方法。基于Fourier的方法[2]是对图像进行全局变换, 因而不能准确定位瑕疵;基于Gabor的算法[3]检测性能比较好, 然而需要对多通道多方向进行二维滤波以及融合, 大大增加了计算复杂度;基于小波变换[4]的算法, 具有良好的局部时频分析特征和多尺度分析特性, 是信号局部奇异性分析的有效工具, 已经被广泛应用于瑕疵检测。单尺度小波变换, 不能在增强瑕疵的同时有效滤除噪声;Sadler和Swami[5]分析了小波多尺度积的边缘检测性能, 指出其有效地利用了相邻尺度下小波系数间的联系, 能在有效抑制噪声的同时放大边缘特征。已有文献将其用于图像去噪[6], 边缘检测[7], 并且得到令人满意的结果。然而小波变换法对于线瑕疵有较好的检测结果, 但不能有效提取块状瑕疵的形状信息。基于统计的方法, 主要分为灰度统计和数学形态学方法, 可以有效提取瑕疵形状特征。灰度统计法[8], 阈值选择比较困难;数学形态学法[9,10]可以提取目标图像的形状特征, 并且有效滤除噪声, 但是对于线瑕疵检测效果不佳。

基于此, 本文提出基于小波多尺度积和数学形态学的瑕疵检测算法。小波变换将信号分解成不同尺度上的低频近似子图和高频子图。低频子图是原图的近似图像, 通过数学形态学运算, 可以很好的获取瑕疵形状特征;高频子图, 反映图像的边缘线性特征, 通过多尺度积变换, 可以有效滤除噪声同时得到线性特征, 最后融合二者结果。实验结果表明, 该算法对线状和块状瑕疵都有较好的检测效果。

1 基本原理

1.1 小波变换多尺度积原理

二进小波变换未进行下采样, 使得其具有平移不变性。二进小波变换还具有完备性和稳定性, 本文采用二进小波变换。设f (x, y) 为输入图像, ϕ (x, y) 为尺度函数, 二维小波函数ψ (x, y) 为

ϕ (x, y) 为满足∫∞-∞ϕ (x, y) dxdy=1, 并能快速收敛的可微平滑函数。ϕ (x, y) 随尺度2j的变化可以表示为

在尺度2j下的小波函数为

令在尺度2j的低频近似分量为

在x, y方向的高频细节分量为

由式 (5) 可知, 输入图像f (x, y) 关于ψ (x, y) 的小波变换正比于f*ϕ (x, y) 的一阶导数, 是对输入图像的平滑, 在滤除部分噪声的同时较好的保存图像的突变区域, 可以用于布匹瑕疵检测。

文献[11]给出一个带噪声信号多尺度积的例子, 表明小波系数在单尺度下被淹没在噪声中, 在多尺度积中却得到增强, 很好的抑制了噪声。因此, 本文采用小波变换多尺度积, 将变换后相邻尺度下的小波系数相乘, 可以抑制噪声的同时增强瑕疵。对于二维图像, 多尺度积有x, y方向两个分量, 在相邻尺度上尺度积函数表示为

对于瑕疵区域, 相邻尺度的小波系数符号相同, 若是噪声影响尺度积就会为负;随着尺度增加, 瑕疵区域的尺度积系数远大于噪声的尺度积系数, 阈值选取容易。一般情况下, 进行3层或者4层小波变换即可。

小波变换虽然具有良好的局部时频分析和多尺度分析特性, 但其只具有有限的方向信息不能最优表示二维图像的奇异性。方向的局限性使得基于小波多尺度积的瑕疵检测, 只对线状瑕疵有较好的检测结果, 瑕疵图像对比度不强时, 基于小波变换的方法, 会丢失瑕疵部分信息。因此需要结合一种能提取瑕疵几何形状特征的方法使得检测结果更可靠。数学形态学是一种非线性滤波方法, 在描述信号的几何特征上有独特的优势。基于小波多尺度积和数学形态学的算法, 可以增强算法的鲁棒性。

1.2 数学形态学原理

数学形态学建立在集合论的基础上, 可以提取图像中感兴趣的区域, 提取其几何特征。数学形态学算子是由基本形态学算子通过组合运算生成的, 基本运算有膨胀和腐蚀运算, 本文采用灰度形态学, 以下给出这两种基本运算的定义。

其中:f (x, y) 为输入图像, b为结构元素, Df和bD分别为f (x, y) 和b的定义域。图像腐蚀可以消除图像的边界点;图像膨胀用于合并图像周围的背景点。这两种算子的组合可用于特征提取[12], 图像边缘检测[13,14]等。基本形态学运算是用结构元素b在图像范围内平移, 并配合基本的集合运算来实现。大尺度结构元素可以有效滤除噪声, 小尺度结构元素可以有效地检测图像细节变化, 本文折中选取5×5的结构元素。

2 基于小波多尺度积和数学形态学的瑕疵检测算法实现

小波变换多尺度积的方法能很好的抑制噪声, 对线状瑕疵有较好的检测结果;数学形态学有良好的提取图像形状特性。二者结合可以实现优势互补, 对线状和块状瑕疵都有比较好的检测结果。算法框图如图1所示, 我们对输入图像f (x, y) 进行二进小波变换, 对变换后的低频近似子图像采用灰度形态学处理;对x, y方向的高频子图进行多尺度积运算。最后对两种方法得到的结果进行融合。

低频子图Ljf经过小波变换后, 在滤除部分噪声的同时保留了输入图像的大部分信息, 对其通过灰度形态学算子滤波后, 可以比较准确的提取出块状瑕疵的形状信息。通过对Ljf进行膨胀和腐蚀运算, 然后对膨胀和腐蚀结果做差, 得到瑕疵区域的几何形状信息, 最后对差值图像做膨胀运算, 可以比较准确的检测出块状瑕疵。最后通过Otsu[15]分割法进行阈值分割得到二值图像A。本文采用的形态学算子如下式:

高频分解子图Wjxf与Wjyf的小波系数, 在单一尺度下, 小波系数被淹没在噪声中, 很难进行瑕疵和背景分割。在经过二进小波变换后, 图像中灰度由亮变暗, 小波系数会出现负值, 在非噪声影响下, 相邻尺度间的系数符号相同;反之在噪声影响下[7], 符号相反。利用多尺度积的这个性质, 不仅滤除噪声而且增强了瑕疵区域的系数值, 有利于其后的阈值分割。对分解后的小波系数计算最后两尺度的乘积, 得到Px和Py, 并将小于零的系数置零, 以滤除噪声影响。并按式 (10) 得到幅值I (x, y) 。

二值化过程选取采用双阈值法。选取n张正常纹理图片, 对其用上述小波变换方法进行处理, 得到参考图片。将每张图片分割成互不重叠的相同大小的正方形子区域, 并求出每个区域的幅度值的均值, 对于第i张图片, 可以得到每个子区域的均值的最大值Dimax和最小值Dimin, 对n张图片, 求出最大值和最小值的均值Dmax和Dmin。对于瑕疵图像, 二值化过程如下式:

对小波变换和形态学结果采用像素级加权平均:

其中:A和B为待融合图像, ωA和ωB为权值系数。

小波变换可以得到不同尺度下的图像边缘特征, 放大瑕疵特征的同时削弱噪声, 对于线状瑕疵有较好的检测结果。对于块状瑕疵, 由于织物纹理复杂, 小波变换法只能检测得到一些不连续的线条, 很难获取几何形状信息。通过以上分析, 可以知道基于小波多尺度积和数学形态学的瑕疵检测算法, 对线状和块状瑕疵都会有比较好的检测效果, 避免了单个方法不能兼顾这两类瑕疵的缺点。根据以上分析, 具体实现步骤如下:

1) 对输入图像f (x, y) 做N层小波分解, 得到第j层变换低频近似子图Ljf和高频小波系数Wjxf, Wjyf。本文N取值为4, 小波基函数选三次样条函数。

2) 对低频子图Ljf按式 (9) 进行形态学边缘检测, 然后对检测结果用Otsu法进行阈值分割, 得到二值结果图A。

3) 对高频子图做尺度积运算, 得到Px和Py;通过式 (10) 运算得到I (x, y) 。对I (x, y) 用式 (11) 做阈值分割, 得到二值图像B。

4) 最后对A, B用式 (12) 融合, 得到最终的检测结果。

3实验结果及分析

实验中的瑕疵样本是庆丰纺织厂通过工业相机在生产线上获取的, 选取16类瑕疵样本, 每类瑕疵取50张图片, 并选取300张无瑕疵正常图片进行测试。图像大小为256×256, 256级灰度。实验环境是Intel Core22.8 GHz, 2 GB内存, Windows XP+Matlab7.1。

图2给出错纤维和跳花瑕疵的小波多尺度积结果、形态学结果以及最后的融合结果。小波多尺度积算法可以准确检测定位错纤维, 对于跳花, 只检测到一些不连续的线条, 几乎无法检测出来。形态学算法对于错纤维检测结果不连续, 对于跳花可以比较准确定位提取其形状特征。实验结果表明, 小波多尺度积算法对线状瑕疵有较好的检测结果, 形态学算法则对块状瑕疵有令人满意的检测效果。这两种算法结合, 可以对两类瑕疵均有比较好的检测结果, 表明本文算法的有效性和可行性。

图3给出本文算法与当前经典的基于Gabor的算法[3]和基于小波变换的算法[4]的主观效果比较, 给出16类样本中具有代表性的9类瑕疵检测结果, 分别是破洞、棉球、纬缩、竹节、跳花、筘路、脱纬、煤灰线、木辊皱, 包含了局部小瑕疵、线状和块状瑕疵。从实验结果看, Gabor算法, 对于大部分瑕疵都有比较好的检测结果, 但是放大了瑕疵面积不能准确提取瑕疵的几何信息, 对细小瑕疵, 如破洞、纬缩等, 会产生较多虚警点, 对于对比度不强的木辊皱瑕疵, Gabor算法无法检测出来。小波变换对于线状瑕疵有较好的检测结果, 对于脱纬也存在线条不连续的问题, 对细小瑕疵有较好的检测结果并且定位比较准确, 对于块状瑕疵跳花只检测到一些模糊的边缘信息, 效果比较差。本文算法, 对于细小瑕疵、线状和块状瑕疵都有较好的检测结果, 并且能比较准确反映瑕疵的几何形状和位置信息。对于大部分瑕疵, 本文算法和Gabor算法一样均能得到比较好的检测结果, 而且对于局部小瑕疵, 虚警点远远少于Gabor算法结果, 本文算法集合了Gabor和小波变换算法的优点。

为了检验算法的整体性能, 本文用检测率、虚警率和时间做客观评估。检测率通过瑕疵样本测试得到, 为正确检测到的瑕疵图片数与瑕疵图片总数的比值;虚警率通过在正常图片上测试得到, 即正常图片误检为瑕疵的图片数与正常图片数的比值。衡量算法的性能, 需要综合考虑检测率和虚警率, 检测率越高的同时虚警率越低则性能就越好。表1中给出三种算法的性能对比结果, 从表中可以看出, 检测率, 本文算法优于Gabor算法和小波变换算法;虚警率, 小波变换算法要优于本文算法和Gabor算法, Gabor算法虚警率最高, 主要是由于文中实验所用图片, 均来自实际生产线, 受噪声影响较大, Gabor算法结果放大了噪点, 造成高虚警率;运算时间, 小波变换算法和本文算法耗时较少, 小波变换算法要优于本文算法, 而Gabor算法耗时最长。综合以上性能考虑, 本文算法性能优于其它两种算法。

4 结论

本文提出一种新的基于小波变换多尺度积和数学形态学的布匹瑕疵检测算法, 得到了较优的检测结果。实验结果证明该算法兼顾小波变换多尺度积和形态学的优点, 能快速有效的对布匹瑕疵进行检测, 是一种有效可行的算法。综合考虑检测率、虚警率与运算时间, 本文算法优于Gabor和小波变换算法。下一步工作是在本文算法基础上, 进行瑕疵分类。

摘要:针对布匹瑕疵种类多以及单个方法仅对特定类瑕疵有效的问题, 提出一种新的基于小波多尺度积和数学形态学的布匹瑕疵检测算法。首先对输入图像进行二进小波变换后, 低频近似子图经过数学形态学运算, 得到良好的瑕疵形状特征, 然后对高频子图使用小波多尺度积方法, 可以抑制噪声的同时增强瑕疵的边缘线性特征, 最后融合得到最终的检测结果。实验结果表明, 该算法在虚警率和运算时间较低的同时, 得到较高的检测率, 综合性能优于经典的Gabor和小波变换算法。

上一篇:初中数学教学有效性下一篇:货币宽松政策