图像分割滤波范文

2024-08-18

图像分割滤波范文(精选8篇)

图像分割滤波 第1篇

在视频监控和视频会议应用领域,经常由于显示终端的不同,需要进行图像的分辨率变换。图像变小必然会导致原始图像的信息丢失,如何在目标分辨率一定的情况下,尽可能保留原始信息是本文的主要目标。另一方面,在同一个显示终端上为用户呈现多画面的效果需要解决如何将多路信号复接在一起的多画面分割拼接技术问题[1]。在多画面分割拼接过程中,必须对多路原始图像进行图像尺寸变化处理,而调整图像尺寸必须对原始图像进行插值滤波(图像放大)或抽取滤波(图像缩小)处理[2]。在图像分割过程中,会采用FIR滤波器技术实现图像的缩小处理。

2 图像分割滤波方法

一般地,对于多画面拼接中主要还是采用图像从高质量、高分辨画面转变为低质量、低分辨画面,再通过多个画面合并的技术方法实现。图像的缩小技术常见分为软件方式和硬件方式。基于软件的图像缩小技术比较灵活,可以采用复杂的算法,可以获得高质量的图像,但缺点是处理带宽小,消耗DSP(数字信号处理)运算量大;基于硬件架构最大的优点是速度非常快,缺点是算法实现比较单一,且耗费的FPGA[3](现场可编程逻辑阵列)内部宝贵的存储资源。需要寻找一种既能节约存储资源,又能利用硬件高速处理特性,同时能实现比较灵活的滤波特性的一种硬件解决方案。

通过改变数字滤波器的结构,采用FPG A实现一种滤波系数相对灵活,同时大大节约存储资源的方案。以4×4滤波器为例,如图1所示,该滤波器结构采用:

先在水平方向滤波,后在垂直方向上滤波的方式实现同样的滤波算法。其中D为逻辑存储部件,水平方向的滤波采用4阶FI R来实现,抽头系数通过系数控制模块来产生;

垂直方向的滤波采用滤波中间缓存FI FO FBUF的数据操作来实现;抽头系数则通过系数控制模块产生。具体工作流程如下:(1)逻辑先判断当前输入行位于一次滤波中的哪一行,根据当前行决定采用哪一个加权系数;(2)根据加权系数对当前横向滤波的结果进行加权累加;(3)对当前的累积和进行加权归一化处理,以保证最终的输出不会产生溢出;(4)判断当前行是不是一次滤波开始的第一行,如果是第一行那么将加权的结果直接写入到FBUF中;如果不是,那么先将FBUF的读出一个数据,与当前的经过加权的滤波结果再求和,然后写入到FBUF中,作为下一行滤波的中间累加结果;(5)当一次滤波完成之后,对FBUF进行清空操作,为下一次滤波做好准备,同时可以防止出现错误累积效应。

该方案设计缓存只是行间累积和,而不是传统设计中采用多行缓存的方式,从而可以大大节约行缓存资源。在图像的缩小的应用场合,滤波之后的图像不需要全部保留下来,因此只存储累计和所得的抽样的图像与保留全部滤波结果再抽样得到的图像效果等价。

本文则采用了一种十分灵活的FIFO组管理的方式,FIFO组由多个小FIFO组成,每个小的FIFO对应很小的一个突发处理,资源选择模块负责根据当前图像要输出的分辨率情况,选择哪一个或者多个FIFO作为当前的临时数据缓存FIFO,FIFO的大小和个数十是根据当前输出图像分辨率和输出的画面数目之间的一个折衷。如表1所示为4画面和16画面的FIFO分配情况。

3 多画面图像分割拼接FPGA实现方法

在多画面图像分割拼接过程中,采用改进后的FIR滤波器实现其图像的分割滤波,节省了FPGA内部存储资源,但在FPGA实现过程中需要采用一些具体实现处理方式。FPGA将不同摄像头进入的图像先缩小为目标分辨率,然后将缩小后的图像数据写入到内存对应的地址。通过读接口将图像按整帧的方式调度出去,从而呈现多画面的效果。以4分屏的地址管理为例,4路摄像头分别以D1分辨率输入4路图像,缩放模块按照目标显示的分辨率进行缩放,写入控制单元将不同路的画面写入到同一帧的内存空间中,在读出控制端按照整帧数据读出,在显示设备上就可以呈现多画面的效果。同样地,其他画面显示系统工作情况也类似。在多画面拼接显示过程中,需要涉及到以下几个问题:

3.1 位置分配与内存空间的分配

为实现多种分辨率的兼容,以降低逻辑管理地址的复杂度,节约逻辑资源,在逻辑内部按照如下方式划分地址空间。

逻辑对每个位置的地址进行管理,为节约逻辑资源,物理内存的地址和位置没有绝对的关系。如图2(a),在16画面的时候,图中的0号位置的物理地址与1号位置的物理地址分辨属于0号位置对应的摄像头和1号位置的摄像头。而当同样的地址空间在4画面的时候,位置编码关系变成了如图2(b)的方式:同样是0号位置,由于分辨率不同,现在占用的实际的物理内存空间也不同了,现在的0号位置占用了原来16画面的0、1、2、3号位置总共的存储空间。同理其他多画面也采用了这种分辨率不同,同样位置可能占用不同物理内存的方式。这种方式的优点:a、控制器可以复用,大大节约了逻辑资源开销;b、可以实现混合分辨率的多画面;c、节约FPGA外部访问内存接口(如D DR DRAM)的容量,降低了硬件成本。

(a、1 6画面;b、4画面)

3.2 防止内存越界的写入保护

内存越界的原因有很多,包括但不限于逻辑内部处理异常、接口信号异常、外部访问DRAM带宽瞬时不足导致的不正常反压等。一旦越界就会出现不同通道的信号间相互影响,从而严重影响画面质量。所以逻辑必须具备一定的越界保护能力。

越界保护通过当前写入突发的信息和当前位置可用地址的信息共同决定,决定的结果有两种可能:(1)当前的申请是有效的:这种情况下地址管理模块给出一个可以写入的地址。(2)当前的申请是无效的:这种情况下,地址管理模块给出一个丢弃标志,逻辑将该突发的数据进行丢弃。

显然上述决策的依据直接决定了地址管理模块抵抗各种异常的能力。决策依据包括但不限于如下几条内存管理规则:(1)如果当前位置可用地址为该位置第一个突发的位置,那么当前写入突发必须是一帧信号的第一行,否则申请无效。此规则能够将错误控制在一帧之内,不会让错误在帧间累积;(2)如果当前位置可用地址为该位置任一一行的第一个突发的位置,那么当前写入突发必须是某一行的第一个突发,否则申请无效。此规则能够将错误控制在一行之内,不会让错误在行间累积;(3)如果当前写入突发是帧的第一个突发,那么必须给出当前位置的首地址。此规则能够让新来的数据帧从新的一帧的位置开始,防止出现错屏;(4)如果当前写入突发是行的第一个突发,那么必须给出当前位置的下一行的行首地址。此规则能够让新来的数据行从新的一行开始,防止图像出现帧内扭错。

3.3 读写同步问题

读写同步问题是为了防止同时读写同一内存空间而出现的错屏现象。因读写时钟的差异,有可能出现在同一时刻读时钟比写时钟快或者慢的情况,如读写之间不做同步保护,则有可能出现读写同一地址空间的问题。

逻辑内部通过寻找当前写入最快的用户的方式,得到当前可以读数据的空间位置,这样保证了外部内存DRAM的读用户和写用户的对应关系。由于写入多画面的不同图像的先后顺序不同,而且可能会出现原来快的用户在某段时间变慢的情况,所以写的最快的用户需要动态变化。在读一侧,需要保证读的位置落后于写的最快的数据帧两帧,这样既保护了读写不会在同一帧,又可以保证当前读的这一帧的所有多画面都得到了刷新。

最快的用户的确认是读写同步的关键,采用如下的方式来实现,为了简便,以4画面为例,其他多画面采用同样的方式处理即可。

如图3所示,假设在t0时刻,0 1 2 3四个用户假设同时写在0号帧位置,此时的最快用户为初始设定的任意一个用户,在tl时刻,0号用户是四个用户中最先写完的一个用户,这样在tl时刻最快用户就变为0号用户;在t2时刻其他用户(1 2 3)也随之写入到内存中,在t3时刻,1号用户最先写完上一帧,所以在t3时刻的最快用户就是1。依次操作,逻辑内部实时维护了当前最快的用户,其他用户的读写都以此为基准进行,从而保证了读写用户的同步。

4 结语

这种多画面图像分割拼接处理采用了改进的分割滤波方法,因此不仅具有缓存容量小、硬件可行性高、灵活性比较高、可以提供比较丰富的滤波抽头以提高图像抽样的画面质量、容易进行各种画面裁减、可多路复用以进一步节约存储空间等优势,而且具有以下优点:1)通过图像多画面拼接过程中画面内存管理方面的处理方案,实现丰富的多画面,可实现包括4、9、16画面以及各种不同分辨率拼接的多画面方案;2)软件管理简单、多画面拼接处理消耗FPGA内存及逻辑资源少;3)具有完备的内存越界保护机制以及先进的读写同步控制机制。

在实际设计中,还可能会涉及到如去交织、后滤波、OSD(在屏显示)以及移动侦测功能的结合等技术,这部分是视频监控和视讯会议中的重要技术,因此基于FPGA实现其各种配置灵活的技术方案,也将是后续研究的重点。

参考文献

[1]Gonzalez R C.阮秋琦等译数字图像处理(Matlab版)[M],北京:电子工业出版社,2005.

[2]章毓晋.图像分割[M],北京:科学出版社,2001.

图像滤波总结 第2篇

一、基本的灰度变换函数 1.1.图像反转

适用场景:增强嵌入在一幅图像的暗区域中的白色或灰色细节,特别是当黑色的面积在尺寸上占主导地位的时候。

1.2.对数变换(反对数变换与其相反)

过程:将输入中范围较窄的低灰度值映射为输出中较宽范围的灰度值。用处:用来扩展图像中暗像素的值,同时压缩更高灰度级的值。特征:压缩像素值变化较大的图像的动态范围。

举例:处理傅里叶频谱,频谱中的低值往往观察不到,对数变换之后细节更加丰富。

1.3.幂律变换(又名:伽马变换)

过程:将窄范围的暗色输入值映射为较宽范围的输出值。

用处:伽马校正可以校正幂律响应现象,常用于在计算机屏幕上精确地显示图像,可进行对比度和可辨细节的加强。

1.4.分段线性变换函数

缺点:技术说明需要用户输入。优点:形式可以是任意复杂的。

1.4.1.对比度拉伸:扩展图像的动态范围。

1.4.2.灰度级分层:可以产生二值图像,研究造影剂的流动。1.4.3.比特平面分层:原图像中任意一个像素的值,都可以类似的由这些比特平面对应的二进制像素值来重建,可用于压缩图片。

1.5.直方图处理

1.5.1直方图均衡:增强对比度,补偿图像在视觉上难以区分灰度级的差别。作为自适应对比度增强工具,功能强大。

1.5.2直方图匹配(直方图规定化):希望处理后的图像具有规定的直方图形状。在直方图均衡的基础上规定化,有利于解决像素集中于灰度级暗端的图像。

1.5.3局部直方图处理:用于增强小区域的细节,方法是以图像中的每个像素邻域中的灰度分布为基础设计变换函数,可用于显示全局直方图均衡化不足以影响的细节的显示。1.5.4直方图统计:可用于图像增强,能够增强暗色区域同时尽可能的保留明亮区域不变,灵活性好。

二、基本的空间滤波器 2.1.平滑空间滤波器

2.1.1平滑线性滤波器(均值滤波器)

输出:包含在滤波器模板邻域内的像素的简单平均值,用邻域内的平均灰度替代了图像中每个像素的值,是一种低通滤波器。结果:降低图像灰度的尖锐变化。

应用:降低噪声,去除图像中的不相关细节。负面效应:边缘模糊。

2.1.2统计排序滤波器(非线性滤波器)举例:中值滤波器。过程:以滤波器包围的图像区域中所包含图像的排序为基础,然后使用统计排序结果决定的值取代中心区域的值。

用处:中值滤波器可以很好的解决椒盐噪声,也就是脉冲噪声。

2.2.锐化空间滤波器

2.2.1拉普拉斯算子(二阶微分)

作用:强调灰度的突变,可以增强图像的细节。

2.2.2非锐化掩蔽和高提升滤波

原理:原图像中减去一幅非锐化(平滑处理)的版本。背景:印刷和出版界使用多年的图像锐化处理。

高提升滤波:原图减去模糊图的结果为模板,输出图像等于原图加上加权后的模板,当权重为1得到非锐化掩蔽,当权重大于1成为高提升滤波。

2.2.3梯度锐化(一阶微分对)

含义:梯度指出了在该位置的最大变化率的方向。

用处:工业检测,辅助人工检测产品的缺陷,自动检测的预处理。

三、基本的频率滤波器 3.1.1理想低(高)通滤波器 特性:振铃现象,实际无法实现。

用处:并不实用,但是研究滤波器的特性很有用。

3.1.2布特沃斯低(高)通滤波器

特点:没有振铃现象,归功于在低频和高频之间的平滑过渡,二阶的布特沃斯低通滤波器是很好的选择。

效果:比理想低(高)通滤波器更平滑,边缘失真小。截止频率越大,失真越平滑。

3.1.3高斯低(高)通滤波器 特点:没有振铃。

用处:任何类型的人工缺陷都不可接受的情况(医学成像)。

3.1.4钝化模板,高提升滤波,高频强调滤波 用处:X射线,先高频强调,然后直方图均衡。

3.1.5同态滤波

原理:图像分为照射分量和反射分量的乘积。

用处:增强图像,锐化图像的反射分量(边缘信息),例如PET扫描。

3.1.6选择性滤波

3.1.6.1带阻滤波器和带通滤波器。作用:处理制定频段和矩形区域的小区域。

3.1.6.2陷阱滤波器

原理:拒绝或通过事先定义的关于频率矩形中心的一邻域。应用:选择性的修改离散傅里叶变换的局部区域。

优点:直接对DFT处理,而不需要填充。交互式的处理,不会导致缠绕错误。用途:解决莫尔波纹。

四、重要的噪声概率密度函数 4.1.高斯噪声

特点:在数学上的易处理性。

4.2瑞利噪声

特点:基本形状向右变形,适用于近似歪斜的直方图。

4.3爱尔兰(伽马)噪声

特点:密度分布函数的分母为伽马函数。

4.4指数噪声

特点:密度分布遵循指数函数。

4.5均匀噪声 特点:密度均匀。

4.6脉冲噪声(双极脉冲噪声又名椒盐噪声)

特点:唯一一种引起退化,视觉上可以区分的噪声类型。

五、空间滤波器还原噪声 5.1均值滤波器 5.1.1算术均值滤波器

结果:模糊了结果,降低了噪声。适用:高斯或均匀随机噪声。5.1.2几何均值滤波器

结果:和算术均值滤波器相比,丢失的图像细节更少。适用:更适用高斯或均匀随机噪声。

5.1.3谐波均值滤波器

结果:对于盐粒噪声(白色)效果较好,但不适用于胡椒噪声(黑色),善于处理高斯噪声那样的其他噪声。

5.1.4逆谐波均值滤波器

结果:适合减少或在实际中消除椒盐噪声的影响,当Q值为正的时候消除胡椒噪声,当Q值为负的时候该滤波器消除盐粒噪声。但不能同时消除这两种噪声。适用:脉冲噪声。

缺点:必须知道噪声是明噪声还是暗噪声。

5.2统计排序滤波器 5.2.1中值滤波器

适用:存在单极或双极脉冲噪声的情况。

5.2.2最大值滤波器

作用:发现图像中的最亮点,可以降低胡椒噪声。

5.2.2最小值滤波器

作用:对最暗点有用,可以降低盐粒噪声。

5.2.3中点滤波器

作用:结合统计排序和求平均,对于随机分布噪声工作的很好,如高斯噪声或均匀噪声。5.2.4修正的阿尔法均值滤波器

作用:在包括多种噪声的情况下很有用,例如高斯噪声和椒盐噪声混合。

5.3自适应滤波器

5.3.1自适应局部降低噪声滤波器

作用:防止由于缺乏图像噪声方差知识而产生的无意义结果,适用均值和方差确定的加性高斯噪声。

5.3.1自适应中值滤波器

作用:处理更大概率的脉冲噪声,同时平滑非脉冲噪声时保留细节,减少诸如物体边界粗化或细化等失真。

5.4频率域滤波器消除周期噪声 5.4.1带阻滤波器

应用:在频率域噪声分量的一般位置近似已知的应用中消除噪声

5.4.2带通滤波器

注意:不能直接在一张图片上使用带通滤波器,那样会消除太多的图像细节。用处:屏蔽选中频段导致的结果,帮助屏蔽噪声模式。

5.4.3陷阱滤波器

原理:阻止事先定义的中心频率的邻域内的频率。作用:消除周期性噪声。

5.4.4最佳陷阱滤波

图像分割滤波 第3篇

在各种图像处理包括细胞图像处理过程中,常常会使用高斯算子对对图像进行滤波处理。其主要的原因是真实图像由于设备的限制,一般都带有噪声,需要使用一定的算法对图像进行平滑处理。

处理噪声的方法很多,从处理方法上来说,主要分为空域滤波和频域滤波。空域滤波技术主要有均值滤波、中值滤波、高斯滤波[1]、拉普拉斯变换等各种方法。

频域滤波是先将时域信息转换到频域,在频域中对图像信息进行处理,处理完毕后再转换成时域的一种方法。

在进行图像分割过程中,选择合适的去噪增强算子对图像进行处理直接影响到分割处理的效果。双边滤波自从被提出以来,因为其具有保留边界的同时又能起到平滑的应用效果,被广泛应用于各种图像增强之中。本文将双边滤波算子引入主动轮廓分割模型,并将构造出来的区域主动轮廓模型应用于图像分割过程中,推导出水平集函数的演化过程。并将该水平集分割函数应用于具体的细胞图像分割过程之中。

1 基于双边滤波的图像分割能量传导模型

1.1 双边滤波介绍

二维图像可以定义为一个二维矩阵,其中每个元素对应相应位置的像素,元素值即为该像素的灰度值。

记Ip为图像位于位置p=(pi,pj)处的像素值,记F[I]为应用滤波器F到图像I的结果。

高斯滤波计算公式为:

其中‖p-q‖为像素p和像素q之间的距离,而为Gσ(i,j)二维高斯函数。

高斯滤波是目前图像处理中使用的应用广泛的一种滤波方式,其具有计算迅速,效果稳定等等众多优点。这主要是因为二维高斯函数具有很多优点[2]。但是同时高斯滤波器也存在一些缺点,如:高斯滤波会使得图像中物体边缘模糊化,还会使得物体边界出现空洞现象。而这些特性使得相应的图像处理变得困难。

双边滤波是C.Tomasi和R.Manduchi[3]提出了一种非迭代的简单策略,是一种可以保边去噪的滤波器[4]。之所以可以达到此去噪效果,是因为滤波器是由两个函数构成。一个函数是由几何空间距离决定滤波器系数而另一个函数由像素差值决定滤波器系数。其计算公式如下:

其中BF[I]p为p处的滤波后的灰度值,GσS(‖p-q‖)项为空域权值,Wp为作用像素的权系数之和,起正规化作用。其值为:

Gσr(Ip-Iq)为新出现的项,其描述了作用像素与目标像素之间灰度值差的影响。像素p与q之间的灰度值差越大,则q对p的影响越小;而如果两者之间的灰度值差越小,则q对p的影响越大。该项表明灰度值差的影响也符合高斯分布。

双边滤波是对高斯滤波进行修正的结果,主要是增加了灰度差的影响。不同的灰度差影响对滤波结果不同,反映到滤波器模板上体现为不同的像素所对应的模板不同,部分灰度差的像素影响值小。

1.2 基于双边滤波的双水平集图像分割算法

在细胞分割中,可以利用细胞的结构来构造主动轮廓模型的能量函数,在文章[5,6]中,用于细胞图像分割的双水平集函数分割模型中的能量函数为:

其中,C1为细胞质和背景的边界,C2为细胞质和细胞核的边界,IG为原图像和梯度图像的合成图像,f10和f11分别代表细胞质、细胞核原图像的近似图像和背景的近似图像,g0和g1为IG的近似图像。inside(c1)表示细胞质和细胞核部分,outside(c1)表示背景部分,inside(c1&inside(c2)表示细胞核部分,inside(c1)&outside(c2)表示细胞质部分。

具体水平集演化公式及推导过程详见文章[5]。

2 基于双边滤波的双水平集图像分割算法实现

双边滤波的函数独立于其它操作,所以在算法实现上,可以先将整个流程变为先进行滤波,再进行水平集演化分割过程。算法实现过程如图1所示:

可以首先对图像进行双边滤波计算,然后进行分割计算。

3 实验结果及讨论

经过大量的实验显示,采用本文介绍的方法能够充分结合双边滤波和主动轮廓模型的优点,得到满意的分割效果。

综上所述,因为双边滤波保留了边界信息,所以基于双边滤波的主动轮廓模型对于目标的边界部分分割情况较好。达到了本文预期的分割目标。

摘要:区域主动轮廓模型采用先验知识指导建立分割模型,并在分割的过程中采用水平集演化的方式使得零水平集自动收敛于目标物体的边界。在采用该模型进行分割之前,通常都采用高斯滤波器对图像进行滤波,但是高斯滤波器在对物体进行平滑操作的同时,也会造成物体边界的弱化,从而影响分割效果。本文将双边滤波和区域主动轮廓模型结合起来,充分利用双边滤波在平滑目标内部的同时不弱化边界的特点,在利用区域主动轮廓模型进行分割之前使用双边滤波对图像进行处理,实验结果显示使用本方法进行分割得到的结果准确性得到了提高。

关键词:图像分割,双边滤波,区域主动分割模型,水平集

参考文献

[1]郭显久,庄严,王珂,王伟.基于高斯滤波器的尺度相乘边缘检测算法[J].计算机工程与应用,2005,41(003):70-71.

[2]成鹏飞,高阳,王仲,张马林.复杂背景下圆形物体分割算法[J].计算机应用,2006,26(10):2360-2361.

[3]C.Tomasi,R.Manduchi.Bilateral filtering for gray and colorimages[M].1998.

[4]S.Mattoccia,S.Giardino,A.Gambini.Accurate andefficient cost aggregation strategy for stereo correspondence basedon approximated joint bilateral filtering[J].Computer Vision¨CACCV2009,2010:371-380.

[5]MA JingFeng,Bu JiaJun,HOU Kai,BAO ShangLian,CHENChun.An Energy Conduction Model for Cell Image Segmentation[J].Chinese Science Bulletin,2011,56(10):1048-1054.

图像分割算法研究 第4篇

关键词:图像分割,对象,图像

数字图像处理技术是一个跨学科的领域。随着计算机科学技术的不断发展, 图像处理和分析逐渐形成了自己的科学体系, 新的处理方法层出不穷, 尽管其发展历史不长, 但却引起各方面人士的广泛关注。首先, 视觉是人类最重要的感知手段, 图像又是视觉的基础, 因此, 数字图像成为心理学、生理学、计算机科学等诸多领域内的学者们研究视觉感知的有效工具。其次, 图像处理在军事、遥感、气象等大型应用中有不断增长的需求。

1、发展现状和研究方向

基于图论的图像分割技术是近年来国际上图像分割领域的一个新的研究热点。该方法将图像映射为带权无向图, 把像素视作节点。利用最小剪切准则得到图像的最佳分割该方法本质上将图像分割问题转化为最优化问题。是一种点对聚类方法。对数据聚类也具有很好的应用前景。但由于其涉及的理论知识较多, 应用也还处在初级阶段。

2、几个重要的图像分割技术

2.1 阈值分割

图像分割的经典方法是基于灰度阈值的分割方法, 它通过设置阈值, 把像素点按灰度级分若干类, 从而实现图像分割。把一副图像转化为二值图像是阈值分割的最简单形式。

阈值处理是一种区域分割技术, 将灰度根据主观愿望分成两个或多个等间隔或不等间隔灰度区间, 它主要是利用图像中要提取的目标物体和北京在灰度上的差异, 选择一个合适的阈值, 通过判断图像中的每一个像素点的特征属性是否满足阈值的要求来确定图像中该像素点术语目标区还是应该属于区域, 从而产生二值图像, 它对物体和背景有较强对比景物的分割特别有用。它计算简单, 而且总能用封闭而且连通的边界定义不交叠的区域。

2.2 基于边缘检测的图像分割

边缘检测的分割方法是通过检测包含不同区域的边缘来解决图像分割问题。所谓边缘, 就是目标和背景的分界线, 提取出边缘就可以将目标和背景区分开来, 因此它是图像分割所依赖的重要特征, 同时也是纹理特征的重要信息源和形状特征的基础。它包含了用于识别的有用信息, 为人们描述或识别目标以及解释图像提供了一个有价值的、重要的特征参数。在图像中, 边界既是一个特征区域的终结, 也是另一个特征区域的开始, 边界所分开区域的内部特征或属性是一致的, 而不同区域内部的特征或属性是不同的, 边缘的检测正是利用物体和背景在某种图像特性上的差异来实现的, 这差异包括灰度、颜色以及纹理特征。边缘检测实际上就是要检测出图像的特性发生变化的位置。图像的信息量很大, 而边缘信息是图像的一种紧描述, 它所包含的往往是图像中最重要的信息。因此边缘检测在计算机视觉中有着非常重要的地位。

3、几个重要的图像分割技术的算法实现

3.1 基于直方图的谷点搜索法

阈值值分割主要有两个步骤:

1) 确定正确分割的阐值;

2) 将所有像素的灰度级与阈值进行比较, 以进行区域划分, 达到目标与背景分离的目的。在这一过程中, 正确确定阂值是关键, 只要能确定一个合适的阐值就可完成图像的准确分割。

阈值法简单、运算效率高, 是图像分割中广泛采用的方法。阐值分割法的结果很大程度上依赖于对阐值的选取, 因此该方法的关键是如何选择合适的阐值。

阈值分割法不仅可以极大地压缩数据量, 而且也大大简化了分析和处理步骤, 对于直方图呈明显双峰特性的图像, 可得到很好的分割效果。阈值分割看似个简单的问题, 在过去的四十年里受到国内外学者的广泛关注, 产生了数以百计的阐值选取方法, 但是遗憾的是, 如同其他图像分割算法一样, 没有一个现有方法对各种各样的图像都能得到令人满意的结果, 甚至也没有一个理论指导我们选择特定方法处理特定图像。

基于直方图的谷点搜索法阈值是通过分析图像的直方图来决定的。假设, 一副图像只有物体和背景两部分组成, 其灰度图直方图呈现明显的双峰值, 如下图1。

找出阈值T, 则可以对整个图像进行二值化赋值。

程序的实现:

通过数组记录直方图中的各像素点值的个数, 再对逐个像素值进行扫描。记录每个像素能作为谷底的范围值, 接着找出能作为谷底范围最大的点作为阈值。

实现流程图:

3.2 边缘检测算法

数字图像可用各种方法检测出边缘点, 在某些情况下, 仅仅活得边缘点是不够的。此外, 由于噪声广造不均匀等因素的影响, 获得的边缘点有可能是不连续的, 必须通过边界跟踪之前, 先利用前边介绍的边缘检测方法对图像进预处理的得到图像的梯度图, 然后在图像的梯度图中进行边界跟踪。边界跟踪包括三个步骤:1) 确定边界判别准和搜索准则。2) 判别准则用于判断一个点是不是边缘点, 搜索准则知道如何搜索下一个边缘点。3) 确定搜索终止条件。霍夫变换可以用于将边缘加测像素连接起来得到边界曲线, 它的主要优点在于收噪声和曲线剪短的影响较小。在已知曲线形状条件下, 霍夫变换实际上是利用分散的边缘点进行曲线逼近, 它也可看成是一种聚类分析技术, 图像空间中的每一点可以对参数集合进行投票表决, 获得多数表决票的参数即为所求的特征参数。

通过对图像逐个扫描, 比较每个点与其八邻域, 判断其是否为边界点, 依据是边界点的变化比较大。

程序的实现:

图像中每个点与其八邻域进行比较, 可通过RGB和HSI两种颜色空间进行比较。

程序流程图2:

4、结论

图像分割的实现既要考虑相同区域的相似性, 又要考虑不同区域之间的差异性, 所以在图像分割应该根据图像的特征, 用有关的算法对图像进行处理, 应该将有关边缘检测的方法结合在一起, 把多种颜色空间应用到图象分割算法中。

参考文献

[1].姚敏等编著, 《数字图像处理》, 机械工业出版社, 2006年1月, 序号:ISBN 7-111-18009-7/TP.4577

[2].吴国强著, 《基于自组织特征映射神经网络的医学图像分割》, 2007年4月

[3].陈传波陆枫等编者, 《计算机图形学基础》, 电子工业出版社, 2006年7月, 序号:ISBN 7-5053-7157-6/TP.4115

[4].郭文平王跃存杨晓光编著, 《Visual C++基础教程》, 西安电子科技大学出版社, 2006年6月, 序号:ISBN 7-5606-1738-7/TP.0432

[5].金桂芳著, 《免疫规划及其在图像分割中的应用研究》, 2007年3月

[6].于志强著, 《医学图像分割与虚拟手术几个关键问题的研究》, 2006年10月

彩色图像分割算法综述 第5篇

图像分割是模式识别和图像分析的核心技术,图像分割是将具备特定属性的目标区域从一定的背景中进行提取。可作如下定义:对一幅图像p(x,y)(0≤x≤xmax,0≤y≤ymax进行分割就是将图像划分为满足条件的N个子区域pi(x,y),i=1,2,...,N。经典的图像分割是基于灰度的,一般单元区域内的灰度级别最多几十个。与灰度图像相比,彩色图像更符合人的视觉特性,更加切合人类对外在世界的认识。由于彩色图像具有颜色空间的信息,如何将颜色空间信息表达为特征,研究颜色空间信息的表达方式以及颜色空间信息在图像分割中所起到的作用,已成为彩色图像分割技术的核心课题。

2 彩色图像分割方法的研究和特点分析

2.1 彩色图像分割方法的研究

彩色图像分割算法的研究最近一些年取得了很大的进展,呈现百花齐放之势。图像分割很大程度上依赖于特定领域需求、特定的目标对象、以及分割背景……这些因素很大程度上影响着分割效果。目前具有广泛应用基础的主要有基于直方图阈值分割、基于特征聚类和区域生长的、基于分水岭算法、基于人工神经网络等。

2.1.1 直方图阈值法

利用灰度阈值变换分割图像就称为阈值分割。它的特点是算法简单、计算量小、性能稳定,因而成为最基本和应用最为广泛的分割技术。阈值分割的基本思想:设置特征阈值,把每个像素点的灰度值和阈值相比较,根据比较的结果把该像素划分为两类—目标区域和背景区域。

阈值分割一般分为三步骤:(1) 确定阈值;(2) 将阈值和像素比较;(3)把像素归类。其中第(1)步阈值最重要,阈值的选择将直接影响分割的准确性以及由此产生的图像描述、分析的正确性。

常用的直方图阈值法有根据直方图谷底确定阈值、迭代选择阈值、最小均方误差法、最大类间方差法。国外学者Hollander等提出了一种基于多维的直方图阈值化方案, 该方法的基本思想是直方图阈值从不同的颜色空间(RGB、YIQ、HSI)中得到,并且把该阈值用于即将进行的区域分裂。然而,对于每个待分裂的区域,首先计算出各颜色空间中各分量的特征量的直方图, 然后再确定各个直方图的峰值, 从得到的峰值中选出具有最佳峰值的直方图,即用该峰值作为阈值,将待分裂的区域再分为两个子区域,采用递归算法,对于新分裂出的子区域重复相同的过程,直至每个区域都是相似的,不能再进行分裂为止。汤凌等人甚至提出一种基于人工免疫的图像分割算法,该算法在生物免疫的思想上加入了人工免疫算子,不仅能够确定最优阈值,而且还能大大缩短分割时间。

基于直方图阈值法的优点是计算量较小,而且不需要先验信息。缺点主要体现在四点:(1)基于单独的某个颜色分量的峰值分割图像区域是不完整的;(2)可能待分割的图像各个颜色分量的直方图并不具备明显的波峰或波谷;(3)彩色图像的像素映射到灰度图像的时候伴随发生的颜色信息发散;(4) 直方图阈值法是个全局的方法,并没有考虑到局部空间信息。

总之虽然很多研究对阈值分割的算法进行了改进,图像分割的效果有所提高。但在阈值的设置上还是没有很一个很好的解决方法。若将智能遗传算法引用到阈值筛选上, 或许对于最优分割图像的阈值的确定大大有利,这或许是基于阈值分割的图像分割法的发展趋势。

2.1.2 特征空间聚类以及区域生长

特征空间聚类算法在提取各类的特征值迭代的分类算法,因此不需要预先训练样本,特征空间聚类算法是一种无监督的统计学方法,比较常用的分类方法有模糊C- 均值、K- 均值等。对于彩色图像,在颜色空间上聚类必须先确定聚类数目,进行聚类的有效性分析,这种方法的优点, 充分利用了各个颜色分量上的颜色信息,而且直观易于实现。

基于特征空间聚类算法没有考虑到空间信息,对噪声比较敏感,但是它不需要预先训练样本,只需要确定聚类的数目。

区域生长分割方法对噪声不敏感, 所以对目标区域进行模糊聚类分割以后, 对分割出来的区域进一步进行区域生长,以达到更精确的分割目的。区域生长是根据事先定义的准则将像素或者子区域聚合成更大区域的过程。其基本思想是从一组生长中心开始(生长中心可以是单个像素,也可以是某个小区域),将与该生长点性质相似的相邻像素或者区域与生长点合并,形成新的生长点,重复此过程直到不能生长为止。生长点和相邻区域的相似性判断依据可以是灰度值、纹理、颜色等多种图像信息。

一般来说,区域生长算法有三个步骤:(1)选择合适的生长点;(2)确定相似性准则即生长准则;(3)确定生长停止条件。

具体过程有三步骤。

第一步: 经聚类算法后的聚类区域有k个, 以这k个区域的聚类中心作为区域生长点。可将区域生长点表示为:{C1(0),C2(0),...,Ck(0)}。

第二步:以区域生长点为基础进行区域增长:设经过i次迭代后的区域为{S1(i),S2(i),...,Sk(i)},每次迭代以后判断该区域是否已增长结束,采用8- 邻接区域来判断其中任意像素是否已经到达区域的边界,以下给出判断条件:

第三步: 当某个区域所有边缘像素的8- 邻接区域都不满足(公式1),即表该区域已增加结束,在下一轮迭代时跳过该区域,然后再返回到第二步,计算其他的区域,直到所有的区域停止增长为止。

一般来说, 在无像素或者满足加入生长区域条件时,区域生长就会停止。

区域的合并是将图像中任意两个具有相似特征的相邻区域合并,合并的两个区域可以大小不同,当无法再进行聚合时操作停止。区域的生长和合并对分割复杂场景图像比较有效,如果引入应用领域知识,则可以更好地提高分割效果。

2.1.3 分水岭分割方法

用来描述物体形状的非线性算子的代数称之为数学形态,在很多方面的应用都要优于线性算子。和其他的一些分割算法相比,在很多领域中:如预处理、物体形状的分割、物体量化……数学形态学方法都够在理结果和速度展现出优势。分水岭算法是数学形态学图像处理理论中比较有代表性的算法。

在彩色图像分割过程中,由于噪声的影响,分水岭算法分割图像非常容易过分分割。当然文献[11]中提到了几种解决方法:中值滤波、彩色形态学、低通滤波和高斯滤波等。这些滤波技术的依据是图像中信息出现的频率,但是频率并不是图像中唯一重要的信息。比如说,有些信息频率并不高,但是属于边缘信息,很重要,因为导致对边缘信息的保持效果较差。如果通过改进的基于边缘信赖度的各向异性扩散算法来对图像进行预处理,能够相对比较好地解决噪声影响。改进的基于边缘信赖度的各向异性扩散算法主要手段是通对P-M扩散算法中K和□的值进行改进:

K是控制传导系统函数形状的参数 ,□是用来控制扩散程度的参数。边缘信赖度是用来衡量局部窗口内的图像像素与边缘相似程度的参数。

改进的基于边缘信赖度的各向异性扩散方程为:

其中,参数P是梯度hNIx,y的函数,下标P的下标值代表四个计算维度的方向。参数Kx,y和λx,y的取值在目标空间域是逐点变化的。分水岭分割方法的关键是标记的选取,适当的选取不会导致过分割。马丽红等提出开闭滤波技术,对输出图像做二值标记预处理后的图像作为初始的分割步骤,然后把所得的分割结果作为分水岭算法的种子(标记),取得较好的效果。

2.1.4 人工神经网络

神经网络是对生物神经网络若干基本特性的抽象和模拟,它可以训练样本,为的函数提供解决方案。在汽车智能驾驶、光学字符识别和人脸识别等领域取得了很大的成功。对于分类问题,目的是学习决策函数h(x),该函数的输出为离散值或者向量,这是人工神经网络的强项;另外,由于可学习实值函数,神经网络也是拟合的利器。

神经网络的研究在受到了生物大脑仿生学启发,由一系列人工神经元相互密集连接构成。每个神经元由三部分组成:输入、人工神经细胞体和输出。每个神经元具有一定数量的实数值输入, 并产生一个的实数值的输出,如图1所示。

一个人工神经元的输入信号来自另一些神经元的输出,其输出又可以作为另一些神经元的输入。一个人工神经元可以看成感知器,具有两种状态:1和 -1。人工神经细胞对这些输入信号进行整合并进行阈值处理,若刺激值超过某一阈值, 则神经元被激活而进入1状态否则神经元就处于 -1状态。

在神经网络的训练过程中,训练样本特征向量是神经网络的输入,训练样本的目标输出是网络的输出。初始情况下,网络权值被初始化为一种随机状态,当把某个训练样本输入网络时,由此产生的网络输出与训练样本目标输出之间的差异称为训练误差。接下来,神经网络将根据某种机制调节权值w, 使得训练误差逐步减小;随着这种训练和调整过程的进行,网络对于训练样本的实际输出将越来越接近于目标输出。

人工神经网络技术的引入,使得图像分割技术具备了学习功能,为图像分割技术的智能化和启发式发展提供了理论基础。

2.2 颜色模型的研究

从物理的角度,颜色的感知源于刺激视网膜的电磁辐射的谱能量。谱能量分布E(λ),λ取值在350~780 nm它们的关系可以表示成:

彩色模型也称为彩色空间或彩色系统,是用来精确标定和生成各种颜色的一套规则和定义。它的用途是在某种标准下用通常可接受的方式简化彩色规范。如针对数码硬件的RGB模型,以及符合人类视觉特性的HSI模型。

2.2.1 RGB 模型

RGB模型是工业界的一种颜色标准 , 是通过对红(Red)、绿 (Green)、蓝 (Blue) 三种颜色的变化以及相互之间的叠加来得到各种的颜色的总称。该标准几乎包括人类视觉所能感知的所有颜色,是目前运用最广的颜色模型之一。

RGB颜色空间对应的坐标系统可以用如下一个三维向量来表示,如图2所示。

在RGB模型中, 三个图像分量组成了所要表示的图像。每一个颜色分量用8比特图像表示的话, 一个RGB彩色像素就有24比特深度。故这24比特RGB图像中颜色总数就是(28)3=16777216。

色觉的产生是需要发光光源的光通过反射或透射方式传递到眼睛,刺激视网膜细胞引起神经信号传输到大脑,然后人脑对此加以解释产生色觉。设为组成某种颜色C所需的3个刺激量分别用X、Y、Z表示,3刺激值与R、G、B有如下关系:

对白光,有X=1,Y=1,Z=1。设每种刺激量的比例系数为x,y,z,则有C=x X+y Y+z Z。比例系数x,y,z为色系数,其定义为:

此时,x+y+z=1。

2.2.2 HSI 颜色模型

HSI模型是从色调、饱和度和亮度来描述颜色 ,符合人类的视觉认知。HSI彩色空间可以用一个圆锥空间模型来描述,如图3所示。

通常用饱和度和色调表示颜色的类别与深浅程度。在模型中体现为横截面圆,模型纵坐标表示亮度。

一般来说,人的视觉对颜色浓淡的敏感程度要远弱于亮度的敏感程度,为了便于颜色处理和识别,人的视觉系统经常采用HSI彩色空间, 它比RGB彩色空间更符合人的视觉特性。此外,由于HSI空间中亮度和色度具有可分离特性,使得图像处理和机器视觉中大量灰度处理算法都可方便地应用在HSI彩色空间中。

综上对RGB和HIS两种颜色空间模型的分析和研究,HSI彩色空间和RGB彩色空间只是对物理量的表示方法不同,它们之间存在着一定的转换关系。

从RGB到HSI的彩色转换 及其实现。 给定一幅RGB格式的图像 ,每一个RGB像素的I、S、H分量可用下面的公式得到:

HSI模型有两个重要的特点 :第一个特点是亮度分量与色度分量是分开的,I分量与图像的彩色信息无关第二个特点是H及S分量与人感受彩色的方式紧密相连(这里强调了颜色的重要性,因为人对光的感知还与分量有关)。这些特点使得HSI模型非常适合基于人的视觉系统对彩色感知特性而进行处理分析的图像算法。

3 结束语

3.1 图像分割算法的评估

图像分割领域的分割算法的研究和改进越来越多算法的评估会适当度量算法的适用条件以及目标区域的优化分割,对分割算法的优化和改进具有一定的理论指导意义。

评估方法应具备两个条件。(1)较高的执行效率和鲁棒性好。如果运算量太大且对环境要求太过于苛刻的话,分割算法的应用意义不大,不能够很好地工业应用(2)应该具备完整、客观和科学的评估体系。能够评估众多不同的分割算法且能够根据分割算法的不同适用领域进行分类。

3.2 图像分割算法的研究方向

随着专家和学者的大量科研工作和实验,图像分割算法的应用型也越来越强。分割算法的智能化,分割效果的准确性和精确性,以及分割算法的鲁棒性都将成为广大学者所追捧的准则和目标。

由于图像分割算法众多, 且各自有各自的适用领域,各种分割算法的协作和融合,也将成为图像分割领域的研究热点。比如分水岭算法与区域生长的结合,遗传算法[17]与聚类分析的结合,寻找最有阈值与最大类间差结合[18]等,并且引入训练样本库技术,在提高图像分割算法性能的同时提高了分割算法的智能性。

摘要:图像分割是计算机视觉和图像分析的核心技术,作者首先对当前各种图像分割算法进行全面的分析和研究,指出色彩在图像分割技术中的作用。然后对直方图阈值法、特征空间聚类及区域生长、分水岭分割算法、神经元网络等主要的彩色图像分割技术进行综述,并分析比较这几种方法的特点,并且引入了颜色模型的概念,进行了研究。最后结论部分,提出图像分割算法的评估体系,展望了彩色图像分割技术的发展趋势和将来的研究方向。

图像的阈值分割法设计 第6篇

图像分割被定义为这样的一个过程, 即按照一定的规则, 把一幅图像分成些许个互相没有联系的小区域, 且在这个过程中产生图像的基元。这里的小区域是指在一定情境下具有相同属性的像素的连通集合, 而连通是一种连接的路径, 就是在集合中随意的两个点之间有着全部属于这个集合的路径。在图像中, 我们可以看出, 若表示的是同一物体的区域, 这些像素都具有相同的特点, 而对于不同的物体, 这些特点却完全不同。

阈值法是图像分割中应用最普遍的基本分割技术, 具有性能稳定、实现简单、计算量小等特点。使用阈值法时, 是将图像的灰度级分为几个部分, 对于同一部分的像素就把它当作一个物体, 而这个过程是通过用一个或者几个阈值来实现的。在阈值法的应用中, 最关键的部分是阈值的选取。本文主要介绍并比较了两种阈值选取的方法及使用效果, 它们是迭代法和最大类间方差法。

1 迭代法

迭代法的基本步骤如下:

(1) 选取初始估计值, 设它为T0。

(2) 用这个估计值T0来分割图像, 令所有的灰度值和T0来比较, 大于它的像素组成了G1, 小于它的则为G2。

(3) 计算平均灰度值, G1的平均灰度值为μ1, G2的平均灰度值为μ2。

(4) 再次计算新阈值

重复第 (2) ~ (4) 步, 直到事先定义好的T0参数大于计算出的T值, 且两组的平均灰度值μ1和μ2不再发生改变, 那么我们就获得了所需要的阈值。

由此法得到的阈值能够把图像的前景和背景的主要部分所在的位置都区分出来, 但是图像的某些细微处没有得到很好的区分。

2 最大类间方差法

最大类间方差法是由Otsu于1978年提出的, 它因为计算简单, 稳定性好, 被普遍使用。最大类间方差法的原理是:设图像有L个灰度级, 灰度值是i的像素数为ni, 则总的像素数是各灰度值出现的概率为Pi=ni/N, 其中。设以灰度t为门限, 将图像分割成两个区域:像素区域A即背景类的区域, 灰度级为0~t;像素区域B即目标类的区域, 灰度级为t+1~L-1。A和B出现的概率分别为:

A和B两类的灰度均值分别为:

图像总的灰度均值为:

因此可以得到A、B两区域的类间方差为:

上文中所提及的PA、PB、ωA、ωB、ω0、σ2均为关于灰度级t的函数。为了得到最优分割阈值, Otsu把两类的类间方差作为判别标准, 认为使得σ2值最大的t*为所求的最佳阈值:

因为方差是灰度分布均匀性的一种度量, 方差越大, 说明构成图像的两部分差别越大。

最大类间方差法在某种程度上改善了分割的效果, 但是它却增加了计算复杂度而且比较耗时, 所以在当前要求实时性高的情况下很难广泛应用。例如, 在高速公路自动收费系统中, 对定位出的车牌需要进行二值化, 这时不仅要求好的分割效果, 而且实时性要高, 此方法在这方面很难达到要求。因此, 人们还需要在实时性方面对这一方法加以研究改进。

3 实验与分析

本文中, 针对植物细胞图像和流感细胞图像, 分别采用迭代法和最大类间方差法选取阈值, 对图像进行了处理。图1为植物细胞和流感细胞的灰度图。图2为植物细胞和流感细胞迭代法阈值分割图。图3为植物细胞和流感细胞最大类间方差法的阈值分割图。

由单阈值分割图像程序可得到植物细胞图像的迭代法所得的阈值T=153, 最大类间方差法所得阈值t*=86;流感细胞图像的迭代法所得阈值T=86, 最大类间方差法所得阈值t*=86。对这两种方法在MATLAB中进行仿真, 得到分割后的图像清晰, 细胞及细胞外部结构都能明显呈现, 但是最大类间方差法的分割效果较迭代法优良, 分割的效果明显些。

4 结论与展望

本文在阈值分割部分, 针对最大类间方差法进行了详细的讨论, 并对两种方法分割后的图像进行了讨论比较。由实验可知, 背景和目标之间的类间方差对图像效果影响很大, 二者的类间方差越大, 构成图像的两部分的差别就越大。除此之外, 人们还提出了一系列的图像分割方法, 如一维最大熵图像分割、二维最大熵图像分割、基于小波变换的图像分割、模糊聚类、共生矩阵等。这些方法应用于不同的领域, 有他们各自的优点。相信随着人们探索的不断深入, 将会有更多、更好的方法涌现出来, 为科学研究以及人们的日常生活提供便利。

摘要:图像分割阈值法具有实现容易、计算量小、性能稳定等优点, 因此这种方法成为图像分割领域中应用最普遍的方法。主要讨论了关于图像的单阈值分割算法的设计与实现, 比较了基于迭代法和基于最大类间方差法的单阈值分割算法, 设计了阈值最大类间方差的分割算法及实现程序。仿真结果表明所提出的算法有效, 分割效果好。

关键词:图像分割,单阈值,灰度直方图,MATLAB语言

参考文献

[1]章毓晋.图像处理和分析[M].北京:清华大学出版社, 2001.

[2]刘直芳, 王运琼, 朱敏.数字图像处理与分析[M].北京:清华大学出版社, 2006.

[3]刘平, 图像分割阈值选取技术综述[J].计算机工程与应用, 2004 (12) :6-7.

[4]任红霞, 郭慧芬.有关复杂图像的多阈值分割法初探[J].濮阳职业技术学院学报, 2007 (5) :15-17.

[5]梁忠伟, 叶邦彦, 彭锐涛, 等.基于灰度直方图的数字图像多阈值分割技术研究[J].航空精密技术学报, 2001 (6) :22-24.

图像分割滤波 第7篇

高光谱遥感图像由于覆盖波段多,光谱分辨率高,可以进行精细的地物分类,近年来被应用在矿物勘测、精细农业、医学检验等民用领域和军事侦察、战场地图绘制等军事应用领域。由于高光谱数据维数高,当样本数量有限时,往往会出现分类精度随特征维数的上升而下降的所谓Hughes现象[1]。支持向量机(Support Vctor Machine,SVM)在解决小样本高维数据的分类问题上具有较好的性能,是目前应用最为广泛的高光谱图像分类方法[2],为了解决SVM的凸优化求解问题提出了最小二乘支持向量机(Least Square Support Vctor Machine,LSSVM)。但由于支持向量机和最小二乘支持向量机分类器都缺乏理论依据且受核函数选择、参数设置的影响较大,不足以满足实际的应用需要。近年来,随着稀疏表示分类(Sparse Representation Classification,SRC)在高光谱图像分类上的良好表现,人们开始研究高维数据的内在低维结构,通过对每一个像元稀疏表示来进行高光谱图像分类,不仅有效解决了维数灾难的问题,而且比支持向量机可以获得更好的分类精度[3]。低秩表示衍生于稀疏表示,与稀疏表示不同的是,低秩表示不再对单个像元进行稀疏,而是寻找一个所有样本点作为向量组的最低秩的表示,它更好地保持了数据的全局结构,并且对噪声和奇异点有更好的鲁棒性[4⁃5]。但以上这些方法都没有将高光谱图像的空间上下文信息融合到分类中,使得分类精度不能更好满足实际应用中的需求。

本文提出一种新的空谱信息分类方法,首先利用熵率超像素分割方法得到高光谱图像的分割图,然后利用分割图区域的内在低秩结构和区域同质性构建降维特征值方程求出投影矩阵,在分类过程中使用LSSVM对降维后的数据进行分类得到分类图,最后采用最大投票方法融合分割图和分类图得到最终分类结果。通过高光谱图像分类实验,结果表明本文提出的结合空谱信息的分类方法有效提高了高光谱图像的分类精度。

1 基于均值漂移的高光谱图像分割

本文先利用主成分分析[6](Principle Compenent Analysis,PCA)提取第一主成分高光谱图像,然后对图像中的每一个像素点求出均值漂移值,基于局部区域同质性的原因,同一个类别的像素点总近似收敛到一点,这样可以将高光谱图像分割成许多形状大小不同、一致性较好的闭合区域[7⁃8]。均值漂移向量的基本形式定义为:

式中:sR是半径为R的高维球区域,sR={x2-y2≤R2};k表示n个样本点有k个落入sR区域;x-xi为样本点xi相对于x的偏移量。向量mR(x)就是对落入区域sR中k个样本点相对于点x的偏移向量然后再平均,从直观上看如果样本点xi从一个概率密度中采样得到,非零的概率密度就会指向概率密度增加最大的方向,因此sR区域内的样本点更大可能地落在沿着概率梯度的方向。因此,对应的均值漂移向量mR(x)指向概率密度梯度的方向。均值漂移示意图和经过均值漂移的分割图如图1、图2所示。

均值漂移将高光谱图像分为大小不同的封闭图像块区域,可以将每一个图像块看作一个超像素,通过对超像素块中的像素点的光谱值求和作平均得到图像块之间的空谱信息

2 基于LSSVM的高光谱图像分类

2.1 构建降维目标函数

由上文均值漂移高光谱分割图可以得到不同形状大小的块区域,同一区域的像素是同一类的,设同一分割区域像素间的相似度为1,不同分割区域的相似度为0,以此来构造相似性矩阵Wij。利用图的拉普拉斯算子来描述数据的局部结构信息,为了使相邻的样本点在降维后依然保持[9]对不是同一区域的点,则不加约束,构造降维目标函数,最小化下列目标函数并变换成最小化拉普拉斯算子:

式中:V是降维映射矩阵,是由降维映射向量{v}nii=1组成;D是相似性矩阵W的度,即每行之和;L是拉普拉斯矩阵。

假设高维数据集X=[x1,x2,……,xn],每一个列向量都是一个样本点都可以用数据集X线性表示,低秩表示[3]的目标函数为:

式中:Z为高维数据集X的最低秩表示;D为一个线性张成数据空间的字典,可以将数据集作为字典;E为噪声向量;λ是平衡参数。所以可将低秩表示模型看作将高维数据矩阵分解为低秩矩阵和稀疏矩阵的形式。为了避免出现NP难问题,可以将式(3)化简为:

式中:‖·‖表示矩阵的核范数,即所有奇异值的和;‖·‖2,1为l2,1泛数。可以化为增广拉格朗日乘子求解问题,通过非精确拉格朗日乘子法求解低秩表示算法得出低秩表示系数矩阵Z。由于低秩表示能够更好地表示数据的全局信息,因此,用低秩表示对高光谱图像进行计算,得到低秩表示系数矩阵Z,基于低秩表示系数构造最小误差目标函数并化简为:

式中,{zi}ni=1是低秩表示系数。结合式(5)构造一个降维映射矩阵,最小化式(2)同时最大化式(5),即基于区域相似性低秩表示的维数约减算法目标函数可写为:

式中,X′是高光谱图像经过超像素分割之后得到的所有超像素的均值向量组成的新数据集。

式中:ve是第e个特征向量;λe为第e个特征值;d是降维后的维数。数据通过V=[v1,v2,……,vn]降维映射到低维空间中,经过降维后的数据,在结构上是稀疏的、低维的,可以真实反映出高光谱数据最本质的分类特征。

2.2 基于支持向量过采样的LSSVM分类

本文先利用数据的内在结构对高光谱数据进行降维,使得降维后的高维数据是低秩的、稀疏的、符合真实高光谱数据内在结构的低维高光谱数据。将原始高光谱图像进行投影,并且将降维后的高光谱图像分为标记训练集和无标记的测试集,然后利用LSSVM进行分类。但是传统的LSSVM分类器,由于为了解决SVM求解的凸优化问题而牺牲了原有支持向量的稀疏特性,使得在解决高光谱数据的多样本、不平衡分类问题时,出现少数类分类精度不高,或者与多数类分类精度差距很大。本文提出对LSSVM分类模型中的支持向量(Sup⁃port Vectors,SVs)过采样来提高少数类分类精度不高的问题。SVs采样主要有两个原因:

(1)只有少量的训练样本作为SVs且这些作为支持向量的样本一般都在判决边界上附近,对少样本类别的支持向量过采样可以减轻与多样本类别支持向量不均衡的问题;

(2)支持向量是最小二乘支持向量机分类模型在信息量最大最有代表性的样本,对其采样比对训练样本采样更节约训练成本。本文对SVs少的一边进行过采样来使得分类边界的SVs分布平衡。本文提出的对支持向量过采样技术为用数学语言可表达为:

式中:N+表示多数类的SVs;N-表示少数类的SVs;N-/(N++N-)∈(0,0.5)和α∈(0,1)是可调参量控制采样位置。首先计算出多核支持向量机中多数类支持向量个数N+和少数支持向量个数N-,然后代入式(8)计算出过采样后的少数支持向量个数,然后将过采样后的支持向量代入多核最小二乘支持向量机模型进行不平衡分类。本处理过程只是针对少数类与多数类训练的子分类器,其他的子分类器不做处理。LSSVM是基于统计学习理论的机器学习算法,采用结构风险最小化准则,根据有限训练样本建立二分类模型通过引入非线性函数和对偶理论后,LSSVM的最大间隔的分类超平面函数为:

约束条件:

式中α为拉格朗日乘子。用核函数替代非线性函数的点积,K(xi,xj)=φ(xi)·φ(xj)。在前文中已经算出空间信息Xw,混合核函数将空谱信息结合起来如下:

式中:Ks,Kw分别为光谱信息核函数,空间信息核函数;0<μ<1用来平衡两者的权重比例。最后得出最优分类函数,b为常数。

本文对降维后的数据采用一类对一类LSSVM分类,在每两类之间训练分类器,进行高光谱图像的多分类问题。本文方法的的流程图如图3所示。

与以往的空谱信息分类方法[10]不同,本文先对高光谱图像利用均值漂移算法分割,然后通过对降维后的高光谱数混合核LSSVM分类得到分类图,最后用最大投票方法融合分割图和分类图得到结合空谱信息的高光谱图像最终分类结果[11]。通过大小不均封闭的分割图和混合核LSSVM分类图融合可以保证同一区域内的像素点是属于同一个类的,如图4所示。

分割图示意图中同一颜色代表同一块区域,当然这些区域内会有奇异点;分类图示意图是代表块区域内基于像素的分类情况,本文利用最大投票融合分类图和分割图消除掉分类图中的奇异点,得到最终的分类结果。

3 实验结果与分析

本文试验一采用1992年AVIRIS采集的印第安纳州西北部的Indian Pines高光谱数据,此数据有220个波段,145×145个像素,去除用于噪声和水汽吸收的20个光谱波段(104~108,150~163和220),有16种地物覆盖类型。这些数据被大多数研究者使用,研究结果具有可比性。通过比较LSSVM分类结果、SRC分类结果、MS分割图和LSSVM分类图融合的分类结果、MS分割图和SRC分类图融合的分类结果以及本文方法的分类结果如图5所示,表1给出了各种方法的总体分类精度(OA)、平均分类精度(AA)、Kappa系数、各地物分类精度。

本文核函数采用径向基函数,参数主要包括惩罚系数C、高斯核参数σ。在分类时需要预先设置C的取值范围,设置为{10-4,10-3,…,102},σ的取值范围设置为{10-7,10-6,10-5,…,1,10,102},C值可通过训练样本的交叉验证获得,最优值为0.002,σ最优值为0.001。由表1可知,苜蓿、玉米略耕地、玉米、玉米未耕地、小麦、大豆略耕地的分类精度(不管是SVM还是SRC分类方法),在融合分割图后都有明显的提高,这也验证了融合分割图和分类图的可行性。本文方法通过对高光谱数据利用其本身的低维数据结构和区域同质性的特点进行降维,然后分类,更符合实际的数据特点。本文方法在分类精度上比MSSVM和MSSRC分类方法有进一步的提高,特别是大豆已耕地的分类精度达到了89.39%比MS+LSSVM的74.48%和MS+SRC的77.88%分别提高了14.91%和10.51%;混合土房的分类精度也比MS+LSSVM的66.94%和MS+SRC的73.21%分别提高了13.67%和7.40%;总体分类精度也达到了87.06%比MS+LSSVM的76.53%和MS+SRC的82.18%分别提高了10.53%和4.98%;Kappa系数为0.851 4。也达到了优良分类精度,高于MS+LSSVM的0.732 2和MS+SRC的0.796 7。

4 结语

本文结合空谱信息进行高光谱图像分类,提出一种基于图像分割和LSSVM分类器的高光谱分类方法。与传统的空谱信息分类方法不同的是本文提出的方法利用分割图提取空间信息,然后利用分割图的区域同质性和高维数据内在的低秩结构构建降维目标函数,得到低秩稀疏数据通过LSSVM进行分类,最后由最大投票融合原则对分割图和分类图进行融合得到最终的分类结果,并且考虑了少数类分类精度不高的问题,提出了对其支持向量过采样来解决不平衡的分类问题。实验结果表明,本文方法很大程度上提高了高光谱图像的总体分类精度。在后续的研究中可以在保持分类精度的基础上,减少分类复杂度。

注:本文通讯作者为晁拴社。

摘要:提出一种基于图像分割和LSSVM的高光谱图像分类方法,将空谱信息结合起来进行高光谱图像的分类。首先利用均值漂移算法对高光谱图像进行分割,然后对每一块分割区域数据进行降维并且对降维后的数据LSSVM分类,最后用最大投票方法融合分割图和分类得到最终的分类结果。该文分类方法先对分割后的区域求出相似性矩阵并训练新样本集求出低秩系数矩阵,由相似性矩阵和低秩系数矩阵构造特征值方程求解出降维矩阵,然后利用混合核LSSVM对降维后的数据进行分类。实验结果表明,提出的基于图像分割和LSSVM的高光谱图像分类方法有效提高了高光谱图像的分类精度。

关键词:高光谱图像分类,图像分割,LSSVM,数据降维

参考文献

[1]LANDGREBE D.Hyperspectral image data analysis[J].IEEEsignal processing magazine,2002,19(1):17-28.

[2]谭琨,杜培军.基于支持向量机的高光谱遥感图像分类[J].红外与毫米波学报,2008,27(2):123-128.

[3]SUN X,QU Q,NASRABADI N M,et al.Structured priors forsparse-representation-based hyperspectral image classification[J].IEEE geoscience and remote sensing letters,2014,11(7):1235-1239.

[4]宋相法,焦李成.基于稀疏表示及光谱信息的高光谱遥感图像分类[J].电子与信息学报,2012,34(2):268-272.

[5]HE Z,LIU L,DENG R,et al.Low-rank group in spired dic-tionary learning for hyperspectral image classification[J].Sig-nal processing,2016,120:209-221.

[6]Ro DARMEL C,SHAN J.Principal component analysis for hy-perspectral image classification[J].Surveying and land informa-tion science,2002,62(2):115-122.

[7]COMANICIU D,MEER P.Mean shift:A robust approach to-ward feature space analysis[J].IEEE transactions on patternanalysis and machine intelligence,2002,24(5):603-619.

[8]HUANG X,ZHANG L.An adaptive mean-shift analysis ap-proach for object extraction and classification from urban hyper-spectral imagery[J].IEEE transactions on geoscience and re-mote sensing,2008,46(12):4173-4185.

[9]KIM D H,FINKEL L H.Hyperspectral image processing usinglocally linear embedding[C]//Proceedings of 2003 First Inter-national IEEE EMBS Conference on Neural Engineering.[S.l.]:IEEE,2003:316-319.

[10]王立国,孙杰,肖倩.结合空-谱信息的高光谱图像分类方法[J].黑龙江大学自然科学学报,2011(6):788-791.

图像分割方法的比较研究 第8篇

近年来, 随着工业、农业、医学、军事等领域自动化和智能化需求的迅速发展, 对图像处理技术的要求也日益提高。其中, 对图像的自动识别与理解就是一项重要任务, 而对图像进行分割来提取目标是其关键步骤之一, 如果得不到合理的图像分割图, 也就无法对图像进行正确的识别与理解。在过去的四十多年里, 图像分割的研究一直受到人们高度的重视。迄今为止, 研究者提出了上千种不同类型的分割算法, 而且近年来每年都有上百篇相关研究成果发表。但是, 现有的方法多是为特定应用设计的, 有很大的针对性和局限性, 对图像分割的研究还缺乏一个统一的理论体系。Fu和Mui从细胞学图像处理的角度将图像分割技术分为三大类:特征阈值或聚类、边缘检测和区域提取。依据算法所使用的技术或针对的图像, Pal and Pal把图像分割算法分成了6类:阈值分割、像素分割、深度图像分割、彩色图像分割、边缘检测和基于模糊集的方法。本文将依据上述两种分类方法进行深入研究。

2 图象分割方法

简而言之, 图像分割 (Image Segmentation) 就是把图像中的物体与背景或物体与物体分割开, 实现不同区域的特殊处理。

2.1 基于阈值的分割方法

这类方法简单实用, 在过去的几十年间备受重视, 其分类也不一而足。根据使用的是图像的整体信息还是局部信息, 可以分为上下文相关方法和上下文无关方法;根据对全图使用统一阈值还是对不同区域使用不同阈值, 可以分为全局阈值方法和局部阈值方法;另外, 还可以分为单阈值方 (bileverthresholding) 和多阈值方法。

阈值分割的核心问题是如何选择合适的阈值。其中, 最简单和常用的方法是从图像的灰度直方图出发, 先得到各个灰度级的概率分布密度, 再依据某一准则选取一个或多个合适的阈值, 以确定每个像素点的归属。选择的准则不同, 得到的阈值化算法就不同。

下面就常见的几种阈值分割算法进行比较:

2.2 基于边缘的分割方法

这类方法主要基于图像灰度级的不连续性, 它通过检测不同均匀区域之间的边界来实现对图像的分割, 这与人的视觉过程有些相似。依据执行方式的不同, 这类方法通常又分为串行边缘检测技术和并行边缘检测技术。

串行边缘检测技术首先要检测出一个边缘起始点, 然后根据某种相似性准则寻找与前一点同类的边缘点, 这种确定后继相似点的方法称为跟踪。根据跟踪方法的不同, 这类方法又可分为轮廓跟踪、光栅跟踪和全向跟踪三种方法。全向跟踪可以克服由于跟踪的方向性可能造成的边界丢失, 但其搜索过程会付出更大的时间代价。串行边缘检测技术的优点在于可以得到连续的单像素边缘, 但是它的效果严重依赖于初始边缘点, 由不恰当的初始边缘点可能得到虚假边缘;较少的初始边缘点可能导致边缘漏检。

并行边缘检测技术通常借助空域微分算子, 通过其模板与图像卷积完成, 因而可以在各个像素上同时进行, 从而大大降低了时间复杂度。常见并行边缘检测方法有如下几种:Roberts算子, Laplacian算子, Sobel算子, Prewitt算子, Kirsh算子, LOG算子, Canny算子。

上述算法和其他边缘检测算法虽然在检测的准确性和边缘定位精度上有所差异, 但是他们都有一个共同的缺点:不能得到连续的单像素边缘, 而这对于分割来说是至关重要的。因此, 通常在进行上述边缘检测之后, 需要进行一些边缘修正的工作, 如边缘连通、去除毛刺和虚假边缘。常用的方法包括启发式连接、相位编组法和层次记号编组法等。与串行边缘检测算法一样, 边缘修正算法的代价也非常高。

2.3 基于区域的分割方法

基于区域的分割技术有两种基本形式:区域生长和分裂合并。前者是从单个像素出发, 逐渐合并以形成所需的分割结果。后者是从整个图像出发, 逐渐分裂或合并以形成所需要的分割结果。与阈值方法不同, 这类方法不但考虑了像素的相似性, 还考虑了空间上的邻接性, 因此可以有效消除孤立噪声的干扰, 具有很强的鲁棒性。而且, 无论是合并还是分裂, 都能够将分割深入到像素级, 因此可以保证较高的分割精度。

区域生长算法先对每个要分割的区域找一个种子像素作为生长的起点, 然后将种子像素邻域内与种子像素有相似性的像素合并到种子像素集合。如此往复, 直到再没有像素可以被合并, 一个区域就形成了。显然, 种子像素、生长准则和终止条件是算法的关键。然而, 种子点的选择并不容易, 有人试图通过边缘检测来确定种子点, 但是, 由于边缘检测算法本身的不足, 并不能避免遗漏重要的种子点。

分裂合并算法则是先从整个图像开始不断的分裂得到各个区域, 再将相邻的具有相似性的区域合并以得到分割结果。这种方法虽然没有选择种子点的麻烦, 但也有自身的不足:一方面, 分裂如果不能深达像素级就会降低分割精度;另一方面, 深达像素级的分裂会增加合并的工作量, 从而大大提高其时间复杂度。

2.4 基于统计模式分类的分割技术

模式可以定义为对图像中的目标或其它感兴趣部分的定量或结构化的描述, 图像分割可以被视为以像素为基元的模式分类过程, 这一过程主要包括两个步骤:特征提取和模式分类。阈值分割就相当于在一维 (灰度) 或二维 (共生矩阵) 特征空间进行的模式分类, 它所使用的特征并没有充分反映像素的空间信息和其邻域像素的相关信息。为了改善分割的效果, 我们自然的想到使用能够充分利用图像信息的高维特征来描述每一个像素。这类方法, 对于无法由灰度区分的复杂的纹理图像显得尤为有效。由于模式分类可以借鉴模式识别技术中的成熟算法, 所以这类分割技术的主要差别在于特征提取的方法。

3 图像分割领域存在的问题

实践证明, 图像分割问题的困难在于它既不属于完全的图像特征提取的问题, 又不属于完全的物体识别的问题, 其主要原因可归结如下:

(1) 在简单的情况下, 可以用图像中同一物体像素点的连通性和物体与背景的灰度差进行分割, 但在有噪声的影响下或物体互相遮挡的情况下, 连通性会被破坏;在复杂背景的情况下, 仅用灰度差也不能区别物体与背景, 而需要更复杂的灰度统计值。

(2) 不同物体所对应的图像区域特征在一般情况下应是该区域中局部特征的统计量 (例如灰度的均值、方差、相关性等) , 而统计量必须在己知区域边界的情况下才能计算。这样, 就陷入一个矛盾, 即要分割必须计算统计量, 要计算统计量又必须己知分割结果。

4 结论

在图像分割问题上, 至今还没有建立起完善的理论体系, 对众多的图像分割方法没有进行很好的归纳整理, 还有大量的工作亟需完成。与之同时, 将多种图像分割方法综合运用, 发挥各自的优势进行图像处理将成为这一领域的发展趋势。

摘要:在计算机视觉的相关研究中, 图像分割是连接低级视觉和高级视觉的桥梁和纽带, 而图像分割是计算机视觉系统中最关键和重要的一个环节。在概要介绍几种常用图像分割方法的基础上, 比较了每种图像分割算法的优缺点及其适应范围, 结果表明:不同工程应用中, 应根据其需求与图像特点合理采用不同的图像分割方法以达到更好的处理效果。

关键词:图象分割,图象处理

参考文献

[1]R.M.Haralick, L.G.Shaprio, “I mage segmentation tech-niques”, Computer Vision, Graphics, and I mage Processing, 1985, (29) :100-132.

[2]吴一全, 朱兆达.图像处理中阈值选取方法30年 (1962-1992) 的进展 (一) [J].数据采集与处理, 1993, (3) :193-201.

[3]赵荣椿, 迟耀斌, 朱重光.图像分割技术进展[J].中国体视学与图像分析, 1998, (2) :121-128.

[4]王爱民, 沈兰荪.图像分割研究综述[J].测控技术, 2000, 19, (5) :1-6.

上一篇:卫浴洁具下一篇:施工进度计划编制