叶片图像范文

2024-08-23

叶片图像范文(精选7篇)

叶片图像 第1篇

植物几乎围绕于一切人类活动中, 是人类赖以生存的坚实基础。首先, 人类所必需的氧气靠植物进行光合作用来供给。同时, 植物是最主要的食物和能源来源, 人类衣食住行中绝大多数是直接或间接来之与植物。据不完全统计, 全世界能食用的植物至少有75000种。

现如今, 随着人口膨胀, 生活污染物与工业废料大量排放、森林被长期过量砍伐, 严重破坏了植被的生存环境, 继而影响人类的正常活动。《中国珍稀濒危植物》首批公布的388种植物中, 濒危物种121种, 稀有物种110种, 渐危物种157种。植物灭绝随之而来的是粮食短缺、能源枯竭、生态失衡与环境恶化等一系列重大问题。因此, 人们意识到保护植物的多样性就是保护人类自己。近几年来, 专业人士展开了一系列有力措施对植物进行识别分类研究, 建立保存植物物种基因库与数据库, 以达到保护濒危植物, 维护植物物种多样性的目的。

植物分类与识别的一个方法是测量与观察植物器官上稳定的特征来分辨植物间的差异并进行分档归类。传统的植物鉴别方法由人工文字记录完成, 该方法工作效率低, 耗时耗力, 并且需要相当的经验技巧, 存在比较大的误差。在计算机技术高速发展的今天, 计算机图像处理技术为植物的分类与检索提供了一种可能的解决方案。尤其是自20世纪90年代起, 基于内容的图像检索 (CBIR) 技术蓬勃发展, 已经成为智能信息领域的热点。

2 基于内容的图像检索的植物分类与检索概述

基于内容的图形检索克服了以文字描述植物特征抽象、主观的难点, 直接从待检测的植物图像直观的视觉特征出发, 在图像数据库中查找相似的植物图像, 从而达到“以图搜图”的检索目的。

典型的基于内容的图像检索工作流程是系统对输入的图像进行训练, 分析图像集并分类统一建立模型, 然后依据各种图像模型提取图像特征存入特征数据库。接着采用相似度匹配算法计算待测图像特征与特征数据库中图像的相似度, 从而排列出一系列相似度从大到小的图像反馈给用户。

2.1 植物图像特征

常用的图像特征是根据本身的形状、颜色、纹理等低层视觉特征, 更高级的是联合基于图像抽象属性 (场景语义、行为语义以和情感语义) 的特征。植物一般的器官有根、叶、花、果实、种子, 可以提取这些器官的图像特征进行分类。但植物的花、根、果实等结构复杂, 特征提取困难。植物叶片由于是平面的二维结构, 特性稳定, 比较容易分析提取其图像特征。其中植物叶片的颜色特征受环境的影响比较大, 因此植物分类识别主要依据其叶片的形状特征与纹理特征。

形状特征是植物叶片图像最为直观的基本特征。一般情况下, 图像形状特征的描述分为基于边界和基于区域的两种方法。其中边界描述的思想是当一个叶片区域边界上的点确定时, 可以利用这些边界点来区分不同区域的形状。基于边界的描述方法主要有边界长度、边界直径、离心率、曲率、链码、多边形近似、标记图和傅里叶形状描述符等。而区域描述是描述构成区域内部所有像素的整体特性。简单的区域描述有区域的质心、区域面积、正交矩 (Zernike矩, Legendre矩, pseudo-Zernike矩) 、通用傅里叶描述符等。综合的基于全局特性的描述包括狭长度、偏心率、圆形度、球状性和基于内角的特征向量等。

描述纹理的方法可以分为三类:结构法、统计法和频域法。常用的纹理描述的统计方法有灰度差分统计法、灰度共生矩阵法、等灰度行程长度法和纹理谱法等。Tamura[5]等人还基于人类对纹理视觉感知的研究, 提出了6个基础性纹理属性, 分别是粗糙度、对比度、方向度、线性度、规则度和粗略度。常用的描述纹理结构方法有纹理基元参数法和文法等。常用的描述纹理的频谱方法有傅里叶变换法、小波变换法、Gabor函数滤波法等。

2.2 植物叶片图像相似度度量

相似度度量是用于衡量同种类样本的类似程度和不同种类样本的差异程度。图像特征描述子大都可以表示成特征向量的形式。可以把图像特征看似空间上的点, 那么点与点之间的联系与其在空间的接近程度相关。点在空间的接近程度则转换为点间的距离来度量。常用的相似度度量方式欧几里德距离、街坊距离、角度相似性函数等。其中欧几里德距离是最简单的距离公式, 在基于内容的图像搜索中应用比较较广泛。欧几里德距离越小, 表示样本之间越相似。

3 基于内容的植物叶片检索国内外研究现状

尽管基于内容的图像检索是一种新的图像检索技术, 代表了其核心技术还不是很成熟。但是, 近年来, 国内外业界人士纷纷投入了大量的人力、物力探索基于内容的植物图像分类与检索的方法, 取得了一定的成果。

在理论研究方面, 早在2000年, Z.Wang等提供了一个高效分两阶段的叶片图像检索方法, 它是运用轮廓质心距离曲线 (CCD) , 偏心距和角度直方图 (ACH) 轮廓这些简单的图像形状特征来描述的。用该方法对140种植物的1 400片叶片图像进行了测试, 对比曲率尺度空间 (CSS) 和修改后的傅立叶描述符 (MFD) 搜索结果, 大大降低了计算复杂度。Ji Xiang Du等依据叶片的形态特征提出一种基于移动中位数中心 (MMC) 的超球分类法, 该方法分类精确, 不仅能节约存储空间而且分类时间复杂度小。George Gagaudakis等尝试结合基于内容的图像形状中一系列新老的描述方法, 根据检索结果分析, 找到既省时省力又高效的检索方法。Mohammad Reza Daliri等采纳相邻近似趋进的方法, 提出了一种鲁棒性良好的用于识别与检索的图形形状的特征描述子。用该方法对包含15类树叶的瑞士叶片数据库进行训练, 识别准确率非常高。Xiao Feng Wang等解决了复杂背景下的植物叶片图像的分类, 把自动标记分水岭预分割算法与形态学特征形结合, 然后利用MCH分类器提取高维特征。实验成功归类出20种现实植物叶子, 平均分类率高达92.6%。

在应用研究方面, Dong-Ho Lee等设计了一个基于内容的图像形状检索系统。该系统采用边缘检测与波形变换提取图像特征, 提供了一个处理超球面的检索算法, 促进了检索速率。Zeng Chen[等用支持向量机和决策树组成了新的能自动图像标记的方法。该算法能把目标图像信息转换成文字信息, 因此这个系统能够同时根据查询图像与关键字来进行图像检索。实验结果显示该系统算法标记与检索图像的能力比传统的学习算法更优越。Yunyoung Nam等的系统检索方法运用了植物叶片的形状和叶脉特征, 提出了一种自适应网格匹配算法。结果显示, 该方法图像检索的召回率比CCD、CSSD、MPP方法都要高。

4 总结与展望

基于内容的植物叶片图像检索技术, 其涉及了视觉、图形处理、信息检索、人工智能等各个领域的专业技术, 是一个热门的有前景的研究方向, 该技术的深入发展也大大提高了植物的分类识别速度和正确率。依据上述业界比较成熟的研究者陈述, 他们采用的数据集、搜索方法、检验方法多不相同, 难以比较不同算法检索图形的性能优劣和鲁棒性。除此之外, 自然环境下的植物叶片构成复杂, 在实验设计过程中要涉及对图像进行预处理, 如叠加叶片的选取、叶片填洞处理、叶柄的去除、噪声滤波等等。总之, 如何提高植物叶片检索能力, 使其具有高的实际意义和应用价值还有很长的路要走, 也是今后业界探索研究努力的方向之一。

摘要:本文就保护植物的实际意义出发, 介绍了以CBIR技术为中心的植物分类与检索方法, 它具有长远的应用意义。简要概述了基于内容的图像检索的关键步骤, 着重阐述了基于内容的植物叶片检索国内外研究现状, 对其发展趋势做出了展望。

关键词:植物,基于图像,检索

参考文献

[[1]扬州大学网.谈植物与人类的关系[z].[EB/OL].http://www.yuanlin8.com/zonghe/lunwen/2784_1.html, 2010, 04, 29

[2]郝日明, 黄致远等.中国珍稀濒危保护植物在江苏省的自然分布及其特点[J].生物多样性, 2000, 05, 8 (2) :154-162.

[3]唐立军, 段丽娟.基于内容的图像检索系统[D].计算机应用研究, 2001, 18 (7) :41-45

[4]李聪, 基于区域综合特征的图像检索[D], 西北师范大学, 2009, 05

[5]Tamura H, Mori S, Yamawaki T.Texture features corresponding to visual perception[J].IEEESMC, 1978, 8 (6) :460-473

叶片图像 第2篇

摘要:本文研究针叶植物数字图像自动识别分类的方法。根据针叶植物不同科(松、杉、柏科)和种叶片/叶小枝的形状特征差异设计了15个特征描述符,以适量样本检验这些描述符以及它们组合使用对于划分针叶植物科和种的有效性,并对这种有效性做评估和排序。实验表明,凹陷密度,凸包欧拉数、凸包面积与同参数三角形面积相对差等,对辨别松科植物有效;叶图斑长宽比、凸残差面积方差、凹陷密度、凹陷平均短长轴比等对划分杉、柏科植物有效。通过这些描述符,可以将至少34种针叶植物分为松、杉、柏3个科和17个种。用这些描述符组合对针叶植物科分类的精度大于80%;由科划分种的精度相对较低,划分松、杉、柏科植物到几个范例种的精度分别为:64.0%、54.3%、40.1%。

关键词:针叶植物;图像分类;形状;数学形态学;特征频数

基金项目:国家自然科学基金项目(41071275)资助

中图分类号: TP391.41 文献标识码: A DOI编号: 10.14025/j.cnki.jlny.2016.06.020

植物数字图像自动分类是植物分类学领域备受关注的新技术“基于内容的图像检索”(Content-Based Image Retrieval, CBIR)是该技术的代表之一,通过把用于植物图像的CBIR软件植入手机等智能移动设备,有可能在野外对植物进行实时分类。已经出现了少量移动设备版植物图像分类/检索软件,如Nam等2005年开发的“三叶草”系统,可以根据植物叶轮廓图检索植物类;Belhumeur等2008年研发的改进型系统,可以查询植物图像与在线植物样本的相似性等。但由于专家知识植入图像自动分类/检索系统比较困难,这类软件目前能够正确辨识的植物种类比较有限,其他类似的CBIR系统还在不断完善中。

据检索,植物图像分类的研究主要集中于阔叶类植物。阔叶植物的属种远比针叶植物的丰富,这可能是它吸引较多关注的原因。另一方面,植物图像分类主要依靠植物叶特征,阔叶类植物的叶特征(包括叶形、叶缘、叶脉等)远比针叶植物的丰富,不同属种之间的特征差异比较显著和易于提取,使得阔叶植物先于针叶植物在图像分类领域取得了较大进展。例如基于叶片形状、基于叶脉和叶缘信息的植物图像分类。

与阔叶植物相比,针叶植物种属间的特征差异不够分明。根据Science Director、Springer Link Journals、中国知网等中外期刊论文数据库的检索,尚未检出针叶植物叶片/叶小枝数字图像自动分类方面的研究文献。本文主要根据松、杉、柏科植物叶片/叶小枝的形状特征差异,设计特征描述符;并以图像分类/分割方法检验这些描述符以及它们的组合,对于辨识不同科和种的针叶植物图像有效。

1 实验数据

研究中使用的植物叶图像样本来自野外自采集和中国植物图像库。野外自采集区域为上海市区和浙江天目山地區,采样设备为普通单反变焦数码相机。自采样本约占总样本数的90%。野外共采集样本近340个,包括了上海市绿地和天目山地区典型的针叶树种。表1列出了实验样本属种和数量。在描述符测试中随机选择其中180个样本构成训练集,其余160个为预留的测试样本。

2 方法

2.1 概述

本文的研究对象为松、杉、柏科植物,由于南洋杉科植物在上海绿化地很少见,仅采集到“智力南洋杉”和“大叶南洋杉”两种,故合并到杉科中。依据松、杉、柏科多种植物叶的表观特征和图像特征,设计了能够将三者及其具体种分开的图像特征描述符。它们中的大多数依据形态测量学设计,能够定量描述叶形特征;还有一小部分根据特征频数统计值设计,如邻域暗细节密度等,用于描述叶片/叶小枝凹陷的密度。通过在这些描述符组合的特征空间里做图像监督分类,可以评估各描述符及其组合的有效性。工作流程见图1。

2.2 针叶图像预处理

针叶植物叶图像预处理的有效算法包括平滑化、维纳滤波、锐化、大津法阈值计算和二值化、形态学开启和闭合、凸(凹)噪声面积过滤、Gaussian滤波和边缘检测等。实验表明,对针叶植物叶图像有效的预处理包括:降噪,去毛刺,闭合裂隙、填补凹陷等,它们能给出比较完整的叶片二值图,以便特征提取和描述符值计算。图2以雪松为例说明该过程。

2.3 描述符设计

形状是叶片图斑的主要特征。常用的形状特征包括图斑面积、图斑的短长轴比、凸包面积、凸残差特征、形状系数、边缘密度、分维等。针叶植物叶形通常具有如下特征:松叶形简单,针状,常2针、3针或5针一束,叶节点无分叉;柏枝叶复杂,分支明显,单叶小而呈鳞片状(或鳞叶、针叶混生);杉多为线形叶等。可以用凸包或凸残差、几何形状、细节频数等描述这些特征,设计出适用的描述符。表2给出部分经实验证明有效的描述符,所有描述符都归一化到值域[0, 1]。

2.4 描述符测试和精度评估

图3和表3~6给出以决策树(DT)评估描述符组合分类精度的实例。如针叶科分类时,随机选择8个描述符构成初始特征向量,训练样本数为180,其中松、杉、柏科植物样本分别为55、61、64。训练中DT自动选择对样本适应性较好的5个描述符构成决策树t(图3);随后以t对测试集图像分类,并以混淆矩阵评估分类精度。

3 描述符的设计依据

表2中的描述符设计基于叶图斑的某些图像特征,例如凸残差、图斑凹陷、图斑面积对称性、图斑密度对称性、图斑几何图形轴对称性、图斑与同参数几何图形的相似性等。下面分别展开讨论。

3.1 凸残差

凸包(convex)是将图斑边界的凸顶点连线形成的外多边形。用凸包减去原图斑得到凸残差(convex deficiency)。实验表明,根据凸包和凸残差设计的描述符对于表征针叶植物叶轮廓形状和叶小枝的分布规律、密度和复杂程度等有效。基于凸残差的描述符有:(见表2)。图4以侧柏、墨西哥落羽杉、白皮松为例,显示这类描述符参变量的提取方法。表7为基于凸残差描述符的分割阈值范例。

(a),(d)分别为龙柏和水杉叶小枝二值图,真元素个数即叶小枝图斑面积;(b),(e)为暗细节二值图,SE均为3×3菱形;(c),(f)为凹陷尺寸大于阈值的图斑,可以通过测量其中面积较大的主凹陷的密度、短长轴比、形状系数等,获得有参考价值的分类特征。由图可见,龙柏的暗细节尺寸较小、细节短、分布密度(单位面积细节个数)较大;而水杉的暗细节尺寸较大、细节狭长、分布密度较小。

3.2 圖斑凹陷

暗细节是叶图像上尺寸较小的暗调元素或叶图斑的孔洞(凹陷),可以通过形态学“低帽变换”提取。它是用闭合操作消除比结构元素(SE)尺寸小的暗细节,获得背景估计b;然后从b中减去原图像I就能获得暗细节集da。

3.3 叶图斑对称性

叶图斑对称性通常以叶小枝某些统计值的上下对称性表述。可用的统计值包括面积、密度和几何图形轴长等。面积和密度的统计对象主要为叶图斑、凸包、凸残差等的二值图。表达式的主要形式为差比值,比如 (见表2)。几何图形轴对称性利用了与叶图斑有关的几种几何图形,如外接矩形、内接圆等。

3.4 图斑与同参数几何图形的相似性

典型的松、杉、柏叶小枝的外轮廓与某些几何图形接近,比如松与三角形、杉与矩形/椭圆、柏与扇形/椭圆相像。利用叶图斑凸包二值图与同参数(高/长轴、宽/短轴等)的几何图形面积的差比值,表征叶图斑凸包接近这些几何形状的程度,可能用于划分不同科的针叶植物,表9列出部分基于图斑对称性的描述符的性能和范例阈值。这些描述符包括(见表2)。

4 结论

本文研究针叶植物叶片或叶小枝图像按科和种分类的方法,设计了14个新的描述符,并评估了各自和组合使用的有效性。上述实验和统计分析支持如下结论:(1)基于凸残差、图斑凹陷、图斑对称性和图斑与同参数几何图形相似性设计的描述符对于识别针叶植物科和部分种有效。(2)适当数量和不同功能的描述符组合,有助于改善分类精度。(3)用这些描述符组合对针叶植物科分类的精度大于80%;由科划分种的精度相对较低,划分松、杉、柏科植物到几个范例种的精度分别为:64.0%、54.3%、40.1%。由本实验还可以看出,要划分更多的属种还有待进一步增加植物样本,并继续深入描述符和分类空间设计等方面的研究。本文的分类方法主要依据的是植物外形特征,而未严格遵守植物学分类规则,比如中国植物志中将日本冷杉划分为松科,而本文根据其形状特征将其划分到杉中,这一点望读者理解。

参考文献

[1]Geng SL (耿生玲). Tian F (田芳). The principle and realization of picture sharpening and smoothing[J]. Journal of Qinghai Normal University(Natural Science) (青海师范大学学报(自然科学版), 2003(03):62-65

[2]Zhu J (朱静),Tian XJ (田兴军),Chen B (陈彬) et al. Computer Recognition System of Plant Leaf-shape[J]. Chinese Bulletin of Botany (植物学通报), 2005,22(05):599-604

作者简介:田超,华东师范大学地理科学学院,在读硕士,研究方向:遥感图像分析与空间数据挖掘。

通讯作者:周坚华,硕士,华东师范大学地理信息科学教育部重点实验室,副教授,研究方向:城市与生态遥感。

网络出版时间:2016-3-10 17:07:45

叶片图像 第3篇

植物作为生态系统中最重要且基础的生产者,通过光合作用,植物调节空气中的碳氧比例,促进水及能量的循环流动,同时为人类提供了丰富的食物来源。植物为人类的生存与发展提供了广阔空间,为人类的生产生活提供了重要且丰富的物质基础。

面对日益增多的濒危物种,对物种保护工作的要求日益紧迫,植物分类研究是植物保护的一个重要方面。基于图像的描述方法弥补了传统的人工识别方法的不足,提高了植物识别工作的效率和准确性。快速、准确的识别方法对濒临植物物种的识别具有积极的作用,给植物保护工作带来了极大的便利。

1.1 常规图像压缩方法

JPEG(Joint Picture Expert Group)是国际标准化组织(ISO)和CCITT联合制定的静态图象的压缩编码标准。和相同图象质量的其它常用文件格式(如GIF,TIFF,PCX)相比,JPEG是目前静态图像中压缩比最高的。

JPEG专家组开发了两种压缩算法、两种熵编码方法、四种编码解码方法。在实际静态图片压缩应用中,常使用的是有损的离散余弦变换(DCT)编码方法、Huffman编码和基于DCT的顺序编码方式,这一流程也称JPEG的基本方式。

1.2 压缩原理(灰度、彩色)

1.2.1 颜色模式转换和采样

对于BMP图像,要将RGB颜色空间转换为YCb Cr颜色空间(又称YUV颜色空间)。

其中人眼对亮度变换的敏感度远大于对颜色变换的敏感度,所以原本为Y:U:V=4:4:4的数据能够以Y:U:V=4:1:1或Y:U:V=4:2:2简化表示,前者称YUV411,后者称YUV422。

1.2.2 分块

由于DCT处理的是8×8的小块,在DCT处理前将图像分割成小块。图像中每点的信息由3个数据组成,将3个信息一次分离存放到3张表中。编码时,程序从源数据中依次读取和处理一个8×8的信息,然后是下一个。

若原始图像的长宽不是8的倍数,不能恰好分成8×8的小块,则补齐数据进行处理。

1.2.3 离散余弦变换(DCT)

DCT是码率压缩中常用的一种变换编码方法,它同傅里叶变换一样具有明确的物理意义,而数据量只有一半。对于渐变像素的图像,由于DCT使用的是半周期的基函数,变换效果反而好于。JPEG编码过程进行的是正向离散余弦变换,解码过程进行的是反向离散余弦变换。

正向离散余弦变换计算公式:

反向离散余弦变换计算公式:

这里的N是水平、垂直方向的像素数目,一般取值为8。经过DCT变换后得到8×8变换系数矩阵,有具体的物理意义。如,U=0,V=0时的F(0,0)是原来的64个数据的均值,称为直流分量(DC系数);其他63个系数代表了水平空间频率和垂直空间频率分量的大小,多半是一些接近于0的正负浮点数,称为高频分量(AC系数)。变换后的系数矩阵中,低频分量集中在矩阵的左上角,高频分量则集中在右下角,这体现了DCT能量集中的特点。

1.3 图像压缩指标

数据压缩方法的优劣主要有所能达到的压缩倍数、从压缩后的数据所能恢复(或称重建)的图像质量以及压缩和解压缩的速度等几方面来评价。此外,算法的复杂性和延时性也是应当考虑的因素。

1.3.1 图像质量评估

图像质量评估包括主观评估和客观评估

主观评估是由若干人对所观测的重建图像的质量按很好、好、尚可、不好、坏五个等级评分,然后计算出平均分数MOS[2]。

客观评估通常使用信噪比SNR来评价,其计算方法是

σ2、σe2分别是输入、输出图像的均方差。

1.3.2 JPEG压缩方法总结

采用JPEG标准可以得到不同压缩比的图像,在使图像质量得到保证的情况下,可以将每个像素24bit压缩到每个像素1bit。这一标准在速率上虽然效果很好,但在低比特速率的情况下,重构图像存在着严重的方块效应,不能很好地适应网络传输图像的要求。

2 从分形理论到分形图形学

2.1 分形理论

1967年,Mandelbrot在《科学》杂志上发表了题为《英国的海岸线有多长?统计自相似和分数维度》(How Long Is the Coast of Britain?Statistical Self-Similarity and Fractional Dimen⁃sion)的著名论文。海岸线作为曲线,其特征是极不规则、极不光滑的,呈现极其蜿蜒复杂的变化。我们不能从形状和结构上区分这部分海岸与那部分海岸有什么本质的不同,这种几乎同样程度的不规则性和复杂性,说明海岸线在形貌上是自相似的,也就是局部形态和整体态的相似。

2.2 用分形解决叶片模拟问题

根据叶片模拟的实现方法,可以将叶片图像的压缩视作模拟的逆过程,其中主要需要解决的问题是,如何高效率的寻找到”基本元”。或者说,作为一个逆问题,给出一幅图像,能不能找到一个混沌系统,使得已知的图像成为该混沌系统的吸引子?[3]

2.3 迭代函数系统

迭代函数系统(Iterated Function System,IFS)提出了利用分形进行图像压缩的理论方法。IFS将待生成的图像看成是由许多与整体自相似的或经过一定变换与整体相似的(自仿射)小块拼贴而成。自相似性通过相似变换来实现,自放射性通过仿射变换来实现。

相似变换是指在各个方向上变换的比率必须相同的一种比例变换,仿射变换是指在不同的方向上变化的比率可以不同的一种比例变换。

2.4 分形算法(sierpinski垫片)和原理

分形算法的典型例子是sierpinski垫片,sierpinski垫片可以看成是三角形△ABC被均分成4部分,然后将中间的三角形扣去,对其余三个小三角形重复操作。

2.5 分形算法流程:

①生成随机数R,并使R的值在0与1之间;

②分配ω1,ω2,ω3,3个放射变换的概率空间平均分布于[0,1];

③判断随机数落入哪一个概率空间,并调用相应的仿射变换所具有的的IFS码值,赋给相应的参数ai,bi,ci,di,ei,fi;

④根据放射变换的关系式,计算变换后的x',y'的值;

⑤在(x',y')处画一点;

⑥循环执行以上步骤,将上次计算变换后的值作为下一次的原位置值;

2.6 不同的IFS码值产生不同的分形图

采用相同的放射变换的规则,但使用不同的放射变换系数会产生不同的图像结果。以前述sierpinski垫片为例,当第三个仿射变换的表达式系数依次为0.5,0,0.5时,会得到直角形的sierpinski垫片。

2.7 一般图像的吸引子

分形算法在自相似图像的模拟、压缩和还原中的应用原理十分便捷,而简单的IFS系统只适合于具有高度自相似性的图像。但一幅一般的灰度图像(甚至彩色图像)需要的是更复杂的系统构造。

3 分形叶的递归算法

3.1 基本元及原理

在叶片模拟中,可以以如图1的基本元为基本单位,利用递归算法不断进行迭代重画。

①设A点坐标为(x,y),B点坐标为(x0,y0),C点坐标为(x1,y1),D点坐标为(x2,y2),L为树干的长度,α为枝干主干的夹角。

②绘制主干AB,即(x,y)-(x0,y0)直线。

计算点坐标,

④计算D点坐标,

⑤将步骤②中x0→x,y0→y,x1→x0,y1→y0,再绘制(x,y)-(x0,y0)直线,即画分枝BC。

⑥将步骤②中x0→x,y0→y,x2→x0,y2→y0,再绘制(x,y)-(x0,y0)直线,即画分枝BD。

⑦重复执行步骤③~⑤,直至完成递归次数。

另外,改变构成分形叶的基本元的组成,也会影响最后的模拟效果。比如将基本元改成如图时构成的分形叶片很贴近自然树叶的形态。

3.3 灰度叶片图像的算法

对sierpinski垫片进行压缩,仅需要存储3个仿射变换。实际图像上,这样“简洁”的图像比较少,仅通过几个压缩仿射变换就能够将自身变换到局部,但经验表明,实际图像中也存在局部的块与块的相似性。

3.4 实现思想和流程

仿照普通图像压缩的方法,分形图像压缩的主要流程为:

①叶片特征参数提取:原图进行灰度处理,使亮度信息更明显;

②通过几何变换进行初步处理并记录几何变换信息。对图像进行平移、缩放、旋转(根据灰度图像的仿射变换,一般选择0°,90°,180°,270°旋转和垂直中线反射、水平中先反射以及对角反射)等操作,将叶片图像调整至合适的状态;

对比度和亮度信息可以利用最小二乘法得出。将原图像定义域块经过旋转反射和伸缩变换后的像素值与分割值域块的像素值按下式计算,最佳的对比度s和亮度o应使得R值最小。

③提取整体和局部具有自相似性的基本元(交叉线),确定位置和长度信息;

④判断各部分基本元落入哪个子块,并按相应的仿射变换所具有的的IFS码值,赋给必要的参数ai,bi,ci等;

⑤根据仿射变换的关系式,计算子块各个基本元所在位置的x',y'的值;

⑥将①②中的亮度、几何变换信息、④中的IFS码值进行编码。

4 拓展

4.1 分形图像压缩待解决的问题

分形图像压缩是有失真的,失真量大小与压缩比密切有相,尽管分形图像压缩有巨大的潜力,但要把这种潜力释放出来,还有许多问题有待进一步的研究,主要表面在:普遍性问题。对于一定的整体与局部存在明显相似性或仿射性的分形图像类,分形图像压缩方法的压缩比极高,但难以期望在很低的失真条件下,对一切分形图像压缩都具有极高的压缩比,只能在压缩比与失真度之间加以平衡。

4.2 图像着色和彩色图像压缩

灰度图像与彩色图像相比,其细节存在许多差异,若将分形图像压缩方法应用于彩色图像,需要增加图像着色和还原的步骤。

自然界中,叶子之间存在颜色差异和互相遮挡,这表现为从树冠部分向下具有渐变的层次感。可以向IFS中引入概率集,用以控制落入相应拼贴子块的绿色点的数目。同时,添加随机干扰色彩,模糊色块之间的边界,使其呈现更好的颜色过渡。

摘要:植物叶片作为植物的重要特征,其图像的采集和传输具有重要意义。目前,图像压缩方法已有近百种,但压缩效果、压缩比及编码解码速度还不能满足叶片标本采录的特定要求。本文提出了基于分形理论的一种灰度叶片图像压缩的算法理论。利用叶片图像本身独特的几何特性对图像压缩方法进行改进,以求获得一种高压缩比,高分辨率的方法。

关键词:分形理论,叶片,图像压缩,拼贴理论,迭代函数

参考文献

[1]姚宇飞.基于分形维数的叶片识别方法研究[D].北京:北京林业大学,2011.

[2]滕姿.基于分形的图像压缩研究[D].西南大学,2008.

[3]曾曲文,文有为,孙炜.分形、小波与图像压缩[M].沈阳:东北大学出版社,2002(10):97-98;105-109.

[4]孙博文.分形算法与程序设计:Visual C++实现[M].北京:科学出版社,2004(11):52-54.

叶片图像 第4篇

关键词:锦橙叶片,数字图像处理,色彩参数,SPAD值

0 引言

遥感技术具有快速、覆盖面积大、价格低廉、无接触和无损伤的特点,这为作物生长期间大范围作物生长、营养状况及病虫害监控提供了可能。一些研究者应用可见光遥感技术和数字图像处理软件监测作物生长状况,取得了明显的进展[1],但遥感监测对环境条件要求较高,对于四川盆地、长江沿岸等多云雾、高空气湿度地区,理想遥感信息获取具有诸多困难,因而农田图像信息获取和图像处理技术应运而生。国内贾良良[2]应用数字图像技术与土壤植株测试方法对冬小麦氮素营养进行了诊断技术研究,并获得了较好的效果;李存军等[4]利用数字照片特征对小麦覆盖度自动提取技术进行了研究,开发出一个对影像进行自动分类提取小麦覆盖度的程序包;国外Lukin等[5]应用数码相机获取田间小麦冠层影像,并通过图像处理技术获取小麦冠层覆盖度和冠层生物量。

作物叶片叶绿素含量与光合速率营养状况等的关系密切[6],是判别作物营养水平和生长发育潜力的重要指标。目前,关于叶绿素含量测定方法主要有分光光度法和SPAD叶绿素仪法,其中分光光度法具有破坏植株和组织、分析过程复杂和实时性差等缺点,而SPAD叶绿素仪测定法虽具有较高的精度,但一次只能测定叶片的很小一部分,需进行多点的测试,而不同部位的测定值相差甚大,因而在大面积应用上费时费力,且时效性、便捷性和精度不足。研究低成本、机动性强、分辨率高和受环境影响小的非损伤实时叶绿素含量检测技术成为迫切需要,为以数码照片为基础的作物图像分析技术的发展创造了条件。

本文采用普通数码相机作为信息采集器,以计算机视觉识别平台作为图像信息处理软件,结合相关统计分析软件处理,分析和建立了基于计算机视觉的锦橙叶片叶绿素含量检测指标和叶绿素含量预测模型,以期为柑桔营养状况监测提供一种快速可靠的非损伤技术方法。

1 材料与方法

1.1 试验材料

试验材料选用盆栽单系枳(Ponciroustrifoliata.)砧蓬安100号锦橙(Citrussinensis(L)cv.Peng'an 100Jingchenorang)嫁接苗。苗木于2007年9月嫁接,2008年4月5日将接芽刚开始萌发生长的嫁接苗定植于直径为20cm×高45cm的圆柱体盆钵(装土66kg/钵)中,每钵1株。盆栽土壤为沙土,pH值为8.04,全氮为8.5g/kg(N计),全磷为0.4g/kg(P2O5计),全钾为62.8g/kg(K2O计),有机质为15.4g/kg。

1.2 数码照片获取与处理

2009年7月27日中午12:00-14:00时,采集蓬安100号锦橙春梢叶片5片/株,共95株(组)叶片样品(此试材前期进行过不同氮用量施肥试验)。洗净擦干每一叶片,从95组试验样本中随机抽取48组叶片数据用于模型构建(建模集),剩余的47组叶片数据用于模型检验(检验集)。将所有试验样本放在无直射阳光条件下,立即用SONY DSC-H 50数码相机(910万像素)采集叶片样品的完整图像。数码相机用相机脚架垂直固定,镜头垂直向下,镜头离目标物体距离为20cm左右。关闭相机闪光灯,在近拍模式、3456×2592图像分辨率条件下进行拍摄。对获得的数码照片以JPEG格式传入计算机,利用AdobePhotoshopCS3软件获取图像的R,G,B及灰度值。

每张叶片样品拍照后立即用日本MINOLTA公司SPAD-502型叶绿素计测定叶绿素含量。每张叶片测定5个部位的SPAD值,取平均值作为该叶片的测定值,其中建模集样品SPAD值范围为18.9~73.8(58.41±11.73),检验集样品SPAD值范围为29.6~72.3(58.65±12.33)。

1.3 颜色特征参数

在图像处理中,常用RGB等彩色系统进行颜色分析。该系统具有对光源变化不敏感、不同颜色易于区分的特点。R,G,B分别表示彩色数字图像中红、绿、蓝3种基色的亮度值,通过分别改变3基色的亮度值可混合出各种颜色。色度系统中常用R,G,B的比例值r,g,b表示色度坐标,且r+g+b=1,r=R/(R+G+B),g=G/(R+G+B),b=B/(R+G+B)。由于r,g,b参数是归一化了的R,G,B,通常认为是消除不同环境条件下光强等差异所造成误差的颜色分量,因此利用归一化直方图的统计特征可以表现出相应的颜色特征参数。本试验对采集的图像信息中的R,G,B值进行了归一化处理,对获得的r,g,b色度坐标值进行了与叶片叶绿素含量的相关性分析。

1.4 模型构建

数据统计分析采用excel,SPSSV 13.0和SigmaPlot9.0软件,处理间的差异显著性采用Duncan'sT-test。分析图像中色度提取、数学变换及归一化处理后的颜色特征参数,并分别分析其与蓬安100号锦橙叶片叶绿素含量的相关性选择相关性高的颜色特征参数,进一步建立锦橙叶片叶绿素含量计算机视觉分析模型。

2 结果与讨论

2.1 锦橙叶片图像色彩参数与叶绿素含量相关性

对95组试验样本利用Photoshop图像分析处理,提取蓬安100号锦橙叶片每张图像的R,G,B均值,对R,G,B进行各种形式的变换,以此作为图像的颜色特征信息。同时,从中随机抽取48组样本的颜色特征信息,分析其颜色特征参数与蓬安100号锦橙叶片SPAD值之间的相关性(见表1所示)。结果表明:颜色特征信息R,G,B,G/R,G/B,R/B,R/(G+B),B/(G+R),r,b,G-R,G-B,B-R,(G-R)/(G+R),(G-B)/(G+B)、(B-R)/(B+R),r-g,r-b,g-b及灰度值达到了极显著相关关系。其中,颜色特征参数R,R/B,R/(G+B),B/(G+R),B/(R+G+B),G-B,B-R,(B-R)/(B+R),r-b与蓬安100号锦橙叶片SPAD值之间的相关系数在0.85以上,而且颜色特征参数R/(G+B),r,B-R与SPAD值相关性最好,相关系数(决定系数)分别为-0.912**(0.832),-0.910**(0.828)和0.916**(0.838)(见图1所示)。对颜色参数R,G,B值进行变换后,除G/(R+B)和g与SPAD值相关性比原三基色R,G,B有所降低之外,其余颜色特征参数与SPAD值的相关性均有所提高。

*和**分别表示显著性检验P<0.05与P<0.01。

R,G,B的色度坐标值r,g,b,与蓬安100号锦橙叶片SPAD值的相关性分析表明,归一化后的r,g,b的相关性与三基色R,G,B的相关性一致,但相关性除g有所降低外,r和b以及r,g,b互为差值的转换中,相关性比三基色大大提高。

2.2 锦橙叶片叶绿素含量预测回归模型

在随机抽取的48个建模样本中,选取与叶绿素含量SPAD值极显著相关且相关系数在0.85以上的10个颜色特征参数,即R,R/B,R/(G+B),B/(G+R),r,b,G-B,B-R,(B-R)/(B+R)和r-b值,建立叶绿素含量预测的回归模型,获得颜色特征参数与蓬安100号锦橙叶片SPAD值之间的拟合回归方程、决定系数(R 2)、标准误(Std.Error)及F值(见表2所示)。由于回归模型各参数中F值越大,标准误愈小,决定系数越接近1,表明拟合的回归模型愈好,所以筛选出R/B,R/(G+B),r,B-R,(B-R)/(B+R)和r-b等6个决定系数R 2都在0.80以上,标准误在5.2以下,F值(66-139)>F0.01(2,45)=5.12的颜色特征参数为叶绿素含量预测指数,建立了拟合度最好的回归模型。

2.3 模型检验

运用筛选出拟合最好的6个回归模型,对检验集47个蓬安100号锦橙叶片样品的实测值和模型预测值进行统计分析和精度检验。对选择的6组模型进行正态分布性检验,结果表明,残差服从正态分布。由此计算6组回归模型的置信限,给定显著性水平α=5%,利用计算得到的置信区间,对回归模型进行精度检验。

图2与表3为蓬安100号锦橙叶片SPAD值以95%的概率落在给定置信区间的测值预测图和叶片SPAD值的精度检验对照表。图2中,实线表示拟合的回归方程,虚线表示给定的95%置信区间。

*和**分别表示显著性检验P<0.05与P<0.01。

从图2和表3可以看出,利用R/B,R/(G+B),r,B-R,(B-R)/(B+R)和r-b等6个颜色特征参数,建立的回归模型能较好地预测叶片SPAD值变化。在95%置信区间内,6组回归模型对SPAD值的预测误差在2.12%~6.38%之间(见表3所示)。其中,R/(G+B),r,(B-R)/(B+R)和r-b等4个颜色特征参数建立的蓬安100号锦橙叶片SPAD值预测模型的误差最小,均为2.12%。

综合考虑模型的相关系数、决定系数、标准误以及模型的检验精度等因素,以R/(G+B)和r等颜色特征参数构建的蓬安100号锦橙叶片SPAD值预测模型,其相关系数和决定系数相对最高,标准误和误差相对最小。因此,用作构建预测回归模型来检测叶片SPAD值,所建模型分别为

3 讨论

本试验研究结果表明,对RGB颜色系统中的R,G,B值进行归一化等处理后,获得的叶片颜色特征参数与蓬安100号锦橙叶片SPAD值建立的相关性,比直接使用三基色R,G,B参数所获得的相关性要好,这与前人的研究结果基本一致[5,6,7,8,9]。

通过对蓬安100号锦橙叶片随机建模样本颜色特征参数与叶片SPAD值的相关性分析、回归模型最佳拟合判定以及模型精度检验,结果表明:颜色特征参数R/(G+B)和归一化处理后的色度坐标值r均是预测叶片SPAD值的最佳参数,其回归模型的相关系数和决定系数相对最高,标准误和误差相对最小,这与王娟等[10]的研究结论基本一致。柴阿丽等[5]对番茄叶片叶绿素含量的研究结果表明,G-R为番茄叶片叶绿素含量的最佳预测指标;王方永等[9]也认为,G-R是获取棉花功能叶叶绿素含量和群体绿色指数的最佳参数。这一差异是否与柑桔叶片蜡质或叶片成熟度有关,还需进一步系统研究。

本试验通过较大样本量数据采集,运用多种统计分析软件研究分析,同时通过对RGB系统中三基色R,G,B的多种数学变换和归一化处理后获得的颜色特征信息与SPAD值相关性分析,最终筛选出了相关性最好、决定系数最大、标准误和检验误差最小的拟合模型。其中,利用数学变换后的R/(G+B)参数和归一化处理的坐标值r所建立的蓬安100号锦橙叶片SPAD值预测回归模型,其模型分别为

其预测误差相对最小,预测误差均为2.12%,具有较好的预测准确度和可信度。因此,叶片颜色参数R/(G+B)和归一化坐标值r均可作为基于计算机视觉技术的锦橙叶片SPAD值最佳预测指标。

利用计算机视觉技术分析植被特征的过程中,图像信息采集时的拍摄状态和光照强度等因素往往会影响颜色特征的分析结果,因此尽量保持相对一致的图像信息采集条件,将有助于这一问题的解决[11]。本试验中,图像信息获取采用了数码相机固定拍摄、焦距以及镜头与叶片间的距离不变等多种条件设置,同时统一设置了拍摄模式、拍摄角度和校正模式等,并保证在光照等自然环境条件相对一致的较短时间内完成叶片图像信息的采集,尽可能减少了误差。但对于不同光照条件、不同拍照模式以及不同相机参数设置等对颜色特征定量信息真实性的影响还有待进一步研究。另外,不同的柑桔品种类型、管理技术、复杂的气候条件和生境条件等是否会对颜色分析与叶片叶绿素含量测试精度产生影响,有待进一步做深入的研究。

4 结论

以计算机视觉技术为平台,通过数字图像分析技术进行了蓬安100号锦橙叶片叶绿素含量与R,G,B及其多种数学变换的颜色特征信息的相关性研究,得出了叶片颜色参数R/(G+B)和归一化坐标值r可作为基于计算机视觉技术的锦橙叶片SPAD值最佳预测指标其相关性和决定系数相对最大而标准误和检验误差最小。因此,利用计算图像技术诊断柑桔叶片叶绿素含量是可行的.

参考文献

[1]白优爱.京郊保护地番茄养分吸收及氮素调控研究[D].北京:中国农业大学,2003.

[2]贾良良.应用数字图像技术与土壤植株测试进行冬小麦氮营养诊断[D].北京:中国农业大学,2003.

[3]孙钦平,贾良良,芮玉奎,等.应用可见光光谱进行夏玉米氮营养诊断[J].光谱学与光谱分析,2009,29(2):432-435.

[4]李存军,王纪华,刘良云,等.基于数字照片特征的小麦覆盖度自动提取研究[J].浙江大学学报(农业与生命科学版),2004,30(6):650-656.

[5]Lukina E,Stone M,Raun W.Estimating vegetation coveragein wheat using digital images[J].Plant Nutr.,1999,22(2):341-350.

[6]柴阿丽,李宝聚,王倩,等.基于计算机视觉技术的番茄叶片叶绿素含量的检测[J].园艺学报,2009,36(1):45-52.

[7]雷咏雯,危常州,冶军,等.计算机辅助叶色分析进行棉花氮素营养诊断的初步研究[J].石河子大学学报(自然科学版),2004,22(2):113-116.

[8]肖焱波,贾良良,陈新平,等.应用数字图像分析技术进行冬小麦拔节期氮营养诊断[J].中国农学通报,2008,24(8):448-453.

[9]王克如,李少昆,王崇桃,等.用机器视觉技术获取棉花叶片叶绿素浓度[J].作物学报,2006,32(1):34-40.

[10]王方永,李少昆,王克如,等.基于机器视觉的棉花群体叶绿素监测[J].作物学报,2007,33(12):2041-2046.

[11]王娟,雷咏雯,张永帅,等.应用数字图像分析技术进行棉花氮素营养诊断的研究[J].中国生态农业学报,2008,16(1):145-149.

叶片图像 第5篇

针对这一课题,国内外的研究人员进行了大量而深入的研究,并取得了不错的效果。例如,Singh等[2]利用基于二叉树结构的多支持向量积的方法,对32种植物叶片进行识别,并取得了不错的效果;张文善等[3]通过改进的鲁棒的监督流形学习算法对20种植物叶片图像进行分类,证明了该算法的可行性;孙永新等[4]通过采用边界跟踪算法和多尺度形状分析技术,大幅提高了对植物叶片形状的识别精度和检索率;刘文萍等[5]提出了克隆选择算法和K近邻植物叶片识别方法,并利用此方法对数据库中的100种植物叶片进行测试,识别率达到了91.37%。

本系统通过对叶片原图像进行预处理,提取叶片轮廓,再利用几何特征提取的方法提取叶片的特征参数,最后利用动态规划算法计算加权代价和人工神经网络技术相结合的方法实现识别和分类。

1 系统总体框架设计

系统基于Web开发,利用Java语言和Matlab语言实现后台图像处理和识别,利用SQL Server2000数据库实现叶片图像数据的存储。主要包括图片上传、图片预处理、特征提取、结果匹配这四大模块,如图1:

获取中草药原植物叶片图像之后,将图像通过互联网上传至服务器后台,通过后台程序的预处理之后提取叶片特征值,最后将叶片特征值与数据库中的模板相匹配,返回结果。

2 系统实现

利用数码相机等摄像设备在光线适宜的环境下拍摄获得中草药原植物叶片图像,再将图片裁剪成尺度为64*64像素的正方形,对于非正方形的叶片图像可以通过背景颜色扩充后再裁剪的方法获得。

2.1 图像的预处理

图像的预处理包括灰度化处理、降噪处理和阈值分割这几个部分。本系统利用加权平均法将输入的彩色图像灰度化转变成黑白图像;然后再利用平滑空间滤波器进行平滑处理,去除图像中比较尖锐的噪声点,最后利用灰度门限法将高于某一灰度值的背景与叶片图像分割开。最后利用Sobel算子与Top-Hat变换相结合的方法,分别提取中草药叶片的边缘和叶脉,从而得到叶片轮廓的二值化图像。

2.2 几何特征提取

中草药叶片的特征可以分为几何特征、纹理特征及叶片颜色特征等。其中几何特征可以描述叶片的形状,是叶片的本质特征, 它具有移动、缩放不变的特性,因此是区别中草药叶片种类的重要特征,本系统通过对中草药叶片的几何特征提取以达到分类目的。

为描述叶片形状,本系统通过对中草药叶片的重心、复杂度、内切圆等几何特征参数进行计算,以下是所获得的几何特征:(1) 复杂度Com = 叶片周长的平方L2/ 叶片区域面积S;(2)圆形性Cir = 叶片区域重心至边界的平均距离Dr/ 区域重心至各边界点距离的方差Ur;(3)球状性Sph = 叶片内切圆半径Ri/ 叶片外切圆半径Ro;(4)偏心率Ecc = 叶片长轴长El/ 叶片短轴长Es;(5)凹凸面积比Pco = 叶片凸包面积St/ 叶片区域面积S;(6)矩形度Rec = 叶片区域面积S / 外接矩形面积Sr;(7)周径比Per = 叶片周长L / 主脉长Lm;(8)叶状值Leaf = 叶片重心到边界最短距离Dmin/ 叶片短轴长Es;

2.3 图像匹配与识别

2.3.1动态规划算法

动态规划算法的主要思想是把一个问题划分成多个子问题求解,通过求解子问题来求解原问题,常用作求解某种最优性质的问题。如果架设输入叶片图像为I,模板叶片图像为M,则可以通过寻找最大匹配度C(I,M)对应特征点的序列来完成图像匹配。首先, 建立一个m×n的动态规划代价表,通过分别寻找I与M的形状特征点的整体匹配度Sz和局域匹配度Sb来加权计算C(I,M),如下:

2.3.2 BP人工神经网络分类器

人工神经网络技术来源于人们对人类大脑神经的结构的认识,是一种常用的运算模型。BP人工网络分类器是用于植物叶片识别的人工网络分类器的一种,它具有较好的自学习性、自适应性、鲁棒性和泛化性[1]。本系统中通过将中草药叶片的形状特征值输入BP人工神经网络分类器,经过反复的训练从而达到记忆的目的。当有类似的叶片图像输入后,BP人工神经网络分类器可通过与数据库中的模板相对比从而达到识别的效果;若待输入的叶片图像为数据库中不存在的图像,则BP人工神经网络分类器也可以通过自学习的方法,将新的图像数据反馈给数据库,从而实现模板数据库图像的更新。

3 实验结果与分析

本文在安徽中医药大学校区,安徽中医药大学中草药标本库中采集的50种中草药原叶片图像,每种中草药叶片采集30张图像,共1500张图像。在每种中草药的30张原叶片图像中,随机抽取20张图像作为训练样本,其余10张图像作为测试样本。为了测试本系统自动识别叶片的准确率,经过反复的训练后,该文随机选择了薄荷、桑树等12种中草药叶片图像进行测试平均识别率为83.3%。

实验证明本系统通过先将中草药植物原叶片进行几何特征提取后,再用动态规划算法和BP人工神经网络分类器进行识别分类的方法是可行的。经过反复的测试,证明本系统具有较好的鲁棒性、自学习性和较高的识别准确率。但是对于形状和纹理相似的不同种类中草药原植物叶片识别率相对较低。

4 结束语

本文介绍了中草药原植物在线识别系统的设计与实现过程,通过降噪、阈值分割、几何特征提取后,再采用动态规划算法和BP人工网络分类器对中草药叶片原图像进行识别分类,并达到了不错的识别效果。这也进一步证实了在保证多途径特征提取的同时,采用多种识别方法相结合的理论是可行的。如何通过Android手机客户端实现中草药原植物叶片在线识别,并进一步提高识别率将是下一步的研究重点。

摘要:利用图像处理和图像识别技术,对中药叶片图像进行在线识别。主要过程包括图像采集、图像处理、特征提取、图像识别,通过动态规划算法与人工神经网络算法相结合的方法实现叶片图像的识别,平均准确率可达到80%以上。系统基于Web开发,后台采用Java语言实现图像的处理和识别,SQL Server2000数据库实现叶片图像数据的存储。实验结果表明,该系统对中药叶片图像识别具有较好的效果,并且便于操作和实现。

叶片图像 第6篇

1 叶片损伤图像预处理

要对叶片损伤类型进行识别就要先对采集图像进行预处理, 本文先采用图像分割技术将叶片损伤区域分割出来, 然后, 采用边界跟踪方法和灰度共生矩阵法提取损伤区域的特征参数, 进而得到损伤信息。

1.1 基于概率神经网络 (PNN) 的图像分割

图像分割的作用是把反映物体真实情况的、具有不同特性的目标区分出来并形成数字特征[2], 图像分割质量的好坏直接影响后续图像处理的效果。本文运用PNN图像分割方法对图像分割, 该方法的最大优点是可直接对真彩图分割, 克服了传统图像分割方法在图像转换、图像增强等处理过程中的信息丢失现象, 得到的分割图像质量更高。采用MATLAB神经网络工具箱中的newpnn函数创建PNN训练网络, 即net=newpnn (P, T, spread) , 其中, P为网络输入向量, 即图像RGB值, T为目标向量, 即背景像素点或损伤像素点, spread网络扩展系数, 采用sim函数对网络进行仿真, 仿真图像大小为300 (pixel) ×300 (pixel) , 图像原图见图1, , 最终分割结果见图2, 图3, 具体实现过程见参考文献3。

1.2 基于边界跟踪和灰度共生的特征参数提取

边界跟踪法提取形状特征参数, 灰度共生矩阵方法提取纹理特征参数。采用MATLAB工具箱的bwboundaries函数跟踪形态学运算后的图像边界, 标记图像边界坐标, 采用regionprops函数, 计算图像面积、长轴距离、短轴距离和边界周长, 根据式 (1) 和式 (2) 计算形状特征参数伸长度 (E) 和形状复杂度 (F) ;采用graycomatrix函数建立灰度共生矩阵, 设置graycoprops函数的属性为contrast和correlation, 计算纹理特征参数的对比度和相关度。

式 (1) 中, W为短轴距离, H为长轴距离。

式 (2) 中, L为周长, S为面积。

2 建立改进GA算法优化RBF网络的识别模型

2.1 RBF神经网络和GA算法的优缺点分析

RBF神经网络是一种性能优越的前向神经网络模型, 第一层为径向基层输出表达式a1=g (‖IW-p‖b1) 其中, g为径向基函数, 这里选取高斯函数:g (n) =e-n2, 第二层为线性输入层:a2=purelin (LW2a1+b2) 。它具有训练速度快、网络结构简单和推广能力强等优点, 但是在网络设计过程中扩展系数的选取对网络的性能影响较大, 如何选取合理的扩展系数成为提高网络识别正确率的关键;GA算法是一种能够在复杂搜索空间快速寻找全局最优解的搜索技术, 但是GA算法中交叉概率Pc和变异概率Pm的选取非常繁琐, 其值直接影响算法行为、性能和收敛性[4]。综上所述, 本文采用GA算法优化RBF神经网络的扩展系数, 针对GA算法的不足, 设计能够使Pc和Pm随着适应度自动调整算法, 进而建立改进GA算法优化RBF网络的识别模型。

2.2 染色体的编码和适应度函数的构造

对于一个实际的优化问题, 需要将其表示为适合GA算法的操作形式。本文采用二进制编码, 假设寻优参数a的区间为[amin, amax], 用m位二进制数b来表示, 则应满足:

将所有参数表示为二进制数串, 该字串为GA算法的操作对象。

适应度函数是区分群体中个体好坏的标准, 是衡量算法优劣的关键。为了使RBF网络的预测值和期望值残差最小, 本文将预测值和期望值的误差矩阵范数作为适应度函数。

2.3 初始种群的确定和选择操作

本文选择完全随机的方法产生初始种群, 种群大小为40。选择操作根据每个个体适应度值大小进行选择, 适应度高低决定个体被遗传到下一代种群的概率[5]。采用适应度比例选择算子进行选择操作, 假设个体xi的适应度为f (xi) , 则其被选中的概率为

式 (4) 中, f (xi) 是个体xi的适应度值;∑f (xj) 为群体适应度总和。

假设当前个体选择概率为p1 (xi) , p2 (xi) , …, pm-1 (xi) , pm (xi) , 随机产生一个[0, 1]之间的数r, 若, p1 (xi) +p2 (xi) +…+pm-1 (xi)

2.4 改进GA算法的交叉和变异操作

交叉和变异操作是实现GA算法的关键环节。Pc过大遗传模式被破坏的可能性就大, 使适应度较高的个体结构被破坏;但是Pc过小, 会使算法搜索过程缓慢;Pm过大算法就完全变成了纯粹的随机搜索算法;Pm过小就不会产生新的个体结构[7—8]。本文采用改进的交叉和变异操作, 当适应度值低于平均值时, 对它采用较大的Pc和Pm;当适应度值高于平均适应度时, 根据其适应度值取相应的Pc和Pm;同时, 为了避免在进化初期优秀个体不发生变化使算法走向局部最优解, 将算法做了进一步改进, 使群体中最大适应度值个体的Pc和Pm, 分别提高到Pc2和Pm2。这种改进后的算法能够保持群体多样性和收敛性。算法自适应调整公式如下:

其中, Pc1为初始交叉概率;Pm1为初始变异概率;Pc2为交叉概率可以提高到的最值;Pm2为变异概率可以提高到的最值;fmax群体中最大的适应度值;favg每代群体的平均适应度值;f'要交叉的两个个体中较大的适应度值;f要变异个体的适应值。实际应用中通常取Pc=0.4~0.99, Pm=0.0001~0.1。

2.5 算法的实现

算法具体实现步骤如下。

(1) 提取叶片损伤图像特征参数, 对参数做归一化处理。

(2) 确定算法初始参数、搜索区间、创建初始种群。

(3) 建立RBF神经网络, 将RBF神经网络的预测值和实际值的误差矩阵范数作为适应度函数。

(4) 计算个体适应度大小, 采用排序方法分配适应度值, 选择种群中适应度大的个体, 重新计算适应度值, 根据公式 (4) 计算交叉概率, 采用单点交叉方式进行交叉操作, 根据公式 (5) 计算变异概率, 进行变异操作。计算目标函数值。

(5) 如果算法选出最优个体执行 (6) , 否则执行 (4) 直到达到最大遗传代数。

(6) 将最优个体作为RBF神经网络扩展系数, 叶片损伤特征参数作为网络输入向量, 对RBF神经网络进行训练, 利用训练好的改进GA_RBF网络对损伤进行识别, 输出识别结果。

3 叶片损伤图像识别实例仿真

叶片损伤图像采用OLYMPUS硬性内窥检测仪采集, 其技术指标为:光学视野方向50°~110°, 视角20°, 工作长度246 mm~446 mm, 插入管外径8.1mm, 测量范围10 mm~180 mm, 测量精度±4%mm。选取了90幅航空发动机叶片损伤图像, 其中60幅作为训练样本, 30幅作为测试样本, 识别结果包含裂纹损伤、边缘刻口、表皮脱落3类常见航空发动机叶片损伤故障。根据上述图像处理方法, 对90幅图像进行处理得到损伤图像特征参数, 部分提取特征参数如表1所示。其中, 3类常见叶片损伤类型各有30组, 3种模式分别对应的类别标签为{1, 2, 3}, 1代表表皮脱落、2代表裂纹损伤、3代表边缘刻口。

表1中, 根据公式 (1) 可知, 伸长度是分割后图像的短轴距离和长轴距离的比值, 所以是无量纲参数, 同理, 根据公式 (2) 可知, 形状复杂度也为比值, 是无量纲参数;在matlab中对比度的计算公式如下:

其中:p (i, j) 是概率值, n是像素个数, i, j是灰度级, μxσx是灰度共生矩阵水平方向的行均值和行标准差, μyσy是灰度共生矩阵垂直方向的列均值和列标准差, 这些参数都是无量纲参数, 所以CON和COR也是无量纲参数。

建立改进GA算法优化RBF网络识别模型, 具体实现过程见步骤 (1) 至 (6) 。GA算法种群规模为40, 最大遗传代数为20, 编码位数为20, 遗传代沟0.95, 初始交叉概率Pc1=0.8, 初始变异概率Pm1=0.01, 交叉概率可以提高到的最值Pc2=0.6, 变异概率可以提高到的最值Pm2=0.001, GA算法的区域描述器Field D=[20;1;10;1;1;1;1]。RBF网络优化扩展参数区间为[1, 10], 采用net=newrb (P, T, goal, best X) 建立RBF识别网络, 其中P, T为网络的输入输出, goal为训练目标, 这里选取0.001, best X为当前训练样本下, 网络的最优扩展系数, 进化过程如图4所示。

可知, 算法迭代到第10代时网络模型误差矩阵范数达到最小值, 此时, 得到的最优扩展系数为best X=4.22。建立优化后的RBF网络识别模型, 仿真识别结果如图5所示, 识别正确率达到93.33%。这说明当前测试样本情况下, 上述最优参数建立的识别网络识别率高、稳定性好。同时, 本文还采用随机获取扩展系数的方式建立了的RBF神经网络识别模型, 将识别结果与本方法进行对比分析, 识别结果见图6和图7, 对比分析结果见表2。从表2对比结果可知, 改进GA算法优化RBF网络识别模型正确率更高。

4 结论

本文首先采用PNN神经网络、边界跟踪和灰度共生算法提取叶片损伤图像的特征参数;然后, 将GA算法进行改进实现Pc和Pm的自适应调整, 提高GA算法的全局搜索能力;最后, 采用自适应GA算法优化RBF神经网络扩展系数, 实现动态获取RBF网络最优扩展系数的目的;建立改进GA算法优化RBF网络的航空发动机叶片损伤图像识别模型, 仿真结果表明:与单一RBF网络识别模型相比, 改进GA算法优化RBF网络识别模型, 识别率更高、网络更稳定, 该方法大大缩短了叶片损伤类型判别时间, 避免了传统叶片损伤类型判定工作的复杂性和繁琐性, 提高了叶片损伤检测的可靠性和自动化程度, 对航空发动机视情维修和外场检测具有重要价值。

参考文献

[1] 陈果, 汤洋.基于孔探纹理特征的航空发动机损伤识别方法.仪器仪表学报, 2008;29 (8) :1709—1713

[2] 朱虹.数字图像处理基础.北京:北京科学出版社, 2005

[3] 张维亮, 李楠, 李昂, 等.基于概率神经网络的航空发动机叶片损伤图像分割.沈阳航空航天大学学报, 2013;30 (2) :22—26

[4] Holland J H.Adaptation in Natural and Artificial Systems.Cambridge Massachusetts:MIT Press, 1992

[5] 刘国海, 蒋志佳.基于遗传优化神经网络在高压瓷瓶裂缝识别中的应用.电测与仪表, 2009;46 (520) :39—43

[6] Leung H, Dubash N, Xie N.Detection of sm all objects in clutter using a GA-RBF neural network.IEEE Transactions on Aerospace and E lectronic Systems, 2002;38 (1) :98—118

[7] 张涛, 费树民, 李晓东.基于GA-RBF神经网络及边界不变特征的车辆识别.智能系统学报, 2009;4 (3) :278—282

叶片图像 第7篇

关键词:L*a*b*空间,动态阈值,叶片,图像分割

0 引言

我国幅员辽阔,自然条件复杂,植物种类繁多。据不完全统计,我国约有植物3万多种[1]。要准确鉴别某植物的种类,有无药用价值,实非易事。本团队致力于药用植物自动化鉴别研究,旨在消除人工鉴别的主观性及对专业知识的依赖性。

药用植物鉴别,涵盖分类和药用价值分析两个层面的内容。单从分类而言,实质上等同于植物的分类。虽然叶、花、果、茎、枝等的特征都可用于植物的分类;但是对于机器而言,由于花、果、茎、枝存在复杂的立体几何特征,叶片的分类相对简单有效。

Stephen Gang Wu等[2]先把叶片RGB图像转换为灰度图像,然后用固定阈值分割方法,得到二值图像,再用概率神经网络PNN(Probabilistic Neural Network)对植物叶片进行分类。实验表明,对32种植物叶片的分类正确率为90%。Qing-Kui Man等[3]则采用动态阈值分割方法对由RGB图像转换而来的灰度图像进行分割。然后提取颜色特征和纹理特征,并用支持向量机进行分类。在结合这两种特征对24种植物叶片进行的分类实验中,正确率为92%。毕于慧等[4]首先利用矢量角变换将图像的三维色彩信息转换成一维的亮度信息,再利用几何活动轮廓模型进行完整叶片的自动分割。该方法将C—V模型不受初始位置影响的优点和改进模型克服弱边界泄漏的优点结合起来,对完整呈现在图像中的叶片具有较好的分割效果,但如果是被遮挡的叶片则需要另行拟合出被遮挡的部分。董金勇等[5]针对叶片灰度图像,融合运用是最大类间方差阈值分割和Canny边缘检测方法,消除了两种方法单独使用时的分割缺陷。但该复合方法缺乏充分的实验验证。此外,前述两种方法同时具有的分割缺陷,其复合方法能否避免,未经探讨。而王萍等[6]提出了叶片灰度图像分割结果的量化评价指标,具有一定的指导意义。

叶片图像分类的首要步骤是分割。受上述文献启发,本团队把叶片RGB图像转换为灰度图像,并使用最大类间方差法进行动态阈值分割,再提取特征,最后应用自行研究的神经网络进行识别[7]。该叶片图像分割方法称为灰度动态阈值分割法,其步骤详见实验部分。

然而,随着所采集的叶片种类的增加,发现几种颜色偏暗叶片的图像,使用此方法分割时,效果非常差。据实验观察,此类叶片RGB图像转换为灰度图像后,叶片区域和背景的灰度值无明显差别。

彩色图像转换为灰度图像,是一个有损压缩的过程。直接在彩色空间中进行分割,是当前的趋势。韩殿元等[8]计算每个像素的R、G、B三通道值的方差,然后进行阈值分割;文献中RGB图像的叶片区域的R、G、B方差较大,背景的很小,分割效果良好。然而,经过实验观察,本团队所采集的颜色偏暗的叶片的反光区域,其R、G、B三通道值的方差较小,而部分背景的R、G、B方差反而更大。袁媛等[9]提出了一种基于先验信息的水平集模型,实现作物病叶图像分割。不过由于依赖先验信息,只能用于指定的某类植物。

此外,Gonzalez R C等[10]提出了一种RGB空间距离阈值的分割方法。受其启发,设计了RGB距离分割法,其步骤详见实验部分。该方法对一般的叶片图像的分割效果良好,但是也无法很好地实现颜色偏暗叶片的图像分割。

彩色图像的表示,除了RGB外,还有NTSC、YCb Cr、HSV、HIS、L*a*b*等多种空间。实验发现,把颜色偏暗叶片的RGB图像转换为L*a*b*图像后,其中的b*通道图像的叶片和背景的对比明显。

因此,本文提出了基于L*a*b*彩色空间和局域动态阈值的药用植物叶片图像分割方法。此方法基于b*通道图像,在目标叶片所在局域范围而非全图统计阈值。实验表明,该方法对偏暗叶片图像及其他叶片图像,均可取得良好的分割效果。

1 分割算法

基于L*a*b*彩色空间和局域动态阈值的药用植物叶片图像分割算法由10个步骤组成,具体如下:

(1)让用户打开叶片图像,用鼠标选定叶基点(Xb,Yb)和叶尖点(Xt,Yt)。连接叶片和枝干的,常呈圆柱形的部分称为叶柄;叶柄与叶片轮廓线的交界处称为叶基点。而叶尖点指的是叶片的顶端。

(2)计算叶基点至叶尖点的线段的中点(Xm,Ym),把此点近似看作叶片的中心。

(3)计算局部矩形范围。计算叶基点至叶尖点距离DISbt。则局部矩形范围左上角坐标点(strat X,start Y),右下角坐标点(end X,end Y)计算如下:

其中,参数ratio大小可调。此步骤作用是确定阈值计算的局域范围。有时,背景点数量过多且像素值不是非常集中时,会导致在直方图上,背景点像素值分布出现两个或以上的波峰,而前景点的波峰过小,动态阈值错误地定在背景点的两个波峰之间。此外,一些离目标叶片较远,且与之不连通的前景点,像素值相对目标叶片偏大,也会对阈值计算带来干扰。经过对现有的图像库中的70种药用植物叶片图像进行观察,DISbt大多数情况下都是叶片轮廓线上距离最大的两点。在此设置ratio=1,使得阈值统计范围包含了目标叶片前景和邻近的面积相当的背景,却排除了远处的区域,有效避免上述问题。

(4)把叶片RGB图像转换为L*a*b*图像。从RGB空间到L*a*b*空间的转换是非线性的。首先要将RGB空间转换到XYZ空间,转换矩阵为[11]:

然后再从XYZ空间转换到L*a*b*空间:

其中:X0=95.04,Y0=100,Y0=108.89。L*表示明度,a*、b*表示色度,+a*表示红色,-a*表示绿色;+b*表示黄色,-b*表示蓝色。

(5)提取L*a*b*图像b*分量的图像,得到叶片b*通道图像。经过多次实验发现:许多偏暗叶片的图像在RGB彩色空间中,背景点包围在前景点的四周,直接在RGB彩色空间实施分割较为困难;把这些图像转换为灰度图像后,采用动态阈值分割的效果也非常差;然而,当转换为L*a*b*图像后,并在b*通道图像上实施分割时,效果很好。详见实验部分。

(6)统计叶片b*通道图像局部矩形范围内的像素值分布直方图。

(7)计算动态阈值。基于像素值分布直方图,采用最大类间方差法[12,13],计算动态阈值。

(8)对叶片b*通道图像进行阈值分割。

(9)填充图中空洞。

(10)保留与叶基点八连通的区域,删除其余区域。

2 实验分析

本团队近年来从事药用植物自动化鉴别的研究,累计采集了70个种类,超过1 400片的叶片。使用ACER Scan Prisa 640U扫描仪扫描成图像存储。以下围绕分割效果、阈值选取范围、开闭运算三个方面进行实验分析。

2.1 分割效果对比

在本方法之前,受文献启发,实现了两种分割方法:

(1)灰度动态阈值分割法。把RGB图像转化为灰度图像,然后进行最大类间方差动态阈值分割,再依次进行数学形态学开运算、数学形态学闭运算、填空空洞、选择保留与叶基点连通的区域等操作。

(2)RGB距离分割法。该方法直接在RGB彩色空间中实施分割。以叶基点为前景代表向量,以图像四个边角点的像素的中值为背景代表向量。对图像中的每一点,求出它的RGB向量,与前景代表向量的欧氏距离f,与背景代表向量的欧氏距离b。重设该点的像素值为标量h,其中h=255-255×f/b,得到一灰度图像。对此灰度图像进行动态阈值分割,并依次进行开运算、闭运算、填空空洞、选择保留与叶基点连通的区域等操作。

三种方法对已有的大部分叶片图像均能达到较好的分割效果。但是对于已采集的几种颜色偏暗的叶片的图像,只有本文提出的方法可以较好地完成分割。图1是南五味子叶片RGB原始图像;如图2所示,经灰度动态阈值分割后,左右两边缘共出现了7处缺失,大大扰乱了叶片轮廓周长值;图3中RGB距离分割更是得到错误的结果;只有图4中应用本方法,得到了正确的分割结果。图5至图8的琵琶叶分割实验中,灰度动态阈值分割后缺失了近半边叶片,而RGB距离分割后只剩下连接叶基点和叶尖点的线状区域。只有应用本方法可得到让人满意的分割效果;并且,细致观察可发现,其分割后的叶边缘锯齿仍得以保留。如图9至图12,鸭脚木叶片采用灰度动态阈值分割后,只剩一个点状区域;经RGB距离分割后也存在多处大小缺失,应用本方法得到正确的分割结果。如图13至图16,朱砂根叶片经灰度动态阈值法或RGB距离分割法分割后均存在较多的缺失,应用本方法可很好地完成分割。

2.2 局域与全图统计阈值的对比

一般的动态阈值分割方法都是在全图范围内计算分割阈值。而本方法则在目标叶片所处的局部矩形范围内计算阈值。首先,明显减低了计算量。而更重要的是:聚焦于局域范围,可找到更适应于目标叶片分割的阈值。如图17所示,是南天竺叶片原图,图18是把本方法改为全图统计阈值后的分割结果。由于原图中,其他多数区域的叶片颜色与目标叶片差异较大,在全图范围内统计阈值时,错误地得出比目标叶片区域绝大多数点像素值更大的结果,使该区域近乎全部被错分为背景。而应用本方法,可得到正确的分割结果,如图19所示。由此可见,局域统计阈值具有更强的针对性。

2.3 有无开闭运算的分割结果对比

本方法的另一特色是无需后续进行数学形态学的开闭运算。这是由于其核心步骤分割效果良好,无需补充进行开闭运算修正。如图20至图23所示,虽然灰度动态阈值分割法、RGB距离分割法也基本能实现艾叶片的分割,但是都不同程度地抹去了艾叶片的边缘细节。如图20标注出了两处叶裂细节;只有应用本方法分割时,该叶裂细节才得以完整保留。

3 结语

(1)本文提出了一种基于L*a*b*彩色空间和局域动态阈值的药用植物叶片图像分割方法。对于颜色偏暗的叶片的图像,采用灰度动态阈值分割法或RGB距离分割法都无法实现分割,而使用本方法可达到很好的分割效果。

(2)本方法在目标叶片所在的局部范围内统计阈值,可更准确地实现分割。

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【叶片图像】相关文章:

叶片故障06-24

玉米叶片07-25

叶片设计08-05

叶轮叶片08-12

大豆叶片08-30

植物叶片结构05-07

叶片出口角06-03

叶片电解加工07-06

叶片建模论文08-13

涡轮叶片冷却08-13

上一篇:质量及评价下一篇:掌握基础