视觉图像论文范文

2024-09-01

视觉图像论文范文(精选11篇)

视觉图像论文 第1篇

图像能表达主体思维形象的感觉程度, 使图像中能感知作者思维影像中的意识, 更直意地表达了主体自己。在现当代社会中视觉性起到了重要作用, 视觉文化的繁荣是人要求看到真实地表达真实的努力, 也使不现实的东西变得现实。从视觉性的思维方式看, 在还没发明制作图像技术和影像前, 思维里的影像只存在于自己个人的想象中, 只能用语言和文本去描述它们, 但毕竟表达是有限的, 听和看的人好像是明白了, 但对作者的思维空间里的影像是空白的, 只有无视觉性的文本符号的理解而以, 而这个空白读者会以自己想象出一个不同于作者想象的影像版本, 以此来理解其文本的描述。除非将来能发明一种能有感应脑部空间影像的扫描器, 能把在人大脑中出现的影像完全扫描出来, 否则, 想要描述的跟想的一样是不可能的, 首先它不能被第二者看到, 阻碍了直接交流, 只能通过语言的中介来表达, 是有一定差距的, 当然, 图像也不能完全表达作者思维影像的完整性, 但我觉得它比语言往前跨进了一步, 更接近主体所想的表达, 虽然不能完全跳出语言符号范围的限制, 因为思维不是单一的模式, 还可以是图文并进的思维模式。其实以图像描绘主体所想一直都有, 那就是绘画, 首先是模仿, 后是创想, 从古时那些对天使、魔鬼和地狱的题材描写可以看出, 以绘画的方式把想象中的图像描绘下来, 但它是静止的, 不是运动持续的表现。随着现代科技的进步迎来了图像时代, 而虚拟是对思维空间中的影像做出极其相似的表达, 特别是科幻电影和电脑对图像的制作等, 给人带来了极大的满足和追求。生活在现实中同时也生活在虚拟的世界中。虽不说思想能达到的程度, 虚拟也能到达, 但虚拟的效果能给人更加深刻的再现清晰影像。就如去看一部科幻电影, 刚从电影院走出来的一小段时间里, 自己的精神领域还停留在刚才的忘我的科幻世界中, 走出电影院门口自己发现自己好像又转向了另一个世界里, 虽然理性里知道这才是现实世界, 但自己还游离在刚才电影的幻境中, 但并不觉得这种感觉不好, 就像刚才经过原始森林留下的飘然神秘的感觉, 而后不得不佩服电影的视觉冲击力和感染力, 完全沉醉于艺术家创造的空间世界里, 因为思想还没能迅速从幻境中抽离出来, 所以感觉现实不像现实, 直到这种感觉慢慢消去。从看电影的投入状态可以看出, 在观看电影时像是一种麻醉状态, 好像只有对意识的感觉存在着, 而且还是无思考地跟着电影设定的设想走, 身体的感知却在不知不觉中失去了, 被控制在无我的观看意识中, 甚至感觉不到自己的心跳又失去了身体的本能反应。这种感觉就像牵制着观众的思想意识融入其建造的幻境世界中。也许过几天就把这个电影忘了, 但当时的视觉震撼感是惊人的。

思想空间中的图像感是模糊的其影像也是不流畅的, 影视的出现极大地把艺术家所想清晰地显示出来, 不仅是听到了还看到了, 消除了不同个体之间在文本的语言描述中各自的想象版本, 经过视觉的直观感后迎来的是观后感和评鉴。我觉得艺术家的思维是图像性的, 就如绘画类, 雕塑, 装置, 建筑等形象性的视觉艺术都具有图像性的思维模式, 是区别于文本的语言性的描述的。在影像出现以前, 除了在自然中看到的世界场景有空间的运动的连续性外, 还有就是人的联想即想象的思境里是连续运动的影像。而图式形式的图片视觉是静止的, 通过文本的语言描述和图形描绘是不会出现动态的影像的, 这也是从二维空间向三维空间的转向, 三维空间的技术对艺术家想象空间的影像表达有很大的帮助, 在创作中过程中更有修饰性和制作性, 虚拟的影像就像是对幻像的模仿和复写, 也是人在交流和传达思想的另一个有效方式, 满足了人更多的需求和表达欲望, 更形象有力地表达和展现超想象性中的幻像。影像对幻象的表达有惊人的视觉表现力, 有时甚至超乎想象力。就如电影《2012世界末日》, 它给观众带来的各自猜测舆论, 因此而引发的种种避难, 造船等末日情结的不寻常的行为活动和恐慌, 同时也反思生命的意义和对环境作出的行为, 这种意识的植入时人接受并实施行动的力量是不可思议的, 同时也给人带来了行为的反思, 影片是对世界未来的种种预测性想象的构思, 其视觉直观感的冲击力深入人心。

在人的大脑思维中有时是以图像 (影像) 性的思维发展方式来想象思考的, 有时又以话语性的逻辑思维进行推理思考, 柯勒律治的《论诗或艺术》描述人通过发声交流, 而最重要的是靠耳朵的记忆, 自然是靠眼睛从视域和表面得来的印象。人总是在这两个大方向的基础下转换思考, 也是同时进行的。视觉艺术性质的创作更多的是以图像方式的思维景象发生的, 创想着各种形象图式并在其基础上进行主观再创作, 以达到作者认为其图像形式最能表达其意想。电影是以影像视觉性质的思维去创造的, 它更注重视觉性的动态效果和独特的视觉角度。思想的空间是无限的, 思考是图像性的也是话语声音性的。在电影还没有出现之前, 人的大脑就已经有非眼睛可视的内在影像, 这种有形的影像就存在于无形的思想空间中。大脑想象中的影像只是内心的可视, 是自我的个人的, 不能展现的, 是现实物象经过大脑发展的影像。影视就像是人类自我探索发展成为眼睛可见的视觉形式, 就如想一个人的时候大脑想象出的是对这个人之前所见的回忆, 当你想让他发生互动的时候, 幻想中的影像的发生过程即是主观预想的表现。而如果你受感悟和启发而发生的思考影像, 你是在做代替的、相似的和象征倾向的具有代表性形象的影像整合, 从而创想

探析旅游策划中存在的问题及对策

任津雨 (广西艺术学院人文学院广西南宁530022)

摘要:我国旅游产业发展迅速, 掀起了一轮又一轮的旅游策划热, 从事旅游策划的人员也日益增多, 随之而来的就是日益激烈的市场竞争。在这种市场背景之下, 各种旅游策划方案都在寻求创新, 以积极吸引更多的眼球来击败竞争对手。但是, 在旅游策划创新的过程中, 也出现了不少的问题。因此, 本文将围绕旅游策划中存在的问题展开讨论, 努力寻求应对这些问题的解决对策, 从而为我国旅游产业进一步发展提供一定的参考建议。

关键词:旅游策划;问题;对策

一、引言

随着人们生活水平的不断提高, 旅游产业活动了迅猛的发展, 各地不时掀起一轮又一轮的旅游策划热。虽然说这些旅游策划热对各地旅游产业的发展来说, 具有积极的促进作用。但是, 旅游产业内相互之间的竞争变得日益激烈, 人们开始寻求具有创新性的旅游项目。因此, 很多旅游从业人员开始对旅游项目进行策划与规划, 以求得吸引更多人的眼球, 进而获得更为优质的旅游资源。但是, 在创新旅游策划的过程中, 也出现了不少问题。我们应该积极寻求解决措施来保障旅游业的顺利发展。

二、旅游策划相关概述

所谓策划, 指的就是为了达到一定的目标, 调查分析有关材料并遵循一定的程序对某项事件进行系统全面的构思和选择, 并根据实际情况变化而调整对策的一种谋划和策略。那么, 旅游策划就是旅游策划者为了实现旅游组织既定的目标而调查旅游市场和旅游环境, 进而整合旅游资源, 创新旅游设计和旅游方案, 使得旅游资源能够与市场紧密结合起来, 获得最佳的经济效益、

出表现观念的图像。从中可以看出在回忆, 幻想, 艺术创作时的图像思维。在生活中一般思维模式的逻辑推理、想主意, 计划等是以话语性的思考方式, 从感知自己内心的话语心声的得知。从想到做之间有很大变动, 无法预测, 往往这也是创作必经之路, 在不断的变动修改中达到艺术家的要求即最终的艺术作品。

图像的视觉性同现实的自然视觉体验是有很大区别的, 人的的各种感官都有其各自的功能, 传达不一样的信息, 即可以根据一种感官或两种以上来判断事物, 它们传达给主体的各种信息感都被主体接受并储存, 就如问你一个苹果的香味时, 用文本的语言表达是“苹果的香味”的字面表达, 而图片的表达是“苹果的图像”如照片, 在思想上的表达是对“苹果的味道的回忆”。也就是说苹果的味道是什么, 只有闻了才知道, 它印在了体验者的脑海中, 这也是嗅觉的功能, 是独特的难以代替的。如果你没有见过苹果或没有吃过苹果, 那么你大脑中对苹果是一片空白。相对于视觉文化而言, 视觉性更多是针对眼睛的, 扩展眼睛的视社会效益和生态效益的运筹过程。从本质上来说, 旅游策划就是思想, 文化和创造等, 其内容非常丰富, 可以包含战略策划、公关策划等。我们在当前日益激烈的市场竞争环境下, 应该创新旅游策划, 主要是指在创新原则指导下“求新”“求异”“求最”“求需”。事实上, 我国旅游策划也已经发展了几十年的时间, 取得了一定的成绩。一般来说, 旅游策划的原则为:市场导向原则、客观现实性原则、整体性原则、特色化原则、群体意识原则。由于策划本身就是一种程序, 我们应该把旅游策划分为四个阶段, 即概念挖掘阶段、主题开发阶段、时空运筹阶段、推销说服阶段等。在进行了策划以后, 我们还要对旅游项目进行构思, 这主要包含了项目产品构思、项目市场构思、项目营销构思三个子系统。

三、当前旅游策划中存在的主要问题

虽然说我国旅游策划已经取得了一些成绩, 但是, 在激烈的市场竞争中, 我国旅游策划也出现了不少的问题。具体表现如下:

1. 旅游策划的资质考察不严格, 造成了旅游策划市场质量不一。

虽然说我国现在很多地方和景区都非常重视旅游策划。但是, 真正有较高资质的旅游策划机构并不多, 很多单位和个人只是单纯的要获得经济利益, 根本不懂策划, 从而使得旅游策划市场显得杂乱无章而缺乏严格的质量监控;

2. 旅游策划盲目化, 导致了策划偏离主题。

有些旅游策划人员只是为了片面的追求经济利益, 并没有深入了解策划或规划的项目与景区主题及文化内涵, 导致了盲目追求创新而变得吃力不讨好, 严重脱离实际情况, 破坏了环境和氛围, 无法调动起游客

野看到更多的信息, 是图像式符号的对应物, 并不是现实自然物的苹果, 而是人类已经从原始的基础上进行过思想的加工, 也就是我们现在所看到的视觉图像展现的是一个模式符号的对应物, 并不是真实事物的感知体验, 它跳过了从自然实践体验的认识直接转到了认识形象符号, 因为人对世界的亲身体验的了解是有限的, 人的感官包括身体也一样, 它的有限性使得人发展更多的辅助媒介了解更多的东西, 看到远方的民族, 地域, 文化即通过图像与视频, 能听到世界另一边的音乐。

参考文献

[1].《图像学—图像文本意识形态》, 作者:米歇尔, 译:陈永国, 北京大学出版社, 2012年5月第2页[1], 第147页[2]

[2].《视觉文化导论》, 作者:尼古拉斯·米尔佐夫, 译:倪伟, 江苏人民出版社, 2006年11月

视觉图像论文 第2篇

(1)对图像进行初始化处理:在获取远程采集的原始水利图像之后,应当对其进行图像预处理,从而获得与之有关的像素参数,并且运用噪声频率阀值来去除原始图像中的噪声,同时对原始图像中所有的有效信息做到最大程度的保留。通过对图像的初始化处理,可以在保留初始图像有效信息的基础上,进一步提高图像质量和清晰度,进而为水利工程质量检测提供准确的数据基础。

(2)建立神经网络数学模型:对待测水利工程质量的归属和类别进行判断,是水利工程质量检测的最终目的,也就是说,通过水利工程质量检测,来判断待测区域的质量是否合格。因此,在建立神经网络数学模型时,必须输入初始化处理之后的图像相关参数和数据,而输出结果分为1 和0,前者代表水利工程质量良好,不存在质量问题;后者则代表水利工程存在质量问题。

(3)检验误差:检验误差是对误差进行补偿的前提和基础,通过误差检验,可以判断水利工程质量检测的误差和衡量标准是否相符,以为误差补偿提供数据支持。通过一系列公式,可以获取水利工程质量检测系数,并将检测系数与衡量标准相对比,如果获取的检测系数比衡量标准小,那么说明水利工程质量的检测误差在允许范围之内,无须进行补偿;如果获取的检测系数比衡量标准大,那么说明水利工程质量的检测误差已经超出允许范围,必须通过误差补偿算法对误差进行有效补偿。

(4)误差补偿:误差补偿主要是通过共轭梯度算法完成的,即通过对平移系数梯度、伸缩系数梯度和权值系数梯度的计算,对误差补偿进行计算,这种算法有利不与地面接触。一般情况下,还应当将照明开关安装在门框旁边,两者相距要在0。2m 左右,距离地面要在1。3m 左右。而对于壁扇则要求其下侧距离地面的高度大于1。8m。

5 接地装置安装

在进行接地装置安全前要进行接地装置的电阻测量,当电阻值满足标准时才能够进行安装。另外,如果没有设计要求,则要保证接地装置的埋设深度不大于0。6m。同时确保各接地装置之间的间距满足相关要求。根据相关规范:如果扁钢与扁钢搭接为扁钢宽度的2 倍,则至少要进行三面的焊接。如果为圆钢的6 倍,则需要进行双面焊接。另外,圆钢与圆钢搭接为圆钢直接6 倍时也要进行双面焊接。此外,连接明配线的地下线部分,要保证其相互之间的间距均匀,水平方向的标准是在1m 左右,垂直方向的标准是2m 左右,弯曲部分的标准是在0。4m左右。施工人员要按照相关施工标准进行接地装置安装,以保证电气工程的质量。无论是对于哪部分的工程进行施工,施工人员都要进行按照相关要求和标准进行施工,从而真正提高施工企业的核心竞争力。

6 结束语

视觉图像论文 第3篇

关键词:视觉图像 神经图像 纠错教学法

【中图分类号】TP391.4

1 引言

体育教学过程中面对出现的错误技术动作一直赖以语言文字来表达纠正,而对视觉图像传导神经图像循环纠错教学法采用的很少,人们只是把图像看其直观性与愉悦性的地位。即使在影像和多媒体技术高速发达的今天,图像已经成为传递信息的主要载体,我们还是无法从观念、意识上真正转过弯来。视觉图像是对表象的动作直观复制,因此与可观世界间的关系似乎更单纯,抽象的书写语言则在进行逻辑性分析方面更胜一筹,是一种对世界的提炼,却天生不能做到具象,是对形象记忆的招回。[1]神经图像是视觉图像的基础上神经生长有作用的因子,促进大脑的学习和记忆所呈现的图像。[2]两者都属于心理学实验范畴。所谓心理实验是指在严密控制的条件下,有组织地逐次变化条件,对相伴随的心理现象的变化进行现象记录和测定,从而确定条件与心理现象之间的关系。通过视觉图像传导神经图像循环记忆教学法,提高体育教学训练的效率,本实验笔者将以排球教学训练进行实验设计。

2 研究现状

目前体育教学训练案例中排球项目的技术动作相关教学方法主要采用示范法、讲解法、分解法等,但是对心理学方面的知识在技术中应用的甚少。关于心理学的相关教学主要应用在运动员比赛场上的心理变化上,本实验主要针对于排球教学中垫球技術——传球技术——发球技术三个环节的教学训练进行心理实验设计。

3 实验对象与方法

3.1 实验对象

本文选取西安市曲江第一中学排球队队员与排球校本课程共39名同学为实验对象,23名参加排球校本课程同学为对照组采用常规训练法,16名校排球队队员为实验组采用视觉图像传导神经图像循环记忆纠错心理学实验法。进行实验对比研究。

3.2 实验方法

在观察、调查以及测量的基础上,在一定的情境对研究的西安市曲江第一中学排球队员与参加校本课程同学掌握技术的变量进行操作和控制,进而揭示通过图像记忆的的原因给技术动作掌握的研究方法。

4实验过程

4.1 研究依据

德国心理学家艾宾浩斯对记忆和以往现象进行了系统的研究。一项通过动作图像的实验研究得出复制动作图像的误差随循环的时间与潜存间隔时间的延长复制的准确性与复制前练习次数呈正相关。[3]人类记忆和思维最主要方式是表象,表象是人脑对过去感知过的事物形象的反映。而运动表象是在运动感知的基础上,在大脑中重现的动作形象或运动情境,反映出视觉图像传导神经图像的循环记忆的原理。通过以下四种方式反映测试者掌握技术动作的能力。

4.1.1 内部表象

内部表象是第一人的视角,它是在外部动觉条件下给观察者呈现出的真实知觉。[4]通过实验组采用观察教师垫球、传球、发球的动作示范,观察者通过内部表象所呈现出的动作在大脑中的记忆进行自主练习,进而加深动作的记忆助于纠错教学。表明了内部表象有助于操作的表现。

4.1.2 模仿表象

在教学过程中,教师将技术分解动作与连贯动作进行示范,针对实验组只示范不讲解,而对照组进行讲解与示范相结合。发现实验组学生加深动作记忆,并出现个别动作的错误呈现,再通过循环示范让实验组同学发现错误并改正。

4.1.3 情境表象

采用情景表象时,教师根据垫球技术、传球技术、发球技术所呈现出的情景,创设出形象鲜明的投影图画片及视频,辅助生动的语言文字,并借助场景语言表达与音乐的艺术感染力,再现技术教学所呈现的的情景表象,使实验组学生如闻其声,身临其境,仿佛置身其中;师生就这此情景中进行一中情景交融的教学活动。培养学生启迪思维,发展想象,开发智力等方面确有独到之处。

4.1.4 表象的个体差异

不同的个体视觉表象的质量和眼动特征都具有很大的差异性,具体表现在四个方面:1、表象的个体差异在知觉、记忆、思维。2、表象的个体差异在发展水平的差异,主要表现在智力能力、体质能力、情绪能力上。表象的个体差异表现在早晚差异,典型的例子就是“人才早熟”和“大器晚成”。4、表象的个体差异在性别的差异和年龄的差异。在实验组成员中采用视觉图像传导神经图像循环记忆法中,不用的观察者、不同的体质、情绪状态、不同性别都呈现出不同的差异。

4.2 研究假设

垫球技术——传球技术——发球技术三个环节的教学训练中,运用视觉图像传导神经图像循环记忆教学法方法进行练习与常规教学练习方法效果进行对比。

4.3 实验设计

排球垫球技术——传球技术——发球技术三环节的教学训练组数为20次(前9次为第一阶段,后11次为第二阶段)。对实验组实施视觉图像传导神经图像循环记忆教学法训练,对对照组进行常规训练。

研究采用垫球技术——传球技术——发球技术效果指标(针对扣球效果和垫球的成功的次数为指标)。实验前对两组测试者均参加初测试;第一阶段结束后,进行阶段测试;第二阶段测试结束后进行终测。然后分别对初测结果、终测结果进行组间比较;分别对两项指标的初测与终测结果进行组内前后比较。

5 结论与建议

本文通过采用视觉图像传导神经图像循环记忆纠错教学法,打破了传统的教学模式,改变了以教师为主体的教学观念。以响应当前新课标要求,以学生为主体,教师为传授知识的引路者。本研究得到的主要研究结论如下:1 在视觉图像传导神经图像循环记忆纠错教学法采用内部表象训练更好的促进技术动作形成且效果优于教师讲解法。2 在视觉图像传导神经图像循环记忆纠错教学法中应用模仿表象更好的让学生掌握技术动作并加深理解与记忆。3 在视觉图像传导神经图像循环记忆纠错教学法采用情景表象让学生能更直观形象的发现自身的动作错误与关键点。4 视觉图像传导神经图像循环记忆纠错教学法同样存在个体学习的差异性,但整体的教学效果优于常规纠错教学法。

参考文献:

基于视觉的图像边缘检测研究 第4篇

在计算机视觉的研究领域中,物体边缘的识别是对外部世界认知过程中的一个不可或缺的重要部分,模式识别理论发展到现在,通过对大脑的研究与图像处理相结合来解决实际问题已经成为发达国家主流的研究趋势。大脑的视觉神经系统拥有完美的图像认知能力,通过研究人脑视觉系统的工作原理,建立其算法的系统模型,不但可以解决单纯依靠图像处理难以解决的实际问题,而且也将为人类认识自我、了解世界做出贡献。

在过去的研究中,使用微分算子的Canny法[1]等由于其高精度的边缘检出性能而被大多数图像处理工具所采用。边缘检测方法的研究由来已久,虽然期间提出的方法均有其各自的优点,但是欲通过将其结合来实现形状识别及运动检出等人们日常所进行的信息处理活动时,会发现方法间的结合非常困难,难以保证各个方法自身特点的发挥。究其原因,各种方法出发模型各异,难以结合使用。众所周知,从视觉系统在视网膜上进行的低层次信息处理到形状识别以及运动检出等高层次处理,在生理学上,其处理过程能够拟同于堆积木一样的方法搭建起来。也就是说,在第一视觉野(V1区)中所进行的较低层次处理是形状认知与运动检出的前提和基础。对第一视觉野的细胞模型化的工作处于建立视觉系统的基础地位。而且在此视觉野得到的细胞模型是否合理,取决于是否能够将其组合进更加复杂的视觉系统,来辅助完成形状认知与运动检出等高层次处理。

关于视觉系统如何认知弯曲。尽管Hubel和Wiesel暗示超复杂细胞能够用来测量曲率,但是到Dobbins为止的很长时间里此观点没有得到生理学实验的验证。这可能存在两个原因,首先生理学上寻找超复杂细胞是一件困难的事情,近期得到验证的只有end-stopped cells[2]。另一方面,endstopped cells虽然确实对弯曲刺激能够做出反应,但是对比于其相对粗略的曲率检出能力该细胞更适合用来对线段长度产生反应。到今天为止,虽然end-stopped cells在弯曲识别上的地位并没有改变,但其只能得出非常粗略的曲率数值的能力,与我们人类的视觉经验是不相符的。其中的原因在于,Dobbins等提出的模型虽然发现了end-stopped cells可以对直线与弯曲做出不同的反应,却没有建立其反应值与曲率的对应关系。作为大脑视觉研究,end-stopped cells更适合用来判断是否为曲线或检测定长线段,尚不足以解决人类的曲率检出问题。所以实现曲率检出还是可以有两种选择,一种选择是curvature-sensitive neurons,另一种是使用对方位具有精确感知能力的简单细胞[3]。或许用curvature-sensitive neurons来检测并计算人眼对弯曲的反应是一个具有广泛代表性的观点,似乎很多人都依然持有这种观点,但是本研究就是要展示以简单细胞为基础的微分细胞不但可以对弯曲产生反应,而且通过建立其反应值与曲率的对应关系,能够对曲率实现精确检测。

除去弯曲之外,构成轮廓线的图形要素还有直线,弯角,变曲点等。其中边缘(直线或曲线)方位由简单细胞检出,自marr后基本已成定论。剩余两种图形要素由端抑制型细胞进行检出。弯角及变曲点在图像处理领域被称为支配点(dominant point)[4]是在形状认识及运动检出处理中所必须的重要特征点。

本文将展示如何以简单细胞为基础,通过其组合结构实现图像边缘的检出。

1 过程与方法

1.1 同心圆感受野

在视网膜上分布着大量的视觉细胞。一个神经节细胞可以接受多个视觉细胞的视觉出力。那么对于一个神经节细胞来说,能够影响到其反应的视觉的细胞所占据的视网膜范围就是这个神经节细胞的感受野。

通过研究可以知道,神经节细胞的感受野中心部分因接受到刺激而兴奋,其周围部分抑制兴奋形成同心圆状。从而分为兴奋中心型与抑制中心型两种如图1所示。对于兴奋中心型来说就是中心部分接受明亮刺激而兴奋,抑制中心型则是中心部分接受暗刺激而兴奋。

同心圆型感受野的数学模型为拉普拉斯高斯滤波,表示为▽2G。图像I经过其处理变换为▽2G×I。把图像看作是点的集合,各点的坐标设定为(x、y)的话,拉普拉斯高斯滤波的计算定义为:

图2为获取图像边缘的原始图像,图3为经过拉普拉斯高斯滤波后的图像。

1.2 最大值选取

在前期研究中提出了边缘检出的线性结构edge cell,并且展示了edge cell精准的方位角度检出能力,但是在最适角度所对应的最大反应值探索问题上仍然有不足之处。现行方法是通过edge cel旋转360°选取最大反应值,此种做法存在两个问题:一是计算成本高,难以缩短计算时间;二是不符合视觉理论,因为在一点存在360个均匀旋转排列的简单细胞感受野是难以想象和接受的。

所以首先要改良这种最大值选取方法。现阶段具体的预想是采用高斯曲线近似法来确定最大反应值所对应的最适方位角。因为发现edge cell的反应值曲线与高斯曲线近似,如图4所示,所以通过计算所近似的高斯曲线来求取最适角度与最大值。高斯曲线方程如下:

其中,A为高斯曲线的峰高,B对应高斯曲线的中心位置,C为高斯曲线的幅宽。那么如果知道曲线上的3个点(θ1,R1)、(θ2,R2)、(θ3,R3)那么就可以通过建立联立方程:

求得:

其中,B为最适方位角度,A为最大值。这样可以通过15°间隔选取3个edge cell最大反应值通过近似高斯曲线来计算最适方位角度。此法不但可以大幅缩减计算量,而且更加符合视觉理论。

1.3 边缘的确定

在解决了edge cell最适角度检出问题的基础上,进一步确定选取了最大值,根据最大值我们确定了图像的边缘,检测的实际结果如图5所示。

2 结束语

本文所使用的边缘检测方法其研究基础采用了简单细胞模型:边缘细胞。此细胞模型脱胎于生理学的基础研究,在曲率检出方面已经取得了一定的应用。而利用此模型所实现的曲率检出方案依托于高斯曲线的现实应用价值和自然事物的高斯分布规律。在以往的研究中,最大值的求取为以细胞旋转360度在旋转结果中选取最大反应值。所找到的最大反应值不但计算成本高、运算复杂,而且不符合生

理学原理与意义。本文修改了以edge cell细胞旋转360度求取最大反应值为算法的求取方法,改为用高斯曲线近似法求取最大反应值。实现了求值算法的改良,计算量的优化。新算法所求取的最大反应值,大大减少了计算量与复杂度。同时检出方法与生理学意义相符合。

参考文献

[1]Canny J Canny.A Computational Approach to Edge Detection[J].IEEE Trans.Pattern Analysis and Machine Intelligence.1986,8(6):679-698.

[2]Kato H,Bishop,P.O.&Orban,G A.Hypercomplex and simple/complex cell classifications in cat striate cortex[J].Neurophysiol.1978,41:1071-1095.

[3]Gheorghiu E Kingdom,F A A.Spatial properties of curvature-encoding mechanisms revealed through the shape-frequency and shapeamplitude after-effects[J].Vision Res.2008,48:1107-1124.

视觉文化视角的广告图像传播研究 第5篇

【关键词】视觉文化;图像传播;广告

【作者单位】高颖,景德镇学院。

一、广告图像传播的历史演变:媒介技术的变革与视觉体验的变迁

广告图像传播的历史演变过程中,媒介一直扮演着十分重要的角色。古代的广告形式虽在一定程度丰富了广告图像传播的手段,但从视觉体验来看并未有大的改变。真正影响视觉体验变迁的是具有科技含量的现代化媒介,其中报纸、摄影、电视和网络对视觉体验的影响最大。

报纸作为一种大众媒介,其初期视觉体验的原理与传统的书籍、宣传册等基本相似。在报纸广告的发展历史中,值得关注的是插图的引入,尤其是手绘插图和摄影插图的引入。将图像引入报纸广告实现了报纸的图文结合。

摄影作为一种技术在广告图像的传播过程中起到了至关重要的作用。摄影能准确地将某一个瞬间的事物或景象记录下来,与真实事物之间可以达到高度的相似性,这是摄影术的本质特点,更重要的是,摄影术改变了我们的观看方式。照相机改变了原有的透视法的视觉原理:以观者为中心建构的一种视觉认知模式。“照相机的发明改变了人们观看事物的方式。他们眼中的事物逐渐有了新的含义。”这种视觉体验使人们关注的焦点开始从宏观走向微观。如果说早期的广告摄影比较客观的话,那么现代的广告摄影所产生的图像就是一种主观意愿的表达。电视广告的安排具有混乱性和穿插性,使电视呈现的图像具有碎片化的特征。电视的观看方式是以快速浏览的方式进行的。从观看情态来看,看电视的过程往往具有多样性和复杂性。

网络以及社交媒体的发展对广告图像传播的影响,使广告图像传播呈现较强的综合性、互动性以及参与性。受众的视觉体验已经从较为单一的媒介转为在不同媒介之间的转换。

二、广告图像传播的历史性动因考察

1.媒介以及技术的变迁推动着广告图像的发展

从表象上看,每一次媒介形式的变迁好像都推动着广告图像传播能力的发展。从近代平面设计发展来看,其源头来源石版画技术的发明。到了19世纪,石板印刷技术凭借其容易复制的优势得到了广泛的传播。19世纪末期出现的海报招贴设计成为宣传和促进商品销售的一种重要工具,此后海报设计成为平面广告图像传播的主要方式。

1925年贝尔德发明了电视机,1939年美国RCA推出了世界上第一台黑白电视机。1941年在道奇队与菲利斯队的一场棒球比赛电视直播间隙,布鲁瓦钟表公司花了9美元播放了历史上第一条正式的电视广告——20秒的马表画面。 1948年Ajax洗洁灵成为第一则有声广告。在现代媒介发展方面,每一种新媒介发明出来不久就成为广告图像传播的新形式。广告作为一种商业推广的手段,利用新的媒介技术给予观众新的视觉体验,可以促进企业在营销中占据竞争优势,因此广告图像传播的快速发展既与媒介紧密相连,也与广告业的积极采纳具有直接的关系。

2.广告对其他领域图像的借用

从广告图像的表现形式来看,广告是一种具有极强吸纳性的事物。对其他领域内容、符号、素材的借用是其惯用的手法。从效果来看,其丰富了广告表现的内容;从原因来看,其更多源于广告图像设计对创意性的要求。在广告设计以及传播中,广告对艺术方面的借用成为创新的主要表现点。比如马格利特是一位超现实主义的画家,其代表性作品有《这不是一支烟斗》等,英国Benson and Hdeges广告公司将其作品的表现手法运用于其广告作品之中。广告是作为一种视觉传达信息以实现其营销目的的艺术,必须引起消费者的关注。为了吸引消费者的关注并满足他们求新求奇的审美心理,广告在设计时往往借用了其他领域作品的符号元素或者现实生活中的素材作为基本加工材料。广告图像的传播可以看作对借用的原始素材的重新设计。比如,在西方近代的广告海报中经常出现自由女神、埃菲尔铁塔等众所周知的事物。随着媒介的进一步多样化,借用的东西变得越来越普及。比如迪塞尔的服装广告作品《现代会议的诞生》就借用了1945年雅尔塔会议丘吉尔、罗斯福和斯大林合影的照片,还在其中增加了几位美女与三巨头之间的亲密关系,消解了其原有的政治意义。广告通过对其他领域图像的不断借用,才保证了其行业源源不断的创意与新的作品,当然也在一定程度上推动了广告图像传播的广泛传播。广告图像传播的图像不仅是简单的图像符号,更包含着文化层面的含义,促进了广告图像文化的繁荣。

3.消费者需求的变迁是推动广告图像传播发展的根本动因

媒介以及相关技术的变革为广告图像传播提供了技术性支持,为广告图像传播提供了丰富的素材。然而,真正推动广告图像传播发展的却是消费者消费理念的变迁,换而言之是人的消费需求。广告传播作为一种商业性艺术,广告公司的设计师必须要将满足消费者的需求,作为其广告创意设计的出发点和立足点。消费者的需求可以简单分为物质性需求和精神性需求。设计物的功能,满足的是物质性需求;设计物的形式,是满足其精神性需求。广告从传播角度来看必须符合视觉传播的规律,满足消费者“看”的需要。随着商品的同质化问题的产生,附着在商品之上的精神性才成为广告传播的关键。求马斯洛认为,人的需求是有层次的,并且有高级需要和低级需要。他将需要分为五个层次:生理需要、安全需要、社交需要、自尊和自我价值实现。由于物质的极大富裕,在满足了人们以较低的生理需要和安全需要层次以后,社交需要成为人们的主要需求。这种需求从性质上来讲更多属于精神性需求。精神性需求的满足主要取决于作品的形式要素。商品的有用性退居次要位置,商品的意义价值成为营销的重点。广告的功能从早期的告知转变为劝服,这正是为了适应消费者需求的变迁。广告图像传播中的图像也渐渐从客观真实的图像展示演变成意义构建、欲望营造的图像。

三、广告图像传播的视觉文化解读——以2008中国国家形象片《幸福篇》为例

2008年,国务院新闻办公室曾策划和制作了一部由梅高广告参与制作的30 秒国家形象片《幸福篇》,并在CNN、BBC等海外主流媒体播出。此广告片与之后的《角度篇》《人物篇》相比,很多人并不知道它的存在。这则广告与别的广告的最大区别,在于没有明星的参与,没有宏大的叙事,没有旁白,文字也很少,它单纯依靠图像自身的力量来传播其背后的意图,但每一个镜头的背后都有值得我们深思的东西。

第一个镜头是一扇古老大门的打开,可以引申为中国的国门打开,也可以理解为国家的对外开放和交流。接着一群儿童跑上台阶、拿着风筝跑上城墙,年轻的儿童与悠久的历史之间形成强烈的对比。镜头切换到传统的江南水乡,流水的船上站着一对身着传统婚礼服装的新娘、新郎正幸福地对望(拍摄地乌镇)。一辆轿车载着一对身着现代婚礼服装的新婚夫妇穿行在一座现代化的大桥上。一扇窗打开,外面是江南的水乡,代表着传统的生活,接着切换到现代都市,三个穿着摩登的女性出现在摩天大楼的前面。镜头开始放远,看到一条江,东方明珠的出现,显而易见是黄浦江,上海。这些镜头都代表着现代都市的生活。传统与现代是这些镜头背后的思想。一组组的镜头表现出我国是一个具有悠久的历史文化传统,又具有现代都市文明的国家,在现代化的发展过程中人们享受着美好的生活。

接下来出现的镜头里,戏曲服装演员的表演、街舞表、少林功夫的表演都具有强烈的象征意义,其代表着传统、现代文化的并存,代表着文化的包容。然后镜头切换到放风筝的儿童的正面、现代婚礼新婚夫妇的正面,这表现的是与最开头镜头的呼应。身着民族服装的少数民族女性的出场与泼水节则代表着少数民族的在场与幸福,点着火柴的小男孩与红灯笼寓意着红红火火的期盼,心形烛光的出现代表着爱心。结尾出现中国书法的“CHINA”属于总结性的镜头。整个影视广告的基调是含蓄、内敛。这些视觉符号的选择以及镜头之间的逻辑联系包含着一个隐藏的叙事者,通过镜头的画面叙事传达了该影视广告片的目的。对这一影视广告文本的解读,可以看出其中的文化思维。文化的差异性对同一视觉符号的编码和解码的方式是不同的。因此,要理解广告图像传播的意义必须要将其置于视觉文化的范畴来思考。

[1][美]尼克拉斯·米尔佐夫. 视觉文化导论[M]. 南京:江苏人民出版社,2006.

[2][日]白石和也. 视觉传达设计史[M]. 北京:机械工业出版社,2010.

基于视觉的道路图像识别技术研究 第6篇

关键词:道路图像识别,区域特征,分水岭算法,边缘检测

1 道路识别技术简介

1.1 基于特征的方法

(1) 基于区域特征的方法。基于区域特征的道路区域检测可以看成是一种图像分割问题, 主要是通过道路区域和背景区域像素点之间色彩、亮度等差异来划分。传统的方法是首先通过计算道路图像直方图, 选取合适的阈值后将图像进行相应的灰度分割, 然后采用区域生长、分裂合并等方法识别出道路区域。

(2) 基于边缘特征的方法。基于边缘特征的方法主要从道路区域与背景区域之间的特征突变来标识道路的边缘。主要包括图像预处理、边缘抽取和二值化等。首先对道路图像选取感兴趣区域, 通过滤波消除噪声, 再进行边缘增强, 完成预处理。对图像进行边缘抽取时, 一般都以处理时间和抽取结果为准选取合适的算子, 常见的边缘算子包括Canny、Laplace、Prewitt、Sobel等。边缘抽取之后进行图像的二值化, 得到边缘图, 其中阈值的选取, 一般采用固定阈值、自适应阈值、动态阈值等方法。对二值化的图像再进行哈夫变换, 形成连续的道路图像。

1.2 基于模型的方法

其主要步骤包括:建立道路模型、提取车道线像素、拟合道路模型等。

2 道路区域检测

2.1 分水岭算法简介

分水岭算法最早是由Digabel和Lantuejoul提出, 并由Beucher和Lantuejoul改进的, 属于基于区域特征的分割方法。一般分为两种:基于数学形态学定义下的递归算法和基于地形学距离定义下的算法。前者首先计算图像的灰度级, 然后根据灰度级划分确定集水盆, 对图像进行分级处理, 从最小级开始对图像进行处理, 如果当前等级像素与不同的集水盆相连, 则此像素就为分水岭像素。基于地形学距离定义下的算法是由Meyer提出的, 它首先定义最小级的集水盆, 然后填充集水盆, 不同集水盆相遇的地方就是分水线的位置。

2.2 改进的基于距离的分水岭算法

本文提出改进的基于距离的分水岭算法, 其基本流程包括: (1) 初始化道路和背景极小值定义; (2) 采用分水岭算法确定分水线; (3) 应用哈夫变换拟合道路边线; (4) 根据检测结果更新最小值。

2.2.1 初始化道路和背景定义

一般, 我们采集到的道路图像中, 道路是一个近似梯形的结构, 所以我们将图像正下方定义为道路的极小值, 图像的顶部及两侧定义为背景的极小值。

2.2.2 分水岭变换

(1) 等级划分。首先寻找道路与背景极小值相邻的像素, 并计算这些像素与极小值之间的距离, 根据计算结果将这些像素划分等级之后储存在堆栈中。这里的相邻像素是指像素的四邻域像素, 像素间的距离是两像素3个颜色分量 (RGB) 差值最大的那个。

(2) 集水盆扩展。集水盆从定义的极小值开始扩展, 按照划分的等级, 从最小级开始对储存于堆栈中的像素进行处理。如果当前像素只与一个集水盆相连, 就把此像素划分为这个集水盆的像素, 并将其作为集水盆新的边界, 然后计算它的相邻像素及距离储存于堆栈。如果处理的像素与两个集水盆都相连, 则把这个像素作为分水岭。

2.2.3 求取道路边线

本文采取哈夫变换求取道路边线的直线模型。一般, 如果道路划分较为理想, 获得的分水线的形状与道路形状基本相似。图像中道路的形状近似为一个梯形, 左右两侧各有一条边线。本文根据获得的分水线从最高点划分左右两侧, 分别求取两侧的哈夫直线, 以减少左右边线的影响。寻找分水线最高点的主要代码如下:

其中, image_w和image_h是图像的宽度和高度;fsl为得到的分水岭图像;idx是图像的像素值, 得到的即是分水岭的最高点。

2.2.4 更新极小值

为提高算法的准确性, 本文提出了实时更新较小值的思想:如果检测结果理想 (即能同时检测到道路两边的哈夫直线) , 就用这个结果来更新极小值的定义;否则, 就继续使用上一帧图像检测的结果。算法的主要代码如下:

其中, image_w和image_h是图像的宽度和高度;fsl为得到的分水岭图像;stk_mark是储存道路和背景极小值的图像;MIN为取小值函数, MAX为取大值函数。

3 道路边缘检测

3.1 图像预处理

3.1.1 道路图像灰度化

摄像机采集到的道路图像颜色模型均为RGB模型, 它有3种基本的颜色分量, 即红 (Red) 、绿 (Green) 、蓝 (Blue) 。大量的实验数据表明, 当采用0.3份红色、0.59份绿色、0.11份蓝色混合后可以得到比较符合人类视觉的灰度值, 即式 (1) 所示:

将式 (1) 计算出来的数值作为图像中彩色像素对应的灰度值。

3.1.2 道路图像滤波

空域滤波算法是在图像空间直接对图像进行各种处理, 常用的算法有:邻域平均法、中值滤波法和边缘保持平滑法等。本文采用邻域平均法进行滤波。

这种方法对原始图像f (x, y) 的每一个像素取邻域S, 计算S中所有像素的灰度值的平均值, 作为滤波后图像g (x, y) 的灰度值, 如式 (2) 所示:

改进的加权算法如式 (3) 所示:

3.1.3 道路图像边缘增强

常用的边缘检测算子有Robert算子、Sobel算子、Laplace算子等。本文采用Sobel算子进行边缘增强。

Sobel算子是先做加权平均, 再做微分。Sobel算子的定义如式 (4) 、式 (5) 所示。

其中, 式 (4) 用来检测水平边缘分量, 式 (5) 用来检测垂直边缘分量。其对应的滤波器内核为:

3.1.4 道路图像二值化

常用的阈值选取方法有直方图法、最大类间方差法、最大熵法等。本文采用最大类间方差法进行图像二值化分割。该方法介绍如下:

将图像中的灰度值按照灰度级用阈值T分成两类C0和C1, 其中, C0={0, 1, …, T}, C1={T+1, T+2, …, l-1}。用σW2、σB2、σT2分别表示类内、类间和总体方差, 则通过表达式 (6) 达到最大值来确定最佳阈值T*。

由于σT2与T无关, 所以最为简单, 从而最佳阈值可以通过式 (7) 求得:

式中的参数为:

其中, i为图像灰度值, pi为灰度值在图像中出现的频率。

3.2 车道边线检测

3.2.1 划分感兴趣区域

将分水岭算法得到的分割结果应用于二值化图像中, 划分感兴趣区域。具体的程序代码如下:

其中, image_w和image_h是图像的宽度和高度;fsl为得到的分水岭图像;TsholdIm是二值化图像;MIN为取小值函数, MAX为取大值函数;dis_point.y是消失点纵坐标。

3.2.2 车道线拟合

由于分道线能够提供更为准确的车道信息, 而且相对于道路边线, 分道线更靠近道路中央, 斜率更大。利用这个特征, 本文首先检测分道线, 再检测道路边线。同样, 这里采用哈夫直线模型进行车道线拟合。先将二值化图像分为左右两部分, 然后对左右两边图像分别进行哈夫变换。

4 结语

本文提出了一种基于视觉技术的道路图像识别算法。今后的工作可以在以下几个方面进行: (1) 对于特殊情况 (如阳光直射、雨雪天等) 下的道路图像进行分析处理; (2) 集成基于双目视觉的道路检测或者障碍物检测, 提高检测技术的鲁棒性; (3) 综合利用道路图像的多特征信息, 加强道路边界或者车道标识的算法研究, 以拓宽识别范围, 提高检测技术的适应能力; (4) 该算法在实现效率上还有进一步改进的空间。

参考文献

[1]徐友春, 王荣本, 李克强, 等.一种基于直线模型的道路识别算法研究[J].中国图像图形学报, 2004, 9 (7) :858-864.

[2]杨明, 陆建业, 王宏, 等.基于视觉的道路跟踪[J].模式识别与人工智能, 2001, 14 (2) :186-193.

[3]MEYER F.Topographic distance and watershed lines[M].Signal Processing, 1994.

基于机器视觉的大米粘连图像分割 第7篇

目前, 国内外有关研究人员应用机器视觉技术对粘连谷物颗粒分割做了许多分析研究, 凌云、王一鸣等人提出一种基于先验知识的流域分割算法, 设定合理的区域面积阈值A, 标记并去除图像中的单个籽粒区域, 结果记为M;然后, 腐蚀N次, 对粘连籽粒区域进行流域分割, 结果记为Mg;最后, 取M与Mg的并集, 作为分割结果, 结果表明:该算法分割效果较好。蜀秦, 何东健等人提出基于籽粒轮廓曲率分割粘连大米图像的算法, 利用能反映边界点尖锐程度的曲率及曲率大小和曲率方向准确快速找到分割点, 用最短距离配对法对粘连大米籽粒进行分割, 此算法对粘连籽粒的准确分割率达95%以上。杨华东、简淼夫提出了一种基于距离变换、形态重构和分水岭算法相结合的图像分割方法, 图像通过距离变换与形态重构算法结合, 得到颗粒图像的标识点图, 再结合分水岭变换对分割后的距离灰度图进行变换, 该方法能有效合理地解决粘连或者重叠颗粒等物体的分割。刘相滨、邹北骥等人提出改进的基于边界跟踪的粘连目标分离算法, 该算法通过自动旋转聚堆目标区域使其中轴方向成垂直或水平来实现这种情况下的分离, 该算法进一步提高了分离效果。

以上研究所处理的籽粒粘连度不高, 而且所使用的方法基本上是基于颗粒的一些形状特征来研究的。本文提出一种基于不同光照方向得到同一堆粘连大米图像, 对这一系列图像综合分析处理, 分割粘连籽粒。

1 图像的采集和预处理

1.1 采集平台搭建和图像采集

图1为搭建好的图像采集平台, 光源为双管日光灯, 从1、2、3和4四个方向, 按照不同的高度为0、0.5、1、1.5、2 (单位cm) , 采集一系列粘连大米图像。图2为按照上述条件采集到的大米图像中的一种粘连情况。图2a、图2b、图2c和图2d分别为光源高度为2cm时采集的4幅图像, 由于篇幅限制, 其他光源高度条件下的图像不再列举。

1.2 图像预处理

图像预处理的主要目的是消除图像中无关的信息, 恢复有用的真实信息, 增强有关信息的可检测性和最大限度地简化数据, 从而增加特征抽取、图像分割、匹配和识别的可靠性。

本文以图2a为例, 可以看出图像中下方米粒和上方米粒之间亮度差异很大, 而且背景噪声比较大。同为前景目标, 如果米粒间亮度差异太大, 就会造成使用传统方法二值化时亮度较低的前景目标信息丢失, 为了验证这一问题, 使用大津法 (OTSU) 对图2a进行二值化, 由图3a可知:图像上方米粒的信息丢失了, 因此要对原图进行图像增强。由图3b可知:从原图中分别划出3个区域, 分别为标记A、B、C、分别代表图像的背景区域, 亮度较低的米粒区域, 亮度较高的米粒区域, 并分别计算其均值和方差, 见表1, 由表1和图3a可知:只要增强亮度较低米粒区域的像素值, 就能改善二值化后的图像。

结合上面的分析, 使用局部增强的方法来处理。增强方案:给定原图中某一点Ⅰ (x, y) , 取其八邻域, 然后求这些值的均值M和方差D, 如果30≤M≤120并且D≤20 (因为在图像中米粒边缘处的方差大, 尽量不要改变米粒边缘上点的像素值, 否则会影响后续处理) , 然后将处理后图像G (x, y) 增强至原图像对应点Ⅰ (x, y) 的E倍, 本文取E=2, 如公式 (1) 。

增强后的图像如图3c所示, 对其二值化, 如图3d所示, 与图3a比较后结果显示:较暗处米粒的信息保留下来了, 但米粒边缘多了许多毛刺, 这是由于米粒反射光线, 照亮了背景, 经过增强后, 这部分也同样被增强了, 使用 结构元素腐蚀, 去除部分孤立点并使米粒边缘粘连的毛刺与米粒分离, 结果如图3e所示, 米粒边缘的毛刺明显减少了, 但有很多孤立点, 使用形态学消噪, 计算图像中每个连接体的面积, 将面积小于500pixel的孤立点去除, 如图3f所示。图像噪声点去除了, 由于在上面步骤中使用了腐蚀, 会丢掉一部分信息, 再使用相同的结构元素膨胀一次, 还原丢失的信息, 如图3g所示。最后, 最终二值化后图像上的0点对应于原图像上的点置0, 如图3h所示, 实现消噪。

2 粘连图像分割

图4是使用Lo G算子计算图2中4幅经过预处理之后的边缘图像, 由图4可知:不同光照方向会丰富米粒相应方向上的细节, 每个光照方向下的米粒都会有不同的细节。在边缘检测之前, 因为米粒表面的凸凹或者垩白等因素的影响, 需要对图像进行平滑处理, 以减少边缘检测时出现过多的细节, 影响处理结果。这里使用八邻域平均法, 即取每个像素点八邻域相加平均后, 替代该像素点的像素值。

在上面基础上, 把4幅边缘图像叠加起来, 就会发现原来不连续的边缘叠加后连接起来了, 如图5a所示。然后对其二值化, 如图5b所示。用预处理中使用过的方法去除边界内的孤立点, 得到图5c。由于边界上可能存在一定的空隙, 使用1.2节中的结构元素对其膨胀, 如图5d所示。要得到单像素边界, 应对图5d细化, 得到图5e。图5e边界点的位置 (x, y) , 经预处理后的原图对应 (x, y) 点的像素值置为0, 结果如图5f所示。简单总结处理步骤:①计算每幅预处理后图像的边界;②把①得到的边界叠加, 并二值化;③使用结构元素对二值化边界图像进行膨胀处理;④细化膨胀后的图像, 得到单像素边缘;⑤边界图像和原图对比处理, 找到分割线, 对粘连米粒分割。

按照上述步骤处理H=0、0.5、1.0、1.5cm的粘连图像, 得到图6a、图6b、图6c和图6d, 对比发现图6a中有米粒没有得到分割, 图6b和图6c中有一小块米粒信息缺失, 图6d中分割效果好, 就这幅图像来说, 在H=1.5、2.0cm时分割效果最好, 但从分割其他粘连情况来说, 在H≠0cm时效果都很好。

图7给出了其他粘连情况和长圆形米粒的分割效果, 都得到了很到的分割。

3 结果分析

通过分割效果, 可得出此分割方法可行, 效果不错, 因为不同方向上的光照会丰富不同方向向光面的细节。在边缘检测过程中, 有分界面的边缘会在不同光照方向上得到累计加强, 而且能使米粒在其他光照方向不能反映的细节显现出来, 各个方向相互弥补。另外由于垩白度较高的米粒反射光比较强烈, 在图像上表现为亮度较高, 若与透明度较好的米粒相粘连, 会有明显的分界;而透明度较高的米粒, 由于其透光性, 光线在穿过米粒进入另一个米粒时会出现折射, 从而出现分界线, 在不同方向光的加强下, 最终得到较为明显的分界线。不同高度的光源在照射米粒时, 接受光照的曲面不同, 而且相互遮挡入射光的情况也不同, 因此会影响分割效果。如果入射光线与图像采集平台夹角过小, 就会造成离光源近的米粒过多遮挡远端米粒的入射光线, 对远端米粒造成不良影响。总之, 只要光源高度合适, 此方法分割效果明显。

4 结论

由试验结果可以得出, 只要光源的高度调整合适, 不同粒型米粒的各种粘连情况都能得到有效的分割。从结果图和原图之间的对比可以发现, 分割后的图像边缘信息少量丢失, 但大致保留了原有的形状特性。下一步需要研究如何减少或者恢复丢失的边缘信息。

参考文献

[1]凌云, 王一鸣, 孙明, 等.基于流域算法的谷物籽粒图像分割技术[J].农业机械学报, 2005, 36 (3) :95-98.

[2]杨蜀秦, 何东健.连接大米籽粒图像的自动分割算法研究[J].农业化研究, 2005, 27 (3) :62-65.

[3]杨华东, 简淼夫.基于灰度形态重构的颗粒图像分割方法[J].南京工业大学学报:自然科学版, 2005, 27 (3) .

[4]刘相滨, 邹北骥, 等.一种改进的基于边界跟踪的粘连目标分离算法[J].湖南师范大学学报:自然科学版, 2006, 29 (2) .

[5]李兵.基于机器视觉的黑片缺陷检测图像预处理技术的研究[D].沈阳:沈阳理工大学, 2010.

计算机视觉鸭蛋图像分割技术研究 第8篇

我国是世界上最重要的禽蛋生产和消费大国, 从1985年至今, 禽蛋产量已连续20几年雄居世界第一。其中, 鸭蛋及其制品包含人体所需蛋白质、脂肪、矿物质和维生素, 易于消化和吸收, 具有很高的营养价值, 是人们日常生活中重要的动物性营养食品。为了利用计算机视觉技术提高鸭蛋品质检测和生产加工的自动化水平, 国内学者做了大量的研究。彭辉在小波域下提取破损鸭蛋的灰度共生矩阵纹理参数, 作为BP神经网络输入, 平均识别率达到90%[1], 但算法复杂, 影响识别速度。在鸭蛋裂纹检测中, 熊利荣提出了利用彩色阈值和灰度阈值分割裂纹的方法。实验结果表明, 灰度阈值分割效果更佳, 分割阈值范围[18 25][2], 但最佳分割阈值要通过实验方法人眼观察分割效果确定, 主观性强。熊利荣采用sobel算子进行鸭蛋品质检测中涉及到的边缘检测[3]。文献[2]和[3]对于鸭蛋上粘有羽毛和稻草等杂物时, 可能误判为裂纹。文献[4]和[5]对鸭蛋大小和蛋芯颜色进行计算机视觉检测, 而对于关键步骤目标与背景的分割在文中未做详细介绍。本文在前人基础上, 提出一种基于梯度-灰度共生矩阵的二维阈值分割方法。

1 图像样本获取与预处理

本研究最初选择数码相机获取鸭蛋样本, 简单方便。通过实验研究发现, 数码相机采集的鸭蛋样本易受光照、抖动等因素影响, 导致后期处理的失败。原始样本由于受到光线的影响, 出现曝光不均匀现象, 导致预处理程序不能准确获取鸭蛋区域, 无法进行下一步的处理, 如图1所示。

鉴于上述原因, 笔者自行设计了鸭蛋样本采集系统, 它由计算机、CCD摄像头、图像采集卡和照明室等组成, 光照系统的设计关系到后续的图像处理和分析。本系统采用封闭式照明系统, 照明室内壁涂成白色, 光源采用环形8W节能灯, 安装在圆柱形光室内壁, 保证均匀光照下拍摄, 摄像头安装位置固定, 防止抖动。照明室内的底面为用细砂打磨过的黑色橡胶板, 可增强目标图像与背景图像的对比度。利用监视器随时观察拍摄图像质量, 通过照明室外面的连杆调节鸭蛋位置, 保证图像采集效果最佳。

利用MATLAB7.0图像处理工具箱对采集后的鸭蛋图像进行滤波、增强等预处理操作;用中值滤波器对图像进行平滑处理, 减弱图像中的噪声;对鸭蛋图像直方图均衡化改善图像视觉效果, 增强对比度。由于蛋场自然环境复杂, 蛋壳上会存在血迹、粪便、羽毛和稻草等杂物, 而传统的灰度阈值分割方法只单纯依靠灰度特征进行分割, 因此会带来很多问题。传统的基于灰度阈值分割效果如图3所示。从图3中发现, 基于区域造成图像的过度分割或误分割, 基于边缘不能提供较好的区域结构。只有充分利用图像中的各种信息以及它们之间的联系, 才能更有利于分割。因此, 本文联合图像梯度信息, 提出建立鸭蛋图像的灰度一梯度共生矩阵模型, 利用改进的二维阈值来分割图像。

2 改进的二维阈值分割

2.1 灰度-梯度共生矩阵

图像的灰度是构成一幅图像的基础, 而梯度是构成图像边缘轮廓的要素, 灰度-梯度共生矩阵的元素c (i, j) 定义为在归一的灰度图像F (m, n) 和归一的梯度图像G (m, n) 中共同具有灰度值为i和梯度值为j的总像点数。因此, 灰度一梯度共生矩阵反应了图像中灰度和梯度的分布规律, 同时也给出了各像点与其邻域像点之间的空间关系。

设一幅M×N的灰度图像f (m, n) , m=0, 1, 2…, M-1, n=0, 1…, N-1, 定义f (m, n) 的正规化灰度图像为

F (m, n) =int[f (m, n) ×lffmax]+1 (1)

式中 int—取整运算;

lf—规定灰度最大灰度级;

fmax—图像f (m, n) 最大灰度。

定义g (m, n) 正规化梯度图像为

G (m, n) =int[g (m, n) ×lggmax]+1 (2)

式中 gmax—梯度图像g (m, n) 最大值;

Lg—规定最大梯度值。

则灰度一梯度共生矩阵C= (cij) , i=0, 1…, lf -1;j=0, 1…, lg-1。其中, 共生矩阵Ci行第j列元素值cij为同时使F (m, n) =i, G (m, n) =j像点对数, 且灰度值为i/梯度值为j处共生矩阵概率为

pij=ciji=0lf-1j=0lg-1 (3)

i=0, 1…, lf -1;j=0, 1…, lg-1

2.2 最大熵方法

阈值法是图像分割的一种重要方法, 在图像处理与识别中广为应用。本文提出了基于灰度-梯度共生矩阵模型和最大熵原理的自动阈值化技术。该方法不仅利用了图像的灰度信息, 而且也利用了图像的梯度信息。该方法通过计算基于灰度-梯度共生矩阵的二维熵并使边缘区域的熵最大, 来选择最佳阈值向量, 最大熵和最佳阈值理论分析参考文献[6]。最佳阈值求解程序流程图如图4所示。首先, 对变量赋初值;之后, 计算目标概率P_EO和背景概率P_EB, 再分别统计目标与背景的熵H_EOH_EB, 取最大熵H= (H_EB+H_EO) /2;最后, 将最大熵存入Max, 所对应的灰度值存入s_Max, 梯度值存入t_Max。表1给出了3种典型鸭蛋样本分割参数。

3 分割图像后处理

由于受蛋场环境的影响, 蛋壳表面粘有杂物和粪便, 分割后图像残留线状或点状的伪目标和噪声, 为了获得理想分割图像, 进行分割图像后处理十分必要。以形态为基础的数学形态学是图像分析的有效工具, 本文涉及到的数学形态学运算有膨胀、腐蚀、填充、开和闭运算。

膨胀作用在于使目标区域连通, 运算符为♁。AB来膨胀记为AB, 其定义为

AB={x|[ (B) xA]Φ} (4)

填充操作是一种根据像素边界求取像素区域的操作, 常常用来填充图像中的“洞”, 是形态学的一种常用操作。

使用同一个结构元素对图像先进行腐蚀, 然后再进行膨胀的运算称为开运算;先进行膨胀, 然后再进行腐蚀的运算则称为闭运算[7]。本文利用开闭运算删除小像素点, 有利于目标物体分割。数学形态学处理后的图像如图5所示, 图5 (a) 为粘有稻草的鸭蛋图像, 图5 (b) 为粘有粪便的鸭蛋图像。

4 结束语

根据上述算法, 用MATLAB7.0编程构造了鸭蛋图像的灰度-梯度共生矩阵和二维阈值分割程序, 并对整个样本库中的鸭蛋样本进行了分割实验。实验表明:图像灰度为lf=256级, 未进行压缩;梯度值压缩至lg=16级, 分割效果最好。图5为两幅鸭蛋图像基于灰度一梯度共生矩阵二维阈值分割结果。以图5 (a) 为例, 第1幅为预处理后鸭蛋图片;第2幅为二维阈值分割后图片, 没有出现过分割现象, 比传统阈值分割效果理想 (如图3 (b) 出现了明显的过分割现象) , 但由于两幅图像都粘有稻草和粪便等杂物, 使分割后图像存在伪目标;第3幅为膨胀后图片;第4幅为填充后图片, 经过膨胀和填充处理后图像上的孔洞被填充;第5幅为去掉多余像素点的图片, 将边界表面不连续的像素点去掉是为了排除杂草的影响, 利于计算鸭蛋像素面积, 为计算机视觉鸭蛋质量检测和质量建模奠定了基础。

摘要:计算机视觉鸭蛋品质检测中, 目标与背景的有效分割尤为重要。为了解决传统灰度阈值分割存在的弊端, 构造图像的灰度-梯度共生矩阵, 提出基于灰度、梯度信息和最大熵原理的二维阈值分割方法。通过统计目标和背景的熵, 并使二者和最大, 确定与此对应的灰度、梯度值, 即为最佳分割阈值。采用数学形态学方法对分割图像后进行处理, 去除噪声点, 使分割效果更理想。实验表明, 该方法有效。

关键词:计算机视觉,鸭蛋,灰度-梯度共生矩阵,二维阈值分割,最大熵

参考文献

[1]彭辉, 文友先.基于小波变换和BP神经网络的蛋壳破损检测[J].农业机械学报, 2009, 40 (2) :170-174.

[2]熊利荣, 王树才.基于机器视觉的鸭蛋裂纹自动检测[J].湖北农业科学, 2009, 48 (12) :3152-3154.

[3]熊利荣, 丁幼春.鸭蛋品质检测分级系统中的图像处理[J].农机化研究, 2006 (1) :79-80.

[4]陈小伟.机器视觉鸭蛋大小及蛋芯颜色检测分级研究[D].武汉:华中农业大学, 2001.

[5]陈红.鸭蛋品质无损自动检测分级系统[J].农业机械学报, 2004, 35 (6) :127-129.

[6]邹丽辉.基于纹理特征的木材表面缺陷识别方法的研究[D].哈尔滨:东北林业大学, 2007:27-28.

视觉图像论文 第9篇

计算机硬盘中有不少形状复杂的精密薄片零件,其尺寸的在线高精度检测已经成为一个重要研究课题。机器视觉检测技术以非接触、柔性好、精度高、速度快、自动化和智能化水平高等优点逐渐成为机械加工领域中新的检测技术,而边缘检测是机器视觉检测技术的基础和关键,边缘的定位精度直接影响到尺寸检测的精度。在视场一定的条件下,提高检测精度最直接的方法就是提高 CCD像机的分辨率,即增加像素点阵数,然而提高硬件分辨率的代价是相当昂贵的,因此需要研究更高精度的边缘检测算法,即亚像素边缘检测。亚像素边缘检测是在硬件条件一定的情况下,用软件的方法来提高边缘定位精度,使边缘定位精度达到亚像素级。

笔者基于机器视觉检测技术研制了薄片零件尺寸检测系统[1],该系统主要用于薄片零件的在线高精度尺寸检测。检测系统的算法应保证检测实时性,计算精度应保证检测精度要求,抗噪声能力要适应工业生产现场。本文针对薄片零件尺寸检测系统中的边缘检测问题,提出了一种新颖的精确亚像素边缘检测方法。

1 像素级边缘检测

数学形态学是一种新型的图像处理方法和理论,它具有天然的并行实现的结构,从而能显著提高图像处理和分析的速度[2],因此,本文采用二值数学形态学方法进行像素级边缘检测。

1.1 图像二值化

待检零件图像如图1所示。画出待检零件图像的灰度直方图,根据灰度直方图设置灰度阈值T,灰度值不小于阈值T的像素将其灰度值设为255(白),灰度值小于阈值T的像素将其灰度值设为0(黑)。

1.2 去除噪声

在生产现场,多个因素引起图像噪声在所难免。这里仅选取待检零件二值化图像的局部来观察其中的噪声,为了便于观察,噪声用箭头表示,如图2所示。图像中灰度值相同的连通区域称为团块。待检零件团块面积比较大,各个噪声团块面积比较小,由于噪声团块的面积相对待检零件团块的面积来说要小得多,因此可以根据团块面积来去除噪声。用二值形态学中的连通组元提取算法求得各个团块的面积,设置阈值,面积小于阈值的均为噪声,予以去除,将其所有像素点灰度值设为255(白)。

1.3 二值数学形态学处理

待检零件图像经过去噪后,将其分别进行二值数学形态学膨胀和腐蚀,然后用膨胀后的图像减腐蚀后的图像,即可得到待检零件的边缘。但此时的边缘不是单像素宽连通的,因此需要对其进行细化。用二值数学形态学中的区域骨架提取算法对边缘进行细化,获得单像素宽连通像素级边缘,我们称之为轮廓。这里仅选取待检零件轮廓局部来观察,如图3所示。

2 亚像素边缘检测

亚像素边缘检测最早由Hueckel提出,现已发展为插值、几何矩、正交空间矩、Zernike矩、最小二乘拟合、曲面拟合、小波变换等多种检测算法[3,4,5,6],这些算法的优点是定位精度较高,可以实现亚像素定位,缺点是算法复杂,计算时间较长。本文提出一种基于三次样条插值的9×9pixel矩形透镜法进行亚像素边缘检测,获得亚像素级轮廓,该方法的步骤包括矩形透镜内灰度值梯度方向的判别和基于三次样条插值函数的亚像素坐标计算。

2.1 灰度值梯度方向的判别

由梯度算子边缘检测的原理可知,在灰度图像中沿着边缘方向的像素灰度值变化较小,垂直于边缘方向的像素灰度值变化大。与边缘垂直的方向定义为灰度值梯度方向。以已获得的像素级轮廓中某一轮廓点为中心生成9×9pixel的矩形透镜,用该透镜对未处理的待检零件图像中的边缘进行观察,计算方向如图4所示。0、1、2、3四个方向的像素灰度差值绝对值之和为

Ei=j=08|pj+1-pj|i=0,1,2,3 (1)

式中,pj为像素点灰度值。

判断Ei的大小,Ei最小的方向为边缘方向,与边缘垂直的方向即为灰度值梯度方向,提取灰度值梯度方向上各像素点的灰度值和坐标值。图4中,xoy是图像坐标系,假设1方向是梯度方向,则ox′是梯度方向坐标系。梯度方向坐标和图像坐标是独立的。

2.2 亚像素坐标计算

在图像边缘过渡区域内,图像边缘灰度在垂直于边缘方向上是连续性分布而非阶跃分布的[7]。根据这种思想,以轮廓点为中心的透镜内图像区域是图像边缘的过渡区域,透镜内垂直于边缘的方向是灰度值梯度方向,对梯度方向上各像素点灰度值,用函数逼近恢复灰度的一维连续分布函数,则分布函数一阶导数的极值点是分布函数斜率最大的地方即梯度方向上的亚像素坐标。由于三次样条插值算法简单,计算量小,三次样条插值函数在整个区间上有二阶连续导数,总能求出一阶导数的极值,所以选取三次样条插值算法对梯度方向上各像素点灰度值进行逼近。

以透镜内梯度方向坐标为自变量,即x′j=j(j=0,1,…,8),像素灰度值为函数值,即f(x′j)=pj,进行三次样条插值[8],可求得三次样条函数的二阶导数S″(x′)。在S″(x′)=0处一阶导数取极值,因此,求得S″(x′)的零值点:

x′jmax=xjmax´pixel+xjmax´subpixel (2)

其中,梯度方向像素级坐标xjmax´pixel为x′jmax的整数部分,梯度方向亚像素级坐标xjmax´subpixel为x′jmax的小数部分。根据xjmax´pixel的值可确定在透镜中对应的像素点的坐标(x,y),其亚像素坐标(xsubpixel,ysubpixel)的计算公式如下:

(1)若灰度值梯度方向为透镜中的0方向,则

xsubpixel=xysubpixel=y+xjmax´subpixel}

(2)若灰度值梯度方向为透镜中的1、3方向,则

(3)若灰度值梯度方向为透镜中的2方向,则

3 实例及结果分析

3.1 亚像素边缘坐标计算实例

某轮廓点坐标为(183,172),透镜内各计算方向的像素点灰度值如图5所示。由式(1)可得E0=8、E1=85、E2=85、E3=85,所以梯度方向为2方向。对2方向上的各像素点灰度值进行三次样条插值,插值后的三次样条函数及其一阶、二阶导数函数如图6所示。经计算得x′jmax=4.02,亚像素坐标值为(183.02, 172.00)。线阵CCD每个图像传感器的大小为14μm×14μm,即图像中每个像素点的大小为14μm×14μm。线扫描图像经过标定后,得到了没有光学缩放效果的1∶1真实反映被检测零件的图像,且相邻两行同一位置像素的距离与一行内相邻两个像素的间距是相等的,均为14μm。通过亚像素坐标的计算,可将亚像素边缘定位到微米级精度。

3.2 计算精度分析

对精密测量平均直径为25.0322mm,测量极限误差为±0.0009mm的精密标准件进行线扫描并标定后,其图像如图7所示,对图中的4个边缘点A、B、C、D进行亚像素边缘检测,结果如表1所示。精密标准件的直径测量值与用其他精密测量方法测量得的平均直径值的差值为亚微米级,表明该检测系统能有效检测精度要求在微米级的薄片零件。

3.3 对比实验及结果分析

分别采用本文提出的基于三次样条插值的矩形透镜法和多项式插值法、空间矩法、最小二乘直线拟合法对如图8所示的宽度为1mm的标准量块图像进行亚像素边缘检测,在此基础上对量块的宽度进行测量,测量结果与检测时间如表2所示。从表2可以看出,本文提出的亚像素边缘检测算法的定位精度要高于其他算法的定位精度,而检测时间要短于其他算法的检测时间。

摘要:针对基于机器视觉的薄片零件尺寸在线高精度检测系统中的边缘检测问题,提出了一种新颖的精确亚像素边缘检测方法。用简单阈值法对待检零件图像进行二值化;用团块面积阈值法去除待检零件图像中的噪声;用二值数学形态学方法进行像素级边缘检测获得单像素宽连通的像素级轮廓;用基于三次样条插值的9×9pixel矩形透镜法进行亚像素边缘检测获得亚像素级轮廓。实验结果表明,该方法计算速度快、抗噪声能力强、检测精度高、亚像素边缘定位精度可达微米级。

关键词:薄片零件,尺寸检测,机器视觉,亚像素,边缘检测

参考文献

[1]伍济钢,宾鸿赞.机器视觉的薄片零件尺寸检测系统[J].光学精密工程,2007,15(1):124-130.

[2]章毓晋.图像处理和分析[M].北京:清华大学出版社,1999.

[3]Kisworo M,Venkatesh S,West G.Modeling Ed-ges at Subpixel Accuracy Using the Local EnergyApproach[J].IEEE Transactions on Pattern Anal-ysis and Machine Intelligence,1994,16(4):405-410.

[4]邹宁,柳健,周曼丽.基于Zernike矩的边缘检测方法[J].华中理工大学学报,1999,27(5):1-8.

[5]李艳,彭嘉雄.基于D2样条插值和LOG算子的亚像素边缘检测[J].华中理工大学学报,2000,28(3):77-79.

[6]Qu Yingdong,Cui Chengsong,Chen Sanben,et al.A Fast Subpixel Edge Detection Method Using So-bel-Zernike Moments Operator[J].I mage and Vi-sion Computing,2005,23(1):11-17.

[7]屈玉福,浦昭邦,王亚爱.视觉检测系统中亚像素边缘检测技术的对比研究[J].仪器仪表学报,2003,24(4):460-462.

视觉图像论文 第10篇

关键词: 农业视觉图像;中值滤波;噪声检测;几何距离;加权滤波

中图分类号:TP391;S126 文献标志码: A

文章编号:1002-1302(2015)08-0419-02

近年来,农业智能化水平逐步提高,具体表现在将计算机技术、激光红外技术与传统农业分析方法相结合,最直观的体现是通过对传统农业机械加装相关图像信息采集传感器件来获取农作物视觉图像,并将其传到室内计算机系统内,借助图像处理技术对图像所承载的农业信息进行判读和分析,根据图像分析结果来对农作物的长势进行评估,对病虫害进行分析 [1-2]。图像传感器由于自身电压不稳定,农业机械行进过程中会发生一定程度的颠簸以及图像拍摄的环境有时候比较恶劣等因素,导致所获取的图像清晰度不佳,因此,研究该类图像的处理方法势在必行。中值滤波算法 [3-4]作为一种较为实用的数字图像处理方法,由于其原理简单、运算简便,得到了广泛应用,诞生了一些改进型算法,如加权中值滤波 [5]、极值中值滤波 [6]等。但该类算法对于细节信息丰富的农业视觉图像处理效果不尽如人意,为此,本研究通过对中值滤波算法进行改进,以探索一种适合于该类图像的滤波算法。

1 中值滤波算法及其改进

1 1 中值滤波算法原理及其特性分析

对于任意一幅数字图像而言,若受到噪声的干扰,图像中部分像素点的灰度值会发生重大变化,若要去除该类噪声,可通过采用一定大小的规则窗口(一般为3×3、5×5、7×7等,模板长宽尺寸相等)在图像中按照从左往右或从上往下的顺序滑动。当该窗口的中心停留于某像素点时,记该像素点的灰度值为f(x,y)(x、y为该像素点在图像中的坐标),那么该点的中值滤波结果可表示为:

f′(x,y)=median{f(x-1,y+1),f(x,y+1),f(x+1,y+1),f(x-1,y),f(x+1,y),f(x-1,y-1),f(x,y-1),f(x+1,y-1)}。 (1)

其中,f(x-1,y+1)等为尺寸3×3滤波窗口中除了f(x,y)之外的像素点灰度值;median{}为取中间值操作。

该算法对于图像中的每一个像素点反复执行式(1)计算过程,通过采用噪声点一定大小的邻域内像素点灰度值来对噪声点进行修正,从而达到去除噪声的目的。但大量研究表明,该算法也具有一些不足之处:(1)该算法对图像中每一个像素点逐个进行取中间值操作,虽然能够抑制噪声,但是,图像即便是受到高强度噪声的干扰,图像中真正受到噪声污染的像素点仍然占一小部分。如果对所有像素点都进行计算,不但导致一些未被噪声污染的像素点被当作噪声点处理,导致图像失真,而且也延长了图像处理时间。(2)特别是对于农业视觉图像而言,图像存在着大量农产品的根、叶片、果实等信息,边缘轮廓较为复杂,且连续性较强,如果将滤波窗口固定为矩形形式,无法有效顾及该类信息的特征。

1 2 中值滤波改进算法

针对上述分析结果,本研究尝试将中值滤波算法进行改进,使其更适合于农业视觉图像处理工作。

1 2 1 噪声点的二步检测法 图像中一旦含有噪声,必将导致其中一部分噪声点的像素值发生变化,基于这一特征,提出了一种噪声点的二步检测方法。

步骤1:采用尺寸为5×5的方形窗口在图像中按照从左到右或者从上到下的顺序逐个像素点移动,若该窗口位于图像中某区域时,计算该窗口中25个像素点的灰度均值f[TX-],那么,可按照下式对图像进行噪声检测:

f(xi,yi)≤f[TX-]

f(xi,yi)>f[TX-][JB)] (i=1,2,3, ,25)。 (2)

其中,f(xi,yi)为5×5的方形窗口重第i个像素点灰度值。通过式(2)处理后,图像像素大体分为2类:一类为目标区域,另一类为背景区域。

步骤2:为了从步骤1所得到的目标区域和背景区域中进一步检出噪声点,采用下式继续进行处理:

│f(xi′,yi′)-f[TX-]1│≥[SX(]2[]3[SX)]f[TX-]1

│f(xi-i′,yi-i′)-f[TX-]2│≤[SX(]1[]3[SX)]f[TX-]2[JB)](i′<25;i-i′<25) 。 (3)

其中,f(xi′,yi′)为目标区域中任意一像素点灰度值;i为目标区域中像素点个数,i-i′为背景区域中像素点的个数;f[TX-]1、f[TX-]2分别为目标区域和背景区域的像素灰度平均值。通过式(3)处理后,逐步将图像中灰度值过高、过低的像素点当做噪声点检测出来,该类点作为后续滤波的对象。

1 2 2 多个方向加权滤波 针对农业视觉图像中目标物边缘轮廓的连续性和复杂性,设计出如图1所示的3个具有方向性的滤波模板。

步骤1:采用图1-a对经过噪声检测后的农业视觉图像进行水平方向的滤波处理,当该模板位于图像中任意一位置时,此时有3类情况:

(1)若该模板中,经过检测后的噪声点个数为4(除待滤波的像素点之外)时,可以认为该模板中包括待滤波的像素点在内是图像中目标物轮廓的一部分,可不作处理;

nlc202309041716

(2)若该模板中,经过检测后的噪声点个数为3(除待滤波的像素点之外)时,可将非噪声点的灰度值与待滤波像素点灰度值的平均值作为滤波值输出;

(3)若该模板中,经过检测后的噪声点个数为1或2(除待滤波的像素点之外)时,可通过下式进行处理:

f′(x,y)=[SX(]p1f1+p2f2+p2f3[]p1+p2+p3[SX)](噪声点个数为1)或f′(x,y)=[SX(]p1f1+p2f2[]p1+p2[SX)] (噪声点个数为2)。 (3)

其中,f′1(x,y)为模板中心点即待滤波像素点灰度值f(x,y)的滤波值;p1、p2、p3分别为对应的非噪声像素点f1、f2、f3与待滤波像素点的几何距离的倒数。

步骤2:按步骤1的思路完成图1-b和图1-c模板的滤波工作,从而得到对应的滤波值分别为f′2(x,y)和f′3(x,y)。

步骤3:对步骤1和步骤2得到的f′1(x,y)、f′2(x,y)和f′3(x,y),按数值大小排序,取中间值作为最终滤波值加以输出。此外,重复执行步骤1至步骤3完成图像所有滤波工作。

2 试验仿真

试验图像为实地拍摄于某葡萄园的夏黑葡萄图像,对其加入不同程度的颗粒噪声来对本研究算法的滤波性能进行测试,并与中值滤波算法、加权中值滤波算法 [5]、极值中值滤波算法 [6]进行比较,试验结果如图2所示。对上述几类算法的滤波效果采用峰值信噪比(peak signal noise to ratio,PSNR) [7-8]这一指标进行客观评价,结果如表1所示。

图2-b为对图2-a所示的夏黑葡萄图像加入了密度为15%的颗粒噪声,来模拟仿真成像传感器内噪声,采用中值滤波算法进行处理,结果如图2-c所示,可见图中的葡萄基本从噪声中恢复出来,但是噪声残留程度较为严重,图中的葡萄叶子、果实基本无法清晰辨认。采用加权中值滤波算法 [5]来进行处理,结果如图2-d所示,可见该图的清晰度明显提高。图2-e为极值中值滤波算法 [6]处理结果,该图的视觉效果与与2-d较为接近,可见,该2类算法滤波性能比较接近。图2-f为本研究算法滤波结果,很明显,图中的噪声基本不存在,葡萄果实、叶片均容易辨认。由表1可知,本研究算法对于含有5%噪声的图像滤波结果不如加权中值滤波算法和极值中值滤波算法,仅仅略优于中值滤波算法,这是由于本研究算法中通过对噪声进行检测,当图像中噪声密度较低时,容易将大量图像像素点误检为噪声点,导致滤波后图像质量降低。但随着噪声密度的增大,本研究算法的优势逐渐显现出来,当图像中的噪声密度达到15%时,本研究算法的PSNR值明显高于其余三者。

3 结语

为了实现对农业视觉图像的有效处理,在对中值滤波算法改进的基础上,提出了一种自适应滤波算法。试验结果表明,本研究提出的新算法滤波效果明显优于中值滤波算法及其已有的2类改进型算法,基本适合于处理农业视觉图像的要求。

参考文献:

[1] 张红旗,王春光,张 永,等 数字图像处理技术在变量农药喷洒装置中的应用研究[J] 农机化研究,2013,35(9):213-217

[2]王献锋,张善文,王 震,等 基于叶片图像和环境信息的黄瓜病害识别方法[J] 农业工程学报,2014,30(14):148-153

[3]Kravchonok A I,Zalesky B A,Lukashevich P V An algorithm for median filtering on the basis of merging of ordered columns[J] Pattern Recognition and Image Analysis,2007,17(3):402-407

[4]赵 辉,刘文明,岳有军,等 一种新的去噪算法在农作物图像处理中的应用[J] 江苏农业科学,2014,42(1):371-373

[5]刘炳良 一种小波域改进双边滤波的水果图像去噪算法[J] 红外技术,2014,36(3):196-199,204

[6]黄存令,段 锦,祝 勇,等 一种改进的极值中值滤波算法[J] 长春理工大学学报:自然科学版,2013(3):141-143

[7]王小兵,孙久运,汤海燕 基于小波变换的图像混合噪声自适应滤波算法[J] 微电子学与计算机,2012,29(6):91-95

[8]杨 青 基于农业视觉图像的高效滤波处理方法[J] 江苏农业科学,2014,42(4):361-362,363

视觉图像论文 第11篇

遥感图像目标检测是随着遥感技术不断发展应运而生的技术,船只作为利用海洋、开发海洋的重要工具,船只检测[1,2]成为检测重点。目标检测方法主要有基于特征的目标检测、基于模型的目标检测和基于统计学的目标检测方法。基于灰度特征的舰船检测主要是利用舰船与水体灰度差异特征进行分割,从而获得舰船目标候选区。有双参数CFAR、K分布的CFAR[3]算法; 基于纹理特征提取有: 基于分形模型[4]、基于CDTM矩阵和基于Gabor滤波器组的纹理特征。近年来,机器学习应用到了目标检测[5]中,主要有基于支持向量机[6]的目标检测。

本文采用选择注意机制中的Itti[7]模型,并在该模型基础上进行改进进行船只目标检测研究。分别提取图像的方向特征、纹理特征和频域上的显著性,将图像中多种特征融合形成特征显著图,然后通过视觉注意转移机制获得显著目标。该模型适用于遥感图像中船只目标检测[8]。

1 船只目标检测模型

视觉注意机制分为2 种模型: 自底向上模型主要从图像本身特征出发,以物体为中心,将容易引起人们注意的物体作为人类感兴趣区域进行研究; 自顶向下模型[9,10]是从人类视觉感兴趣区域出发,加入了先验知识,已知感兴趣目标的相关信息来对图像进行目标发现。Itti模型主要基于自底向上的模型,主要分为3 步: 1 对图像进行线性滤波,分别计算图像亮度、颜色和方向特征,生成3 种特征的显著图; 2 利用赢者为王机制,提取图像的视觉显著性区域; 3 返回抑制机制抑制提取出的显著性区域,通过赢着为王机制,视觉注意转移到下一个显著性区域,实现视觉在全图中的转移。

1.1 Itti模型

Itti模型依据目标与背景之间特征,对比度之间的差异,模拟人类感知能力,提取感兴趣区域。Itti模型示意图如图1 所示。

1.1.1 显著性特征图生成

r,g,b为图像的红、绿、蓝3 个通道,亮度特征I = ( r+g+b) / 3。提取图像的红、黄、绿、蓝4 个颜色通道的特征分量。

Gabor滤波器分别提取图像{ 0°,45°,90°,135°}4 个方向特征,Gabor滤波器表示如下:

式中,θ 表示方向,分别为0°,45°,90°,135°; f表示频率; δx 0,δy 0分别表示水平方向和垂直方向上的方差。

对提取的亮度特征、颜色特征和方向特征进行高斯滤波建立金字塔模型,分别是I ( δ) ,R ( δ) ,G( δ) ,B( δ) ,O( σ,θ) ,σ 表示尺度。对得到多尺度的特征图进行中央—周边差分操作,特征图在不同尺度下进行相减操作。c表示金字塔的中央层,取值为{ 2,3,4} ,c + s表示金字塔结构周边层,s为{ 3,4} ,中央层与周边层做减法操作。

强度特征中心周边差为:

颜色特征中心周边差为:

方向特征中心周边差为:

C和S之间的关系为:

计算中心周边差异进行合并得到3 幅图像的醒目图计算公式为:

特征图进行归一化,并通过线性组合得到最终的显著图S,

1.1.2 视觉转移机制[11]

显著图中各目标通过竞争吸引注意焦点,焦点在每个待测目标中进行转移,采用胜者全赢机制选择显著图中最值。如果没有一定的机制,注意焦点指向显著值最大的点及领域,采用胜者取全的方法得到显著图。

1.2 改进Itti模型

传统的Itti模型只考虑到了颜色、方向和亮度3 种特征,针对于海面背景目标检测[12],传统的模型具有一定的局限性。遥感图像中,颜色所占比重比较小,遥感图像中存在云、海浪等干扰,只考虑图像颜色、方向和亮度3 种特征会增大误检率。遥感图像中目标与背景纹理上具有一定差异,提取特征显著图时加入纹理特征显著图,同时结合频域思想和全局对比等思想。

1.2.1 纹理特征

纹理在图像上表现为灰度或者是颜色分布的某种规律性。图像可以看成是不同纹理区域的组合,纹理是对局部区域像素之间关系的一种度量。纹理特征可用于定量描述图像中的空间信息。

梯度结构张量对图像进行纹理分析,I( x,y) 设为图像的灰度值,水平和垂直方向上的梯度用Ix和Iy表示。图像的梯度结构张量T为:

λ1,λ2表示矩阵的特征值,特征值为:

结构张量矩阵的特征值表示图像局部特征信息,图像的一致性用结构张量矩阵的特征表示为:

1.2.2 频域上显著性

图像在频率域[13]上分为低频和高频2 个部分,高频部分反映图像纹理信息,低频部分反映图像轮廓。Wtc表示显著性低频率,Whc表示最高频率。设计一组DOG滤波器来获得Wtc ~ Whc的信息。DOG带通滤波器表达式为:

σ1σ2适合的比率为 ρ= 1 ∶1.6,设计多个DOG组成一个组合DOG滤波器:

基于频域的方法使用窗口5* 5 的高斯平滑舍去高频信息,N=∞ ,G( x,y,ρNσ) 是对整个图像的平均,像素P的显著性公式为:

式中,Iμ为图像平均特征; Iwhc( p) 为p在高斯平滑后的图像中颜色特征。

1.3 显著目标检测

结合Itti模型和频域模型,分别得到2 种模型下的显著图,对得到的显著图进行规范化,规范化函数为:

利用两者相乘得到总的显著图:

利用区域生长方法对显著图进行分割,以一组种子开始处理生长区域,将那些预定义属性类似于种子的领域像素附加到作为种子的次簇的质心。记显著图上最大像素值为Imax,从显著图中最亮的一个点向周围八领域方向生长,在某一个方向上某个像素值小于最亮点像素值的a倍,则停止生长,a的取值为0 ~ 1,直到所有方向上的生长都停止结束。计算上一个目标清零后的显著图中最亮点像素值,小于Imax* a,则检测结束。

2 实验结果

为了验证改进算法的有效性,在Matlab2010( b) 下进行实验,实验中采用图像尺寸为400* 400的TM图像和400* 400 的IKONOS图像。Itti算法检测结果如图2 和图3 所示。

图2 和图3 中分别是2 种数据在Itti模型下的检测过程结果,原始图像( a) 中一共有2 个船只目标,而Itti模型得到的显著图出现了错误目标。Itti算法对IKONOS影像进行检测,检测率较低。在Itti模型上进行改进后的算法实验结果图如图4 所示。从图4 中可以看到改进后的算法具有较高的检测率。

用recall、precision对算法进行评价,recall-pre-cision曲线图如图5 所示,评价指标如图6 所示。

图5 中,右极限表示当阈值取0 时召回率最大,左极限表示当召回率最低时精确度最高。图6 为迭代法取阈值情况下,每个算法的recall、precision和F的值。横坐标表示6 种算法,每种算法分别有3 个指标精度: precision、召回率recall和综合指标F。纵坐标代表3 个指标的数值。改进的算法相对于其他算法值要高。

3 结束语

上一篇:网购摄影的分析与研究下一篇:实验问题及对策