识别技术范文

2024-06-26

识别技术范文(精选12篇)

识别技术 第1篇

关键词:红外传感器,Matlab仿真,步态识别,人体识别

0 引 言

随着社会的进步,地铁作为城市轨道交通中的重要组成部分在人们的生活中发挥着至关重要的作用。传统方式逐步被新型方式取代,现在的自动售检票系统(Automatic Fare Collection system,AFC)是一种由中央处理单元控制的集自动售检票功能为一体的自动化处理系统。人体识别系统主要运行在闸机设备上,利用其内部的识别技术对乘客的行为进行识别,从而实现自动检票[1,2]。系统中运用的通行识别技术是十分重要的环节,它是保证持票乘客正常通过、阻止无票乘客进出的“守门人”,在城市轨道交通中发挥着重要作用。

识别技术中的步态识别方法是重要的识别方式之一。步态识别方法是通过人体的通行特征来区分通行者和与通行者十分相似的物体,并且融合了计算机视觉技术、模式识别技术与视频图像序列识别技术,是特征生物技术的一个新兴研究领域,具有广阔的应用前景[3,4]。本文利用Matlab实现对通道内通行目标进行仿真,综合步态识别技术进行识别验证,实验证明,借助Matlab平台对通道内通行的物体进行识别具有很好的准确性和可靠性。

1 人体识别系统

人体识别系统是城市轨道交通闸机中的核心部分,是闸机的“思维中枢”。闸机人体识别系统是由控制通行模块和闸机上的若干传感器组成,它将人体识别技术、现代传感器技术和计算机技术相结合,检测通行通道内通行目标的通行情况,将检测结果报告给控制通行模块,控制通行模块根据检测结果来控制闸机其他部分的工作。因此,人体识别系统的研究是整个闸机系统设计的关键,它的优劣不仅是衡量闸机性能的主要标准,而且还关系到整个自动售检票系统的成败。

闸机人体识别系统中的通行通道是由两台平行放置的闸机组成,对射式红外传感器分别布置在两端的闸机上,一端为传感器的发射端,另一端则为传感器的接收端。控制通行模块是人体识别系统的核心组件,是连接系统软件和硬件设置的中心纽带。当传感器检测到有目标进入通道时同时检查是否存在刷卡信号:如果不存在刷卡信号,则检查是否达到收费的身高要求,未达到收费的身高要求则打开扇门允许通过,如达到收费的身高要求则为非法通行并进行报警处理;如果存在刷卡信号,则查询进入通行通道的目标个数与刷卡次数是否一致,不一致则为非法通行并进行报警处理,一致则打开扇门使其通行,并且通过传感器再次检测离开通行通道的目标个数是否与刷卡次数一致,不一致则为非法通行并进行报警处理,一致则为合法通行。控制通行模块主要通过采集到的传感器的显示状态,分析得出通行目标的类型与数量,得出进入通道通行的人数,检查是否与刷卡时人数一致,如不同,则判别为非法通行启动报警装置;如相同,则打开扇门将其通过,并同时通过传感器检测通行目标离开通道时是否与刷卡时人数一致,不一致则判别为非法通行启动报警装置,一致则为合法通行。人体识别系统通行基本流程图如图1所示。

2 仿真实验

2.1 通道传感器布置

使用对射式红外传感器采集通道内通行目标,对射式红外传感器由发射端和接收端两部分组成,它可以用来检测在发射端和接收端之间是否存在通行目标[5]。当在发射端和接收端之间不存在通行目标时,接收端则会接收到对应发射端发射的红外线,此时传感器所对应的工作状态为0;当在发射端和接收端之间存在通行目标时,通行目标会遮挡发射端发射的红外线,相对应的接收端则不会接收到红外线,此时传感器所对应的工作状态就变为1。则t时刻,所有的传感器状态均可以用0或者用1来显示。

本实验中根据GB 10000-1988中国成年人人体尺寸[6]布置12对传感器,传感器1~4对用于检测通行目标是否进入通道,分别布置于小腿、大腿及臀部位置;传感器5~10对用于步态识别,分别布置于脚踝位置;传感器11~12对用于检测通行目标是否离开通道,布置于直立行走时臀部、坐时头部位置。状态数据分为四个部分,分别用1隔开,数据前三个部分分别对应三类传感器,最后一个部分为通行目标通行的时间。当t时刻通道内无人通行时,数据显示为10000,1000000,100,t。如图2所示,显示为无人通行时传感器状态图。图中0显示为白色,1则显示为黑色,横坐标对应数据显示格式。

2.2 通行识别方法

2.2.1 步态识别方法

步态识别是近年来计算机视觉和生物特征识别领域备受关注的一个研究方向,主要根据人体行走过程中双腿直立行走这一特殊行为特征进行身份识别。与其他生物特征识别技术[7](例如指纹、语音、人脸等)相比,步态识别的优势在于非接触性、非侵犯性、易于感知、难于隐藏、难于伪装[8]。本实验的步态识别方法是借助对射式红外传感器对闸机通道内通行状态中人体与物体进行识别的方法,是在人体步态的XYT 模型的基础上,通过对人体特殊的步态特征定义来区分人体与物体。

在含有传感器组成的通行通道内,人体行走与物体在通过传感器时会产生一系列与时间序列相联系的离散点,每个时间点传感器的状态则相应地反应出当时状态下人体与物体遮挡传感器的情况。在本实验中,借助Matlab[9]仿真平台显示通行目标通过通道时传感器的状态,如果人体通过通道时,由于人体特殊的行走规律,会产生特殊的双绞线模型,而物体通过通道时,则是连续遮挡锯齿模型,对这些离散数据进行处理,人体识别系统则可以对人体与物体进行区分。人体通过时传感器状态如图3所示。

如图3所示,横坐标对应数据显示格式,显示传感器的状态,纵坐标代表时间(单位:s),中间6个传感器为步态检测传感器。人体的行走过程可以分为若干个步态周期的组合[10]。在采集数据中可以看到,用于采集步态识别的传感器有数据缺失的现象,采样点的限制造成了数据的缺失,因此理论上传感器布置的数量越多,采集到的数据越充分,仿真效果就越准确,人体识别系统的识别率越高。但是,传感器数量的增多会带来很多其他问题,因此,要获得高的识别率还要进行大量实验以确定传感器数量的最佳值。

人体与物体共同通行时传感器状态如图4所示。从结果显示中可以看出人体的双脚步态特征:两脚前后遮挡传感器,一脚先遮挡传感器,另一只脚随后遮挡并且遮挡时间不一致。物体特征:一直遮挡传感器。由上述特征可以检测出通行通道中的通行目标的类型和数量,从而将检测结果传输给控制通行模块,以便更好地控制系统中其他设备的正常工作。

2.2.2 人体识别规则

人体识别规则是通过人体库综合通行规则方法对通行通道内的目标进行判定,由于采用之前所述传感器布置方案,人体识别可以对各种不同的人体通行情况进行有效识别。

人体库是对通行目标进行逐一分类,实现对已经在自动检票机刷卡即将在闸机通行通道内通行人体的识别,结合人体识别系统:按身高:身高低于130 cm的儿童不需要购票,只需针对高于130 cm的通行目标进行识别; 按胖瘦:胖(包括女士怀孕)、正常、瘦;按穿着:显示两腿、显示三条腿(拐杖)、显示一条腿(残疾、穿长裙);按通行个数:单人通行、多人通行;多人通行间隔:紧贴、并排、正常。

通行规则是对不同人体通行过程中通行状态进行识别,实现对自动检票机刷卡即将在通道内通行人体的识别:人体正常行走;人体携带物体正常通行;人体非法通行。

人体识别规则是人体库综合通行规则的方法控制闸机的正常运行以实现对通道通行目标的识别。当单人通行时,如果出现单人爬行和单人跨越的现象,则认定为非法通行进行报警处理,其余认定为合法通行;如果多人通行出现紧贴、并排通行试图逃票者,则认定为非法通行进行报警处理,其余认定为合法通行。

3 结 论

本文主要研究了城市轨道交通自动售检票系统中通行识别技术,在Matlab仿真的基础上结合步态识别方法与人体识别规则,并将其运用到自动检票机的人体识别系统中,摆脱了对图像检测技术的依赖,减少了自动检票机的设备成本,两者结合提高了自动检票机的设备性能,实验表明该设计可靠有效,为将来自动检票设备提供了新的设计方案。

参考文献

[1]石慧麟.城市轨道交通自动售检票系统设计[J].城市轨道交通研究,2001(2):61-63,68.

[2]范文毅,殷锡金.城市轨道交通车站设备[M].北京:中国铁道出版社,2000.

[3]HUANG P,HARRIS C,NIXON M.Human gait recogni-tion in canonical space using temporal templates[J].VisionImage and Signal Processing,1999,146(2):93-100.

[4]谢林海,刘相滨,佟施.基于步态的身份识别技术[J].计算机技术与发展,2007,17(9):106-108,112.

[5]曲日,鲍彦如,任长明.城市轨道交通中闸机事件识别技术[J].中国铁道科学,2006,27(4):112-118.

[6]中国标准化与信息分类编码研究所.GB10000-1988中国成年人人体尺寸[S].北京:中国标准化与信息分类研究所,1989.

[7]朱亚涛,金花,吕晶.基于生物特征的身份识别技术[J].现代电子技术,2005,28(6):6-7.

[8]王亮,胡卫明,谭铁牛.基于步态的身份识别[J].计算机学报,2003,26(3):353-360.

[9][美]冈萨雷斯.数字图像处理(Matlab版)[M].阮秋琦,译.北京:电子工业出版社,2005.

语音识别技术调研报告 第2篇

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。

在语音识别的特征提取过程中,主要有语音信息量大,语音的模糊性,重音、音调、音量和音速的变化,环境噪声和干扰等难点。导致语音识别在互联网和传媒行业一直没有得到广泛的应用。但是近几年来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,硬件的性能的提升和算法的改进,语音识别技术得到突飞猛进的发展。例如音频指纹技术和音频二维码技术等。下面本文具体讨论这两种技术。

音频二维码 音频二维码技术

二维码技术经过多年的发展,已成为大家耳熟能详的名词了。二维码取代传统的键盘树盘输入技术的部分功能,成为互联网行业的第二大入口方式。但是普通的二维码技术只是将文本信息进行加码和解码。这导致二维码只能传输普通的文本信息。如果将音频技术和二维码的概念相结合,利用声音实现终端之间的近距离信息传输,那么毫无疑问音频信息将成为互联网行业的第三大入口方式。

音频二维码技术采用仿生学技术,利用声音实现文件的快速传输。采用跨平台的技术,实现手机、电脑、智能机顶盒等智能设备间的图片、文字、链接的传输。音频二维码技术能在一定程度上取代图像二维码、近磁场传输和蓝牙等技术。

2012年底蛐蛐儿创始人朱连兴开发了一套音频二维码的引擎,名字叫蛐蛐儿SDK。在朱连兴推出了蛐蛐儿SDK之后,音频二维码的开发也变的比以前更加快速和简单。蛐蛐儿通过声音传输的不是文件,而是在发送端生成一个四位的二进制数。这四位二进制数是待发送文件的ID。发送端向接收端发送的其实只是上述生成的ID。发送端在向客户端发送ID的同时向云端发送ID和数据。在接收端接收到ID后,通过该ID向云端获取对应的数据。

音频二维码应用

音频二维码的应用非常广泛。音频二维码通过声音传递信息。广播和电视也通过声音传递信息。如果结合音频二维码技术和广播电视技术,将使二者相得益彰。音频二维码可以使广播电视用户不再是单一的受众,也是参与者。通过音频二维码可以让用户的手机等终端设备接入电视屏幕或者广播。用户在欣赏电视节目或者收听广播节目的同时,也可以通过手持终端参与节目互动环节。这会在给用户带来更好体验的同时,拉动广播电视行业的收视率和收听率。

例如在非诚勿扰的节目播放结束时,孟非不需要说那么长的一串话让观众知道如何来报名参加非诚勿扰,只需要说“欢迎在听到嘀声后报名参加非诚勿扰”就可以了。观众的终端在听到嘀声后解析相应的内容,获取到报名所需要的电话号码和电子邮箱。观众可以任选一种进行报名。这样观众再也不需要拿笔和纸去记录这些信息了。

观众在观看好享购频道的时候,在一个节目结束的时候插入一个声音。观众的手机在听到这个声音后自动解析购买此商品的号码,用户按拨号键就可以直接购买自己想要的商品。使用了音频二维码技术,用户便从对着电视屏幕记录购买号码中解脱出来了。

不像电视技术同时通过声音和画面来传递信息,广播技术只能通过声音来传递信息。所以在广播行业中,尤其需要其它的手段让听众接收信息。在这个需求下,音频二维码技术变得尤为重要。

通过音频二维码技术,广播和电视可以向用户推送广告,例如团购消息、好享购商品信息以及商场打折券等等;可以向用户推送增值服务,例如天气预报、银行还款等等;可以向用户发起投票活动;还可以允许用户分享这些内容到各大社交论坛,吸引物联网用户的眼球。

缺点

蛐蛐儿SDK采用的是人耳可以听到的四千到一万伏的频段。这导致非常容易被周围环境中的噪声干扰。经过测试,该SDK在咖啡店和火锅店等公共场所中,在两米以内的传输率能达到百分之百,距离越远,传输率越低。蛐蛐儿SDK采用的是人耳听觉范围内的音频,这对于广播电视行业来说是个缺点。因为在原本纯内容的声音信息中加入了其它的对人耳来说无用的声音,可能会让观众无法接受。这个问题可以通过采用超声波或者次声波来代替可听波来解决。但是如果采用超声波,会显著增加功耗,并且不能绕过障碍物。在电视前站一个人将把所有信息拒之门外。并且某些频率的次声波对人体产生的危害非常大。所以确定音频的频率是一个非常重要的研究。

音频指纹 音频指纹技术

音频指纹技术是一种通用音频处理技术。它能根据音频对象的特征准确识别该对象的信息。音频指纹是音频对象简短的摘要。音频指纹技术在音频对象和指纹之间建立一种映射关系。通过这种机制,不需要通过比较较大的音频对象本身,而是通过比较相关的指纹,就可以确定音频之间知觉平等的关系。

音频技术的研究起步较早,现在已发展的非常成熟。音频指纹的研究主要有两个方向。一是基于水印嵌入的指纹方法。周鸿飞提出了一种基于混沌和系数均指统计特性的音频指纹方案。首先使用用户信息生成混沌映射初值,然后应用混沌方法把混沌映射初值生成用户指纹,再根据小波系数统计恒定特性将指纹嵌入到每帧中。这种方法具有一定的鲁棒性,但是需要嵌入多余的数据。另一种是基于内容的指纹方法。Haitsma J.提出了一种鲁棒的音频哈希指纹方法,对相邻2帧提取频域能量的差异作为哈希指纹。

音频指纹应用

音频指纹起步较早,应用也非常广泛。目前应用最广的领域是音乐播放软件中。根据音乐的旋律能够准确识别歌名歌手等信息。飞利浦公司研制了一款手机软件。只要把手机贴近正在播放歌曲的收音机,不出三秒钟的时间就能记下这首歌曲的音频指纹。然后手机可以通过该音频指纹去音频指纹数据库寻找匹配的歌曲。酷我音乐也采用了这种技术实现了类似的功能。

音频指纹也可以应用到电视媒体中。例如可以使用音频指纹对电视广告进行检测。商业公司可以检测电视台的广告是否按合同规定播出。媒体研究机构和广告策略公司可以统计广告的信息,对其进行整理和数据挖掘。

音频指纹还可以用于版权控制。版权所有者可以对广播和电视进行音频指纹采集,然后根据音频指纹对比音视频数据库,找到该音视频,进而挖掘传播者是否具有该音视频的版权。

音频指纹也可以用于向电视和广播用户的终端推送服务,增加与用户的互动。例如用户的手机接收到特定的音频指纹后就打开web浏览器,转到一个URL。该URL可以是与用户互动的投票系统,也可以是广告,或者是一些增值服务。

音频指纹同样也可以用于物联网行业。当用户上传或者下载音频的时候,首先传递该音频的指纹。如果发现已存在该音频,将直接完成此次下载任务。达到秒级的用户体验。

总结

追踪面部识别技术 第3篇

面部识别(FaceDetection)特指利用分析、比较人脸视觉特征信息进行身份鉴别的计算机技术。广义的面部识别实际包括构建面部识别系统的一系列相关技术,例如面部图像采集、面部定位、面部识别预处理、身份确认以及身份查找等;狭义的面部识别特指通过面部进行身份确认或身份查找的技术或系统。

面部识别技术最初的原理是将人的脸谱用特殊方法记录在数据库中并形成记忆。发展至今,面部识别技术包括面像检测、面像跟踪与面像比对等不同方面的技术。面像检测是指在动态的场景与复杂的背景中判断是否存在面像并将面像从背景中分离出来,面像跟踪是指对已经被检测到的面像进行动态的追踪,面像对比则是指将被检测的面像与目标面像相比对以进行身份确认。

通常的面像识别过程主要分三步;第一步,建立面像档案,就是通过攝像头或者照片来采集并获取面像文件进而生成面纹(Faceprint);第二步,获取当前面像,即通过摄像头捕捉面像或提取照片以获得被检测目标面像文件并生成面纹;第三步,将当前面像的面纹编码与档案中的面纹编码进行检索比较。面纹作为面部识别的关键组成部分,其最核心的技术就是编码方式,它是根据面部的本质特征而工作的,可以抵抗光线、皮肤色调,面部毛发、发型、眼镜、表情和姿态的变化,具有强大的可靠性。

识别技术 第4篇

一、图像识别系统

一个图像识别系统可分为四个主要部分:被识图像、图像信息获取、图像预处理、图像特征提取、分类判决。

二、图像识别方法

图像识别的方法很多, 可概括为统计 (或决策理论) 模式识别方法、句法 (或结构) 模式识别方法、模糊模式识别方法以及神经网络识别方法。重点介绍神经网络识别方法。

2.1神经网络识别方法

2.1.1人工神经网络的组成

人工神经网络 (简称ANN) 是由大量处理单元经广泛互连而组成的人工网络, 用来模拟脑神经系统的结构和功能。而这些处理单元我们把它称作人工神经元。

2.1.2人工神经网络的输出

对于某个处理单元 (神经元) 来说, 假设来自其他处理单元 (神经元) i的信息为Xi, 它们与本处理单元的互相作用强度即连接权值为Wi, i=0, 1.....n-1处理单元的内部阈值为θ。那么本处理单元 (神经元) 的输入为而处理单元的输出为式中, Xi为第i个元素的输入, Wi为第i个处理单元与本处理单元的互联权重。f称为激发函数或作用函数, 它决定节点 (神经元) 的输出。

2.1.3人工神经网络的结构

人工神经网络中, 各神经元的不同连接方式就构成了网络的不同连接模型。常见的连接模型有:前向网络、从输入层到输出层有反馈的网络、层内有互联的网络及互联网络。

2.1.4学习算法

1) 感知器模型及其算法

算法思想:首先把连接权和阈值初始化为较小的非零随机数, 然后把有n个连接权值的输入送入网络中, 经加权运算处理后, 得到一个输出, 如果输出与所期望的有较大的差别, 就对连接权值参数按照某种算法进行自动调整, 经过多次反复, 直到所得到的输出与所期望的输出间的差别满足要求为止。

2) 反向传播模型及其算法

反向传播模型也称B-P模型, 是一种用于前向多层的反向传播学习算法。

算法思想是:B-P算法的学习目的是对网络的连接权值进行调整, 使得调整后的网络对任一输入都能得到所期望的输出。学习过程包括正向传播和反向传播。正向传播用于对前向网络进行计算, 即对某一输入信息, 经过网络计算后求出它的输出结果;反向传播用于逐层传递误差, 修改神经元之间的连接权值, 使网络最终得到的输出能够达到期望的误差要求。

B-P算法的学习过程如下:

第一步:选择一组训练样例, 每一个样例由输入信息和期望的输出结果两部分组成;第二步:从训练样例集中取出一样例, 把输入信息输入到网络中;第三步:分别计算经神经元处理后的各层节点的输出;第四步:计算网络的实际输出和期望输出的误差;第五步:从输出层反向计算到第一个隐层, 并按照某种原则 (能使误差向减小方向发展) , 调整网络中各神经元的权值;第六步:对训练样例集中的每一个样例重复一到五的步骤, 直到误差达到要求时为止。

3) Hopfield模型及其学习算法

它是一种反馈型的神经网络, 在反馈网络中, 网络的输出要反复地作为输入再送入网络中, 使得网络具有了动态性, 因此网络的状态在不断的改变之中。

算法思想是:

(a) 设置互连权值

其中xis是s类样例的第i个分量, 它可以为1或0, 样例类别数为m, 节点数为n。

(b) 未知类别样本初始化。Yi (0) =Xi 0≤i≤n-1

其中Yi (t) 为节点I在t时刻的输出, 当t=0时, Yi (0) 就是节点I的初始值, Xi为输入样本的第I个分量。

(c) 迭代直到收n-1敛

f为阈值型激发函数。该过程一直迭代到不再改变节点的输出为止。这时各节点的输出与输入样例达到最佳匹配。

总结:每一种识别方法都有自己的优缺点, 我们在今后的工作中需要把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来, 深入掌握各种工具的效能和应用的可能性, 互相取长补短, 开创模式识别应用的新局面。

摘要:图像识别技术的方法主要分为统计模式识别方法、句法模式识别方法、模糊模式识别方法以及神经网络识别方法, 本文在概述图像识别基本概念及基本技术的基础上, 着重对图像识别中神经网络识别方法进行分析。

PDC钻头岩屑录井识别技术 第5篇

由于PDC钻头与3A钻头在制造工艺和结构方面有着本质的区别,加之其特殊的破岩机理,导致PDC钻屑非常细碎(粒径最小达0.5-2.0mm或粉末状);同时,由于PDC钻头机械钻速高、米钻时小,地质工岩样采集难以跟上钻头进度,造成岩性识别、分析化验挑样困难和剖面符合率低。因此,目前石油石化录井行业在钻达目的层时往往限制PDC钻头的使用,其原因可归纳为:①PDC钻头机械钻速高,给按地质设计实施岩屑录井带来了困难;②PDC钻屑细碎、岩性难辩,造成岩屑剖面符合率偏低,尤其是当油质轻、显示级别低时,易造成油气显示漏失;③PDC钻头使用井段砂泥岩钻时幅差不明显,尤其是在砂泥岩颜色相近、砂岩泥质含量高、粒径小、地层成岩性较差的层段,给借助钻时分层带来很大困难。

为此,开展PDC钻屑录井随钻岩性识别技术的研究,就是要在钻井采用新技术的条件下,保证录井能够不影响钻井技术的进步,齐全准确地收集各项录井资料,使地质录井各项技术指标如:油气显示的发现率、岩性识别准确率、地质剖面归位符合率等满足油田勘探开发工作的需求,使随钻录井岩性识别和油气显示快速评价解释技术进一步提高,提升油田的整体勘探开发效益。

一、PDC钻屑成因分析

1.金刚石钻头的分类(国内)

金刚石钻头由国外七十年代初研制成功,并于八十年代得到迅速发展,其显著的高钻速、低成本特点在实践中被钻井界证实和认可,因此获得广泛推广及普及。目前全国大部分油田都在使用 PDC钻头,具备不完全统计,全国近50% 探井 ,80%的生产都不同程度当地使用了PDC钻头。河南油田自 1987 年引进该技术以来,得到了广泛的推广和使用,钻井时效提高了 30-50%,不论给钻井公司还是给河南油田均带来了显著的经济效益和社会效益。从近期收集的中石化西部新区钻探资料看,PDC钻头的使用率达80%以上,但大多为非目的层段使用,如征1井使用FM256D型PDC钻头于3020.20-4616.90m井段,连续钻进1596.70m,纯钻进时间231小时,平均机械钻速7m/h,给提高钻井时效、降低勘探成本带来了显著的经济效益。

PDC钻头是人造聚晶金刚石复合片钻头(Polycrystalline Diamond Compact Bit)的简称,它是用聚晶金刚石复合片与硬质合金齿柱结合成切削元件镶嵌在钻头钢体或胎体上的优质钻头。国内主要的金刚石钻头生产厂家有江汉休斯和四川克里斯坦森钻头厂,另外还有部分小规模的地方、油田钻头厂及大专院校(石油大学、中国地质大学等)生产的各类金刚石钻头。其钻头类型分类见表。

厂 家

江汉休斯

四川克里斯坦森 R系列 PDC(Polycrystalline Diamond Compact)B系列 TSP(Thermally Stable Polycrystalline Diamond)P系列

S.M.Z系列 D系列 天然金刚石(Diamond)ND系列

2.PDC钻头的主要特点(1)钻头无活动部分(牙轮)。

钻进中无掉牙轮顾忌,可实现高转速安全钻进。(2)不同岩性适应性强。

针对地层情况,PDC钻头有不同的设计,如用于软地层,其钻头冠部外型呈长形或锥形;用于硬地层其钻头冠部外型呈圆形或抛物线形状。所以,适应范围比较广。(3)使用时间长。

采用聚晶金刚石镶齿,坚硬锋利,寿命长;一般一支PDC钻头入井的工作时间是普通钻头的五至八倍,减少了起下钻时间,降低了钻工的劳动强度,提高了钻井时效。(4)硬度高、破岩能力强。

金刚石的硬度最高,钻头强度大,钻进速度快,钻时均匀。

(5)破岩机理以切削和研磨为主。

PDC钻头所钻的岩屑细小,甚至呈粉末状,尤其是疏松砂岩则往往呈颗粒状出现。钻屑颗粒细小,便于泥浆携带,保持井底清洁。

(6)低钻压剪切均匀破碎,能够防斜、纠斜、稳斜。3.PDC钻头破岩机理

PDC钻头按其切削原理分为F型钻头和R型钻头,其中常用的是F型。F型钻头冠部形状分为:浅锥形、短抛物线形、抛物线形和鱼尾形四种形态;齿形多为圆形齿或楔形齿,破岩方式主要有剪切、预破碎、梨削和磨削四种。

剪切破碎:

从岩石破碎强度可知,岩石抗剪切强度远低于岩石的抗压强度(为抗压强度的0.09-0.15倍),PDC钻头正是利用岩石的这一特征实现其高速钻进,其破岩机理见图-3。PDC钻头切削力受力分析(首先做出以下基本假设): ①地层岩石是塑性的;

②井底大体上平行于钻头轮廓面;

③单切削刃和全钻头之间有相似之处:钻速与切削刃吃入深度成正比,作用于单切削刃的法向力与钻压成正比;

④切削角忽略不计;

⑤PDC钻头切削刃的体积磨损与摩擦成正比; ⑥切削刃侧面摩擦力忽略不计。

在钻压P和扭矩力T的合力R作用下,生产一个沿剪切面由合力R产生的分力F(剪切力),当力F等于或大于剪切面积和岩石的抗剪切强度极限强度的乘积时,岩石就沿剪切面破碎。一般PDC钻屑颗粒大于其它类型金刚石钻头的钻屑,其钻头适合于中软——中硬地层。PDC钻头的切削刃是以切削方式来破碎岩石的,它在扭矩力的作用下,能自锐地切入地层、向前移动剪切岩石。在理想条件下,复合片刮切岩石时生成的岩屑会沿着金刚石表面上移,直至与复合片脱离,通过岩石在切削齿边缘处的破碎,钻头的切削能量得到高效释放。然而,在很多情况下,岩屑所承受的压力使其紧贴切削齿表面,从而生产阻碍岩屑移动的摩擦力。这种摩擦力往往可以积累到相当高的程度,以至于会造成岩屑在切削齿边缘的堆积。这种现象一旦发生,井底岩石的运移就不再是直接依靠切削齿的边缘,而是通过切削齿表面积累的岩屑自身来完成。这样,岩石的破碎和运移将需要消耗更多的能量,由此降低钻井效率。目前,PDC钻头制造工艺中采用了“黑冰”抛光切削技术(黑冰齿有高度抛光的外表面,其摩擦系数低得就象闪冰与冰的滑动一样),它是通过降低岩屑与切削齿表面之间的摩擦力,以避免岩屑在切削齿表面的堆积,以有效减少切削时的剪切力,显著改善岩屑的运移,提高钻井速度和钻井效率。

根据PDC钻头镶齿形态和受力分析,楔形刀翼设计增加了钻头表面的流道体积,有利于改进钻头水力性能,新的刀翼布齿方式使钻头心部更开放,容屑空间更大,减少钻屑在齿部的淤积,有益于改善钻头的清洗条件。在钻井现场可根据岩石成岩性(致密程度)情况,合理选择PDC钻头类型,一般,中软地层适合长齿,硬地层适合小齿。当钻头选型与岩石硬度不匹配时,有时会造成井筒返出岩屑成粉末状。如:B283井1945-1988m井段,岩屑呈稀糊状,无法捞取、清洗岩屑。

4.PDC钻头钻井带来的录井技术难题

(1)岩屑量少、岩屑细碎、岩性难辨、采样困难

不能准确判断地层岩石的矿物成份和结构,难于进行地层分层,使录井剖面符合率降低。岩屑细碎(粒径在0.5—2mm之间),现场挑样极为困难,挑样任务无法完成,难以开展地化、定量荧光分析化验工作。如下T4-2211井在快速钻进的700—1200m段,钻时一般2—3min/m,岩屑返出量极少,造成采样不足现象。(2)钻时与岩性的对应关系不明显

砂、泥岩钻时区别不大(图-4),利用钻时曲线划分岩性及分层不再准确,使传统的依据钻时辅助分层确定岩屑实物定名的方法难以满足现场地质录井工作的需要。

(3)岩屑混杂、难以清洗

岩屑混杂,给岩屑描述带来一定困难,特别在浅层影响更明显,利用PDC钻头资料难于进行随钻地层对比。如南阳凹陷的南76井,砂岩含量低,从录取的岩屑实物上看,井段1800—2020m段岩性基本无变化,泥岩含量在85—95%,砂岩含量在5—15%,很难区分岩性。另外,当单根钻杆钻时小,迟到井深与标准井深相差大,井筒内滞留岩屑多时,接单根时易造成岩屑混杂。如张34井:钻进井段1732.32—1741.93m单根时,用时15min,迟到时间为23min/m,当钻至1741.93m时井筒内滞留岩屑6m,接单根用时3.5min,不可避免造成了岩屑混杂、难以清洗。(4)烃损耗重、显示易漏

由于岩屑变得细小,增大了岩屑的比表面,降低了油气显示等级,增加了油气显示发现和评价的难度,使油气显示发现率和解释符合率降低。传统的捞砂方法是根据迟到时间算出岩屑到达时间,通过震动筛滤去泥浆,在振动筛后捞取岩屑、泥浆混合物,用清水搅拌冲洗后晾干。在PDC钻头下泥岩为糊状,疏松砂岩为分散的颗粒状,非常细碎,部分细微颗粒混入泥浆中不能及时在振动处分离,在除砂处直接混入泥浆池中,另一方面,在清洗过程中随剧烈搅拌与冲洗使细碎颗粒容易漏失。因此,录取的岩屑失真较严重,不能如实反映地下地质信息,极易造成漏失油气显示现象。(5)捞砂洗砂时间与钻井时间不配套

PDC钻头平均钻时1~4 min / m,快的时候不足1 min钻进一米,而采集一包岩屑样一般需要2-5min左右,当钻时小于采样时间时,既会造成采样困难,砂样的质量及代表性变差。

(6)钻速快、薄层显示难以识别。

由于钻时小、常规色谱分析周期长,给薄层显示的识别和评价带来了一定困难。综上所述:即便是同种类型的PDC钻头,在不同构造区块,其对各种地层的可钻性也不同,造成岩屑混杂、破碎程度也是不一样的。如下T4-2211井核二段的700—1000m井段,无论是泥岩还是砂岩,钻时一般为2—3min/m,岩石成岩性差,地层造浆严重,返出岩屑基本为泥糊状,砂岩含量很低,砂泥岩岩性很难区分。泌283井核三段的1100—1400m井段,泥岩、砂岩钻时一般为4—6min/m,岩石成岩性差,砂岩常呈分散状颗粒,粒径0.5—2mm,泥岩为糊状,砂岩含量较高,粒度大,砂泥岩钻时变化不明显。

从现场录井观察中发现,造成PDC钻头钻井条件下岩屑细小的原因主要有三方面的因素:

其一:造成钻屑细小的客观因素——地层。对于地层埋藏浅、岩石成岩性差、胶结疏松的地层,经PDC钻头的快速剪切、研磨破碎,加之上返不及时等造成钻屑细小、甚至为糊状。例如:王集、下二门、张店地区成岩性差的廖庄组、核桃园组核一段、核二段地层,双河地区的廖庄组、核桃园组核一段储集层等,随钻井液返出至地面的岩屑均为分散状矿物颗粒或泥糊,岩屑直径特别细小;另外,当所钻地层岩石致密、性脆,钻进中返出的岩屑也比较细小。这方面具有代表性的例子是安棚地区的安84井及安2017井,该区属深层系,储层砂岩特别致密,多为灰质胶结、性脆、易破碎,钻进中返出的岩屑呈细碎、分散状。

其二:钻头因素——PDC钻头(前已叙述,略)。

其三:钻井工艺、钻具组合因素——高泵压、大排量、满眼钻进。随着钻井工艺技术水平的提高,目前钻井中普遍采取高泵压、大排量(泵压高达15-20MPa、排量达1300-1500cc)钻进,在大水马力的作用下,加大了已破碎岩石的粉碎程度。另外,为防止钻进中的自然造斜,钻井施工中往往采用满眼钻进的手段来稳斜,钻头上部数十米长的近钻头直径的钻铤、扶正器等,减少了井壁与钻具之间的环形空间,加重了钻屑重复性碾磨的粉碎程度。

二、岩性识别仪矿场试验及应用效果

1.“岩性识别仪”识别岩性原理(1)岩石的放射性

岩石中含有的放射性元素,主要是由铀(U)、钍(Th)、钾(K)等放射性元素组成,所以岩石的放射性强度取决于放射性元素的类别和含量。238U的半衰期为4.5×109a,232Th的半衰期为1.42×1010a,40K的半衰期为1.25×109a。

一般条件下,按照放射性的强弱可把沉积岩分成以下几类:

放射性物质含量高:放射性软泥、红色粘土、黑色沥青质粘土的放射性物质含高。海绿石砂岩、独居石、钾钒矿砂砾岩等具有高放射性含量。

放射性物质含量中等:浅海相和陆上沉积的砂质岩石,如泥质砂岩、泥质石灰岩、泥灰岩等。

放射性物质含量少:砂层、砂岩、石灰岩等。放射性物质含量很少:硬石膏、岩盐、煤和沥青等。(2)“岩性识别仪”设计原理

利用岩石矿物中的自然放射性(γ射线),借助伽玛射线探测器检测被测PDC钻屑中的自然伽玛射线强度,并依据沉积岩的自然放射性强弱变化规律,通过仪器标定,定性鉴别被测样品的岩石类别。以此达到提高岩屑录井技术含量和提高岩屑定名准确性的目的。

2.“岩性识别仪”性能技术指标

①样机体积小(80cm×50cm×40cm 重95kg)、结构简单、易操作,维修方便。②线性好:R2=0.9883 ③样品检测重复性误差小:平均误差<5% ④样品检测灵敏度高:> 10g ⑤样品分析周期可选(30秒、60秒、90秒、120秒、180秒)、分析周期短。由于泥岩的伽玛值高,砂岩的伽玛值低,样机采用岩屑包围晶体,利用金属铅对伽玛射线的屏蔽能力,将岩屑与晶体用铅罐密封,通过光电倍增管将电信号放大并进行伽玛计数,在设定时间段内自动求得平均值。应用表明:尽管同一岩屑每秒的伽玛计数值不一样,但在90s、120s、180s各时间段内的平均值重复性很好,误差在一个计数点左右,误差率3—5%,用标准的砂泥岩样自0—100%混合进行检测,线性关系较好,方差在0.99左右。

3.PDC钻屑泥质含量估算方法 首先用自然伽玛相对幅度的变化计算出泥质含量指数IGR: IGR=(GR目的-GRmin)/(GRmax-Gamin)1≥IGR≥0 式中:GR目的——目的层自然伽玛幅度(或混合样品); GRmax——纯泥岩的自然伽玛幅度;

GRmin——纯砂岩的自然伽玛幅度。用下式将IGR转化成泥质含量Vsh:

Vsh={(2G×IGR-1)/(2G-1)}×100%

100%≥Vsh≥0 式中:G—希尔奇指数,可根据实验室取心分析资料确定(参考北美第三系地层取G=3.7、老地层=2)。

4.“岩性识别仪” 矿场试验及应用效果 样机经室内调试、检测,分别在下T4-2211井、B283井等二口进行了现场实验,并取得了初步成果。

三、PDC钻头岩屑录井技术对策

1.岩屑捞取与清洗

从现场岩屑录井过程看,除不可抗拒的钻头和钻具结构因素外,对于振动筛的振动、岩屑清洗时的水冲、搅动力度、频度等也加重了钻屑的粉碎程度,尤其是对疏松的砂砾岩储层和含油砂岩,更减少了有效成分的含量,严重时可能会造成岩屑采集量不足、油气显示难以发现等。因此,解决这一问题的有效办法是对含泥浆岩屑清洗时要用小量、缓冲、缓倒、轻搅拌,切忌急水、猛冲、快倒、急搅拌,从而保证细碎的真岩屑不被人为冲掉,达到保障岩屑具有代表性的目的。

在晒样、烤样时,切忌在岩屑未滤干水分的情况下,过多地翻动,以免造成岩屑表面模糊;在岩屑收样装袋时,应尽量将细小的真岩屑装入袋中,减少各个环节的技术损失。当然,要严、细、全、准地做好这些工作,给地质采集工增加了较大的工作量,特别是使用PDC钻头采用螺杆加转盘复合钻进时,钻时快,一个采集工既要记录钻时,又要按要求取准岩屑,就需要增加人员,进行双岗作业,才能确保细小岩屑录井工作的准确性。

2.岩屑分选筛样描述

岩屑颗粒大小对岩性描述的影响很大,一般2-5mm的岩屑肉眼易观察和识别,而对0.5-2mm或粉末状岩屑则肉眼很难进行观察和描述,一包岩屑中很大的岩屑往往是掉块假岩屑。因此,为了有效区别真假岩屑,B283井采取洗净岩屑过筛的办法,即利用1、3、5mm孔径的筛网分别对样品进行预处理,首先将大于5mm的假屑剔除,然后根据整包岩屑总体颗粒的大小,用1或3mm的筛网进行筛析,最后对筛析后的真岩屑采用Ι-SCOPE显微镜显微观察描述的方法进行定名,该方法取得了较好的效果。

3.PDC钻屑混合样氯仿浸泡荧光定级

B283井2150-2345m、2422-2486m井段,对具荧光显示的粉末状岩屑,用天平称取1克混合样,加入5ml氯仿浸泡,密封2小时后,经系列对比观察定级。实践证实,利用该方法增加了PDC钻屑的油气显示发现率,达到了提高岩屑录井质量的目的。该方法使用时要注意,对泥浆受污染造成的假异常要慎重,以避免误导岩屑描述。如在南83井的录井施工中,在井深2186m—2189m气测发现异常,而砂岩、泥岩钻时均在9—11min/m之间变化不明显,捞取的岩屑岩性为呈分散状浅灰色粉砂岩,荧光直照暗黄色,取出砂岩滴照呈黄色不均匀斑点,系列对比为9级;砂岩含量极少,由于该井区距物源区较远,储层整体物性较差,其岩性均为粉、细砂岩,加上使用PDC钻头,返出的砂岩呈极为细小的分散状颗粒;针对这种情况,我们加强了荧光录井工作,对目的层段每米储集层均进行荧光滴照分析,及时、准确地落实了该井的油气水显示。4.PDC钻屑混合样氯仿喷洒法

针对轻质、凝析油储层粉末状、难分离(湿样)PDC钻屑,可将钻屑置于普通荧光灯或岩性识别仪下,采取PDC钻屑混合样氯仿喷洒的方法进行观察,也可在一定程度上提高油气显示的发现率。

5.加强气相色谱录井

利用气测录井随钻时实检测的技术优势,尤其在各别井、局部井段(如B283井1100—1400m井段)返出岩屑呈稀糊状时(岩屑量极少、难以清洗),利用气测全烃检测有效地检测到二层1-2m的薄层荧光砂岩(岩屑中无显示)。

6.及时测定迟到时间

岩屑迟到时间的准确性直接影响到岩屑剖面与测井深度的系统误差,决定着岩屑剖面的合理归位。因此在使用PDC钻头钻进过程中,要经常实测迟到时间(50m/1次),采用接近钻屑密度、颜色与钻屑反差较大的实物进行迟到时间的测定,以保证捞样时间的准确性。

7.加强钻井与地质录井的横向协作

识别技术的军事应用 第6篇

自动识别技术,就是根据现实数据,利用计算机系统进行信息化数据自动采集的一种集计算机、光磁物理、机电、通信技术为一体的高新信息技术,条形码技术就是其中一种。但是近年来,由于条形码本身具有一些缺陷,人们一直在探求一种更新更完善的信息解决方案。射频识别技术电子标签此时应运而生。射频识别技术是20世纪90年代兴起的一门新技术,它是在无线电通信技术、计算机技术和集成电路技术基础上发展起来的一个新型技术分支。通过附着在被处理物品上的识别卡和阅读器之间的射频信号交换信息,可以对物体身份等各种属性进行识别,从而自动完成分检、统计和定位等各种处理工作,以提高物,品流通的自动化水平。射频识别不仅方便,创造的经济效益也很可观。现在美国每年经国防物资利用与销售系统处理的物资价值在60亿美元以上。经估算,采用射频识别技术后,每年除可节约1亿美元以上的经费,另外大约有10亿美元的物资可在物资过剩单位和不足单位之间调剂使用,从而可大大节省采购费与维修费。由于大规模集成电路技术的发展,研制出适合各种应用途径的专用射频识别集成芯片,使射频识别技术在功能上大为增强的同时,应用成本大幅度降低。目前,这项新技术被广泛应用到自动化生产线、航空包裹识别、后勤供应链、公路收费系统、电子商务系统等各种大流量、实时性要求高的领域,给生产、生活带来了极大的方便。

无线射频识别技术在军事上的应用最早可追溯到第二次世界大战中飞机敌我目标识别,但是由于技术及成本原因,一直没有得到广泛应用。20世纪90年代随着大规模集成电路,网络通信、信息安全等技术的发展,无线射频识别技术进入商业化应用阶段,经济发达国家和地区已经率先应用于军事领域。无线射频识别技术系统主要由电子标签、阅读器和数据库组成,阅读器对电子标签进行电子化的识别扫描并向数据库发送信息,数据库检索、储存或传递数据,并根据实际应用做出进一步的信息处理如远程传输、跟踪预警等。无线射频识别技术起源于美国,目前已被美军广泛应用于军事物流领域。如特定物品定位系统、运输途中物资可见性系统、单兵电子病历卡,生理状态监测器和服装发放装置等,极大地改革了传统物流跟踪方式。

对军队来说,后勤物资调动是打赢战争最为重要的保障,特别是在战争进行时。但如何把这样庞大繁复的工作进行得迅速准确,却是目前困扰美军的一大难题。如在作战过程中在哪个方向投入了多少兵力、有多少装备、携带了多少物资给养、能维持多长时间、需要在什么时间、什么地点补充,通过无线射频识别技术都可一目了然。这支部队所需的给养现在哪个集装箱内,是否需要向上领取或就近调配,目前物资已运到什么地方、有没有送错,都会尽收眼底。对于弹药消耗的数量,装备损坏了多少。现有多少伤员等这些战损情况,系统都能了如指掌,并迅速指挥后装保障分队实施快速、精确的保障。1991年海湾战争中,美国向中东运送了约4万个集装箱,但由于标识不清,其中2万多个集装箱不得不重新打开、登记、封装并再次投入运输系统。当战争结束后,还有8000多个打开的集装箱未能加以利用。索马里维和、阿富汗战争和伊拉克战争等实战行动中,美军使用无线射频识别技术取得了理想的效果。最典型的应用案例是在伊拉克战争中美军采用无线射频识别技术,将几十万种不同规格型号的军用物资输送从原先的饱和供应转变成为当前的精确供应,实现了在全球范围内军事物流的可视化。在时间紧迫,路途遥远,地形复杂的情况下,军事物流可视化解决方案可达到快速、准确、安全的作用。

当前,美军正在加快研制和装备“全物资可视系统”和“在运物资可视系统”。前者可以实现后方厂家到前方散兵坑物资发送的全程跟踪,包括物资装备的位置、状况及承运人等;后者则利用“射频装置、搜索装置和卫星联网的计算机系统、物资数据库”追踪补给物资的调运情况。这两个大系统将大大提高物资分发的快捷性、准确性和经济性,为实施精确保障提供了有力的技术支撑。

美国政府计划于2008年10月开始签发运用无线射频识别技术的新版护照,这将涉及数百万美国公民。而信息安全专家则警告说,这种护照存在安全隐患。2008年8月3日,在美国拉斯维加斯举行的最新一届“黑帽”安全大会上,研究人员现场展示了射频识别技术存在的安全隐患。他们利用一台价值仅200美元的射频识别技术读卡器和一台并不先进的智能卡刻录机,轻易复制了射频识别技术智能卡。一位来自德国的科学家,现场表演了“将射频识别技术标签中的电子护照信息,拷贝到了另一张安装射频识别技术芯片的智能卡中”,从而直接证明了射频识别技术电子护照存在的巨大安全稳患。因此,安全专家开始担心,这种技术在护照上的应用有可能为恐怖分子提供新的袭击手段。因为运用了射频识别技术的标签可以作为触发器,即任何携带这种标签的人或物都可以被射频识别技术读取装置远程自动识别(也就是这种标签可以引起读取装置的一次电脑计算反应),恐怖分子也就可以把射频识别技术标签作为爆炸的触发装置。他们可以将炸弹安放在某处,并将它与射频识别技术护照射频识别技术相连,当护照被读取装置识别的时候炸弹就会自动引爆。当然,目前科学家尚未发现直接入侵电子护照的方法,能够做的只是将信息完全复制到其他卡片上。然而,这依然不能避免保密内容的泄露,例如通过读卡器,黑客和不法分子将可以轻易获取电子护照用户的个人信息,从而为进一步犯罪行为铺平道路。(文章代码:2031)

人脸识别技术研究 第7篇

1 人脸识别技术概述

人脸识别技术的定义有广义和狭义之分, 广义的人脸识别有五个过程, 分别是输入图像或者视频、人脸检测、特征提取、人脸识别、辨认确认。如下图所示。

而狭义的人脸识别过程只是针对第四步, 即人脸识别, 就是将待识别的人脸特征与数据库中的人脸特征进行对比, 从而根据相似度进行分类。人脸识别有两大类, 一类是确认, 一类是辨认。确认就是用输入图像或者视频来与特定的某个图像或者视频进行对比, 来确认是否就是该人;辨认则是输入图像或者视频, 在数据库中存储的图像进行逐一匹配, 进行特征比对。很明显, 辨认的难度要远远高于确认, 因为辨认要进行比对的数据太多, 涉及海量数据的处理、特征提取和选择分类算法, 这些都会影响整个人脸识别的速率。在人体识别技术中, 选择合适的算法非常重要, 而衡量算法性能的指标则是识别率和识别速度。文中主要探讨的是人脸辨认。

2 人脸识别技术原理

人脸识别技术的算法可以分为两大类, 一类是基于特征的人脸识别算法, 另外一类是基于外观的人脸识别算法。基于特征的人脸识别算法是属于早期的人脸识别方法, 当前已经很少使用。基于外观的人脸识别算法实现起来相对简单, 也因此成为了当前主要使用的人脸识别算法。

2.1 基于特征的人脸识别算法

早期的人脸识别算法的实现方法主要是通过特征模板和几何约束来进行人脸识别。首先, 对输入的图像或者视频进行处理, 提取出相关的特征, 比如说眼睛、鼻子、嘴巴等面部特征以及外观的轮廓。在提取出相关的特征之后, 算法会计算这些特征之间存在的几何关系, 比如说距离、面积和角度等, 计算出来后算法会将这些数据与指定的某些数据进行匹配, 这就完成了从输入图像或视频向几何特征向量的转换。这种算法的优势是只是选择了一些直观的特征, 因此, 其计算量比较小。然而, 也因为这些特征点的选择并不是很精确, 也使其的应用范围受到了限制。另外, 这种算法也受到了很多的约束, 比如说光照变化、外在遮挡物和面部表情, 当这些因素发生变化的时候, 通过算法算出来的几何向量会发生很大变化。因此, 这类算法在实际中应用很少, 几乎不会使用, 只能用于人脸的粗略识别。

除了通过特征模板和几何约束来检测面部特征及计算出特征之间的关系, 还有另外的基于特征的人脸识别方法。比如说局部二值模式算法。局部二值模式算法是将图像划分为若干个区域, 在每个区域的像素3X3领域中用中心值作阈值化, 将结果看成二进制数。在每个区域中, 通过这种运算, 就可以得到一组直方图, 而所有的区域计算出的直方图组合起来就会形成一个大的直方图, 通过直方图的比对来进行人脸识别。

基于特征的人脸识别技术的优势是很少受到图像本身的成像质量的影响, 而且提取出来的面部特征一般维数都很低, 匹配的速度非常快。然而, 这些方法也存在自动特征提取难度很大, 鉴别能力较弱的缺点。

2.2 基于外观的人脸识别技术

基于外观的人脸识别技术, 也称之为整体算法。这种算法是通过获取人脸的全局信息来进行识别的。基于外观的人脸识别技术有很多种, 最简单的一种是用二维数组来存放图像的灰度值, 然后再将输入图像与数据库中的图像进行比对, 找出相关性强的图像。然而, 这种方法存在很多的缺点, 比如耗费时间很长, 而且受环境因素的影响很大。另外, 这种方法是在高维空间进行的, 为了克服维数问题, 有一些算法使用统计降维的方式来获取和保留更有用的信息, 比如说线主成分分析算法和线性鉴别分析算法。

主成分分析算法的基础理论是认为任何的人脸是可以由一个低维的特征子空间来表示, 而且根据这个特征子空间可以近似的重建人脸。这一算法的主要功能是将输入的图像投影到特征子空间上, 从而得到一个特征数据, 然后将这个特征数据与数据库在后面那个已有的特征数据来进行比对和匹配。主成分分析算法所选取的一些特征能够将人脸样本之间的差异最大化, 从而方便进行比对, 然而, 对于一些因为光照原因和面部表情不同而引起的不必要的变化也进行了存储, 由于有时候由于光照引起的差异甚至会大于不同人脸之间的差异, 所以主成分分析算法存在一些不足之处。线性鉴别分析算法则是在讲不同人脸之间的差异最大化的同时, 也会将同一个人脸样本之间的差异进行最小化, 从而实现了对人脸特征子空间的划分。主成分分析算法与线性鉴别分析算法的不同在于, 主成分分析算法在讲特征子空间的特征向量按照二维图像排列之后, 能够得到近似人脸的图像, 而且重建人脸之后与输入图像之间的差异很小;而线性鉴别分析算法计算出来的人脸很难辨认, 但是保留了该个体的显著特征。

基于外观的人脸识别技术的优点是保留了图像中的所有信息, 然而, 这一个优点也导致其认为图像中所有的像素同等重要, 使得计算耗时大大增长, 而且也需要测试样本与训练样本高度相关;此外, 当图像中的表情、尺寸和光照发生较大变化的时候, 基于外观的人脸识别技术是很难进行识别的。

3 人脸识别技术的应用现状

人脸识别技术的应用非常广泛, 已经运用到了各行各业当中。目前, 应用最为广泛的主要有以下几个方面:

(1) 公安破案。在公安机关的档案中存储有犯罪嫌疑人的照片, 当公安机关获得犯罪嫌疑人的作案现场照片或者其他照片时, 可以与档案数据库中进行比对和匹配, 从而迅速找出嫌疑人, 提高了破案的准确性和速度。

(2) 视频监控。通过对公共场所、银行、车站等地点的监控, 发现异常情况或者有陌生人闯入时, 可以利用人脸识别技术对异常情况进行监控和识别, 也可以对陌生人进行跟踪。

(3) 身份验证。当前, 对于身份验证主要是通过身份证或者其他有效证件进行验证。其实, 利用人脸识别技术进行验证是一种更加安全有效的验证方式, 而且人脸识别技术能够让机器自动完成身份验证工作, 从而实现全智能管理。

(4) 出入口控制。对于火车站、汽车站、机场、地铁、公司、楼宇等出入口的安全检查和身份验证就可以采用人脸识别技术。另外, 还有公司、学校考勤也可以用人脸识别技术来取代指纹打卡或者打卡考勤机, 从而提供更加准确的考勤记录。

当前, 生物特征识别技术在不断发展成熟, 而其中的指纹、虹膜和语音等生物特征的身份验证技术的局限性也在日益凸显, 人脸识别技术具有采集成本低、操作简单和具有非侵入性等优先, 已经越来越受到人们的重视。

4 人脸识别技术的发展趋势

随着科学技术的飞速发展, 人脸识别技术也取得了长足的进步, 在很多行业和领域也得到了广泛的应用, 然而, 当前的人脸识别技术仍然存在一些不足之处。比如说前面提到的, 不同的光照情况下, 同一个人都会呈现出不同的样子, 就算是肉眼也很难辨别, 另外, 还有姿态、表情、年龄等因素也在影响人脸识别技术的应用。现阶段的人脸识别技术受到很多方面因素的限制, 比如说人脸必须要正对摄像机, 而且人脸在图像中要有一定的像素宽度, 在实际应用中很难保证完全满足这些限制条件。这也给人脸识别技术带来了挑战, 在未来的人脸识别技术研究中, 必须要充分提高算法的识别精度, 提高对于环境的适应程度, 从而充分满足实际应用的需求。

目前, 已经有一些研究机构已经开始对人脸识别进行进一步的深化研究, 在新的领域和新的技术方向去寻求突破。比如, 远距离人脸识别技术和3D人脸识别技术等。

远距离人脸识别技术存在两个问题, 一个是如何从远距离的图像中获得人脸图像, 另外一个就是所获取的数据不够理想和充分的情况下, 如何有效识别身份。目前, 对于这两个问题的解决方法是使用高清摄像机, 但是高清摄像机需要进行合理协调, 同步操作, 而且造价也会更加高昂。一般来说, 需要使用低分辨率广角摄像机和高分辨率长焦摄像机来组成一套摄像系统, 前者用来检测和追踪目标, 后者用来进行人脸图像的采集和识别。

3D人脸识别技术比起2D人脸识别技术有了很大的突破, 其受光照、姿态和表情等因素的影响已经大大减少。2D人脸识别技术无法获取深度信息, 3D人脸识别技术则能够通过3D扫面技术来获取3D人脸, 然后通过建模方式来进行人脸识别。然而, 3D人脸识别技术需要的设备较多, 设备成本很高, 而且建模所耗费的时间也很长。不过, 随着芯片技术的发展, 相信以后的计算能力比必然可以满足3D人脸识别技术的要求。

摘要:随着科学技术的飞速发展, 人脸识别技术也取得了长足的进步, 在很多行业和领域也得到了广泛的应用。本文对人脸识别技术的原理、应用现状和发展趋势进行了探讨。

关键词:人脸识别技术,方法,应用

参考文献

[1]舒双宝, 罗家融, 徐从东, 等.一种基于支持向量机的人脸识别新方法[J].计算机仿真, 2011, 28 (2) :288-291.

3D人脸识别技术 第8篇

随着社会的不断发展进步, 很多行业和领域都迫切需要快速和高效的身份验证, 科学家们也对此进行了不断的研究和创新, 目前, 关于生物特征识别的研究工作已经取得了很大的进步。目前, 人脸识别技术正在朝着友好、直接和便捷的方向发展, 这也让使用者更加的容易接受, 不会让其产生心理障碍。

经过数十年的发展, 人脸识别技术已经日趋丰富和完善,从技术种类来分, 人脸识别技术大致可以分为2D人脸识别技术和3D人脸识别技术。3D人脸识别技术有两种主要的实现方法, 一种是基于三维数据的人脸识别方法, 另外一种是基于2D图像的人脸识别方法。

2 基于三维数据的 3D 人脸识别方法

从20世纪80年代开始, 有科学家开始直接使用人脸深度图像来研究3D人脸识别技术, 而且也取得了一定的科研成果,这种方法就是基于三维数据的3D人脸识别方法。基于三维数据的3D人脸识别方法又有两种主要的实现方法, 一种是基于图像特征的实现方法, 另一种是基于模型可变参数的方法。

2.1 基于图像特征

基于图像特征的方法, 顾名思义, 是利用图像中人脸的相关特征来进行人脸识别工作, 这些特征包括人脸的曲率的几何特征、凹凸区域的特征、正面和侧面轮廓 边缘的特 征 ,给予图像特征方法中采用的是深度图像处理技术, 将上述特征与数据库中的特征进行比对, 从而完成人脸识别工作。基于图像特征的方法在最开始应用于人脸识别方面时, 是提取出轮廓线上的一些特征点, 然后对曲面曲率进行分析, 从而进行比较和识别。经过不断的发展, 当前的基于图像特征的方法能够使用脸部特征分离算法, 在对人脸整体尺寸轮廓和三维空间方向进行匹配分析之后, 然后脸部其他各个特征点进行局部的匹配和分析。

2.2 基于可变模型

基于可变模型的方法是将人脸模型的3D变形技术和基于距离映射的矩阵迭代技术结合使用, 从而有效恢复头部姿态和3D人脸。人脸模型的改变姿态, 各个特征的关联关系也会发生相应变化, 各种姿态参数也会随之改变, 人脸模型姿态不断改变知道最小化尺度达到相应要求, 就可以有效来进行人脸识别。

在实际的人脸识别应用当中, 人脸基本上不可能是固定不动的, 而是在不断的移动, 人脸的姿态也在不断的进行改变, 因此, 如果是采用基于图像特征的方法, 人脸姿态改变之后, 需要重新搜索特征点坐标, 这极大的加大了人脸识别工作的难度。而基于可变模型的方法则有效地解决了这个问题, 人脸姿态的每次改变, 只需要调整3D变形模型的参数即可解决问题。

基于三维数据 的3D人脸识别 方法 , 使用了深 度 (Z坐标) 的信息, 从而让人脸形成了一个真正的曲面。与2D人脸识别技术不同的是 , 3D人脸识别 技术在人 脸转动到 一定的范围内仍然可以精确的识别, 不会因为视角的变化而影响人脸识别, 这是2D人脸识别技术不可能实现的。而且因为3D人脸识别技术中的面部特征是通过曲面信息构成的, 这也让其不受光线的影响, 摆脱了对光线的依赖, 有效提高了识别精度。

3 基于二维图形的 3D 识别技术

传统的3D人脸识别技术都是利用人脸模型来构建一个三维立体坐标, 虽然这种方法能够非常精确地对人脸进行识别,但是其也存在一些不足, 如设备非常昂贵, 采集系统庞大复杂, 传输量大, 3D人脸模型库重建算法复杂和识别速度较慢等。正因为如此, 很多科研人员开始研究基于2D图像的3D识别技术。

2D人脸识别技术较为成熟 , 因此 , 基于二维图形的3D识别技术在利用二维图像的基础上, 使用三维信息所包含的人脸三维形状属性, 从而有效进行人脸识别。基于二维图形的3D识别技术是从2D人脸和3D人脸分别提取出相应特征,将其整合之后形成一个特征向量, 从而进行人脸识别。具体来说, 基于二维图形的3D识别技术有几种建模方法, 分别是基于单幅图像的方法, 基于两幅或者多幅图像的方法, 基于可形变模型的人脸三维建模和识别方法。

3.1 基于单幅图像

要从单幅图像中进行3D建模较为复杂, 因此, 在3D建模过程中, 要采用人脸的先验信息来参与辅助工作。具体的建模算法有几种, 分别是从明暗恢复形状方法和基于统计学习模型方法。

从明暗恢复形状方法是指根据二维图像, 从图像的灰度值中恢复出物体的三维形状和表面方向。这个算法需要假设物体表面是朗伯体表面, 而且外界的光线条件是已知的。从明暗恢复形状算法适应于灰度变化较为平缓的图像区域的深度恢复。但是这个算法在应用于人脸面部器官区域处理时会出现一个深度二义性问题。为了解决这个问题, 有专家提出了一种基于local shape indicator的算法和基于表面法向量的算法。这种算法能够利用曲率来指示当前局部形状的凹凸变化趋势, 并且会指定一个全区域最高深度值作为基准, 从而确定当前恢复出来的深度值的指向, 这个最高深度值就是鼻尖点的深度值。有了这个算法, 就可以很好地恢复出人脸信息。

基于统计学习模型的算法主要是对人脸的二维图像进行深入分析, 对图像的纹理数据进行处理, 从中挖掘出深度信息。这种方法的实现也有几种方式, 主要有基于图像灰度值和深度值的多元正态分布法和基于标准相关分析法两种。多元正态分布法是采集图像的灰度值和相对应的深度值, 将其整合之后形成一个向量, 并且利用多元正态分布来描述这个向量的统计特征。将单幅的人脸二维图形输入之后, 采集其灰度值, 然后通过条件密度函数估计, 就可以根据灰度值来获取深度值。多元正态分布法存在一个比较大的缺陷, 就是无法对人脸图像进行精确配准, 这会导致出现较大 的误差。基于标准相关分析法则是从彩色的RGB图像中恢复深度图像。这种方法首先会将人脸面部的相关特征点进行定位, 然后通过对齐和变形过程来完成人脸纹理图像和深度图像 的配准 ,再使用LBP对人脸纹理图像进行编码, 从而获取LBP图像,再利用基于核的偏最小二乘回归算法来建立一个映 射关系 ,这个映射关系是从LBP纹理图像空间到深度图像空间的。因此, 一个二维人脸图像, 在经过配准之后生成LBP图像, 即可利用映射关系来获得其深度图, 基于标准相关分析法是目前3D人脸识别领域中效果非常好的一种方法。

3.2 基于两幅或者多幅图像

基于两幅或者多幅图像的方法无论从技术实现难度角度还是最终效果角度来说都要比单幅图像方法更好。因为基于两幅或者多幅图像能够使用立体视觉来计算出人脸的三维信息。基于两幅图像的方法有几种, 根据对输入图片要求的不同, 可以分为基于正交图片的方法和基于非正交图片的方法。基于多幅图像的方法主要有基于面片的多角度立体 视觉法、基于多组人脸图像的方法和基于视频序列的方法。

正交图片, 就是指两幅图像成90度, 即一幅正面的人脸图像, 一幅侧面的人脸图像。基于正交图片的方法首先会从两幅图片中提取出面部的各个特征点的位置信息, 然后提取出三维信息, 最后根据这些特征点信息, 使用相关算法来完成人脸模型的构建。

在实际的人脸识别工作中, 要获取完全正交的图片是很困难的, 因此, 正交图片方法应用范围很狭窄, 一般采用的都是非正交图片方法。普通的人脸图像纹理变化较 为平缓 ,梯度信息很少, 而且纹理重复情况非常多见, 这就导致立体匹配计算时难以获得可靠的人脸信息, 这严重影响了人脸模型重构。因此, 这种方法也需要借助人脸的先验信息的帮助。

在多幅图像方法中, 最常见的基于面片的多角度立体视觉算法, 这个算法分为两个步骤, 第一个步骤是点云 生成 ,第二个则是表面重建。基于面片的多角度立体视觉算法首先会利用人脸的特征点信息按照匹配算法生成稀疏的种子面片,然后利用多次迭代面片扩展和面片滤波的方法来生成高精度的人脸面片点云, 再利用人脸点云去逼近人脸的Visual hull来完成表面重建, 从而获取三维人脸模型。

3.3 基于可形变模型

三维可形变模型是目前比较常用而且应用较为成功的人脸识别方法。三维可形变模型不但能够基于单幅图片进行特定人脸建模, 也能够利用多幅图片进行人脸建模, 最为重要的是这种方法考虑了各方面的因素, 包括光照和姿态等, 因而其能够生成真实感非常高的三维人脸模型。这种技术方法的出现, 是人脸识别技术的一次飞跃, 其深刻影响了计算机视觉领域和计算机图形学领域。

形变模型的基本思想是某一类对象中的个体, 可以使用对象空间的基底的线性组合来表示。二维图像方面, 形变模型的应用取得了良好的效果, 后来, 研究人员又提出了线性对象类概念, 得出了三维对象满足线性对象类的充分 条件 ,而且也证明了人脸对象在一定条件下是可以称为现象对象类的。与其他的人脸识别方法不同, 在三维可形变模型中, 形状和纹理是区别开来的, 而二维图像形变模型则是将形状和纹理整合在一起来进行表示, 形状和纹理分开表示, 有效地解决了在实际工作中对姿态不断变化的人脸进行识别的难题。

三维可形变模型在应用于人脸的二维图像生成时, 会考虑到各种因素的影响, 比如说光照和姿态, 而且还会考虑旋转、平移、焦距、环境光强度和光源方向等, 因此, 通过三维可形变模型可以生成真实感非常强的人脸图片。

摘要:科学技术的飞速发展,很多高新技术都在各行各业得到了广泛应用,也在各个领域内掀起了一股科技改革浪潮,3D人脸识别技术就是其中的典型代表,3D人脸识别技术的应用领域已经越来越广泛。主要介绍了几种主流的3D人脸识别技术,包括基于三维数据的3D人脸识别技术和基于二维图形的3D识别技术。

谈无线射频识别技术 第9篇

近几年来,人工智能催生物联网技术迅猛发展,RFID(Radio Frequency Identification)作为物联网的重要组成部分之一也越来越受到大家的重视。之所以能成为物联网的基础是因为它是一种非接触式的无线识别设备,它通过射频方式自动识别相关的物品,无需光源和任何可视化操作,操作简单且准确率高,极大地降低人工费用。

RFID与条形码的区别和优势

谈到非接触式识别,人们自然会想到超市用的条形码,但是RFID与条形码又存在着本质的区别,因为其本身存在着独有的优势:

首先,条形码必须通过扫描仪在短距离内识别物品,而RFID则无需扫描仪类的附加设备和距离要求就可以识别物品,节省仪器损耗的同时也减低了人力成本(1)。

其次,条形码是识别某一类物品的名称、生产厂家和预先设定的价格,而RFID则可以细致识别到此类物品中的每一个物品,其信息也要比条形码包含的更细致,甚至可以实时跟踪物品的当前位置等。

RFID的组成和工作过程

既然RFID有诸多优势,那么它是怎么构成的呢?一般的RFID通常由三部分构成,分别是RFID标签、射频读写器和支持通信的网络设备。RFID标签是由芯片组和无线天线组成,根据射频信号的发射方式又分为主动标签和被动标签,主动标签含有供电电池,所以射频信号范围较大,一般在100米左右,而被动的因为没有电源,所以识别范围受到较大影响,只有30米之内,但受到电池寿命的限制,主动标签寿命也只有3年左右。射频读写器主要功能是控制标签发射和接受信号,并对信息进行加密和解码(2)。通信网络主要是作为信息发送和接受的网络支持。其三部分配合共同完成任务,基本流程如下:

1.射频读写器控制天线向外发送信号,查询是否有标签;

2.当RFID标签进入有效区域后,标签激活,将装有自身信息的代码通过天线发射给读写器;

3.读写器接收到标签天线发送的信息后,进行解码后,传输到服务器;

4.服务器根据得到的信息发出相应的指令。

制约RFID发展的瓶颈问题

虽然RFID操作简单,又有其独有的优势,但是它也存在着发展的瓶颈部分,下面我们共同研究一下哪些问题比较关键。

1.成本方面

成本问题是制约RFID迅速扩大生产规模和增加使用群体的最大问题。目前,读写器的成本市场价大概在几千元之间,标签相对来说比较便宜,只有几角钱,但是同条形码相比(3),成本仍然较高,所以推广起来较为困难,只有掌握具有自主专利的技术和研发新材料才能降低成本,使这项技术得到普及。

2.识别效果方面

受到不同的情况的影响,识别的效果并非一直是100%,但这个不是制约RFID的主要因素。一般情况下影响识别效果的因素主要有作业环境、标签损毁、识别物材质和数量等情况,但是随着物联网技术的发展,这方面的制约因素影响已经越来越弱,专家们不断地寻找新的材料以提高识别的精准程度。

3.信息安全和隐私方面

正是由于RFID独有的特性,才更加引起了人们对于其侵犯个人隐私和信息安全方面的担忧。针对于标签的信号发送功能,人们正在尝试研制新的标签,例如kill标签,即商品售出以后,随即杀死标签,使标签不能被再次激活;法拉第网罩,将标签罩在里面,避免不法分子的入侵和信息的泄露等(4)。但是即使是再多的方法,也会有信息安全方面的问题,这也是将来技术突破的一个方向。

市场发展预测

美国的一家知名调研公司2010年曾公布权威调查数据,无线射频识别技术将加速推动智能地球的进程,同时此项技术的市场产值也将在未来几年内成倍增加,2015年达到100亿美元,降低人力成本的同时也会创造新的就业机会。而国内的需求射频识别标签的总数量将达到20亿个,读写器也将达到1000万,所以,无线射频识别技术不仅前景广阔而且产值巨大,必将成为未来中国的朝阳产业。

注释

1张成海,张铎.现代自动识别技术与应用[M].北京:清华大学出版社,2012

2[德]Klaus Finkenzeller.射频识别(RFID)技术[M].陈大才译.电子工业出版社,2010

3郭星香,曲亮生,张宗军.射频识别技术在军事物流配送中的应用[J].物流科技.2008,3

人脸表情识别技术综述 第10篇

心理学家Mehrabian认为, 声音 (38%) +言词 (7%) +面部表情 (55%) =情感表达。在人们的日常交流中, 通过面部表情来传递的信息高达55%, 可见在人与人之间的交流中表情信息的重要性。

面部表情识别

面部表情识别系统一般由人脸图像获取、图像预处理、特征提取、特征分类、后处理五个部分组成。如图1所示。

表情特征的提取

人脸表情提取按图像性质的不同来划分, 可分为静态图像特征提取、序列图像特征提取。

静态图像特征提取

从静态图像中提取的是表情的形变特征, 提取的对象是表情模型。形变特征提取的常用方法有基于模型的方法, Gabor小波法和主成分分析法PCA等。

基于模型的方法。它包括点分布模型PDM和活动外观模型AAM等。点分布模型PDM是一种参数化的形状描述模型。其原理是采用PCA方法构建出描述对象形状的各个控制点的运动模型。通过约束控制点的基准位置与移动模式, 保证模型的整体形变一直保持在可接受的范围之内。活动外观模型AAM建立了一种针对目标对象变化程度的参数化描述, 也属于基于模型的方法之一。

Gabor小波法。Gabor小波滤波器的方向、中心频率及基频带宽均是可调的。它是一个由二维高斯函数衍生出的复数域正旋曲线函数。通过调节Gabor滤波器的不同参数, 能够捕捉到对应图像中不同的空间位置, 空间频率以及方向信息。

主成份分析法PCA。基本原理是在不同表情具有可分性的前提下, 假设人脸处于低维线性空间, 将一组高维训练图像K-L正交变换, 消除原有向量间的相关性的同时生成一组新的正交基。然后, 提取出新的正交基中对应较大特征值的部分特征向量, 生成低维表情特征空间的同时保留原高维空间的主要成分分量。

序列图像特征提取

序列图像特征提取不仅要提取每一帧的表情形变特征还要提取连续序列的运动特征。常用的提取方法有特征点跟踪法, 光流法以及差分图像法。

特征点跟踪法。是选择脸部的显著特征点来进行运动估计, 它仅提取了部分特征点信息而忽略了其他部分脸部信息, 因此部分有用信息可能会丢失。

光流法。光流属于运动特征提取法之一, 基于光流的算法有基于梯度的光流计算法、基于频率域的方法和基于区域匹配的光流计算方法。

差分图像法。是将视频序列中相邻的两帧图像作差分运算, 不为“0”的点代表变化区域, 为“0”的点代表不变区域。由于图像序列中处于极大状态时表情信息最为丰富, 因此在进行表情分析时, 通常将被测帧与标准帧进行差分运算, 来检测该表情所对应的关键帧。

面部表情的分类

表情分类方法通常包含以下几种:

(1) 基于几何特征的方法。通过人脸面部拓扑结构几何关系的先验知识, 利用基于结构的方法将人脸用几何特征矢量表示。

(2) 特征脸方法。将K-L变换用于人脸图像的最优表示, 以训练样本集的总体散布矩阵, 经K-L变换后得到相应的一组特征矢量。

(3) 基于模板的方法。首先定义一个能量函数, 设计一个参数可调的器官模板, 然后通过调整模型参数使得能量函数最小化。

研究中的难点

人类识别人脸信息比较容易, 但用计算机来分析识别人的面部表情是一个相对困难且复杂的问题。关键点在于构建一个情绪模型, 并把它们同人的面部特征及表情变化联系起来。由于人脸是一个柔性体, 而非刚体, 因此很难用某种模型来精确描述。并且表情的识别还依赖于 (1) 外部光照强弱和人脸姿态。 (2) 对人脸的熟悉程度。 (3) 对各种表情的体验。 (4) 计算机没有知识和经验, 不具有举一反三的能力。 (5) 对脸部的注意程度等因素。因此, 这些都是它的难点所在。

展望

人脸表情识别是一个跨学科、富有挑战性的前沿课题, 其研究目的主要在于建立一种友好、和谐的人机交互环境, 使计算机能够通过观察人的脸色变化来行事, 进而营造出一种真正和谐的人机交互环境。目前此项研究尽管已经取得了很多重大成果, 但仍处于研究阶段, 各种算法也还在摸索当中, 不是十分成熟。

人脸检测及识别技术综述 第11篇

【关键词】人脸检测;人脸定位;特征提取;人脸识别

0.引言

在现实生活中,很多情况下都需要进行身份验证。人脸是人体最重要的外貌特征,由于脸部信息可以通过如摄像头等非接触的方式取得,所以非常适合作为身份鉴别的依据。与指纹识别、虹膜识别等诸多生物识别技术比较而言,人脸识别技术的独特之处还表现这种识别技术具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受。该技术被广泛应用于国家安全、军事安全和公安、司法、民政、金融、民航、海关、边境、口岸、保险及其他民用安全控制系统等领域当中。此外,人脸识别技术的研究还涉及生理学、心理学、人工智能、模式识别、图像处理等多个学科领域,因此它具有重要的理论研究价值。

1.人脸检测

人脸检测问题起源于人脸识别技术。人脸检测从总体上可分为两大类:基于先验知识的人脸检测方法和基于后验学习和训练的人脸检测方法。

1.1基于先验知识的人脸检测方法

基于先验知识的人脸检测方法自上而下,依据人脸面部器官的对称性、灰度差异等先验知识,将人脸面部器官之间的关系编码并制定出一系列的准则。当待测图像中的某些区域符合该准则,该区域就被检测为人脸。

此类方法所使用的特征可以分为灰度特征、形状特征、结构特征、纹理特征和颜色特征。

1.1.1灰度特征

多个人脸图像的平均就是一个简单的人脸模板,同时,人脸的眉、眼、嘴、前额、鼻梁、下颌、脸颊等区域的灰度值较高,因而人脸具有特定的灰度分布特征。对人脸区域进行水平和垂直方向的灰度投影,根据极小值点位置即可得到眼、鼻、嘴等各自所处的区域。因此基于灰度特征建立人脸模板可以检测人脸。

1.1.2形状特征

从人脸子器官的形状和相互位置关系出发,提取人脸特征。人脸轮廓、眉毛轮廓、嘴唇轮廓、鼻侧线等可以近似视为椭圆、弧线、线段组合等简单的几何单元。与灰度特征相比,形状特征对光照变化具有一定的鲁棒性。Graf等首先利用带通滤波器选择出一段频率,然后根据形态学的知识设定一系列的阈值找出眼睛、嘴巴等区域,最后依照以上位置检测出人脸。Leung等提出任意图匹配的方法,其主要目的是用准则正确表达出面部特征的几何分布。

1.1.3结构特征

人脸具有对称性。正面人脸是左右对称的,对应的灰度特征和形状特征基本相同。眉毛、眼睛、鼻子和嘴巴等区域是按照一定比例关系组织在一起的。各个器官自上而下排列,两眼和嘴中心构成一个三角形。

1.1.4纹理特征

人脸图像具有一定的纹理特征。灰度共生矩阵或者Gabor小波等频域特征可以表征人脸图像的纹理特性。

1.2基于后验学习和训练的人脸检测法

这一方法实际上是将人脸检测问题转化为统计模式识别的二分类问题。通过对大量的“人脸”与“非人脸”样本进行训练,得到“人脸”与“非人脸”分类器,通过判别图像中所有可能区域属于哪类模式的方法实现人脸的检测。此类人脸检测方法主要有基于Adaboost级联分类器的方法,基于概率模型的方法,基于支持向量机的方法等。

2.人脸识别

2.1特征脸(Eigenface)方法

以主成分(Principal Component Analysis ,PCA)分析理论为基础的人脸识别方法称为特征脸方法。PCA是通过K-L变换展开的网络递推实现, K-L 变换是一种常用的特征提取方法,对消除模式特征之间的相关性、突出差异性有最显著的效果。特征脸识别方法就是把含有人脸图像的区域作为一种随机向量,继而用K-L变换得到其正交基底。这些基底中特征值较大的基底具与人脸的形状相似,所以称之为特征脸。而这些基底的线性组合可以表述和充分接近人脸的图像,就可以对人脸进行识别和合成。识别过程是首先得到由特征脸组成的子空间,将人脸图像映射到该子空间上,进而比较其与标准的人脸图像在特征脸空间中位置的差异。

2.2奇异值分解方法

奇异值特征是一种代数特征,它用于反映图像的本质属性。在某种程度上,奇异值特征除了具有比例不变性、旋转不变性等重要性质,在某种程度上还具有代数和几何的双重稳定性。利用这一特性,可以用奇异值分解对人脸图像矩阵提取出图像的代数特征后进行匹配识别。在奇异值分解的基础上利用奇异值分解方法可以产生多种人脸识别方法。例如基于图像集似然度的人脸识别方法,是用人脸图像集中每个人脸图像的奇异值向量构造出一个特征矩阵,再用待检测人脸的特征矩阵与已知的各类人脸图像的特征矩阵做似然度的对比,判断待检测人脸属于人脸图像集中的哪一类。

除了上述几种典型的方法之外,灰度模板、可变形模板、弹性属性图、频域特征表示法、光流形状模型、光照锥模型等也是较常用的人脸表示方法。

2.3弹性图匹配技术

弹性图匹配技术是对几何特征进行分析的基础上,结合对灰度分布信息进行小波纹理分析的识别算法。早期,Lades等人提出了针对畸变不变性物体的动态链接模型,用稀疏图形来描述物体,用局部能量谱的多尺度描述标记顶点,其拓扑连接关系用边来表示且标记为几何距离,然后应用塑性图形匹配技术来寻找最近的已知图形。随后,Wiscot等人对改技术进行了改进。由于该方法保留了人脸图像的空间信息,提取了描述人脸图像的局部特征,并在一定程度上允许人脸从三维投影到二维引起变形的情况,因此这种方法具有典型代表性。

2.4人工神经网络方法

在人脸识别技术的发展过程中,神经网络的应用研究从未停止。人工神经网络最早应用于人脸识别技术的是一种单层的自适应网络WISARD。后期多使用多层感知器(MLP)识别人脸图像,其方法是直接将原始的未经任何处理的人脸灰度图像送入MLP的输入层,却常常导致输入节点的数目过多。为了解决这个问题,研究者们将图像进行采样、分割或映射等处理后送到MLP中记性分类,大大提高了识别的精确度。除MLP外,研究人员还提出了许多不同的神经网络结构,取得了较为理想的识别效果。

3.总结与展望

本文结合人脸检测与识别技术的发展状况,对人脸检测技术和人脸识别技术分别进行了综述。由于各方面对身份验证这一人机交互技术需求的激增,作为身份验证中最重要技术的人脸检测与识别技术正日益受到重视。在世界范围内已经成为了研究的热点。人脸检测与识别技术牵涉面十分广泛,理论问题也非常多,目前出现形成一个专题的趋势。

射频识别技术及其应用 第12篇

由此可见, 研究RFID, 发展RFID产业对提升社会信息化水平、促进经济可持续发展、提高人民生活质量、增强公共安全与国防安全等方面产生深远影响[4]。本文对RFID系统模型、实现原理和关键技术进行了详细的介绍, 同生活中的条形码进行了区分, 通过一些简单的应用实例, 加深对射频识别技术的了解和认识, 最后对射频识别技术的发展进行了展望。

1、RFID系统模型和工作原理

一个RFID系统包含三个基本的组成部分:射频标签 (tag) , 射频阅读器 (reader) 和数据采集设备 (data collection device) [5]。

射频标签内部具有完整的电路而且有一个独立的识别号, 通过射频标签上的天线与射频阅读器进行数据的交换。按照能量供给方式的不同, 射频标签可以分为有源 (active) 、无源 (passive) 和半有源三种;按照工作频率的不同, RFID标签分为低频 (LF) 、高频 (HF) 、超高频 (UHF) 和微波频段 (MW) 的标签。有源标签是指一些配有内置电池的标签, 由内置电池供给标签资料读写及转送功能。有源标签主动向射频读写器发送信号, 因此又被称为主动式标签。无源标签是指内部没有内置电池的标签。工作时, 由射频阅读器透过无线电波激活标签, 间接向标签供给电力, 因此该标签又被称为被动式标签。半有源标签是标签内部有内置电源, 而这个电源只能维持标签内部电路的运作, 标签不能向射频阅读器发送信息。只有阅读器向半有源标签发送信号时, 该标签才能被激活, 同阅读器进行数据的交换。有源标签和无源标签的具体区别可以见表1。

对于按照工作频率进行划分的标签, 不同频段标签的工作有效范围是不一样的。低频标签工作在125KHz, 高频标签工作在13.56MHz, 超高频标签工作在1000MHz, 微波标签工作在2.45GHz。RFID工作频谱分布如图1所示。不同频段上的标签, 工作的有效范围是不一样的, 如表2所示。在实际需要中, 根据作用距离选用不同的标签。

目前国际上RFID应用以LF和HF标签为主;UHF标签开始规模生产, 由于其具有可远距离识别和低成本的优势, 有望在未来五年内成为主流;MW标签在部分国家已经得到应用。

射频阅读器主要由射频模块、控制单元和天线组成。射频模块通过天线向标签发送信射频信号, 同时接收来之标签的信号。阅读器将接收到的信号经过一定的处理, 发送给数据采集系统, 让数据采集系统对数据进行整理。

数据采集系统可以是便携式电脑, 可以是台式机, 可以是任何与阅读器有接口的设备。在大多数情况下, 数据采集设备是一台电脑, 通过固定的接口与阅读器实现数据的交换, 然后运行电脑上的应用软件实现对数据的处理。

RFID系统框图如图2所示。图中的服务器就是所谓的数据采集设备。射频标签与阅读器之间通过两者的天线架起空间电磁波传输的通道。射频标签与阅读器之间的电磁耦合分为近距离的电感耦合与远距离的电磁耦合。在电感耦合方式中, 阅读器将射频能量束缚在阅读器电感线圈的周围, 通过交变闭合的线圈磁场, 沟通阅读器线圈与射频标签线圈之间的射频通道, 不向空间辐射电磁能量;在电磁耦合方式中, 阅读器的天线将阅读器产生的读写射频能量以电磁波的方式发送到定向的空间范围内, 形成阅读器的有效阅读区域, 位于阅读器有效阅读区域中的射频标签从阅读器天线发出的电磁场中提取工作电源, 并通过射频标签的内部电路及标签天线将标签内存的数据信息传送到阅读器。

如图2所示, 射频识别系统工作过程中, RFID标签和RFID阅读器之间进行着数据、时钟和能量的交换。其中数据交换是目的, 时序是数据交换的实现方式, 能量是时序得以实现的基础。当标签进入磁场后, 标签凭借阅读器发出的射频信号所产生的感应电流而获得的能量发送出存储在芯片中的产品信息 (Passive Tag, 无源标签或被动标签) , 或者主动发送某一频率的信号 (Active Tag, 有源标签或主动标签) ;阅读器读取信息并解码后, 送至数据采集系统进行有关数据处理。

2、RFID实现的关键技术

RFID技术的研发, 主要是对标签、阅读器以及RFID应用技术的研究。就RFID系统所包含得标签、阅读器和数据采集设备等三个部分而言, 对标签和阅读器的研究, 将扩大RFID技术的应用范围, 提高其普及率。因此, 标签芯片设计与制造、天线设计与制造、标签的封装与集成以及阅读器的设计和制造等技术的研究, 是实现RFID技术的关键。

(1) 对于标签的开发和研究, 必须做到:

低成本、低功耗, 这是实现标签全面普及的关键。相对于条形码来说, 现在标签的成本还是比较高的, 这限制了RFID的应用;

标签天线的设计, 包括天线的匹配技术, 针对不同应用对象的天线结构优化技术以及天线设计的仿真软件;

标签的封装技术与装备和标签的抗干扰性、安全性技术。

(2) 对于阅读器的开发和研究, 必须做到:

防冲突算法, 这是阅读器实现一次读取多个标签的关键, 该算法直接影响RFID的工作效率;

抗干扰技术, 安全认证技术;

低成本、高集成度、小型号。

对于这些关键技术的研究, 有利于RFID技术的推广和应用。同时, 在应用中加强对RFID的体系结构、系统集成与中间件、公共服务体系和测试技术与规范等应用关键技术的进一步研究。

3、RFID与条形码的区别

条形码是用来标识商品的, 根据12位的条形码代码, 可以知道该商品的一些信息。条形码技术和射频识别技术都是识别技术, 它们当中容纳的数据都能够由某些类型的读取器来访问。两者的区别在于:条形码技术是一种光学技术, 而射频识别是一种无线电技术, 由此造成了射频识别与条形码技术交换数据的方式的不同。作为一种无线电技术, RFID不要求在阅读器和交换数据的标签之间形成直视线。因此射频识别标签可以穿透包装材料来读取, 包括纸板包装箱和用于密封货盘的塑料包装。然而RFID很容易受到干扰, 特别是金属、液体等, 因此必须在系统规划当中识别潜在的干扰源, 并将其考虑在内。射频识别读取器可以自动识别和区分在它们读取范围内的所有射频标签, 每秒可以读取十几个甚或上百个标签, 使它们非常胜任高速分类、接收、越库以及其他一些操作。射频识别标签的数据功能使它们能够装载与条形码相同甚至更多的信息。

条形码作为一种光学技术, 当阅读器在进行数据读取时, 要求条形码和阅读器之间为直视线, 这样才可以识别条形码中的信息内容。条形码的读取每次只能有一个, 与射频识别技术一次可以读取十几个甚或上百个标签相比, 这样的数据读取能力降低了工作的效率。

此外, 射频识别以无线方式发送数据, 并且是可读写技术, 可以在跟踪周期内更新或改变编制在标签内的数据。业内专家认为, 射频识别技术是条形码技术的补充, 将不会大幅度替换条形码, 而是将两者有机的结合, 形成了具有条形码技术的成本优势与射频识别功能的“智能标签”[7]。

4、RFID应用实例及存在问题

RFID应用于物流、制造、公共信息服务等行业, 可以大幅提高管理和运作效率, 降低成本。举两例说明RFID在实际中的应用, 加深对RFID技术的认识和了解。

在销售市场上存在的大量的伪劣商品, 这影响了正品生产厂商的销售利润和市场声誉, 同时也给消费者带来了经济上的损失和不必要的麻烦。因此, 必须采取行之有效的方法, 对伪劣商品加以打击。RFID可以用来制止伪劣商品的泛滥。在生产过程中产品置以RFID标签, 其中包含了产品信息;在产品装配过程中, 采用RFID阅读器读取RFID标签内容, 同时将内容存储到资料系统管理中心;零售商读取产品RFID标签内容, 将之与资料系统管理中心的数据进行核对, 通过验证前后信息的一致性, 来确定商品的真伪, 同时还可以给客户提供产品的相应资料。

在公共服务体系中, 图书馆的书籍管理相当复杂, 书本的整理和盘点, 特定书本的查找, 借还书的手续登记等都比较繁琐。利用RFID技术后, 在每本书中置以RFID标签, 这样书本在进行整理和盘点时, 只要运用RFID阅读器对书本进行整体扫描一下, 就知道图书馆中的藏书了。同时, 在查找特定书本时, 也只需要用阅读器进行扫描, 就可以方便地查找到书本的位置。进行借还书手续登记时, 读者只要拿着书在阅读器上扫描一下就可以了, 而且可以同时扫描多个, 提高了借还书的效率。这样, 方便了读者和管理人员, 也极大提高了公共服务体系的办事效率。

RFID还应用在高速公路收费、物流、动物识别和跟踪、药品管理、病历文件管理、射频卡、机场地勤等方面和领域。在使用的过程中, 也暴露出了RFID技术的一些弊端, 如安全保密问题, 文献[8]对此进行了讨论。还有包括采用射频识别系统带来的失业问题、国际标准的制定和推行等问题, 有待进一步的研究和解决。

5、RFID发展展望

RFID作为20世纪90年代开始兴起的一种自动识别技术, 在世界范围内被广泛应用。我国在射频识别技术及应用方面, 还处于初级阶段。因此, 必须加强对RFID关键技术的研究, 在生产线自动化、仓储管理、电子物品监视系统、货运集装箱的识别以及畜牧管理等方面有所突破, 从而推动自动识别行业的发展。

参考文献

[1]Royal Air Force.History:1940.http://www.raf.mod.uk/history/line1940.html

[2]http://gov.finance.sina.com.cn/zsyz/2004-10-10/29608.html

[3]Rajit Gadh and B.S.Prabhu, Radio Frequency Identification of Hurricane Katrina Victims.IEEE SIGNAL PROCESSING MAGAZINE MARCH2006.

[4]中国射频识别 (RFID) 技术政策白皮书.

[5]Mark L.Mckelvin, Jr.Mitchel L.Williams and Nina M.Berry.I-ntegrated Radio Frequency Identification and Wireless Sensor Network Architecture for Automated Inventory Management and Tracking Applications.TAPIA'05, Oct.19-22, 2005:44-47.

[6]李锦涛, 郭俊波, 罗海勇, 曹岗, 冯波, 陈益强.射频识别 (RFID) 技术及其应用.信息技术快报, 2004 (11) .

[7]射频识别:新一代自动识别数据收集 (AIDC) 技术白皮书.

上一篇:非心脏手术论文下一篇:人事档案管理中心