手势设计范文

2024-08-19

手势设计范文(精选12篇)

手势设计 第1篇

人与机器的通信方法多种多样, 从这些方法的发展趋势可以看出, 趋势是越来越方便, 越来越趋于自然直接的方法。而手势控制的优点就在于, 它是运用最自然的语言———肢体语言, 不需任何工具, 运用身体本身就能实现功能。三维建模是现代工业生产中必不可少的, 而现在传统的建模方法由于运用了鼠标键盘等工具, 使部分人的创作思维受到了限制。而基于手势控制的3D建模端口由于没有借用任何工具, 所以它能最大程度地释放人们的创作灵感。

1 总体设计

本文设计的建模端口总体功能如图1所示。该端口设计是通过运用kinect捕捉人手在空间中的X坐标、Y坐标和深度坐标, 然后传输到计算机充当建模的画笔坐标。4个手指的弯曲分别担任4个不同的功能, 分别是添加点、移动点、添加线、添加面。手指弯曲程度的获取, 是通过一个安装好曲度传感器、Arduino Lily Pad单片机、无线通信模块和小型电源的手套获得。计算机的实时三维建模是通过Processing编程实现。Arduino单片机和计算机的通信是通过无线模块来实现。

2 系统硬件设计

2.1 硬件总体

本设计中, 采用了Arduino Lily Pad单片机、Lily Pad XBee无线通信模块、曲度传感器、kinect (X-BOX360) 等硬件来实现功能。

系统总体功能如下:

1) 把曲度传感器安装在手套的各个手指上, 与Arduino单片机连接, 获得手指弯曲程度。

2) 把XBee无线模块与Arduino单片机连接, 将数据传至计算机。

3) 5V电源连接Arduino单片机、220V家用电源连接kinect, kinect通过USB传输数据至计算机。

4) 计算机通过运行Processing相应程序实现三维建模。

2.2 单片机系统设计

本文采用Arduino Lily Pad单片机, 它的最大优点是轻便小巧, 可以缝在衣服上。其整个系统只有两个硬币大小, 而且可以清洗。它的编程平台是基于C语言开发而成, 由于它是开源的, 所以它有相当多而且强大的函数库, 在编写程序的时候非常快捷方便, 而且便于交流。

3 软件设计方案

3.1 Arduino单片机程序设计

由于Arduino单片机负责把曲度传感器的数据读回, 而曲度传感器属于模拟量的传感器, 所以程序方面在读取数据后, 经过一个均值滤波算法后, 再将数据传送至计算机。

在通信方面波特率采用9600。在Arduino程序编写中, 无线通信只需要通过调用函数库即可。

3.2 Processing程序设计

1) 手部感应方面。通过运用Processing中的kinect的Open NI函数库来捕捉手, 然后提取X坐标Y坐标和深度坐标, 在建模中充当点的画笔的坐标。

由于kinect的感应坐标零点与建模零点不一样, 所以感应中以第一次捕捉到人手的坐标为建模坐标的零点, 以后感应到手的坐标减去建模零点坐标得出相对坐标即可以完成建模。

2) 曲度传感器的矫正。由于每个人的手指都不一样, 所以弯曲的程度也不一样。因此在开始建模前实行建模手套的手指弯曲校准。先伸直所有手指然后按下键盘“z”储存此值。然后把所有手指收紧按下键盘“x”储存此值。校准完成后, 运用此值计算总的弯曲程度, 当手指弯曲度大于70%触发功能。以下是校准手套储存值的程序语言:

3) 建模方面。在建模过程中由于不同手指的功能是不一样的, 所以在不同功能下画笔点 (手的坐标) 的颜色是不一样的, 这样可以方便区分功能。

在建模显示方面, 先建立好三维空间, 再建立不同的函数, 点函数、线函数、面函数等, 通过不同手指触发不同的功能, 画出不同的图形。然后通过先前获得手的坐标, 得到点线面的坐标, 最终建成模型。模型建立完毕后通过按下键盘“c”键导出DXF文件。

4 结语

通过本设计可以看出体感控制建模的可行性和新颖性, 不过同时也可以看出其不足之处。目前这种三维建模的端口设计, 还是一个概念性的设计, 只能用于初步的建模。本设计可以快速地建立一个大概模型, 能让人有一个直观的印象, 但是模型要用于生产还需要经过建模软件的细化。

摘要:文中介绍了如何运用手势进行3D建模, 通过曲度传感器捕获不同手指的曲度来实现在建模中的各种功能, 通过编程实现建模的实时显示和生成DXF文件, 从而导入现有的三维建模软件。

关键词:三维建模,手势控制,kinect,processing,arduino

参考文献

[1]Enrique Ramos Melgar.Arduino and Kinect Projects[M].Apress.Apr 2012.

手势设计 第2篇

知识“音的高低”“柯尔文手势”教学设计

演丰镇中心小学李小芬

我校李小芬老师正在同步课堂授音乐课

教学内容

1.知识“音的高低”

2.知识“柯尔文手势”

教学目标

能初步模仿和听辨生活中各种声音的高低。

学习“柯尔文手势”并模唱唱名。

教学重点

指导学生听辨日常生活及音乐中声音的高低。

教学难点

用“柯尔文手势”表现歌曲。

教具准备

教学课件、电子琴、打击乐器

教学过程

一、组织教学

师生问好

课前律动(大鹿)

二、学习新课

知识“音的高低”

(1).由有视觉感的物体的“高度”引入“音的高低”对比

① 教师与同学或同学之间相互比身高

② 图片中建筑物的高低对比

③ 图片中长颈鹿与斑马的个子高低对比

④ 图片中人物的个子高低对比

(2)学生聆听几组声音,辨别音的高低

①.碰铃与寺庙铁钟

②闹钟和大钟

③三角铁和鼓

(3).学生聆听三组声音,辨别音的高低

①鸟和牛

②大号和小号

③大提琴和小提琴

(4).学生分别模仿两种动物或物体发出的高低不同的声音,请其他同学听辨

(5).“音的高低”游戏

规则:教师弹标准音,当听到比这个音高时,举起双手,听到比它低时,双手叉腰。

2.知识“柯尔文手势”

(1).认识唱名

①音乐中,“音的高低”用“1234567”来表示,由低到高排列。

⑤ 教师带领学生用模唱唱名(u),边唱边用手势模仿爬楼梯的动作,以帮助学生直观的感受音的高低。

(2).学习“柯尔文手势”

①教师向学生介绍也可用“柯尔文手势”来表示“音的高低”。

(“柯尔文手势”是柯达伊音乐教学法中的一个组成部分,手势是19世纪70年代由优翰·柯尔文首创的,所以称之为“柯尔文手势”。)

②教师边唱边示范“柯尔文手势”

⑥ 教师带领学生练习“柯尔文手势”并纠正学生错误手势。

⑦ 用“柯尔文手势”来模唱唱名(la).⑧ 听歌曲《哆来咪》,一起做“柯尔文手势”。

⑨ 用“柯尔文手势”表现歌曲《闪烁的小星》。

(3).拓展

用“柯尔文手势”进行音程练习。

三、小结

滑动手势拨通电话 第3篇

一款名为“手势联系EasyCall”的手势拨号应用可以有效解决这一问题。该应用可以把常用的联系人设定为某个简单手势图案,以后只要在屏幕上画出那个手势就能被智能识别,然后进行拨号或运行应用程序。

运行该应用后首先要录入新的手势。直接点击主界面上的“加人”按钮,如果是给自己手机通讯录中的联系人添加手势,则点击“从电话本里找”,然后打开自己手机里的通讯录,点击要添加手势的联系人。进入手势录入界面,用手指画出简单的手势图案(如图1),画的时候一定要快速画完,不能停顿,完成后,点击“确认添加”则添加成功。如果是给手机通讯录里没有的电话号码添加手势,则点击“自定义联系人”,然后依次输入联系人名字、手机号码,画出对应的手势图案即可。

手势设计 第4篇

1 系统方案设计

空中鼠标系统设计分为两部分:手持端和主机端。手持端是由可充电锂电池、升压稳压电路、电容式触摸感应开关、C8051F311、MEMS传感器ADXL343和发送蓝牙模块组成。空中鼠标手持端设计框图如图1所示。

主机端是由接收蓝牙模块、UART转USB桥接电路和PC上位机组成,空中鼠标主机端设计框图如图2所示。

2 系统硬件设计

2.1 主控器与MEMS传感器

本设计采用C8051F311 单片机作为主控芯片,它具有增强型UART和增强型SPI串行接口,高速、流水线结构的8051 兼容的CIP⁃51 内核。ADXL343 是一款多功能3 轴、低功耗和具有I2C和SPI接口的数字输出低g MEMS加速度计[4]。以高分辨率(13 位)测量加速度,测量变化范围达±16 g;内置运动检测功能,可以检测到活动、静止和自由落体的运动,所有中断可独立映射至两个外部中断引脚;采用32 级FIFO缓冲器存储数据,将MCU的负荷降至最低,并降低了整体系统功耗。

2.2 锂电池充电电路设计

锂电池充电电路采用了恒定电流/恒定电压充电芯片TP4056 为充电器。空中鼠标的锂电池可用USB进行充电,通过2 管脚外接的电阻调节充电电流大小。锂电池充电电路如图3 所示,红色D1亮时表示正在充电,蓝色D2亮时表示充电完成,当欠压、电池温度过高、过低时D1,D2都熄灭[5]。

2.3 升压稳压电路设计

由可充电锂电池给系统供电,长时间使用电池电压会降低,不足以提供系统3.3 V正常工作电压。现采用BL8530 芯片将低电压(低至0.8 V)升压稳压至3.3 V电压。升压稳压电路如图4所示,BL8530只需要电感、输出电容和肖特基二极管3个外部元件就可以输出3.3 V电压。

2.4 电容式触控开关

应用电容式触控传感器技术[6],使空中鼠标更加低功耗。手接触电容式触控开关(当空中鼠标正常使用时),使系统处于导通工作状态;当手不接触电容开关时,系统处于低功耗待机状态。

2.5 蓝牙通信

无线通信采用以CC2540 为核心的低功耗蓝牙4.0系列HM⁃11 模块,支持AT指令,可更改主、从模式以及串口波特率等参数。上位机与蓝牙接收模块之间应用Silicon Labs公司的USB转UART桥接芯片CP2102,实现了MEMS三轴加速度与上位机通信。

3 系统软件设计

3.1 主程序设计

接触空中鼠标电容式触摸键,使系统上电;系统初始化、配置UART、SPI和使能中断;对ADXL343 寄存器进行参数设置,包括活动阈值(THRESH_ACT)、静止阈值(THRESH_INACT)、静止时间(TIME_INACT)、数据格式(DATA_FORMAT)以及中断使能与中断映射等;等待外部DATA_READY中断获取DATAX0,DATAX1,DATAY0,DATAY1,DATAZ0,DATAZ1 寄存器数据;通过蓝牙发送包含三轴加速度的8 个字节数据,系统主程序流程框图如图5 所示。

3.2 上位机软件设计

在VB上位机将接收到的8 B进行数据解析,如果没找见第1 个字节0x DD,返回值为1;第8 个字节是对前7 个字节CRC校验,如果校验错误,返回值为2;如果头字节与CRC校验尾字节都接收正确,返回值为0,继续读取中间6 个字节的加速度,数据格式为Data[N].ax,Da⁃ta[N].ay,Data[N].az。由于MEMS传感器安装存在方向性,利用旋转矩阵调整坐标方向,使手势运动方向与MEMS传感器坐标方向相一致。数据接收流程图见图6。

手势姿态加速度Data[0]在xy,yz,xz三个平面的投影加速度为axy,ayz,axz。由于鼠标指针在xy平面运动,所以|axy|>阈值、|ayz|<阈值、|axz|<阈值,当某个平面的投影加速度小于阈值时,表示在该平面保持静止状态。利用xy平面投影加速度axy正负控制指针移动方向、axy模大小控制指针移动速度。Data[0].ax、Data[0].ay按一定非线性对应关系得到相对位移dx和dy,驱动鼠标事件mouse_event(&H1,Int(dx),Int(dy),0,0)来控制鼠标指针移动。手势控制空中鼠标倾斜角度越大,axy模越大,指针移动速度越快。空中鼠标指针移动流程框图如图7 所示。

利用当前手势姿态加速度Data[0],解析为ax,ay,az,axy,ayz,axz,手势姿态流程框图如图8 所示,比较各个分量加速度与设定阈值的关系和手势姿态保持时间(Time)的关系,得到六种空间姿态(静态):上、下、左、右、前、后。六种姿态来驱动键盘事件(keybd_event),对键盘事件定义不同,实现不同的快捷键播放多媒体(PPT)功能,如F5,Alt+F4,Page_Up等快捷键。

通过手势动作获得N组加速度Data[N],通过数据筛选法得到x,y,z三轴加速度的最大值与最小值,对应三轴最值作差得到dx,dy,dz,记录出现最大值时三轴对应的N值ax_t1,ay_t1,az_t1和最小值时N值ax_t2,ay_t2,az_t2,当dz>dx与dz>dy时,因为双击时会出现四次极值,所以在一定时间内比较连续极值的次数,判断是否发生双击。手势动作流程框图如图9 所示,通过比较识别出七种动作(动态):向左、向后、向前、向后、向下(左击)、向上(右击)与双击。各种手势动作驱动不同事件来模拟鼠标按键和媒体播放功能。

4 实验分析

随机抽取20 个人对空中鼠标指针移动、PPT播放和鼠标单/双击功能的准确率做100 次实验数据次数统计与分析,实验测试结果如表1 所示。

实验证明本文设计的空中鼠标功能准确率在96%以上。鼠标指针移动失误源于倾斜角度过大或过小导致偏离指定目标;控制PPT播放失误源于手势姿态(静态)不够标准;鼠标单/双击操作的失误是未能向正确的方向做出对应动作(误动作),如向下动作一次是单击,实验者不是向下动作,而是向右下方动作。通过给实验者指导使用空中鼠标姿态与动作后再次实验统计,准确率高达99%以上。

5 结论

本文设计的空中鼠标在具有传统鼠标功能的基础上又融入了多媒体播放快捷键功能,更主要的是突破了传统鼠标必须放在桌面使用的限制,实现了空中无按键全手势/运动控制。实验证明:空中运动/手势控制接口技术对手势姿态与动作的识别率高,准确的控制鼠标指针移动、模拟鼠标按键功能和遥控多媒体播放。在空中运动/手势控制接口技术的基础上,为进一步开发人机体感交互设备提供参考。

参考文献

[1]DRAKE A J,KIM H,CHAE J,et al.Two-dimensional position detection system with MEMS accelerometer for MOUSE applications[C]//Proceedings of 2001 IEEE Conference on Design Automation.[S.l.]:IEEE,2001:852-857.

[2]陈建新,卜翔,王荣,等.基于MEMS加速度的三维无线鼠标设计与实现[J].无线互联科技,2011(8):22-25.

[3]陈建新,王荣,章韵.MEMS加速度传感器的距离测量性能分析[J].电脑与电信,2011(11):30-32.

[4]Analog Devices.ADXL343:3-Axis,±2 g/±4 g/±8 g/±16 g digital MEMS accelerometer datasheet[R].US:Analog Devices,2012.

[5]丁学用,王玲玲,何彦廷.便携式太阳能手机充电器设计[J].中国科技信息,2014(16):190-192.

演讲动作手势技巧 第5篇

第一,想象肚子前边有一个盒子,手的移动范围不超过这个盒子。美国前总统比尔·克林顿在早期的政治生涯中,演讲时的动作总是很随意,让人觉得他这个人不可信。为了帮助他控制自己的身体语言,他的顾问让他想象在胸前和肚子前有一个盒子,在做手势的时候,范围不能超出盒子外。后来,“克林顿盒子”就成了一个热门概念。

第二,想象双手抱着一个球。在演讲中,你可以想象自己双手正在抱着一个篮球,这种手势能让你看起来更有控制力,就好像你把事实掌握在手里一样。不知道大家发现没有,乔布斯在演讲中就经常使用这个手势。

第三,用双手摆出金字塔的形状。人们在公开场合演讲的时候,一旦紧张,双手就会不停摆动甚至发抖,所以不让双手乱动,也是自信的一种标志。这时候,你就可以用双手在胸前摆出一个金字塔的形状。很多企业高管会在演讲中用到这个手势。但是注意这种手势不要和霸气的表情配合使用,否则会显得很傲慢。

第四,站的时候,让双脚距离大一点。站立的姿势反映了心态。当你想表明自己的位置强大而且稳定的时候,你可以让双脚站得宽一点,超过肩膀的宽度也没有关系。

第五,双手自然在胸前打开,掌心向上。这个手势能传达出演讲者开放和诚实的态度。美国著名脱口秀主持人奥普拉就常用这个手势。

第六恰好跟第五相反,要求演讲者双手打开后,手掌心向下。这个手势其实是力量、权威和有自信的标志。奥巴马经常在发表了激动人心的演说之后用这个手势,示意人们安静下来。

让你演讲技巧加分的方法

一、遣词造句技巧

1、用词和用句

口译的根本目的在于沟通,且听众往往看不到口译员表达的文本,很多时候也没有笔记在身旁,因此,遣词造句时要尽可能符合口语表达/演讲的规律,即避免使用过长和冗杂的句子、用词简洁明确、逻辑清晰。简单句和复合句可以混合使用。

当然,遣词造句也要考虑不同场合,如正式会谈场合,确保准确、完整是最重要的,对于修辞等要求不那么高;在开闭幕式、宴会口译上,则可适当使用四字成语,注意修辞,传达感情。

2、流畅度

演讲和口译表达中,流畅度都是非常重要的一个方面。一个频繁改口的演讲人是很难被视为优秀的,口译中也是同理。频繁的改口会降低听众对于口译员的信心。一旦听众的信心受到影响,他们就很可能会仔细监听译者的内容,从而发现更多的不足,陷入恶性循环。因此,口译员在表达时第一要义就是不出现绝对错误避免改口,要尽可能一次性说清楚,漏下的可以再行补充,尽量不要改口。

二、声音控制技巧

口译员控制好声音,可以在信息不变的情况下,大大改善听众的听觉感受,提高沟通效果。

1、发音和吐字

正确的发音是口译的基础,不仅是英文,而且中文发音也要注意。一些初学口译的学员有吐字不清的问题,其实可能一直以来的习惯使然。但将这个习惯带到口译中就有害无益,会影响口译员的专业形象。改进的这个习惯的方法,我们的口译学习者可以选择有标准录音和文本的材料,每天做英文的朗读练习;中文甚至可以考虑参加普通话考试,了解专业的发音和吐字规范。

2、语速与停顿

口译现场的语速,口译员应该根据具体场合和发言人语速进行调整,一般开始的时候可以采取中等语速,以便让自己热身。随后使用中等偏快的语速较为合适,原因一是提高语速可以为发言人节省时间;二是口译中难免有信息冗余,适当提高语速可以避免译文比原文长出很多。

但是,有时语速根据情况可以放慢或者加快。比如祝酒词最后要提高语速,否则声音会淹没在大家的cheers声中;在演讲人表达自己的深情或者坚定立场时,往往译文语速也要放慢。

适当控制语速有助于强调重点,加强理解。然而,需避免语速太快,让听众完全跟不上节奏,或者慢到让听众苦苦等待。

在整体语速控制的情况下,适当使用停顿可以激起听众的好奇心,使他们集中听讲。对观众来说,停顿也很必要,给他们提供思考和回味的时间。如何伴随着目光交流和扫视,则可促进译员与听众之间的沟通。

3、音量与语调

口译员要控制说话音量,使每个人都能听得清楚,而又不会大声到让人感觉不适。必要时使用麦克风,也要主要与嘴与麦克风之间的距离,避免噪音。根据场景适时变换语调,有助于更好地传达信息。观众可以从口译员的语调中感受到对这个话题是否充满热情,对听众是否在意。

三、身体姿态技巧

据说,听众对演讲者的整体感觉7%取决于发言的内容,38%是声音因素,非语言因素占 55%,包括面部表情,眼神接触,手势,身体动作和个人着装。

1、面部表情

根据场合选择适当的表情很重要。在严肃的谈判场合,切忌不可笑呵呵地翻译,我就曾在中俄一次技术交流中遇到这个情况。中方对俄方提出很多要求,俄方很是不爽,这是我作为译员能感觉到是双方文化差异和办事风格差异,所以无奈地笑了一下,这时俄方代表就很不高兴,反问我 “You think this is funny?” 对此,各位应引以为戒。

但是在宴会致辞中,微笑着翻译是很正常的,有助于营造一个愉快的气氛。译员结合其面部表情来配合讲话目的和情绪很重要。

2、眼神接触

上文已经提过,眼神接触很重要。这体现了译员对听众的认可和尊重。眼光可以扫视到所有听众,目光偶尔在某个观众身上停顿几秒钟。切不可像风扇一样扫过,跟所有人目光接触时间过短。当与对方目光直视时,不可直接回避,这会显得口译员不自信。

3、手势与身体动作

手势应该显得自然、轻松,并符合演讲意义。口译员的手势不会很多,因为往往手里都拿着笔和麦克风,但有些时候适当使用手势彰显口译员的礼仪素养。口译时心理紧张很正常,但要避免晃动身体、搔头弄耳、抖腿抖手,要站有站相,坐有坐相,端庄有礼,但又不拒人千里之外。

总之,演讲技巧是可以通过比如进行命题演讲练习、演讲加口译练习、朗读练习、录音、模拟会议等训练方法予以提高的。很多口译老师得益于他们日常授课所养成的口语表达与沟通能力,也很自然地成为口译员,这也侧面说明演讲技能对于交替口译的重要性。

手势及语言 第6篇

许多事物还没有名字,

提到的时候尚须用手指指点点

在《百年孤独》开头,加西亚 · 马尔克斯这样写道,“世界新生伊始,许多事物还没有名字,提到的时候尚须用手指指点点。”当世界如同新生,唯有作家们有能力把无法言说的手势变成新鲜的语言,并用这些指指点点的语言建构成叙事及反叙事,并形成自身独特的风格—而艺术家的工作也显然如此,在上海外滩美术馆横跨四个月的春夏大展“从手势到语言:转型中的艺术表现实践”中,艺术创作与书写实践之间独具创造性的联接得到了视觉意义上的呈现。

虽然展览有巴塞利兹、布尔乔亚、霍尔泽和布鲁斯 · 瑙曼,奇奇 · 史密斯等国际一线艺术家加盟,使其具有了朝圣般的蛊惑力,但现场作品却没有宣传文字来的那么唬人,三分之二的艺术家作品是以轻巧的版画和小型作品来出现。策展方似乎并没有意图突出作品的体量,而是侧重于建构整个展览的容量。对于期待上的落差,展览所具有反复解读的丰富性倒令人印象深刻:精巧地把握历史化与当代性作品,工艺感与观念性的对仗,以及视觉与文本的互文,都指向了两位法籍策展人彼此趣味的差异和美学融合。

布鲁斯 · 瑙曼的代表性的霓虹灯字没有到场,出现是两台显像管电视并置的视频《好男孩坏男孩》。当画面中的女子愤怒地说“你有工作”时,似乎另一画面中的男子为拥有一份工作而表现出感激;或者当男子说“这就是工作”时,似乎他在埋怨不得不忍受劳作之苦。布鲁斯·瑙曼所强调的是那些相同语汇的不同意义,由此激活并颠倒了口语文本的客观性与中立性假象,深受着维特根斯坦的语言哲学影响。珍妮 · 霍尔泽的《紫色》装置,由19件弧形LED灯管组成,每根灯管上流动性地循环播放着艺术家取自与美国政府的国家安全相关的秘密军事和政治资料的文本,以色彩鲜艳的、极具视觉冲击力的、震撼人心的表现方式来呈现中立的、客观的文字,并通过循环流动的播放方式切断了完整捕捉文本语义的可能,让观者在非典型化的解读过程中检视着这些悲剧事实。

弗朗索瓦 · 莫尔莱的红色《哀恸》非字非词,仅将纯粹的形式缀合,将艺术品化简到其本体结构的根基,艺术家利用普通长霓虹灯管,从天花板连缀至地面,似乎使抽象的形态即刻成为某种实在,仿佛未完成的字母在试图寻找自己的形状。而同样位于三楼展厅的马丁 · 撒拉萨则是关注迥异的材料间的极端对比(木、金属、毡、声、光),使卡夫卡的名作《审判》中最后一句获得极为感性、又极具批判性的解读。让 · 菲利普·图森在6层展厅设置了一个“阅读/现场”的表演空间:演员坐在一个由视频录像环绕的座椅上(视频中展现的是其它读者),所谓的医学设备模拟展示出阅读时脑部活动的图像,这些艺术家们在三维空间中延展书写,完成了兼具批判性与诗性的装置。

在语言重构的无尽过程中,翻译同样是一种可贵的实践,因而与后现代艺术家们所对应的是来自卢浮宫的古代及现当代铜版画馆藏,围绕这些铜版画收藏,展览通过路易斯 · 布尔乔亚、罗伯特 · 莫里斯、居斯帕 · 皮诺内、奇奇 · 史密斯等艺术家的素描和版画等作品,在形式与内容的复制和刻写中,表达出身体在建筑体或景观元素中的微妙处境。其中还有颇为珍贵的清朝乾隆帝向法王路易十五赠送十六幅再现其武功征战的这两个版本都得到呈现。

除西方艺术家和铜版画部分,海外背景的中国艺术家是展览的另一侧重:如徐冰就圣 · 琼 · 佩斯的诗作《鸟之维》所做的装置以及中英文书法《魔毯》,模糊了中国书法与西方书写之间的界限;而揭示本次展览的精神所指的严培明的《蒙娜丽莎的葬礼》影像及手绘稿,无疑是对传统古典作品的拒绝;杨诘苍的《我仍然记得》是对记忆的不断加工,“墨迹漏痕让这些名字模模糊糊,使真实的面貌成了有距离的过去,他们永远存在”。另外,越南艺术家傅丹带来了《我们人民》的几块铸铜碎片,这件作品来源于艺术家曾将自由女神像转变成了400块分裂的碎块,然后被带到了世界各地。

有着法国背景的展览必然会映射出福柯、德里达等为代表的一众法国后现代思想人物的强烈影响,此次展览同样如此,从“从手势到语言”为题,到探讨从制艺技术转换到观念语法的关联,参展作品犹如策展人所遴选出的“标点符号”,被妥帖地布置在展厅空间各处,编织着图像与语词,围绕有关语言的一系列历史的、社会的、政治的建构,以及符号的、编码的、形式的与含义的诸多机制关系提问,以此打破时间顺序,使古典、现代与当代作品在同一空间中并置,完成了一场国际语境下的具有历史感的视觉语言及文本的精致穿越。

手势设计 第7篇

基于视觉的手势识别技术一直是机器视觉与人机交互领域的研究热点问题。目前手势识别技术在手语翻译、远程非接触式控制等应用中起了非常重要的作用。

手势识别过程中,从一幅背景比较复杂的图像将手势分割开来是比较困难的,手势图像分割方法也极为丰富:Tang[1]、Bangdanow[2]通过彩色图像对肤色检测并实现手部区域定位,Park等[3]提出一种基于手势图像的MHI模型及利用运动对象面积进行定位手部区域分割。但是由于RGB视觉图像中,光照的影响非常大,因此对视觉图像进行手势分割时会受到很大的限制,导致手势捕捉失败、手势图像不全等缺陷。

2010年微软推出Kinect设备,该设备既有彩色摄像头又有红外摄像头,不仅能拍摄场景的RGB图像,还可以采集深度信息。由于具有低成本、操作便捷、开发方便等优点,Kinect深度图像的应用是一个热点研究方向。Wang等人[4]提出一种手臂动作识别方案,用于远程非接触遥控电脑PPT播放;Gasparrini[5]利用Kinect设备实现跌倒检测;Suau[6]通过深度信息分析实现人肢体检测;Asad等人[7]提出一个基于Kinect深度图像的手势识别系统。和视觉图像不同,深度图像实现手势分割时不会受光照的影响。它返回的是场景中物体与摄像头的相对距离,通过不同灰度级进行距离值的表征,形成反映深度信息的灰度图像。手势操作时,通过灰度级直方图统计可以精确地将操作手臂图像分割下来[4]。

手势识别时,可以提取手指几何形状[8]、中心距[9]、手掌轨迹[10]、图像梯度方向直方图(HOG)[11]等特征作为匹配对象,还可以与Kalman Filter[1]、HMM[10]、神经网络[14]、SVM[17]、KNN等各种分类器相结合以得到最佳的识别效果。文献[9]通过深度图像提出一种基于手轮廓的手势识别,最佳识别率达97.9%。文献[12]中提出一种融合HU矩与基于快速鲁棒特征包的手势识别方法。该文献中将视觉手势图像分为六类,每一类的训练及测试样本均为100幅图像,此时识别率达96.33%。刘鑫辰等人[13]通过RGB-D图像提出一种基于手势轮廓及手指轨迹跟踪的快速识别方法,对六类手势进行识别并优化了处理时间。

本文提出一种基于Kinect深度图像HOG特征及SVM分类器的手势识别系统。该系统可以精确地定位操作手势区域,提取HOG特征并投入SVM机器学习模型进行手势识别。本文中对大量的训练集及测试集的七类手势进行学习、识别,经过优化取得平均识别率为99.03%。

1 手势分割方法

相对于视觉图像,深度图像比较方便于进行目标捕捉,具体手势分割的实现流程如图1所示。

本文中,首先对反映深度信息的灰度图像进行直方图统计,并通过灰度级分割方法,将手臂分割开来,此时已经定位了包含手臂的感兴趣区域。由于后续处理要对手掌部分的HOG特征进行研究和分析,需要尽量将冗余信息的部分去除掉。因此从手臂图像要进一步做处理,把多余的部分去掉,只留下图像中手掌的部分。该方法具有设计简单、运行时间少、捕获率高、精确度高等优点,是深度图像分割技术中最好的方法之一。

1.1 基于深度信息的手部区域定位

本文中,利用手臂和人体以及背景之间的关系进行手势捕捉、分割。手臂分割原理如图2所示。

由于Kinect的成像特点,深度图像中的灰度级取决于目标物体相对于传感器的距离。本文中提出一种基于深度图像直方图的手势提取方法,具体实验条件如下:手臂离传感器最近、手臂不能离人体太近、手掌相对于手臂要靠近Kinect。此条件与人进行正常的手势动作是一致的。

手势操作时,传感器返回的深度图像及其直方图统计如图3所示。

图3(a)中表示了手势操作过程中,手臂、人体、背景的分布情况。深度图像中,像素的灰度级是跟实际深度(与传感器的距离)成比例关系,因此进行手势操作时,在深度图像中手臂的灰度级相对于身体和背景比较低。图3(b)中演示了以上三个区域的灰度分布状态,代表手臂的灰度级较低而且分布概率是最少的,背景部分在图像中的灰度级与分布概率均较高,即:

其中,Hand(x,y)是目标分割图像,src(x,y)是源输入图像,mingrayscale是由图像直方图计算出的手臂区域灰度级区域的中心点,thr为分割半径(灰度级)。本文中选择分割半径为30灰度级。式(1)的手臂分割效果如图3(c)所示。

1.2 手臂图像的校正

本文中,手势图像由手掌轮廓及其内部的灰度分布情况构成,其中手指不同的状态会构成不同的类。又因为Kinect深度图像存在较大的噪声,导致在一个类别当中的各个样本之间会出现比较大的差异。为确保在一个类别中不同样本的特征向量的一致性,需要先对手臂图像进行校正,即将不同方向的手势图像调整至垂直方向(手掌朝上),提高类之间的区分度。

先对图像实现椭圆拟合,得到长轴与垂直方向的角度(就是手臂的方向)。本文中椭圆角度alpha取顺时针方向,而旋转角度beta取逆时针方向。椭圆及旋转取向设定如图4所示。

手臂图像中,从手臂到手掌位置的灰度级的变化是由高到低的,灰度级比较低的一端代表手掌的方向(palm)。旋转角度由下式确定:

以大小为(w,h)原始图像的中心点为参考点进行旋转,目标图像的中心点(centerx,centery)可以由式(3)、式(4)计算得到:

以目标图像的中心点为原点,对原始输入图像进行旋转。本文中提出的图像旋转方法不仅能够尽可能保留图像中的信息量,还可以节省后期的处理时间,提高每一类手势中样本的一致性及其特征向量的汇聚程度。

1.3 距离变化及手掌心和手腕的定位

一般情况下人手臂的外围轮廓可以当作一个凸面,其中手掌及手臂部分比较宽,而手腕部分是最窄的。因此对手臂图像的距离变换矩阵进行分析可以确定手掌、手腕及手臂精确的坐标。距离变换过程中,将计算图像中每一个非零像素到最近边缘的欧式距离。统计手臂轮廓中心线上的像素点的距离值(可以通过计算距离矩阵每一行中最大值得到)。设中心线像素点距离值为D={xi},i=0,1,…,n,其中n为手臂图像的高度,可见D是一个一维离散信号。通过对D的处理可以计算出手掌、手腕及手臂在图像中的坐标。D中,手腕位置的两边会出现两个最大距离值m1和m2,这两个峰值的行坐标对应在c1和c2,其中一个最大值是由手掌心变换得到的值。m1由式(5)计算得到,即:

第二个最大值m2=xc2(0≤c2≤n,c2≠c1)通过式(6)确定:

从m1与m2之间的关系可以定位手掌心距离变换的值palmdist,即:

手掌所在位置的横坐标palmx-local由式(8)计算得到:

通过搜索图像中横坐标为palmx-local像素的最大变换距离值应可以找到手掌的精确坐标;D中xc1与xc2之间存在一个最小的距离值,该值在图像中所对应的坐标是手腕的位置所在。以手腕横坐标为参考点,将手臂图像中手腕以下的部分全部置零,彻底消除冗余部分,提取出手势图像。基于手部几何形状实现手掌心、手腕定位的示意如图5所示。

本文利用前述的手势捕捉与分割方法,获取手势图像,以便进行手势的识别。实验过程中,采集不同位置、角度、方向的手势图像作为标准样本,7个不同类别的标准样本如图6所示。再按照第2节的方法计算图像的HOG特征,建立了包含7个类别的机器学习训练矩阵。

2 HOG-SVM手势识别模型

本文提出一个基于深度图像的手势识别模型,其中对手掌图像计算HOG特征并投入SVM学习机实现手势识别。HOG-SVM手势识别模型的流程如图7所示。

图像HOG是一种比较经典的特征,该特征在图像处理领域得到非常广泛的应用,比如:人脸检测[10]、行人检测[15]、手势识别[14]等。HOG特征可以检测图像中边缘信息并描述边缘内部灰度级的分布状况。同一幅图像在不同参数下可以计算出不同的HOG特征,而且它们之间对机器学习的分类效果影响都不一样。图像HOG特征计算方法如图8所示。

图8中描述了HOG特征的计算过程,先将原图像(图8(a))分成很多大小一致的block(图8(b)),每一个block又被分成若干小块cell(图8(c))。对每一单元cell计算梯度方向直方图(图8(d)),将该直方图转换为极坐标,极坐标中又被划分成bin组(每一组的角度范围为360/bin),对同一个bin下的向量进行叠加。cell的梯度方向串联起来构成block的特征向量,而图像目标输出HOG特征是由各个block的特征串联得到,图像HOG特征示意图如图8(e)所示。图像HOG特征向量的维数由划分block的数量、block大小、cell大小及方向数量bin共同决定。因为block越小识别率越可靠[16],本文提出一种计算HOG特征的配置:图像大小为(48,48),block数量为1,block大小为(3,3),cell大小为(16,16),bin=5,每一个样本输出45维的特征向量。

SVM机器学习模型是一种比较通用的分类器,SVM的核函数包含多项式核函数、sigmoid函数及径向基函数(RBF)。本文中利用RBF函数作为SVM的核函数:

SVM分类器模型中,需要确定惩罚参数C和核函数自身的参数gamma,这两个参数的选择会直接影响到SVM的分类效果。从SVM和RBF的数学模型可以看出:惩罚参数决定了分离面的弯曲程度,随着C的增大,分离面弯曲越复杂。在RBF核函数中,分离面的平滑度取决于gamma值。这是因为gamma越小,核函数对x的衰减越快,这就放大了数据x之间的差别,即k(x)对x值的变化很敏感,因此SVM的分离面变得细致;同样的道理,gamma越大,核函数对x的衰减越慢,这使k(x)对x的变化变得钝化(即不敏感),进而使SVM的分离面变得平滑。

根据不同的学习矩阵可以对C和gamma实现最优化,最优的C和gamma可以最大化识别率。目前常用的SVM优化参数方法有:遗传算法(GA)、粒子群(PSO)、鱼群等算法。

3 实验结果及分析

本文中的硬件信息为:Intel(R)core(TM)i5-2410,CPU的频率为2.3 GHz,电脑内存为4 GB的基础上,通过Python 2.7编程软件结合图像处理库Open CV 2.8对Kinect深度图像实现实时手势识别。实验时对训练集和测试集通过上述的HOG计算配置对手掌灰度图像进行计算,得到45维的HOG向量并投入机器学习模型实现训练和识别。

图9中G0—G6的RBF响应曲线是针对图6中七个类别的标准样本计算得到的。

图9中描述了七种类别标准样本在不同gamma值下的RBF响应,其中横坐标为gamma值,纵坐标为相对应的响应值。不同的gamma值下,响应曲线之间的距离也随之而变化。通过RBF响应值可以判断类别之间的区分度,响应曲线之间的距离越宽区分度就越好,较窄的距离表示较低的区分度。从图9可以看出,G1类与其他的类别比较好分辨,而(G2,G3,G4)和(G0,G5,G6)两组类别中的区分度较低。RBF-SVM机器学习模型中,对同样的训练矩阵,C和gamma值将会决定该模型最大能达到的识别率,所以C和gamma值的优化有非常大的意义。本文中采用遗传算法(GA)与粒子群算法(PSO)对训练矩阵进行迭代以优化机器学习参数,得到最优的C和gamma,其优化结果如表1所示。

表1中Best A指的是可达到的最大识别率,C和gamma表示SVM训练时最优参数。从表1中可以看出,遗传算法对本文的实验起了很大的优化效果,因此将参数组[C=4.4811,gamma=278.7726]作为SVM的训练参数,对输入的测试样本进行分类。

以保证算法的鲁棒性,本文中通过7名志愿者在各个不同的距离、角度下进行操作并采集、建立了一个数量多、样式丰富的手势数据库,里面包含了七种手势类别,训练样本与静态测试样本数量分别为17 125和20 951。数据库中代表样本示意如图10所示。

具体的训练样本数量、测试样本数量以及识别率如表2所示。

表2表明了本文提出的HOG-SVM手势识别模型的检测效率。在使用大量、多样式的测试样本集时平均正确识别率可达到99.03%,表明了该系统的鲁棒性及优越的识别率。与其他基于深度图像手势识别方法识别率的对比如表3所示。

表3的算法对比表明本文提出的识别模型具有显著优势,另外也体现了灰度图像HOG特征在手势识别领域中的可行性以及SVM机器学习训练参数优化过程的重要性。

4 结语

本文提出一种基于深度图像的实时鲁棒的手势检测与识别方法。在深度图像中,利用手臂、人体和背景之间的位置差异特点进行手臂图像分割。通过处理旋转后的手臂图像距离变换,可以精确地定位手掌、手腕及手臂的位置,因而可以将手掌图像从手臂图像中分割开来。实验证明,此分割方法可以正确将手掌部位进行分割。本文通过此手势检测方法实时地采集了大量样本。从训练样本计算其HOG特征,得到的特征矩阵投入SVM模型实现样本训练,并通过遗传算法对分类器的参数进行优化,最终使整个系统的手势识别效果达到理想的识别率,并满足手势实时识别的要求。

摘要:针对深度图像静态手势识别问题,提出一种基于深度图像手势分割及HOG-SVM手势识别方法。该方法的具体做法包含以下四个步骤:第一步,对深度图像进行手势分割,对随机方向的手臂图像通过椭圆拟合算法计算其倾斜角度,并将其校正至垂直方向;第二步,对手臂图像进行距离变换,通过分析距离变换返回的距离矩阵精确定位手掌心、手腕及手臂在图像中的坐标;第三步,计算、优化手势图像的HOG特征;第四步,实时采集大量训练样本并获取其训练矩阵,对训练矩阵进行处理找到最优的SVM参数,使响应曲线的可区分度达到最佳以提高手势识别率。实验证明,所设计的系统在保证实时性、鲁棒性的同时也获得了很高的识别率。

语音+手势人机交互新体验 第8篇

在电视通往未来的道路上, “智能”无疑是其必备属性, 但同时也是最充满想象以及最具可改造性的地方。这也正是芯片厂商、终端厂商、内容提供商、服务提供商等各产业环节竞相涌入继电脑、平板、手机后的“第四屏”原因之一。但从智能电视诞生至今, 较差的用户体验以及应用的缺乏时常被用户所诟病, 用户期待的不是从互联网照搬下来的“屏幕+键盘”的操控方式, 也不是生搬硬套移植移动互联网的触控应用, 更为自然与人性化的体验才是未来电视所要求的。

最自然的交互方式

曾经人们对电视的操控依赖于电视遥控器, 然而随着电视节目的不断增加, 功能的逐渐丰富, 遥控器已不能满足人们对电视操控的需求, 复杂的遥控器也降低着人们的使用体验。厂商们开始尝试着各种新的人机交互方式, 包括流行了一段时间的键盘式遥控器等, 但电视屏幕位置相对固定、人与电视屏距离较远的特性, 使得触摸屏、键盘等方式也并不适合。

在业界众多专家看来, 电视人机交互方式的革新, 也正是电视产业有所突破的关键, 这需要厂商有所创新性突破。

“人与人之间的交流主要通过语音和肢体语言, 同样在电视产业, 语音加上手势的方式将可能是最贴切、自然、友好的操控途径。”海信产品经理董琪表示, 此处的语音控制并非传统生硬的特定语音指令, 而是借助智能语音分析系统, 以人工智能为基础, 进行样本学习, 并在在大量数据采集之上实现语义分析, 从而理解操作者的指令含义。

效果仍待大幅提升

目前许多厂商已将交互方式关注重点转向语音控制, 但声名在外的仍只有“未有实际行动”的苹果Siri。在iPhone上实用性不佳的Siri, 被国外分析师视作是良好的电视遥控器。而此前传闻众多的iTV版本里, Siri功能也赫然在列。

与此同时, 董琪表示“我们希望通过手势这样的自然动作来操作电视。”实际上, 手势操作可以追溯到微软的Kinect技术, 主要通过摄像头来捕捉肢体动作及运动轨迹, 包括挥手、抓取、点击等人们较为自然的动作, 进而分析, 以实现对电视的操控。目前市场主流厂商均有相应研究, 但手势操控的实际效果在董琪看来还不够自然流畅, 有大幅度提升空间。具体可表现在存在误操作现象、识别反应速度慢等。

用Scratch玩手势控制(上) 第9篇

十多年过去了,这一手势控制技术也逐步飞入寻常百姓家。从理论上说,只要有一款摄像头,就能够编写程序体验简单的手势识别。如果拥有Kinect和Leap Motion之类的体感传感器,你也能像《少数派报告》中男主角一样,用最自然的手势和电脑进行交互。例如,你可以用手在空中翻动你的音乐专辑,竖起大拇指它就会为你播放;你只要做出开车的手势就可以在极品飞车中自由驰骋;你用手指做出手枪的形状就可以代替鼠标来操纵游戏中的枪;你还可以用它画画、玩纸牌等。

当然,只要你会编程,哪怕仅仅懂得最简单的图形化编程软件——Scratch,也能够编个小游戏,用手势来控制角色运动,够酷吧!考虑到Kinect体积比较大,需要在较大的空间才能使用,我选择了Leap Motion来介绍如何实现手势控制。

Leap Motion简介

Leap Motion是体感控制器制造公司Leap生产的体感控制器。当LeapMotion首次亮相之时,外界认为它承载了一个新颖而独特的计算机用户体验──通过挥舞手指或拳头来和计算机进行交互,甚至有媒体认为可用Leap Motion替换传统的鼠标。LeapMotion的体积小,仅一包口香糖大小,通过USB连接电脑后,它会创造出一个4立方英尺的工作空间。在这个空间里,10个手指的动作都会被即时追踪,误差在0.01毫米以内,最大频率是每秒钟290帧,精确度相当于Kinect的200倍(如图1)。这样的精准程度足够保证用户顺利完成如pinch-to-zoom或控制3D渲染物体等操作。

Leap Motion编程环境配置

1.安装Leap Motion的驱动程序

首先要安装Leap Motion的驱动程序。访问https://www.leapmotion.com/setup,下载驱动。驱动安装成功后,还要注册并登录Leap Motion的网站,具体过程这里不再赘述。

2.安装Scratch 2.0 Plug-in forLeap Motion

Scratch 2.0 Plug-in for LeapMotion是一位名叫斯蒂芬·豪威尔的爱尔兰老师开发的插件。这位老师先后为Kinect和Leap Motion编写了forScratch的插件程序,为Scratch的功能扩展做了很多有趣的工作。

点击Leap Motion官网的“APPS”栏目,在搜索框中输入关键词“Scratch”,就能找到斯蒂芬·豪威尔编写的插件“Scratch 2.0 Plug-in for LeapMotion”。登录网站即可免费安装,只是服务器在国外,安装速度有点慢。

插件安装地址:https://apps.leapmotion.com/apps/scratch2-0-plug-in-for-leap-motion/windows#,插件安装成功后,Leap Motion App Home中会出现一个新的应用,如图2所示。

3.安装Scratch 2.0并载入相关脚本

顾名思义,“Scratch2.0 Plug-in for LeapMotion”是Scratch2.0的插件 ,要先安装Scratch2.0。在插件的安装页面中,作者还提供了Scratch2.0的脚本文件“Leap Motion.json”。打开Scratch2.0,按住“Shift”键点击程序上方的“文件”,弹出的下拉菜单中将多出一项命令“Importexperimental HTTP extension”(如图3)。载入“Leap Motion.json”文件后,Scratch的“更多模块”中就能看到Leap Motion的专属指令了(如图4)。

从原理看,“Scratch 2.0 Plug-infor Leap Motion”相当于是一个桥梁,将Leap Motion和Scratch联系起来。当电脑接入Leap Motion,并且Scratch正常运行时,Scratch 2.0 Plug-in for LeapMotion的界面会显示如图5的提示。

编一个手势控制的程序

Leap Motion能够精确识别双手,提供一系列和手势相关的信息,如每一个手指的X、Y、Z的坐标位置等。其遵循右手坐标系,坐标系中单位与物理世界中的一毫米相对应,坐标原点是设备的中心。X、Z轴组成水平的一个平面,X轴指向设备的长边,Y轴竖直向上为正方向,Z轴相对屏幕向外是正方向,建议通过Leap Motion的观察器来熟悉操作(如图6)。

Scratch 2.0 Plug-in for LeapMotion并没有提供Leap Motion的全部SDK数据,而是提供了其中最常用的几类数据,如手和手指的坐标。手势方面也仅仅提供了是否可见以及手掌是否张开。

为了帮助大家理解这些指令,我进行了分类整理,并进行说明(如下页表1)。

1.小试身手:用手“抓”住小猫

首先用手势控制一个角色“hand_open”,当“hand_open”角色遇到小猫角色的时候,用“Hand-1 open”判断是否处于“抓”的动作。如果是,小猫角色的坐标就跟随手的坐标移动(如图7)。

具体的程序代码说明如表2。

2.自由创意:用手势控制的“捕鱼游戏”

这是五年级小学生编写的一个小游戏,小作者设计了如下功能:渔网在默认情况下是关闭的,随着手的运动而移动坐标。当张开手掌时,渔网张开,小鱼碰到就被捕。一秒钟后,渔网自动收回。其中每撒一次网,就要扣除一定的金币,而捕到的鱼可以换金币(如图8)。

考虑到Leap Motion的Y轴是手的高度,在电脑前操作容易遮住显示屏。小作者用Z轴的数据来作为Scratch的Y轴数据。其实代码还是很简单,如图9所示。

通过这两个范例,大家可能对Scratch2.0加上Leap Motion来玩手势控制有了一定的了解。斯蒂芬·豪威尔老师在插件页面中提供了他的几个简单范例,值得初学者参考。一般而言,我们很难用Scratch2.0编写很复杂的手势控制的程序。但是,只要有足够的创意和算法基础,仅仅“Scratch 2.0 Plug-in for Leap Motion”提供的功能,就可以让中小学生编写出很酷的手势控制方面的应用来。如果具有足够的数学功底,完全可以试试一些简单的手势识别。如果你对Leap Motion手势控制编程感兴趣,请关注下一篇,跟我一起继续研究更加有趣的作品。

手势绘图锁的应用研究 第10篇

关键词:树莓派,红外避障传感器,手势绘图,方便简洁

1引言

随着经济的不断发展,人们的生活水平也不断提高。传统的门锁已经渐渐不能满足人类的需求。传统的门锁有着许多弊端比如:当钥匙丢了的时候门便打不开只有撬门这一条路可走。所以传统的门锁即不能适应时代的发展,也很不实用。因此,本人与同伴一起发明这个手势绘图锁来解决大家的问题。历史中出现的锁不计其数,但是我确信我们制作的这款手势绘图锁一定是最方便的,最实用的。现代生活中每一件物体都在不断地更新,功能也在不断的提升。用手势绘图锁是十分方便的,你只需要用手轻轻划出你设计的密码便可以将门打开。你不必会担心你的钥匙会丢在家中,也不必会担心钥匙被别人偷然后偷偷进家行窃。这款锁可以让你用得放心,在外玩得开心。

2总体设计分析

2.1系统组成部分

2.2硬件需求

2.2.1树莓派

树莓派作为一台运行Linux系统的台式计算机,它不是以传统的依靠硬盘来储存数据而是以SD或外接USB硬盘来储存。方便编程、容易改造,十分方便。 并且RPi是一个相对完整的电脑,自带的接口比较全面,USB-host、RJ45、HDMI、SD读卡器等常用接口都有所以可以运行完整的操作系统。

硬件方面,树莓派的参数如下:

Broadcom BCM2835 700MHz ARM1176JZFS配备FPU处理器,4核GPU处理器

GPU支持Open GL ES 2.0, Open VG硬件加速,1080p30 H.264 高清解码

GPU带宽1Gpixel/s, 1.5Gtexel/s or 24GFLOPs DMA纹理解析

带Micro SD卡插槽(支持通过它启动Linux操作系如Fedora)

尺寸:85 x 56 x 17 mm

3.5 mm音频输出接口

microUSB接口供电

10/100自适应网卡

USB 2.0接口x 4

Micro SD卡插槽

512 MB内存

摄像头接口

40PIN接口

HDMI接口

LCD接口

2.2. 2红外避障传感器

红外避障传感器(9个):

该传感器模块具有一对红外线发射以及接收管,对周围环境光线适应能力较强,发射管会发射出一定频率的红外线,红外线反射回来被接收管接收。当检测方向遇到障碍物(反射面)时,经过比较器电路处理之后,绿色指示灯会亮起,同时信号输出接口输出数字信号(一个低电平信号),可通过电位器旋钮调节检测距离,有效距离范围2~30cm,工作电压为3.3V-5V[1]。该传感器的探测距离可以通过电位器调节、具有便于装配、干扰小、使用方便等特点,可以广泛应用于避障机器人、避障小车、黑白线循迹及流水线计数等众多场合[2]。

本文中红外避障传感器具有一对红外信号发射与接收二极管,利用的红红外避障传感器LDM301 发射出一束红外光,在照射到物体后形成一个反射的过程,反射到传感器后接收信号,然后利用CCD图像处理接收发射与接收的时间差的数据。经信号处理器处理后计算出物体的距离。红外信号反射回来被接收管接收。接受处理后通过数字传感器接口返回到树莓派中,树莓派再利用红外的返回信号来对舵机进行控制。

其数据参数如下:

1)当模块检测到前方障碍物信号时,电路板上绿色指示灯点亮电平,同时OUT

端口持续输出低电平信号,该模块检测距离2~30cm,检测角度35°,检测距离

可以通过电位器进行调节,顺时针调电位器,检测距离增加;逆时针调电位器,

检测距离减少。

2)传感器主动红外线反射探测,因此目标的反射率和形状是探测距离的关键。其

中黑色探测距离最小,白色最大;小面积物体距离小,大面积距离大。

3)传感器模块输出端口OUT可直接与单片机IO口连接即可,也可以直接驱动

一个5V继电器;连接方式:VCC-VCC;GND-GND;OUT-IO

4)比较器采用LM393,工作稳定;

5)可采用3-5V直流电源对模块进行供电。当电源接通时,红色电源指示灯点亮;

6)具有3mm的螺丝孔,便于固定、安装;

)电路板尺寸:

8)每个模块在发货已经将阈值比较电压通过电位器调节好,非特殊情况,请勿随意调节电位器。

模块接口说明:

1)VCC外接3.3V-5V电压(可以直接与5v单片机和3.3v单片机相连)

2)GND外接GND

3)OUT小板数字量输出接口(0和1)

2.2.3小型舵机

舵机主要是由齿轮、无核心马达、电路板与位置检测器所构成。控制电路板接收来自中央控制器信号的控制信号,控制电机转动,电机带动一系列齿轮组传动至输出舵盘。位置反馈电位计和舵机的输出轴是相互连接的。舵盘转动的同时,位置反馈电位计将输出一个电位信号至控制电路板将其进行处理反馈,控制电路板根据所在位置决定电机转动速度与方向,从而达到目标停止[3,4]。

本文中控制信号由接收机的通道进入信号调制芯片,获得直流偏置电压。它内部有一个基准电路,产生周期20ms,宽度为1.5ms的基准信号,将获得的直流偏置电压与电位器的电压比较获得电压输出。最终使电机停止转动。实现开关门。

其技术参数如下:

1)重量:9g

2)尺寸:23x12.2x29mm

3)无负载操作速度:0.12秒/60度(4.8V);0.10秒/60度(6.0V)

4)扭矩:1.6kg·cm(4.8V)

5)使用温度:-30~+60摄氏度

6)死区设定:5微秒

7)工作电压:4.8V~6V

8)附件:

线长25cm

速度:0.23秒/60度(4.8V)

0.19秒/60度(6V)

力矩:3.2kg/cm(4.8V)

4.1kg/cm(6V)

体积:44L X 20W X 40H

重量:37.2g

转动角度:180度(左右各90°)

技术参数:Futaba S3003 标准舵机,使用在车、船等遥控模型上.可替代Futaba的S138、S148、S22、S38和S12。

3手势解锁的软件设计

3.1手势绘图锁系统流程图

初始化后,避障传感器处于检测状态,根据按键来选择更正和检测手势。

3.2 Python

Python是一种面向对象具备动态数据类型的解释性语言,你所编码的脚本或程序可以直接运行,而不需要类似其他语言把它们先编译成机器码。这样使用起来非常便捷。Rasp-berry Pi上也提供了与Python绑定在一块的集成开发环境IDLE。

开始编写手势绘图程序前需要对树莓派计算机的相关Py-thon的库文件进行安装设置,首先是GPIO,打开LX终端(LX-Terminal),更新apt-get软件安装包列表(注意必须要在网络连接正常情况下),然后执行安装命令来安raspberry -gpio-python包。在安装完成Python的GPIO库后,接下来是安装Python的UART库,和上述之前步骤相似,更新apt-get软件安装包列表,后安装Python的串口通信模块.

3.3 检测模块设计

本实验中所用的9 个红外避障传感器可以检测出你所绘出的图案。为了防止用户自己画错了本作品中设置了确定与取消两个按键。当你画错了的时候你可以按取消键重新绘图。这样你就不会担心自己画错了而系统会自动报警或者在绘图过程中停留时系统会立刻自动检测导致绘图错误。当然,我们也设计了两次绘图机会防止你自己在少数情况下绘图错误却按了确定键。这样,我们这款手势绘图锁就可以说是完美之作了。如下图所示手势检测过程。

4 总结

手势控制器等 第11篇

一款像鼠标一样准确、比键盘更可靠、比触摸屏还灵敏的体感控制器问世了,它的外设体积只有口香糖那么大,有了它,你就可以直接用手势来控制电脑,而无需鼠标、键盘。与电脑连接后,它会闪出一个工作空间,在这个空间里,你的10根手指的动作都会被即时跟踪,其对移动轨迹的记录可以精确到百分之一毫米。

听觉导游地图

英国阿伯丁大学设计专业的学生制作了一款相当有趣的听觉导游地图。设计者把具有实时录音与数据传输功能的终端机放在景点周围,并在导游图上用红色标记出来。游客可以使用听筒先倾听该景点周边环境的声音,然后再决定自己是否该到这个地方旅游。

可拆分的熨衣板

在普通的熨衣板上熨烫裤腿或是袖口,很难做到没有褶皱。为了解决这一难题,设计师设计了这款面板可以拆分的熨衣板:在需要时,可以将板面部分拆分成衬衫形状或是裤子形状,将衣物套上之后再熨烫。有了这样的熨衣板,熨烫什么衣物都不在话下了。

神奇电路板

基于视觉的手势识别系统研究 第12篇

1 手势模型

本文将手势识别技术应用到机器人控制系统。机器人控制系统中自带的摄像头通过采集人的手势图像,通过一系列分析、处理、降噪等算法识别手势含义,并据此做出相对应的动作。

手势模型的选取对于整个手势识别系统的影响举足轻重。目前,没有普适性的通用模型,因此需根据系统应用选择特定的模型。从文献资料来看,手势建模方法可以分为两大类:基于3D模型的手势建模和基于表观的手势建模。

本文采用了基于图像属性的表观模型,从图像属性抽取的参数被称之为图像属性参数,包括:轮廓、边界、图像矩、Z不变矩、方向直方图和图像特征向量等,其中很多参数在分析手势过程中作为特征使用。例如,轮廓是一种直接的模型参数。基于边界的轮廓提取模型为深层次的特征空间分析提供基础,便于降低算法计算时间和算法复杂度。

2 手势分析

本文上一节介绍了基于图像属性的表观建模方法,此节根据手势图像的测量值估测一些模型参数对系统采集的图像进行手势分析,分为两大模块:检测或提取相关的图像特征、运用这些特征计算模型参数。当然,在实现第一个模块时还需要对手势图像进行一系列的预处理,如灰度化,去噪、二值化,提取轮廓等。

2.1 图像的预处理

图像的灰度化就是将采集的彩色手势图像转化单通道的,即只含有亮度信息的灰度图像,因为灰度图像提供的信息已经足够充分,并且计算复杂度是原来的三分之一甚至更低。

图像的去噪目的是消除手势图像中的椒盐噪声以及高斯噪声。良好的去噪平滑方法既能消除图像中的噪声又不使图像的边缘轮廓和线条变模糊。本文采用了中值滤波方法,它是非线性滤波器中最常用的一种方法。对于一定类型的随机噪声,中值滤波器有优秀的去噪能力,与相同尺寸的线性滤波器相比,它的模糊程度明显降低。

2.2 图像分割

图像分割无论在模式识别还是计算机视觉中都是非常关键的一个步骤,分割质量的好坏直接影响着后续处理的结果。图像阈值化是最为普遍使用且最为有效的分割技术之一。在众多的阈值方法中,Otsu分割方法因简单、快速以及性能稳定成为最受欢迎的图像阈值方法。Otsu也称为最大类间方差法,是一种全局化的动态二值化方法。其基本思想是根据直方图,选取一个阈值t,将图像分为两类,分别求类间方差及类内方差,使两者的比值最大化的t即为最佳阈值。

Otsu算法步骤概括如下:

第一,将图象按照灰度进行分级;图像分成L级,共从0至L-1级图象总的象素点数为N=N0+N1+…+NL-1

第二,计算图像的平均灰度,即计算各像素点的概率:Pi=Ni/N表示像素点总和,Ni表示第i级像素点总和,Pi表示第i级像素点的概率。

第三,门限t将整幅图象分为暗区A和亮区B两类,遍历所有像素,并循环计算从像素为0至L-1计算类间方差,则类间方差σ是t的函数:

其中aA和aB分别为类A和B的面积与图像总面积之比,uA和uB分别为类A和B的均值,该法选择最佳门限使类间方差最大,即得到Otsu阈值t,

第四,实现二值化。Open CV中提供了两种阈值方法:阈值化和自适应阈值化。将这两种算法与Otsu算法的分割结果对比会发现Otsu的算法要远远优于另外两种算法。阈值化后借助形态学处理方法即可消除后手势图中前景的孔洞或者背景的噪声,从而更有效地提取手势的轮廓图片,进入下一步特征提取阶段。

2.3 特征提取

在得到有效的手势分割区域之后,需要选取合适的手势特征向量才能识别出手势。手势的形状特征可以由几何属性、统计属性和拓扑属性来描述,其中针对背景比较简单的手势图形,基于拓扑的手势特征提取方法更为适用。

基于拓扑学的特征提取算法如下:

第一,针对分割后的手势图像计算手势区域的重心以及距离重心距离最远的一点,该距离设为r。

第二,以重心为中心点,0.6*r为半径画圆与伸展出的手指相交。

第三,将上一步骤得到的图映射到坐标轴上,通过进一步分析可以得出该手势图中有几根活动手指。

2.3.1 计算重心及最远的距离

针对处理得到的手势区域图,我们用以下公式计算其重心,其重心坐标(X,Y)为:

其中,xi,yi表示第i个像素的坐标,N是指所有的像素数。

接着针对二值化的手势图像,计算手势区域中每一个像素到重心的距离,比较计算结果确定最大距离为r,但是采用这种方法必须遍历每一个像素点,计算复杂度增加,系统效率降低。

从直观上,人们的第一反应是手指的指尖到重心距离最远,通过反复的实验也证实了这一点。在这个认识的基础上,引入角点这一特征,因为一个手势图像中的角点是有限的,可以通过计算有限角点到重心的距离,通过比较确定我们所求的那个距离重心最远的点,进而计算下一步骤中的所画圆的半径。(a)中小圆圈是寻找到的角点,手掌重心的红色十字叉是重心所在位置,中指指尖的红色十字叉是距离重心最远的角点所在的位置。图6(b)中中指指尖的黑色十字叉是在传统的方法下计算出来的,与快速算法下的定位精确度相差无几。

2.3.2 画圆

以重心为圆心,考虑到手指的长短不一,将上一步骤中得到的长度乘以一个系数,即以0.6*r为半径画圆,这样的圆有极大的可能性与手势图像中的所有活动手指相交。

3 手势分析

在理想的情况下,坐标中矩形区域对应手势图像中活动的手指,通过计算像素从0到1变化的次数,确定有几根活动手指,从而实现手势的识别。

4 总结和展望

本文针对背景相对简单以及控制信号单一的手势识别场景,提出了一种能较快并准确地识别手势信号的系统,实验证明该系统可以很好地应用于机器人导航中。但该算法的缺陷是只能对机器人“向左”和“向右”进行控制,“向前”和“向后”的控制算法还需要进一步研究。

摘要:手势识别是把手势这种自然的、直观的交流方式引入人机交互系统中,计算机通过读取手语信息,转换成文本、语音等信息,或者事先对计算机进行设置,使得不同的手势对应不同的控制信号,既简便又实时。本文针对几种常用的手势,提出了一种快速识别算法,可以应用于机器人控制的环境中。该手势识别系统采用了一种快速有效的图像分割算法,为之后的提取特征及识别奠定了良好的基础。

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【手势设计】相关文章:

手势礼仪09-10

交通手势教案05-28

运用手势教学06-17

手语手势教学07-15

音符手势范文05-20

世界手势拾趣范文06-06

演讲手势动作范文06-10

篮球裁判手势图解07-22

演讲手势注意事项06-16

中班语言:有趣的手势06-29

上一篇:防火墙的选择下一篇:关于幼儿园的教育管理