语音控制范文

2024-08-08

语音控制范文(精选12篇)

语音控制 第1篇

Strategy Analytics的最新研究报告表明,消费者尤其是美国的中年人群对车载语音识别系统的满意度急剧下降。

Strategy Analytics的车载用户体验服务作了一项最新调查,评估消费者对车载语音识别系统和触屏的使用及满意度。频繁使用者对车载触屏和语音控制系统的满意度依旧很高,但整体用户满意度却下降了。尽管车载语音控制的日常使用在欧洲保持平稳,但是在美国和中国却有所下降,尤其是在某些年龄段的用户中。

语音控制 第2篇

在Windows 7中,有一个语音识别功能可以让我们彻底抛开鼠标和键盘,只用语音控制电脑,完成编辑文档、使用软件等一系列操作。

玩声控 磨刀不误砍柴工

在Windows 7当中,语音识别已经成为一项非常重要的应用。我们可以在控制面板中找到“语音识别”选项,此外还可以通过在开始面板当中的搜索栏输入“语音识别”来运行它。

推荐大家在第一次使用语音识别时,首先设置好你的麦克风,工欲善其事,必先利其器嘛。然后,基本的语音教程也是你掌握语音识别应用方法的关键,这个学习整个过程大概需要10分钟。当然了,如果你实在没这份耐心,也可以直接点击语音识别面板当中的“打开语音参考卡片”来查看一些常用的操作命令。

提示:初次使用语音识别,建议你在设置麦克风时开启“启用文档审阅”选项,以便提高语音识别精度。

接下来,为了进一步提高语音识别的精度,强烈建议大家点击“训练您的计算机以使其更了解您”链接,启动“语音识别声音训练”程序。马跑得快,也需要跟主人的默契配合不是么?要让这匹“快马”更听你的话,多下点工夫让它适应你才是硬道理。

温馨提示:语音识别训练程序当中提到,你要像电视播音员那样字正腔圆地说话,才能更有利于计算机识别你的声音。这一点对于很多人来说显然有点“不人道”了!事实并非如此,只要你多训练几次,略有方言口音,甚至就是方言口音,只要不是生僻的词组,一样可以很好地识别!

录文字 动动口就成

你的基础工作都做完了吗?下面就真刀真枪地编辑一份文档吧!这里以打开写字板,输入一段文字为例,

首先,打开写字板的操作,只需要说“打开写字板”,就会直接启动写字板程序。这时就进入了编辑状态,有点小激动吧?呵呵,别急,接下来,我们就可以动嘴说,让计算机“动手”做了。

第一句话是“牛牛今天很高兴”,结果它给写成了“命令今天很高兴”,真不给面子!

“选择命令”说完,“命令”两个字就被选上了,然后再说“牛牛”,就会弹出替换面板并显示可以替换的字词。如果依然没有准确的字词,可以直接再说一次,面板当中的选项即可更改。找到合适的字词之后,就可以说编号,并说“确定”就完成修改了。很快,一段文字就完成了。

温馨提示:文字录入开始阶段,可能会产生不少错误的字词,但随着你应用语音识别次数的增加,准确率会越来越高,录入速度和效率也就更高。

玩操作 两句话的事

昨天夜里看了两部电影,不过这次没有再像以前那样,爬出暖暖的被窝,去切换影片或者关闭电脑。美美地享受了一次躺在床上的“远程控制”,感觉真的不是一般的爽!怎么控制的?

这里以射手影音播放器为例。第一部影片播放完成后,只需手里捧着心爱的麦克风说“空格”以暂停影片(避免影片的声音影响操作,其实经测试,语音识别基本可以忽略其他非语音的声音),然后再说“鼠标右键单击窗口”,就可以弹出操作菜单。

接下来,就跟操作其他程序一样了。“显示编号→1→确定”,就可以打开选择窗口,再说“显示编号→双击29”,就可以打开新的影片了。

两部影片看完,一句“关闭窗口”就可以直接关闭播放器。关闭计算机的操作就简单了,依次说“开始→显示编号→18→确定”,就准备做美梦去了!哎呀,等等!“停止关机”!忘记说“洗脸刷牙”啦!

语音也能控制桌面图标等 第3篇

在确认语音识别功能已经启动的情况下,首先读出“显示桌面”,此时会切换到桌面,读出“鼠标网格”,桌面会覆盖一块3×3的方块网络,我们可以看到网格中的每个方块都已经进行了编号。

现在,你只要读出需要选择的图标所在网格编号,此时网格会在该方块上放大,而另外一个3×3网格即可在其区域被覆盖。当然,大部分情况下你所需要的图标一般都是处于某个网格,而其中可能还存在一些你并不需要的图标,因此你可能还需要经过多次读数,最后才能最终选中自己所需要的图标。

在读数的过程中,网格会不断缩小,直至覆盖在你需要的最终目标上,最后你就可以读出“单击”或“双击”,前者是选中,后者是运行。

扪心自问,用语音来控制桌面图标,其实与使用鼠标操作没有什么区别,从某种程度上来说可能还更麻烦一些,不过这种方法蛮有趣的,还可以锻炼你的普通话呢。

让IE浏览器打上你的烙印

宋连党

你是否厌倦了呆板的IE浏览器?要是能把IE浏览器标题换成自己想要的标题,比如自己的名字,那该多酷啊!朋友们看了以后一定会惊讶地投来佩服的目光。

1点击“开始→运行”,在对话框里输入gpedit.msc。

2选择“用户配置→Windows设置→Internet Explorer维护→浏览器用户界面→浏览器标题”。

3勾选“自定义标题栏”,写下有个性的标题,最后“确定”,看看效果吧。

字数统计 我要更方便

越野苍狼

大家在Word中写完文章或最终的文章经过改动后,总是要统计一下字数,而每次都要去点击菜单不免麻烦。其实我们只要稍微设置一下,就可以让“字数统计”变得更方便。

1运行Word程序,依次点击“工具→字数统计”,在弹出的“字数统计”对话框中单击“显示工具栏”。

2你会发现在Word窗口中已经出现了一个“字数统计”工具条。

3用鼠标左键按住工具条标题栏,将其拖动到Word工具栏中。

行车控制设备语音提示系统 第4篇

关键词:行车,设备,提示

随着铁路运输任务的日益增加, 行车的运行密度越来越大, 加大了行车控制人员的劳动强度, 现有的微机联锁控制台上的按钮按下后虽然有闪动, 但是对行车控制人员来说反馈的信息还是不够丰富。研制适合微机联锁车站的行车控制设备语音提示系统, 确保行车控制人员实时能听到自己做了哪些操作, 提高行车作业水平是一项必要的任务。本文采用微机联锁共享数据的方式, 设计了一套语音提示系统, 用以及时提醒行车作业人员当前所做的操作, 有助于行车作业人员听到自己误操作后的及时处理。

一、系统组成及工作原理

1.1系统组成

系统由串口长线传输隔离器、计算机主机、音响设备及系统软件构成。系统通过串口长线传输隔离器从微机联锁的电务维修机采集开关量数据, 分析值班员的操作, 播报值班员按下的控制台的按钮, 系统结构框图如下:

1.2工作原理

1、微机联锁电务维修机每秒钟通过串口隔离设备向系统主机发送开关量的状态。

2、系统主机根据该车站微机联锁的接口码位表, 解析出信息中所包含的站场和区间各种按钮、信号机状态, 并进行分析处理, 从而准确判断出行车控制人员要做的工作, 然后从配置表中提取出相应的文本内容, 再将文本内容转换为语音播放出来。

系统播报内容示例:

1.3系统设计原则

1.共享微机联锁信息, 运用计算分析处理技术为行车作业人员提供及时的语音信息反馈。

2.通过对微机联锁信息的采集、处理, 实时掌握行车人员对控制台上的操作情况。

3.主机采用模块化设计、信息码设计, 达到信息低延时处理, 以及文本到语音播放的运用, 保证语音播报的准确及时。

二、系统总体设计

2.1系统硬件设计

1.串口长线传输隔离器

微机联锁电务采集机为铁路运输主要设备, 采集数据必须满足相关技术标准规定, 另外由于现场条件不同, 电务采集机距离计算机主机 (本系统用于对采集的微机联锁数据进行解析、分析) 的距离不同, 市场通用的串口隔离器不能满足本系统的个性化需求, 因而必须针对实际情况开发研制, 电路原理图如下图所示:

(1) 串口隔离。

电源输入采用DC/DC电源隔离, 数字信号输入与输出之间采用6N137光电隔离, 光耦合器以光为媒介传输电信号对输入、输出电信号有良好的隔离作用。光耦合器由三部分组成:光的发射、光的接收及信号放大。输入的电信号驱动发光二极管 (LED) , 使之发出一定波长的光, 被光探测器接收而产生光电流, 再经过进一步放大后输出。这就完成了电—光—电的转换, 从而起到输入、输出、隔离的作用。由于光耦合器输入输出间互相隔离, 电信号传输具有单向性等特点, 因而具有良好的电绝缘能力和抗干扰能力, 其隔离电压为2500V。

(2) 长线传输。

数据传输中经常采用串口传输, 串口中收、发端的数据信号是相对于信号地而言。典型的RS-232信号在正负电平之间摆动, 在发送数据时, 发送端驱动器输出正电平在+5~+15V, 负电平在-5~-15V电平。当无数据传输时, 线上为TTL, 从开始传送数据到结束, 线上电平从TTL电平到RS-232电平再返回TTL电平。接收器典型的工作电平在+3~+12V与-3~-12V。由于发送电平与接收电平的差仅为2V至3V左右, 所以其共模抑制能力差, 再加上双绞线上的分布电容, 最远理论距离仅为15米, 且不稳定。因此本系统中采用CAN总线驱动器251, 将数据信号变为差分信号传输, 通过两根信号线 (屏蔽双绞线) 传输, 具有稳定可靠、实时、抗干扰能力强、传输距离远等特点, 其直接通信距离最远可达10Km。在隐性状态下, CAN-H与CAN-L的输入差分电压为0V (最大不超过0.5V) , 共模输入电压为2.5V。在显性状态下, CAN-H与CAN-L的输入差分电压为2V (最小不小于0.9V) 。

2.计算机主机和音响设备。采用市场通用工控机及音响设备。

2.2系统软件设计

本系统从功能结构上比较单一, 主要目标是获取开关量状态, 提供有声的反馈, 软件的运行流程如图3所示。

三、系统主要特点

1.系统可全天候、不间断工作, 随时提供提示信息, 极大地方便行车控制人员的工作。2.系统整机可靠性较强, 具有抗干扰和防死机措施。

四、结束语

语音控制 第5篇

语音偏误标记与语音对比-谈泰国学生语音习得问题

基于在泰国的教学实践,文章归纳了泰国学生区别于其他国家学生的语音偏误标记,并借助汉语和泰语的.语音共时层面的对比,分析泰国学生在汉语语音习得过程中由于母语负迁移和目的语干扰所造成的“化石化”难点,并提出了有针对性的解决方案.

作 者:陈晨 李秋杨 CHEN Chen LI Qiu-yang  作者单位:陈晨,CHEN Chen(湘潭大学,外国语学院,湖南,湘潭,411105)

李秋杨,LI Qiu-yang(中央民族大学,语言文学系,北京,100081)

刊 名:云南师范大学学报(对外汉语教学与研究版) 英文刊名:JOURNAL OF YUNAN NORMAL UNIVERSITY TEACHING AND RESEARCH ON CHINESE AS A FOREIGN LANGUAGE EDITION 年,卷(期): 6(2) 分类号:H195 关键词:语音偏误标记   汉泰语音对比   化石化  

语音控制 第6篇

关键词:GSM显示语音播报

0引言

早在2007年,中国气象局公布了《气象灾害预警信号发布与传播办法》,要求学校、机场、旅游景点等人口密集公共场所的管理单位设置或利用电子显示装置及时传播气象预警信号。气象预警类信息显示与播报系统主要是集气象信息与用户信息发布于一体的系统,数据传输方式可以选择GSM或者GPRS。充分利用现有的无线网络,接收来自气象信息发布中心的气象预警信息并实时地对外发布。根据传输数据量及产品成本等诸多因素的考虑,设计人员可灵活选择。毫无疑问不管是GSM还是GPRS,优点都是能够快速、便捷地随时将信息通过平台或手机短信方式传递到远端电子显示屏,没有区域距离等空间的限制。从而能够在第一时间直接将气象信息发布给公众,以增强预警能力,最大程度地减轻气象灾害造成的生命及财产损失,而目前的气象信息发布主要通过电视、报纸、广播、短信、互联网等途径,不仅会有一定的时间延迟,其到达率也会有一定程度的损失,从而影响了气象信息发布的有效性。本文以GSM为例,浅谈GSM信息显示与语音播报控制系统的设计过程中需要研究的几个问题。

1LED信息显示屏屏体设计方案

1.1屏体部分显示部分使用点阵与数码相结合,点阵部分用来显示气象预警信息,如:天气预报、气象等级预警信息等,还可以用来作为用户形象宣传或者发布通知以及发布广告的媒体。数码部分是用来显示万年历,还可以根据用户需求加设温度传感器,甚至湿度传感器等等。点阵部分使用C5单红室内单元板,总点阵为:128*32,扫描方式:动态1/16扫描。根据点阵部分的尺寸确定数码部分使用1.5英寸大小的数码管,静态扫描方式。因为点阵大小为128×32,故支持2行16点阵大小字体文字。同时可以设计多种文字显示方式,这里绐出几种供读者参考:百页窗,翻屏,整屏移进移出,马赛克进出屏,条状游动等等。

1.2GSM-一种越来越普及的数据传输方式GSM的英文全称是GIobal System for Mobile Communications,其中文含义是“全球移动通信系统”。GSM数字移动通信系统是由欧洲主要电信运营者和制造厂家组成的标准化委员会设计,并在蜂窝系统的基础上发展而成。我国1994年开始建设GSM网,目前全国GSM用户接近5亿,而且数量迅速增长。而作为GSM服务中一项重要的远程业务,SMS(short Message Severs)能够在移动用户及外部系统(比如电子邮件、页面调度以及声音邮件系统)之间传送包括文字与数字的短信息。其独特的快捷性,方便性,易用性,已经使其在诸如E-Mail、娱乐,GPS定位等领域得到了越来越广泛的应用。目前已经有许多厂商开发了具有单独短信息收发功能的功能模块,GSM短信息收发功能模块的广泛应用,为GSM短信息在自动控制领域的应用注入了新的活力。

2短信发送端及短信发送者权限的问题

2.1短信发送端常用的两种类型

2.1.1发送端采用MODEM(一般俗称:短信猫)来发送信息,把猫跟电脑的串口相连,并在电脑里安装配套的驱动软件,软件里可以选择发送目标的手机卡号码以及需要发送的文字信息,每条信息70个字符上限(一个中文或英文或是符号都称一个字符)。用此方法操作好处是电脑无需互联网即可发送,缺点是短信猫里必须安装一张SIM卡(根据使用要求确定是需要办理GSM或是GPRS业务)。现市面上此类型猫种类繁多,用户可以选购稳定且价格相对低廉的产品。

2.1.2还有一种方法是通过短信平台。此方法原理是直接通过intemet将短信内容提交到移动或是联通的短信平台,平台直接下发到目标手机号码。用此方法快捷方便,但需要跟电信运营商沟通,估计如果每天没有一定的短信发送量肯定是没有必要用此方法的。

2.2显示屏短信接受源的控制即发送者权限问题:发送端选择好了,接下来要考虑的是如何设定通讯协议,首先不是什么信息都接受,而且不是谁的信息都接受,如今各种垃圾短信满天飞,我们如何解决显示屏正确选择有用信息而丢弃非法信息的问题呢?这是通讯协议中必须考虑的首要问题。

我们很容易想到一个很简单实用的丢弃垃圾短信的方法一设定短信接收头,也就是说牺牲有限的短信字符数来告知显示屏此条信息的功能,比如:设定显示方式,显示速度,发送内容等等。这种思路通常可以满足一般要求的LED显示屏发布系统。

一般显示屏支持的短信条数在4条以上,假设这4条短信发送的是不同类型的短信,如第一条是天气预报,第二条是近期天气趋势,后面两条是宣传标语或者是收费广告,那么这就可以确定发送源不止1个,甚至就是4个,发送源和短信通道之间有可能是一一对应的。如果这样那么就需要设定一个最高权限用户,由最高权限用户通过短信去设定其他用户,每个用户只能发送对应其权限范围之内的短信通道。而且最高权限用户可以解除其他权限用户并重新设定。通过这种方法就可以解决这一系列的问题。

3语音模块(XF-S4240)的相关介绍

XF-S4240是科大讯飞推出最新的语音合成模块,为业内效果最好的模块级语音合成产品。该模块可通过UART、SPl和J2C三种接口接收待朗读的文本,将文本转换为语音输出,具有非常好的文本朗读效果。模块采用COB(Chip On Board)封装,可方便的集成到需要中文语音合成功能的嵌入式设备之中。此模块面向无法利用软件实现语音合成的嵌入式应用环境提供一套效果卓越的语音技术解决方案。应用领域:车载监控调度终端、排队机、考勤机、公交报站器、税控机、导游机、智能仪器仪表、自动售货机、气象系统提示终端、智能玩具、行业手持通讯终端、信息电话。

DSP的智能语音控制系统设计 第7篇

1 DSP的智能语音控制系统硬件设计

该系统硬件结构框图见图1, 其中核心处理芯片用的是T1公司的TMS320VC5509芯片, 特有的高速率、低功耗优势, 被应用到便携式设备终端信号处理、语音处理等多领域。语音编解码芯片TLV320AIC23B用到了现代化Sigma-Delta采样技术, 可在8-96k Hz采样率范围中提供16位、20位、24位与32位采样, ADC与DAC信噪比各自能达90d B与100d B, 此芯片被广泛应用到不同音频信号处理领域。无线部分则用到了基于n RF401无线通信芯片设计的PTR2000模块, 此模块发射功耗低, 灵敏性强, 为现今低功耗无线电传输最佳选择。

系统上电后, 首先测试者需利用麦克风或线性输入模式把语音信号成功传至音频编码芯片TLV320AIC23B, 再记住MCBSP串口传送至系统核心处理芯片 (DSP) 。此后, DSP成功接收语音控制信号后通过对应算法展开分析, 分辨出其中的语音控制命令。最后, 系统把辨别出的结果部分传至LCD显示模块利于后期观察, 而另外的则被传送至无线收发模块, 实现与智能化控制设备的远程交互。通过键盘可对显示电路给予控制使其显示, 对监控系统工作情况给予实时监控。

2 DSP的智能语音控制系统软件实现

整个系统软件实现流程框图见图2。首先系统使用片上支持库初始化语音编码芯片、无线收发模块、时钟、存储器等片上资源。后打开多通道缓冲串口实现语音信号的全面采集, 并把所采集信号完成传送至DSP芯片, 执行语音信号端点检测、训练模块生成等流程的操作。训练模板生成后, 借助DSP的EMIF口把训练模板妥善保存至存储器内, 再借助MCBSP串口执行语音信号特征提取、再次采样等环节的操作。后把训练模块里的特征分量及该次采样结果展开对比, 实现语音命令识别。

2.1 语音编解码模块

语音编解码芯片TLV320AIC23芯片、DSP通过I2C实现总线互联, 语音芯片被启动后, 首先借助I2C总线实现对语音芯片控制寄存器的配置。如:进行语音采样速率的设置、增益倍数等。在程序的实现上DSP多是通过CSL片的支持库实现对语音芯片的配置, 并借助MCBSP串口实现对语音破解编码芯片的读写操作。

2.2 存储器与无线收发模块

同步东塔器存储器大小约4M×16bit, 通过DSP的EMIF口语DSP完成双向通信, 可寻址范围即0x40000~0x7ffff, 完成对训练模板的存储。扩张存储器接口配置方法与AIC相似。

无线收发模块用的是PTR2000模块, 内核芯片为Nrf401无线通信芯片。整体属于封装好的模块结构, 包括7个引脚:VCC电源引脚、PWR低功耗控制、CND电源地、DO/DI数据输入输出、TXEN收发模式切换、CND电源地、CS频道选择引脚。使用期间只要简单借助DSP的IO口设置频道与收发方式等相对简单的配置引脚即能正常工作。

整个软件设计流程片上外设均用到的是DSP片上支持库进行编写, 通过一组标准化方法来访问与控制片上资源, 整个系统可裁剪性相当好, 便于移植。软件流程具体如图2。

3 小结

智能人机交互系统可解决人们不能与设备直接接触完成设备控制的问题, 更符合复杂工业现场需求, 因该系统核心处理芯片特有的片上资源与扩展接口, 更易与其它设备互联, 便于系统升级。

参考文献

[1]高海英.基于DSP的机器人语言识别及控制系统设计[D].重庆:重庆大学, 2006.

康复机器人的语音控制及实现 第8篇

1 语音信号处理及识别技术

1.1 语音识别的基本原理

基于模板匹配方式的语音识别技术的基本原理如图1所示:

图1中, 对语音信号进行采集、电压放大、滤波、分帧加窗、AD转换和端点检测等预处理之后便得到短时语音帧, 然后采用线性预测 (LP, Linear Prediction) 分析方法求解语音信号实际值与预测值的均方差, 并使其最小, 从而得到能反映语音信号特征的矢量, 这个矢量就是线性预测系数[4,5]。对提取的特征建立语音模板库, 通过隐马尔可夫模型对需要识别的语音特征进行匹配, 最终得到语音识别结果。

1.2 隐马尔可夫模型 (HMM)

HMM是在马尔可夫 (Markov) 链基础上建立的一个双重随机过程, 一个随机过程是描述与Markov链的每一状态相关的观察值之间的统计对应关系, 可以用短时模型描述短时稳态的语音信号;另一个随机过程是通过Markov链模拟与另一组概率分布相联系的状态的转移统计对应关系来描述每个短时稳态语音信号如何转变到下一个短时稳态信号.而人说话的过程其实就是一个双重随机过程, 人想要说话的过程是不可观测的状态, 而发出的语音信号则是在时间上可观测, 所以相比于其它语音模型或算法, HMM更准确、全面地模仿了人说话的过程, 是较理想的语音模型[6,7]。所以在康复机器人语音控制中采用的主要的语音识别方法。

Markov链描述一个状态集在时间内的状态变化, 可以由满足特定概率的一条状态链表示为:

在马尔可夫假设 (Markov Assumption) 下, 状态在状态集S中某个状态的概率仅与有关。如果用矩阵表示相邻两时刻中前一时刻的状态为与后一时刻状态为的概率, 则有

因此, 用状态转移矩阵A就可以表示离散Markov链的状态变化过程。

在Markov链的基础上, HMM可以由5个模型参数定义, 为:

式中, S为HMM中状态的集合, O为输出的观测值符号集合, 为系统初始状态概率的集合, A为状态转移概率矩阵, 即转移概率。B为输出观测值概率的集合。

2 语音控制系统设计

康复机器人语音控制结构如图2所示, 该图中, 语音识别系统是康复机器人控制系统中的一个独立的子系统, 语音识别系统对康复医师或患者说的话进行语音识别后, 将识别结果发送给康复机器人控制软件, 由控制软件控制康复机器人执行指定的康复运动。

2.1 语音识别模块设计

为了将语音识别系统既能应用于基于PC环境, 又能应用于嵌入式系统, 设计中采用了特定的语音识别模块, 在此基础上进行康复机器人语音识别系统的开发。该模块的内核为一片8位微处理器, 程序指令及数据通常是从外部程序存储器中读取, 外存最大容量为1Mbytes。因此, 在对该模块的编程完成后, 需要使用专用工具软件将编译后的.hex或.bin文件烧录到语音识别模块的外存中。在非特定人语音识别中, 需要对真人发音进行训练, 建立语音模板库, 并生成模板库文件及.h文件, 供C语言调用。

2.2 语音控制通讯协议设计

语音识别模块作为独立的子系统, 与康复机器人控制系统软件通过USB进行通讯。由于语音识别模块的USB接口是由UART经过FT232芯片转换, 并且符合RS232通讯协议, 因此语音识别模块相对于工控机 (或PC) 而言, 其实就是一个RS232串口器件。

在康复机器人语音控制过程中, 控制系统软件通过USB串口与语音识别系统进行数据交换过程中, 不仅需要控制语音识别系统的启动或停止, 还需要能读取语音识别结果, 从而执行相应的康复运动。因此, 度康复机器人的语音控制通讯协议需要包含控制与数据两部分的通讯协议。

以三自由度上肢康复机器人为例, 控制部分通讯协议见表1。

2.3 语音控制系统的开发及应用

在康复机器人语音控制通讯协议设计完成后, 就可以分别开始设计嵌入式语音识别程序与康复机器人控制软件中的语音接口部分程序。

嵌入式语音识别程序采用C语言编程, 其核心代码为:

3 语音控制系统测试结果

康复机器人语音控制系统测试过程中, 共有五位同学参加, 其中四位男生, 一位女生。语音指令均为汉语普通话 (由于同学们来自不同的地方, 因此普通话略带口音) , 语速力求均匀、平稳。测试过程中, 男生说话声音较大, 女生声音较小。测试者与语音识别系统的受话器 (麦克风) 间的距离在0.25~0.5米之间, 共随机对语音识别系统发出750条语音指令, 识别率为93%。

摘要:研究语音识别技术在康复机器人控制系统中的运用.通过对语音信号进行分析, 提取线性预测系数 (LPC) 作为特征参数.然后采用隐马尔可夫模型 (HMM) 进行模板匹配, 对有限的词汇进行识别.在康复机器人的语音控制中, 语音识别模块作为独立的子系统, 与上位机之间通过USB串口进行数据交换.上位机将读取的语音识别结果转换成命令, 控制康复机器人执行指定的康复运动。

关键词:康复机器人,线性预测系数,隐马尔可夫模型,语音识别模块

参考文献

[1]赵力.语音信号处理[M].第2版.北京:机械工业出版社, 2009.

[2]刘幺和, 宋庭新.语音识别与控制技术[M]北京:科学出版社, 2008.

[3]吴黎明, 王桂堂, 吴正光.语音信号及单片机处理[M].北京:科学出版社, 2007.

[4]李艳花.基于特征提取的智能轮椅语音识别控制技术的研究与实现[D].重庆:重庆邮电大学, 2010.

[5]罗致增, 赵敬斌.机器人语音控制及其实现[J].杭州电子工业学院学报, 2004, 24 (1) :30-35.

[6]Rabiner L R.A tutorial on hidden Markov mo-dels and se-lected applications in speech reco-nition[J].Readings in spe-ech recognition, 19-90, 53 (3) :267-296.

基于云计算和语音识别的控制系统 第9篇

随着科技的发展, 计算机硬件性能变得越来越强大, 互联网用户对互联网的依赖变得越来越强, 在需求的推动下, 硬件虚拟化和分布式计算变得越来越热门, 云计算由此诞生, 同时大数据的概念提出以及智能化设备的普及, 云计算的应用变得越来越广泛。文章提出通过将云计算和语音识别的结合构造一个控制系统, 其研究内容主要包括语音控制模块、天气查询模块、气温查询模块、出行建议模块。

2 系统原理

2.1 系统原理概述

软件的交互是基于语音的, 因此, 语音的识别和合成是必须的, 软件的语音识别通过Microsoft Speech Recognition库实现, 通过构建用户的语法来识别用户的指令, 其语音识别引擎是由Windows自带的语音识别引擎驱动的, 可实现随时聆听用户命令, 并实现自学习和自适应的能力。

语音识别以及学习能力的原理:

通过研究发现, 用户常用的指令通常由谓语和宾语构成, 而由谓语可以了解到用户想怎么做, 由宾语可以了解到用户想做什么。因此, 语音识别的语法构建是通过两个关键词来完成的。固化于程序中的指令由固定的命令格式组成, 可以在任何情况下使用, 由用自定义的语法, 用于程序控制和语音对话, 这个是由用户根据自己的需求自行定义, 程序将加载用户自定义的语法规则, 并对符合用户自定义语法的语音指令进行响应。

云计算是本软件获取天气和相关数据的主要途径, 云计算使用了中国天气网的云计算接口, 获取天气后在本地进行处理后, 进行语音合成后反馈。

温度查询使用了本地的温度传感器, 温度传感器通过虚拟COM口与主机相连, 软件通过收集温度传感器的大量数据后计算出本地的平均温度, 通过大量的温度数据收集可以减少突变性温度变化对整体数据的影响。本地会对温度进行舒适度的计算, 提供给用户当前温度的舒适度评价。

2.2 系统原理流程图

2.3 系统工作流程

1) 软件启动, 加载登录的基础语法包, 初始化登录语音识别引擎, 初始化界面, 并且开始温度收集;

2) 等待用户语音登录指令;

3) 用户发出正确的语音登录指令后, 登录成功;

4) 软件开始加载用户语法包和基础语音控制语法。初始化控制语音识别引擎;

5) 等待用户指令。

6) 识别用户指令, 如是天气查询指令, 则提取用户指令中的城市关键词, 连接天气云服务, 获取相关的天气数据。如是温度查询指令, 则从温度模块中获取用户当前位置的温度数据, 同时反馈舒适度数据。如是出行建议查询:则识别用户的目的地关键词, 连接云计算服务并获取相关数据, 提供出行建议。语音对话:识别用户关键词, 从内存中获取相关回复。系统控制:对于用户的控制指令, 识别用户的关键词, 执行对应的控制操作;

7) 合成语音反馈。

3 系统功能模块

“基于云计算和语音识别的控制系统”由以下几个部分组成:

1) 界面组件:通过特定格式的图片, 可自定义作为软件的界面形象。

2) 温度感知:由硬件和相应的软件组成, 硬件部分为一个温度传感器, 能够感知环境温度, 通过虚拟COM口进行数据传输。软件部分为对应的处理部分, 由一个单独的类进行处理。

3) 语音控制组件:由硬件和相应的件组成, 硬件部分为麦克风, 软件部分为Windows的语音识别引擎和语音合成引擎, 该组件为应用的主要交互组件, 用户通过语音对其控制, 应用使用语音合成进行反馈。

4) 声音处理:对于欢迎界面和用户声音录制的功能, 通过开源库lib Zplay实现声音处理。

5) 天气服务:通过HTTP请求中国天气网的API获得相应天气数据, 处理后进行语音合成反馈。

用户配置处理模块:因该应用具备一定的用户自定义能力, 所以用了多个配置文件, 主要是xml文件的读写, 可用来加载用户自定义的对话和命令。

4 系统设计

4.1系统基本控制命令

在登录后, 以下命令可以使用, 均为基本命令。

1) 隐藏/激活界面:“藏好”, 应用界面会消失, 但对功能无影响。“出来”则程序界面会出现。

2) 打开/关闭Wi Fi:针对Windows系统设计, 语音命令“打开Wi Fi”, “关闭Wi Fi”, 即可执行相应动作。

3) 截图:命令“截图”, 会自动将当前屏幕显示内容保存为图片。

4) 报时:命令“现在时间”, 应用会将当前时间反馈。

5) 学习命令:该命令可让应用开启一个新窗口, 将其他应用程序的路径和名称添加到输入框中, 就能语音控制其他应用程序的启动和关闭。见图2。

6) 更新命令:该命令可以动态更新之前学习的应用程序路径和名称。

7) 学习对话:该命令可以开启一个新窗口, 输入关键词和回复, 即可让应用自动回复你的相关话语。

8) 更新对话:将学习到的对话更新, 并立刻可以使用。

9) 学习城市:将开启一个新窗口, 将常用的城市添加到应用中, 以便查询。见图3。

10) 更新城市:将之前添加的城市更新到应用中, 立刻可以开始查询。

11) 现在关机:将设定1 分钟后自动关闭系统。

12) 取消关机:取消1分钟关机的命令。

4.2 系统的扩展性

系统两种扩展接口:

第一种的接口是通用程序, 其他开发者通过开发一个单独的控制程序或脚本对其软件或硬件进行控制, 具备单一的控制功能即可, 将其通过用户的程序控制指令进行启动和关闭。仅需设定程序的路径, 即可通过语音进行控制。

第二种是需重新编译的, 代码中留有可扩展的余地, 仅需添加一条case语句, 即可添加一个新的扩展功能。与第一种相比, 其灵活性较差。但其可定制性更高, 可根据实际控制的硬件进行开发。

此外, 也可以对其他硬件设备进行控制, 但需要该硬件提供相应的硬件支持, 例如可以通过语音控制对点灯, 空调等家具的开关, 以及GPS定位进行相关服务等等。

5 结束语

在当前的科技潮流和需求的推动下, 云计算的概念逐渐被广大用户和开发者所知晓, 其所倡导的弹性扩展和按需计费的概念也被广大用户接受, 但云本身是高度抽象和庞大的计算机集群, 蕴含着丰富的软硬件资源, 对于整个互联网系统来说, 云更像是大脑。《基于云计算和语音识别的控制系统》通过本地传感器网络结合云计算进行基于语音识别的交互, 展示了物联网和云计算结合应用的冰山一角, 云计算强大的数据处理能力, 和物联网广泛的分布, 合理的应用, 可以将两者的优势充分发挥出来, 让云计算和物联网有机结合也必将是未来的发展趋势。物联网和云计算必定有更多的潜力值得挖掘, 两者的融合也必定能够为未来的智能化提供更多的服务。

摘要:近年来, 随着语音控制的热度逐渐增加, 语音助手的种类也越来越多, 但该类应用通常都是通过语音识别技术来实现对用户指令的识别和反馈。本文所介绍的软件是一款基于云计算和语音识别的控制系统, 和传统语音识别应用不同的在于其语音识别的方式采用了本地语音识别, 结合云计算和物联网传感器进行信息的处理。

关键词:云计算,语音识别,物联网传感器

参考文献

[1]徐燕.物联网云计算平台[J].中国学术期刊电子杂志, 2013:490.

[2]倪一鸣.浅析我国物联网发展中存在的问题与解决办法[J].科技信息, 2012, (3) :157.

[3]王新燕, 范金刚.初探云计算[C].两化融合与物联网发展学术研讨会论文集, 2010:155~156.

[4]王雪茹.物联网技术的特点与应用[J].计算机光盘软件与应用, 2014, (3) :46.

[5]Geoffrey C.Fox Jack J.Dongarra.《Distributed and Cloud Computing:From Parallel Processing to the Internet of Things》[M].机械工业出版社, 2012, 5.

红外线人体感应控制语音系统的研究 第10篇

近年来,智能家居系统迅速发展,各式各样的控制产品层出不穷。如一些公共场所的自动门等红外线人体感应单片机控制语音留言系统与之相似,并具有两大特点:一是从节能的角度考虑,可用于室内的灯等用电器自动断电保护装置上,当人们出门时,用电器自动断电;二是能够判断人进出的方向性。同时受到电话留言的启发,本系统在解决识别人进出的问题基础上扩展了语音留言提示功能,适用于办公室或家庭等的普通门上,对单个人进出的情况进行识别和分析。

1 总体设计

系统设计的关键在于如何对感应产生的信号进行分析和判断,也就是方向性的识别,即人的进出。它是通过对两个红外线人体感应模块A和B采集信号的时间差来实现的,如图1所示。在房间的门里装传感器A,在门外装传感器B。当有人经过时,A先产生感应信号,B后产生感应信号,表示人出;反之,若B先感应信号,A后感应信号,表示人进。同时,系统采用模块化设计,可大大简化硬件电路,并能保证结构的完整性。

2 硬件电路设计

电路整体分为传感器模块,控制模块AT89C51,语音留言模块三部分,如图1所示。各模块功能介绍如下。

2.1 红外线人体感应模块

利用红外线在测试温度和位移方面的应用所设计的。当人体进入检测范围时,测试的温度和位移同时发生变化,此时模块就会发出信号,即1~2的高电平(5 V),见图2。单片机就是对该信号进行判断和处理。该模块具有以下功能:

(1)可选全天候工作,也可选仅在某一时间段工作。

(2)随机延时选择、固定延时选择。

(3)当感应到被测信号时传感器输出高电平,平时保持低电平。电路连接如图2所示。

2.2 控制模块

选用AT89C51单片机,内有4 KB的Flash闪存,128字节的内部RAM,2个16位定时器/计数器,6个中断源,片内时钟振荡器。它对两个传感器的信号进行扫描,判断,记数,并将记数结果通过LED数码管显示,即显示出室内的人数。 当最后一人走出房间时,便给语音模块发出指令,通过语音模块实现语音提醒功能。

2.3 语音模块

由于语音模块属系统的执行元件,实现留言和提醒人做事的功能。它只需10~30 s内短暂录音并且可随时播放。而ISD10、20 s录放模块抗断电语音录放模块广泛用于各种留言、语音报警及提示装置。能够在电源断开的情况下,长期保存信息,又能随意进行录入,完全满足本系统的设计要求。当按住录音键(即REC保持低电平),电路开始录音,LED灯亮。松开REC后,录音结束,电路自动在内部设置段结束标志,然后进入节电状态。 若存储器录满,录音自动结束。放音可采用边沿或电平触发,每放完一段,LED灯闪亮一下(约15 ms)。如图3所示:

2.4 电源设计

由于红外线感应模块所需电源为6 V,语音模块的工作电压为4.5~6.5 V,而单片机控制系统所需电源为5 V,为了使本系统结构紧凑,采用三端固定集成稳压器,型号为MC78L05C,外接三个管脚1,2,3,分别为输出、接地、输入。如图4所示。

2.5 功率放大应用电路

由于语音模块内部已含有功率放大电路,但根据实际系统使用的场所不同,若需进一步放大录音播放的音量,可选用LM386、D2283、D2822等功率放大器。声音信号由SP+或SP-通过电容耦合输入,SP+或SP-不用的一端必须悬空,不能接地。使用LM386作放大器的连线如图5。

3 软件设计

由于系统的核心控制元件是AT89C51单片机,所以程序设计采用汇编语言。其程序结构分为扫描检测,记数显示,控制录放音三个模块。扫描检测程序为主程序,是对传感器信号的采集,并进行分析和判断。红外线人体感应模块的信号输出端与单片机的P1口连接,单片机通过对P1口的扫描来分析判断室内人员的进出。另外,对语音模块的控制也要用到P1口,即P1.2,常态下处于高电位。检测程序的工作状态如表1所示。

记数显示子程序是对采集到的信号进行累加并用LED数码管显示。语音控制子程序的工作过程为:单片机上的P1.2口与语音模块的播放键相连,控制开关。当最后一个人离开时,P1.2口发出一个信号控制播放,由于模块录音时间为20 ms,所以有一段延时程序,20 ms后系统使开关置位。方法如图6。

整个程序流程如图7所示。

4 结束语

本系统在实验室等公共场所的门上进行调试,测试结果成功,验证了对人体运动方向识别设计的正确性。它不仅可用于智能家居的监控系统,也可用于工程生产等领域,解决一些实际问题,为智能监控提供了一种设计方法。另外,现在许多公共场所的节能灯多使用声控系统,需要人为的发出响声。若能用本系统改为感应灯,就更加方便了。

参考文献

[1]胡健,刘玉宾,朱焕立.单片机原理及接口技术实践教程.北京:机械工业出版社,2004

[2]李钟实.实用电子报警器精选百例.北京:科学技术文献出版社,2002

[3]韩江洪.智能家居系统与技术.合肥:合肥工业大学出版社,2005

语音控制 第11篇

关键词:LD3320语音识别;WAP200B无线通讯;ATmega128单片机;鱼体波;51单片机

近年来,海洋资源开发日趋焦点,机器鱼作为一项现代化的新成果,具有广泛的现实意义,它可以更逼真的模拟鱼的游动原理,在水下的运动更符合流体力学原理,具有更好的加速和转向能力,利用它可以探测海洋资源,寻找和检测海域中受污染的地方,也可以用来勘探地形等等。随着科技的发展,人类对智能化产品的研究步伐在不断加快。但是,作为一项比较新的产品,机器鱼的智能化程度还远远不够,伴随着研究的加深,机器鱼的功能也会更趋完善。语音识别作为一门交叉学科,它的出现实现了长期以来人们渴望与机器交流的梦想。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近年来,语音识别技术发展迅速,取得显著进步,并且已经开始被应用于通信、家庭服务、汽车电子、医疗、家电、消费电子产品等各个领域。截至目前,还没有出现针对语音识别系统和机器鱼结合的设计。本文实现了机器鱼和语音识别系统结合的硬件设计。

1 芯片介绍

1.1 LD3320语音芯片介绍

LD3320是一颗基于ASR技术非特定人语音识别的语音识别芯片。语音识别ASR技术,是基于关键词语列表识别的技术。只需要软件编辑好要识别的关键词语列表,并把这些关键词语以字符形式传送到芯片内部,就可以对人说出的关键词语进行识别,不需要作任何录音。比如,在51单片机编程中,简单地设置语音芯片的寄存器,诸如把“ni hao”这样的识别关键词动态地传入芯片中,芯片就可以识别这个关键词语了。并且在同一时刻,最多可以在50条关键词语中进行识别,可以根据场景需要,在终端随时编辑和更新这50条关键词语。另外,芯片上集成了高精度的D/A和A/D接口,并且接有Flash和RAM,只需把麦克风接在芯片的AD引脚上即可实现语音识别/声控/人机对话功能。

1.2 AVR芯片介绍

本例使用ATmega128单片机作为鱼体控制芯片,ATmega128具有以下特点:低功耗的8位微处理器,有133条指令,且大多数指令可以在一个时钟周期内完成;53个可编程I/O口线;128K字节的系统内可编程Flash;4K字节的EEPROM;优化的外部存储器空间多达64K字节;两个带有独立预分频器和比较器的8位定时器/计数器;两个带有预分频器、比较功能和捕捉功能的16位定时器/计数器;两路8位PWM;6路分辨率可变(2到16位)的PWM;两个可编程的串行USART;8路10位的ADC。

2 硬件设计实现

2.1 整体设计方案

语音识别系统识别到语音数据会产生一个中断信号给51单片机,然后单片机通过程序判断语音数据的正确性(可能是噪音),如果正确就通过P0口读取语音数据,并且将数据通过WAP200B无线通讯模块发送给鱼体主控芯片AVR单片机,此时AVR就可以根据命令产生相应占空比的PWM波。整体方案设计如图1所示。

2.2 语音控制部分

M-LD3320进行语音识别时,需要有较高纯净度的3.3V直流电源供电和合适的晶振信号(我们使用了12M正方形有源晶振)。使用51单片机编写程序主控LD3320芯片,来实现语音识别功能。同时必须保证51单片机和语音模块的最终供电电源统一。

麦克风采集到声音,不管是否识别到正常结果,芯片都会产生一个中断信号通过IRQ管脚返回给51单片机,并且将数据通过ICR_P0~ICR_P7传送给51单片机进行处理,然后中断程序要根据寄存器的值分析结果,如果识别成功,就将识别得到的数据通过无线通讯模块发送出去。由于本文在语音模块传送数据给MCU时采用并行方式,所以MD直接接地,如果采用串行方式需要使MD管脚置高。它与51单片机(基于STC89C52)的连接示意图如图2所示。

模块PCB板已经将连接麦克风的引脚接到模块的MIC插座上,所以在连接电路的时候11~19和22~31引脚悬空不用。与51单片机连接时,ICR_P0~ICR_P7(2和33-39引脚)必须连接在单片机的数据总线上,同时需要在P0-P7,以及RDB,MD,INTB,WRB,CSB这些控制管脚上焊接1K/10K的上拉电阻(上拉到3.3V即可),这样可以辅助系统稳定运行。CLK引脚的连接有两种选择:1)直接将51单片机的晶振信号通过导线输入到LD3320的CLK管脚,但是导线不宜过长。2)将正方形有源晶振直接焊接在模块上预留的连接点,此时CLK管脚需要悬空。本文采用的第二种方法。

2.3 AVR控制部分

AVR是鱼体的主控MCU,主要用来控制机器鱼的的动力部分。机器鱼的动力来自舵机,设计关节数为三个,即有三个舵机。每个舵机由十五位的不同占空比的PWM波来控制转动不同的角度,三个舵机需要配合形成鱼体波来控制鱼体摆动。鱼体结构如图3。

鱼体波是利用杆系机器鱼对真实鱼游动形态的拟合,可以认为鱼体波曲线是鱼体波幅包络线和正弦曲线的合成,它开始于鱼体惯性力的中心,延伸至尾柄,其曲线方程可表示为

ybody(x,t)=[(c1x+c2x2)][sin(kx+wt)](1)

式中,yboby是鱼体的横向位移(背腹轴),x是鱼体的轴向位移(头尾轴),c1是鱼体波波幅包络线的一次项系数,c2是鱼体波波幅包络线的二次项系数,k是波长倍数(k=2π/λ),λ是鱼体波的波长,w是鱼体波的频率(w=2πf=2π/T)。

由于计算机控制是一种离散的数字量,鱼体波曲线也需要离散化,所以把时间参数t从鱼体波运动函数yboby(x,t)中分离出来,方程即为

ybody(x,i)=[c1x+c2x2][sin(kx±i)](2)

式中,i表示一个摆动周期内的样条曲线序列的第i个变量;N表示鱼体波分辨率,即在一个摆动周期内整个鱼体波被离散的程度,其上限不能大于驱动机构摆动的最高频率。

为了更好地表征鱼体波动的参数,提高鱼体方向控制特别是转弯过程中的灵活性,在方程2的特征参数基础上,增加波长倍数k相对于x的二次增益,修改后的方程如下

ybody(x,i)=[c1x+c2x2][sin(k1+k2x)x+i)](3)

通过调整k1和k2的值,根据x的变化可以得到更多的鱼体波曲线。同时,在机器鱼的设计过程中,可通过微调身体波参数来增加运动的机动性和灵活性。

根据实际鱼体选择合适的鱼体波参数,通过仿真工具模拟出一个摆动周期内i从0~N的所有鱼体波,就可以计算舵机在各种情况下所需转动的角度,然后就可以设定各个舵机的PWM波占空比,就可以产生所需要的鱼体波。本文设定参数为c1=0.05;c2=0.09;k1=0.5;k2=0.1;N=10的一条鱼体波曲线如图4,直线段为实际中三节舵机配合形成的鱼体波,曲线为理想鱼体波曲线。

使用AVR的USART0与无线通信模块连接。当51单片机通过无线通讯模块将数据传送到AVR时,AVR单片机软件控制会产生一个串行中断,此时可以判断接收到的命令,根据命令改变PWM波的占空比,从而改变机器鱼的游动方向。

2.4 WAP200B无线通讯传输部分

无线模块WAP200B总共有10个管脚:VCC_CPU为MCU电源输入,VCC_RF为RF 短路电源,VCC_PA为RF 功放电源,它们三个管脚接DC3.3V;SET为配置或者正常工作模式选择信号输入管脚,低电平时WAP200B为配置模式,此时串口的数据作为配置指令而不会被传送出去,高电平(3.3V)时模块使能接发功能;RXD/TXD是串口数据从WAP200B输入/输出的管脚,3.3V/5V兼容TTL逻辑电平,RESET为复位信号输入管脚,正常工作接高电平;ANTENNA为天线接口。连接方式如图5所示。

无线通讯模块的TXD/RXD分别与51单片机的RXD/TXD相连,就相当于51单片机的一个串口。在使用无线通讯模块之前,需要配置它的波特率、串口模式、频道以及发射功率(SET置低),两个互相通讯的模块必须保证具有相同的波特率和频道,同时51单片机串口的波特率也必须和通讯模块一致,发射功率可以根据发射的距离远近设定。

3 控制软件设计流程

51单片机是语音芯片的主控CPU,它的软件主要包括主程序,串口初始化(波特率和串口模式设定需要和无线通讯模块一致),语音系统的识别控制,命令数据的发送。51程序流程如图6所示。

AVR是鱼体主控芯片,它的软件主要包括主程序,串口初始化(波特率和串口模式需要同上一致,还设置接收中断打开状态),产生使机器鱼直游的PWM波,无论在什么状态,只要串口接收到命令就会产生中断,就需要根据命令改变PWM波的占空比,从而改变机器鱼的游动方向,需要注意的是在改变PWM波占空比以后,只需要保持此占空比一段时间(该时间段内有可能有新的命令),在鱼体改变方向以后就需要再次将占空比改为直游。AVR控制流程如图7所示。

4 实验结果

此语音控制系统在实验中已经得到实现。我们在51单片机中编辑了“zuo”、“you”、“qian”等命令;在AVR单片机的接受中断编辑了相应命令的PWM波占空比;所有串口通讯参数设置为:波特率9600bps;串口模式为8个数据位,1个停止位,无校验位;频道设置为28;发射功率设为最大(FF)。使用了奥林巴斯ME52 的麦克风作为语音接收设备。

表1是鱼在直游(前)的时候,三个舵机在十个离散周期各自的转角。在转向的时候,前两个舵机偏转,第三个舵机保持不变;在进行“左”转命令时,舵机1和舵机2在直游基础上加上负40°;“右”转时加上正40°。由于舵机转角与PWM波占空比是线性关系,在此基础上,我们匹配了PWM波占空比与舵机转角的数学关系式

PWM=20000-(((jiaodu[j][i]+xiuzheng+pianjiao)*1000)/90+1400) (4)

jiaodu[3][9]是定义的直游时各舵机的转角数组,j是舵机号,i是周期,pianjiao是左转右转等附加给直游时的角度(正负40°);xiuzheng是实际中需要调试的补偿角度。

实际操作中,当发出“左”、“右”、“前”等命令时,机器鱼会立即做出相应的动作。

5 结束语

文中主要介绍了语音识别技术在机器鱼上的应用以及鱼体波的产生原理,实现了语音控制机器鱼的游动方向,相信随着机器鱼的研究深入,可以在语音系统基础上实现更多功能,使机器鱼更加趋于智能化,最终可以为人类探索海洋提供更多帮助和便利。

参考文献

[1] 金钟夫. AVR ATmega128单片机C程序设计与实[M]. 北京: 北京航空航天大学出版社.

[2] 郭峰,彭刚.基于杆系的机器鱼运动控制参数研究[J].武汉:华中科技大学控制科学与工程系,2008

[3] 徐春燕.非特定人连续语音识别的理论、分析和实验[D]. 浙江:浙江工业大学

[4] ATmega128技术手册[Z],2005

[5] 张毅坤.单片微型计算机原理及应用[M]. 西安:西安电子科技大学出版社,1998-9-1

[6] 孟庆鑫.基于AVR单片机的仿生机器鱼控制系统设计与实现[D]. 哈尔滨:哈尔滨工程大学

[7] 喻俊志.多仿生机器鱼控制与协调研究.2003.[D]

[8] 周超.仿鲹科机器鱼的倒退游动控制.[J]. 自动化学报,2008,34(8): 1024-1027.

[9] LD3320开发手册[Z],2009

作者简介

基于凌阳单片机控制的语音小车 第12篇

随着电子工业的蓬勃发展, 各种电子产品和智能设备层出不穷, 在人工智能的领域里单片机的应用有着不可忽视的作用, 其硬件结构与计算机软件的完美结合, 使嵌入式开发得以实现, C语言和汇编语言的相互配合使得软硬件的开发有了更深层次的理念。单片机以其良好的嵌入性能, 结构的简易, 及低廉的价格在电子市场上占有一席之地。

对于智能小车的开发和应用早已成为一项多层次多角度的启发性科研课题, 其可以完成的任务有很多, 大则航空登月的探索采集任务, 小则完成寻迹智能声控等工程及娱乐任务。

1 硬件部分

步进电机作为脉冲电流驱动的伺服执行元件, 通常情况需要环形脉冲分配器的控制, 每输入一个控制脉冲, 就改变一次电机绕组的通电状态。以三相步进电机为例, 在三相六拍控制方式下, A、B、C三相的通电状态转换为:A—AB—B—BC—C—CA—A……, 其波形如图1所示。

如图1所示, 是理想的波形, 电流上升过程中, 绕组电流从0能迅速上升到额定电流, 对于下降的过程来说, 则能从额定电流迅速下降到0, 但是实际情况并非如此。通过公式 (1) 描述其电流上升过程, 通过公式 (2) 描述电流的下降过程:

式中:I (t) —绕组电流 (A) ;IM—峰值电流 (A) ;T—时间常数 (ms) 。

1.1 传统的驱动方式

对于传统的驱动方式来说, 通常情况下包括:单电源电阻限流驱动方式和线性恒流驱动方式等。一相单电源电阻限流驱动方式的原理和线性恒流方式一相主回路原理分别如图2中a、b所示。

1.2 PWM恒流控制

PWM恒流控制方式针对线性恒流方式的缺点作了改进。其原理框图如图3所示。

主控制管使用功率场效应管, 通过1个PWM控制器进行控制。绕组电流上升率基本相同, 由于PWM方式的功耗小, 它可以取更高的峰值电流, 因此可以做到t1<t2。

1.3 功率放大电路

由于单片机的输出端功率远远不够, 带不动直流电机, 所以只能做使能端, 做电机的控制引脚。L293就是典型的功率放大芯片, 由两个输入端的正反相高低电平作为输入, 分别控制直流电机的正转和反转, 而两个输出端直接接在电机的两个引脚上, 实现功率放大的功能。本设计就是利用L293功率放大芯片, 放大功率, 以完成单片机对直流电机的控制。

1.4 电源电路

本设计电源采用集成7805稳压电路, 1脚接12伏电压并需要10欧电阻分压, 且电阻两端分别需要两个并联电容100uf和0.1uf做瞬时电流缓冲电容;2脚接地;3脚输出5伏电压, 且同理也要接两个并联电容100uf和0.1uf做瞬时电流缓冲电容, 如此设计, 图4即为7805稳压电路设计原理图。

2 软件部分

本设计的关键就是利用1k时基中断的调用, 编写一个可控频率和可控个数的脉冲, 以此来控制步进电机的左转和右转的turn函数。再把turn函数加入语音识别中, 完成声控小车转向;同理加入传感器程序, 把turn函数作为判断到传感器的触发信号之后的动作函数, 完成小车遇到障碍物的躲避功能。

3 结束语

小车的机械连动部分还不是十分稳定, 齿轮的咬合偶尔还会出现打滑的现象;轮子和轴的固定都是用手钻打孔, 水平精度不是很高, 连杆的传动轴也是手工打的孔, 用螺丝固定作轴, 摩擦力较大, 还需要进一步调试和改进。

摘要:本设计利用凌阳SPCE061A单片机控制四相步进电机, 完成智能小车前轮的连杆传动, 带动前轮转向;并通过单片机控制功率放大电路, 带动后轮共轴直流电机, 完成正转倒转功能;其间的各种行进控制用语音识别来完成, 包括前进, 后退, 停止, 左转, 右转。在智能车的前端装有两个光线传感器, 可以通过对左右光线的变化识别是否将要碰撞前方障碍物, 进而反馈到单片机进行转向控制, 完成躲避障碍物的功能。

关键词:SPCE061A单片机,步进电机,语音小车

参考文献

[1]李映波.集成电流反馈放大器的应用设计[J].电子技术, 1997.

[2]雷思孝.凌阳16位单片机原理及应用[M].西安电子科技大学出版社, 2004.

[3]罗亚非.凌阳16位单片机应用基础[M].北京航空航天大学出版社, 2003.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【语音控制】相关文章:

语音控制芯片06-18

以英语语音教学为模版的对外汉语语音教学01-25

语音体系05-11

语音教学05-20

语音意识05-26

讯飞语音06-07

语音课程06-10

实时语音06-15

语音平台06-19

语音对比06-22

上一篇:出国进修下一篇:会计人本教育