数字语音技术范文

2024-08-13

数字语音技术范文（精选12篇）

数字语音技术第1篇

关键词：数字语音技术,编码,应用

1 数字处理关键技术

1.1 语音编码技术

语音信号的数字化, 最简单的方法是对其直接进行模/数转换;只要采样率足够高, 量化每个样本的比特数足够多, 则可以保证解码恢复的语音信号有很好的音质, 不会丢失有用信息。对语音进行压缩编码的基本依据有两个:一个是从产生语音的物理机理和语言结构的性质来看, 语音信号是强相关、弱平稳信号, 有很高的冗余度。语音压缩的实质就是识别这些冗余度并设法去掉它们。语音编码的第二个依据是利用人类的听觉特性。首先语音编码利用人耳分辨率有限特性, 不需要对语音样点幅度做精确表示, 即语音信号对于人耳带有过多的信息, 通过量化可以去除这些过多的信息, 从而达到压缩的目的。其次, 人类听觉有“掩蔽效应”的特点, 即当两个响度不等的声音作用于人耳时, 则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受, 使其变得不易察觉。目前常见的语音编码算法有线性预测编码、多脉冲激励线性预测编码、码激励线性预测编码、多带激励编码等。

多脉冲激励线性预测编码算法采用了由多个不均匀间隔脉冲所组成的激励序列, 此算法在10kbit/s的低码率下能产生比较好的语音质量, 但对高基音说话者来说, 其性能通常会有所下降。码激励线性预测编码的算法是利用矢量化的码本, 将激励序列编码。码本中的每一个存储的码字矢量 (简称码矢量) 都可以代替余量信号作为可能的激励信号源。实践表明, 码激励线性预测编码器在4.8-1610kbit/s范围内可以获得质量相当高的合成语音, 是最具有吸引力的语音压缩编码方式之一。多带激励语音编码将语音谱按基音谐波频率分成若干个频带, 逐带分别判断是清音还是浊音, 然后采用不同的激励信号源产生该带的合成信号, 最后将各带相加, 形成全带合成语音。多带激励语音编码是目前低速率语音编码较理想的方案, 在2.4-4.skbit/s的速率上能合成出比传统声码器好得多的语音。

目前, 语音压缩编码技术主要有两个努力方向:一个是中低速率的语音编码的实用化, 及如何在使用过程中进一步减低编码速率和提高其抗干扰、抗噪声能力;另一个是如何进一步的降低其编码速率。目前比较好的算法还有正弦变换编码、混合激励线性预测编码、时频域插值编码、基音同步激励线性预测编码等, 同时还要求引入新的分析技术, 如非线性预测、多精度时频分析技术 (包括子波变换技术) 、高阶统计分析技术等。这些技术更能挖掘人耳听觉掩蔽等感知机理, 更能以类似人耳的特性作语音的分析与合成, 使语音编码系统更接近于人类听觉器官的处理方式工作, 从而在低速率语音编码的研究上取得突破。

1.2 纠错编码技术

纠错编码技术的目的有两个:一是解决由信道噪声所产生的随机性差错, 二是解决由脉冲干扰所引起的突发性差错。

RS码纠错性能分析:RS码是非二进制码, RS码的码字取自GF (2m) , 也就是由0.1、α和α的各次幂组成。RS码不仅能够纠单个随机错误, 还可以纠突发错误。在GF (24) 域中, (15, 11) 码可纠2位错, (15, 9) 码可纠3位错, (15, 7) 码可纠4位错。RS码是多进制码, 而通常在实际系统中用的是二进制码。如何把二进制码与多进制码对应起来?我们以GF (24) 域上的RS码加以说明。首先, 把二进制数据流按四比特分, 将一个二进制序列分为四位一组。这每个四位二进制按照预先编辑好的4一重表示法与α的某个幂值, 即GF (24) 域中的元素一一对应, 把这4位二进制序列可以看成是RS码中的一个符号, 这样, 就可以用RS码来解决我们实际系统中的复杂信道数据传输的纠错问题了。

1.3 自适应均衡技术

均衡的目的是在接收端对于信道非理想特性造成的信号畸变进行补偿, 抑制接收信号之间的符号间干扰, 从而尽可能地恢复发射波形。自适应均衡技术是目前使用较多的一种信道均衡方法。它可以通过发射学习码, 来自适应的学习信道特性, 实时估计信道响应, 以便利用学习阶段得到的自适应均衡网络参数, 对畸变的信号波形进行补偿, 从而得到估计信号。总之, 自适应均衡器是用来自动补偿由于信道的非理想频率特性而产生的畸变, 可以简单地理解成均衡器与信道的传递函数互为倒数, 作用抵消, 从而获得最佳传输波形以消除IS工, 恢复原始信号, 同时使有限的带宽得以充分利用。

2 数字语音技术的应用

近年来, 随着信息技术的发展, 数字语音技术在各领域应用有了突破性的进展, 主要有可视电话伴音、无绳电话机、单路单载波卫星和海事卫星通信、数字插空设备、存储和转发系统、语音信息录音、数字移动无线系统、分组化语音等。

目前, AOL、Lycos与Yahoo对语音识别和语音到文本技术的使用, 限于用声音传送现有内容, 所以用户可以通过电话阅读电子邮件、获取股票报价和新闻或享用其他服务。Yankee集团的分析家兰开斯特认为, 在这一市场中, 大公司具有相当大的优势。他认为:在吸引与留住顾客的这场竞争中, 大公司正设法为自己的网站增添尽可能多的价值。就把电子邮件众多信息服务结合起来而言, 免费提供语音服务就是一种诱惑。为了留住顾客, 这些公司可谓不遗余力, 这是因为它们有能力这么做, 而许多小公司却没有财力投资这类新兴而又有风险的服务。对大多数公司来说, 提供语音服务还颇具风险, 这主要是由于缺乏明确的收入模式。虽然广告似乎是必然选择, 但很多消费者对广告己经大倒胃口。Cahners In-Stat集团在调查了1000名消费者后指出, 48%的人可能会使用语音门户网站, 但如果必须收听广告的话, 只有31%的人仍会选择这种服务。

参考文献

[1]张德辉, 贾琦.数字语音编码技术进展[J].河南科技, 2005.

[2]陈杰.水下数字语音通信系统的硬件设计与实现研究[D].哈尔滨:哈尔滨工程大学, 2003.

高校数字语音室第2篇

为了加速培养适应经济全球化趋势的人才，数字语音室以其先进完善的超强功能为高校外语教学创造了良好的语言环境，是培养学生外语听、说、读、写、译等能力的重要教学实验场地，是进行外语教学、提高学生外语能力的基础设施。数字语音室承担的教学任务也越来越多，如英语听说、德语听说、日语听说、商务英语、综合英语等。除此以外还承担大学英语部分的听说课程，利用率高，任务繁重。在现有条件下如何适应形势、提高数字语音室的管理和维护，显得尤为重要。

一、数字语音室的管理与维护中存在的问题

(一)管理人员技术缺乏

语音室管理人员学历普遍偏低，且许多人员专业不对口，缺乏基础理论知识和专业知识。数字语音室的设备较多，且教学系统都比较先进、功能较为齐全，需要有具备专业知识的人员来实施管理。但目前管理人员多数为非本专业, 业务不精, 管理缺乏科学性, 队伍不稳定,加上人员管理制度不健全或者管理人员自身的业务素质、执行能力不够所造成的管理规定未得以充分执行，都给管理带来了极大困难。基础好、业务精，受过专门训练的年轻管理人员十分缺乏，这大大制约了管理水平的提高。

(二)管理制度不够完善

目前，虽然高校多媒体语音室大都制订了相应的管理制度和规章条例，但由于没有组织学习，也没有严格实施，致使各项规章制度并未真正落到实处，执行力度不够所造成的制度、条例未得能以充分执行。很多规章制度，形同虚设。

(三)系统功能利用率低，大多数功能闲置

目前许多高校新配置的语音室功能先进多样，但由于没有组织教师进行有关技术培训，他们对计算机的操作不熟练，不能真正掌握对语音室的使用。由于大多数老师受到传统教学思想及方法的影响，有的教师把语音室设备简单的当成传统录音机的升级版，对语音室设备的功能不了解，对上机操作不够熟练，出现了多功能系统，单一化使用的尴尬局面。对语音室的低利用率使语音室的设备功能不能得到充分有效的发挥, 很难使语音学习系统发挥其最大功效。

(四)学生故意损坏设备

语音室使用频率较高，往往有个别的学生对语音室的耳机故意损坏，比如，第一种，是由于夏天天气比较炎热，语音室的耳机都有耳垫，个别学生故意把耳垫弄坏然后拿掉。第二种，是由于学生不会操作，耳机声音较小或是有点杂音时，学生干脆不找老师就直接把耳机弄坏。第三种，是学生完全无理由的故意破坏，存属是拿耳机进行发泄，恶意损坏。由于语音室课程安排的比较满，课间没有进行全面检查的时间，所以管理员并不能每次都能准时的发现这种恶意破坏行为，这时就会出现两班的学生互相推诿的现象。

二、关于加强数字语音室管理与维护的建议

(一)建立高素质的语音室管理队伍

要建设、管理好语音室，必须有一支工作认真负责、技术水平高、结构合理并且相对稳定的队伍，这是科学管理语音室的根本保证。在新的教学模式下，语音室是与理论教学平行的教学实体。语音室管理人员的工作成绩，虽然不能表现为独立的成果，但在人才培养活动中发挥着重要的作用。语音室管理人员应切实树立起事业心、责任感，热爱自己从事的工作，充分认识所从事的工作在教学中的地位和作用，努力个人的业务能力。可制订语音室管理人员培训计划，对他们开展多种形式的技术培训，努力提高他们的业务能力。要有计划地安排语音室管理人员参加各种研讨会、交流会、技术培训活动、参观考察活动等，达到激活思想、开阔眼界、提高业务素质、促进自身发展的目的。

(二)建立严格、科学、完善的语音室管理规章制度

建立相应的安全使用操作规程和技术档案，健全完整的语音室管理项目和管理制度。要建立相应的管理办法、操作规程、技术档案、管理项目和管理工作制度，提高管理人员的设备维护技术，加强日常管理与维护工作。对许多高校来说，语音室的排课基本都是比较满的，而对语音室的检修又绝不能占用上课时间，要求管理人员必须采取切实可行的检修计划，要保证设备的检修到位。对于易损坏的设备，例如耳机，应该做到一天一检，及时更换。对于较易损坏的设备，例如总控台、电脑，学生终端机、电源及线路，应该做到一周一检。当然除此之外，还要做好临时故障的紧急处理工作，对于小故障能做到随时解决、大故障不能解决的应及时联系厂家进行解决，把因设备问题而造成无法正常上课的几率降到最低，保证学校课堂教学的进展不受影响。

(三)加强对专业教师进行技术培训

应对使用语音室的专业教师进行专门的培训和指导 ,这是提高语音室使用效率的重要保证。让专业老师充分了解语音学习系统的功能和使用方法，同时掌握一些基本的计算机操作技能 ,熟悉常用应用软件的简单操作。在每学期开学初，对使用者进行一定的培训。通过培训使教师与学生能正确的使用语音室系统和设备，争取做到能自行处理上课过程中出现的一些问题。此外教师还应做好设备使用记录，方便管理人员及时维修。

(四)加强对学生的管理和沟通

分析数字语音室的作用及其应用第3篇

【关键词】数字语音室特点应用

伴随着计算机技术和网络技术的高速发展，数字语音室是创新和发展的必然结果。网络数字语音室在功能上已经完全实现了交互式、自主式、网络化的全新型听力教育课堂，可以很好地把教师讲、学生听的学习模式抓变为学生学、教师导的主动型学习模式。

一、数字语音教室的特点

1. 智能化特点。传统的语音教室都是利用录音机的方式，然后结合线缆和学生使用的主机进行互联，接下来再把音频设备的信号源接进去，就构成教学需要的语音系统。但是录音机在使用的时候会出现磨损和振动等造成的故障问题。但是现阶段最先进的数字语音室基本上没有任何的机械零部件，并且可以在计算机终端上使用语音软件，很好的实现了学生和教师之间的可视化交流和操作，利用鼠标就可以操作，过程很简单，在短时间内实现了数字语音室教育模式。

2. 数字化特点。传统语音教室当中，教师控制端和学生主机端的信息交流都是通过模拟信号传输的，并且模拟信号在传输的过程中很容易受到外界因素的干扰，所以说学生接收到的语音信号经常出现噪音过大、保真效率低的情况。但是数字语音室将噪音降到了最低，并且保证了信号的保真性，在教育过程编辑和录制的时候操作都很简单，缩减了重复工作的量，轻化了教师的工作量。

3. 网络化特点。网络环境中存在无穷无尽的教育资源，因为网络资源可以随时随地更新，并且网络资源涵盖了的范围非常广，为教师和学生都提供了很多的选择余地。但是数字语音室是利用网线将学生终端和教师终端连接在一起形成的局域网，并且可以利用无线网，实现网络资源的搜索利用，为学生和教师之间的信息交流提供基础。

4. 多样化特点。网络教育课堂中的资料非常形象生动，结合音频就可以很好的吸引学生的注意力，可以很好的引导学生进入到最自然最真切的情景环境中学习，身临其境感受到知识的魅力和文化的吸引力，学生学习的效果也会事半功倍，使得学生学习内容更加多样化。

二、数字语音教室的应用

1. 数字语音室对教师教育模式的影响。首先一点，在教育教材控制方面，教师可以使用8套数字化共享教材和5套模拟教材，教师根据学生学习的能力选择不同的教材和教育方式。在数字语音室当中，教师可以根据现场情况随意编排和更改适合学习的组合教材，针对每个小组不同的学习情况下达不同样的学习任务，但是学习目标都是一样。然后在考试测验部分可以添加考试功能、独立试题编辑、同频试题编辑、多元化测验和检测结果分析等，教师在教育过程中可以充分利用数字语音室当中的材料，在选择试题的时候可以很好支持口语测试、听力测试和互动测试等，并且可以执行课堂上的随机检查、随机考试等，将其整合为一张测试卷，利用网络方式传送到学生终端服务器上，让学生作答和思考。在测验结束之后，教师还可以利用不同的方式进行成绩总结和分析，分析的模式有圆柱表、线性图表和列表。教师还可以在控制终端直接控制学生设备的屏幕，为教育加入了一定的强制性。

2. 数字语音室对学生学习方式的影响。第一是在自主学习方面，学生可以从教师给定的试题库当中随意选择适合自己的文字资料、音频资料进行练习和写作方面的检测，还能够利用录音功能对自己的语言表达内容进行录音，生成MP3文件，将自己录制下来的内容和标准内容反复比较，找出自己的不足。第二是在自主学习的渠道方面，学生可以利用网络资源平台在网络中获取大量的辅助知识，学习本课程内容的时候，还能够丰富自己的视野和内涵。第三是在学习进度的控制方面，学生在学习的时候可以根据自身的发展需要，把网络中一些音频资料进行反复的快进、倒退、重播等，提升了学生学习的效率。第四个方面就是在网络聊天方面，在网络聊天中，学生可以和外国友人、专家学者进行英语交流，在实际交流中锻炼自己的胆量，并且加深了自己对英语知识的理解，在交流中看到缺点，针对性的学习和强化。

3. 数字语音室对师生角色互换的影响。数字语音室都是学生为主导、教师为辅导的全员参与模式，在这个模式中存在两个主体，一个是学生是学习的主体，而教师就是引导的主体，在这种环境中，教育过程不再是简单的听说读写译，而是信息交流和师生沟通的互动情景。在教师的引导下，学生可以根据制定网站资源信息学习知识和锻炼能力，根据自身学习知识的方式组合、融化资源，最后形成自己喜欢的知识结构，很好的强化了学生学习的积极性。

总结

通过上述材料的具体分析，结合现阶段我国的教育事业发展速度，终身教育和开放式教育等新生教育事物正在蓬勃发展，并且已经成为英语教学中最好的语音教学方式。我们必须依托现代化的教育模式和先进技术，推动学生个性化学习方式的形成和学习能力的进步。

【参考文献】

[1]龚小琼，李文，王炜立. 数字化语言实验室的实现[J]. 科技广场， 2010（18）：250-253.

[2]王海波.外语网络教学与数字语言实验室的建设[J].中国现代教育装备，2010（8）：116-118.

数字语音技术第4篇

关键词：民用航空VHF通信,数字化,IP网络,移动路由技术

1 数字化的必要性

随着无线通信技术的快速发展,数字化已经在民用商业领域全面普及,现在几乎各种民用无线通信已全部数字化,所以数字化已经成为未来不可扭转的潮流和趋势。对于民航甚高频(VHF)无线通信来说,数字化通信也将会是一个趋势,而且是一个不可阻挡的趋势。

传统的ATC VHF的通信方式,直到目前为止,大部分还局限在模拟通信阶段,如图1所示。

从地面VHF共用系统到机载VHF通信设备再到地面的远端传输链路,几乎都是出于模拟通信以及专线传输方式。例如目前所使用的以FA-16为主用的传输设备传输语音信号时以E&M类型V为接口协议,通过租用运营商的2M专线中继线路进行远端语音信号的传输。同时对于VHF无线通信电台来说,民航所使用的电台,无论是R/S、PAE还是OTE电台,虽然其电台经过技术革新时候已经称之为数字化电台,但是在最终的调制和功放部分仍为模拟的AM调制技术,其无线部分仍然沿用了传统的AM调制方式,数字化所指的只是在内部对于基带信号的处理以及传输所支持的数字化协议,对于这种传统的调制方式来说,不但对于民航118MHz~136.975MHz这19MHz的带宽来说利用率非常低,容量极其有限,而且传统的AM调制方式对于各种频率干扰,尤其是互调干扰更是无法从根本上消除。

同时,从目前所使用的中继传输方式来说,2M模拟中继线路为专有线路,资源占用大,利用率低,成本高,对于未来的发展来说极为不利,虽然其传输的实时性和专用性来说有一定的优点,但是对于数字化传输已经相对成熟的时代来说已经失去了其优势性地位,与此同时,运营商对于2M专用线路的投资已经越来越少,有些甚至已经不再经营2M专用链路的租用业务,所以这种模拟中继传输方式已经处于被淘汰的边缘。

因此,对于未来民航VHF语音通信来说,全程的数字通信方式将会最终取代传统的模拟通信方式,无论是无线VHF传输还是有线的中继传输,都会最终实现数字化工作模式。

2 IP网络技术的应用

随着互联网技术发展的成熟及其应用领域日益扩大,对于民航所使用的语音模拟中继信令E&M类型V来说最终将会被IP网络所取代。无论是IPv4还是IPv6的网络协议版本,语音信号的中继传输都会通过Vo IP的模式进行,从而取代传统的模拟语音传输,这种趋势或者潮流很快就会被应用在民航的语音传输中去。很多VHF电台供应商,如德国Rohde&Schwarz(R/S)公司、英国Park Air Electronics(PAE)公司均生产有供民用航空所使用的新型数字电台,这类数字电台与传输设备的接口可支持IP互联网协议的数字语音传输方式,即Vo IP方式。如果利用这种模式来进行语音信号的传输,其优点是显而易见的,因为这种传输方式利用了现在最为庞大也最为廉价的IP网络互连系统,地面VHF电台将接收到的信号或者由终端区传送至远端地面VHF台站的基带语音信号通过IP网络进行传输,不但降低了购置各种专用设备的成本,也能够使信号传输效率得到提升。所以,在未来的民航发展中smart center&dumb terminal的结构会逐渐被smart terminal&dumb center的结构所取代,从而适合未来数字化数据传输的要求,并且能够更加容易的融入通信技术发展的潮流。

3 移动路由技术在民用航空VHF数字通信中的应用

虽然IP技术已经在民航数据的中继传输中逐渐取得应用,但是在飞行器与地面电台之间的VHF无线信号传输依然延用着传统的AM模拟无线传输模式,而并未使用数字射频技术,也没有实现无线IP网络传输技术。这种传统的AM模拟调制技术对于带宽的利用率非常低,并且对于各种类型频率干扰的防护效果也非常不好。如果将数字射频技术与无线TCP/IP网络传输技术应用于VHF无线传输中,那么将会对整体的空管语音通信系统的性能得到提升。

现在的互联网通信技术中,信号的传输是通过IP地址的Package Switch方式进行发送和接收的,其中继链路是通过网络之间互联的路由器(Router)对数据进行存储和转发的,如图2所示。路由器通过之间的相互通信,建立自己的路由表,并通过路由表对所收集到的数据信息选择最佳路径进行传输进行转发。

基于以上描述的IP网络传输模式,如果将所有这些路由器从固定的形势变成移动形式,同时这些路由器之间的连接变成以无线形式相互级联,那么就可以不仅仅在传输过程中实现IP网络传输模式,而是可以实现VHF语音通信的全程数字化IP传输模式。

对于移动路由器的选择,则可以使用民用航空器来充当移动路由设备的角色以实现存储转发功能。如果向每一个民用航空器分配一个IP地址,那么这些航空器的“身份”就会被确定下来,从而可以实现IP网络的传输形式,如图3所示。

图中所示的虚线为VHF数字频带信号之间的无线传输链路。这种传输方式改变了传统的单纯依靠VHF系统远端台站将信号收集后经过中间的传输设备传至管制中心,然后进行语音的比较和选择模式,而是改为由飞行器之间的无线路由功能将VHF信号通过空中的路由存储转发功能最后传至管制中心的模式。这种数字化VHF语音传输方式较传统的传输方式有较为明显的优势。

首先,能够高效、合理地利用已经存在的资源和技术,减少对专用设备资源的依赖,从而避免不必要的浪费。IP网络技术,包括无线IP网络技术,已经相当成熟,各种技术已经将大量的信息融汇在一个公共的、庞大网络中进行相对独立的传输和应用,而且对网络新增用户和删减用户的操作非常方便,无需添加过多的昂贵设备就能实现;而传统的民航专线网络如果需要增加用户,则需要从远端到中心端增加一整套的设备,其费用相当昂贵,并不利于资源的合理利用。

其次,对于VHF无线通信设备来说,IP数字形式的传输设备由于其小型化和集成化,其设计和生产成本都会大大降低。所以不但只针对于传输设备,而且对于VHF收发电台来说,其成本也会大大降低,极端情况下,一台普通家用电脑和一个无线路由设备就能承担空中的语音通信业务。

再次,能够提高语音传输的有效性和可靠性。对于IP网络的交换技术,数据可以选择最佳的路线进行传输,每一次经过路由器的存储和转发时,下一跳都会再次选择最佳的路径进行传输,因此对于语音的传输每个数据包都会选择最佳路径传输,从而可以更加有效的传送语音信号;而且对于数字频带传输来说,各种不同的信道编码可以减少信号的错误概率并且提高信号的抗干扰能力,所以基于这一点,数字语音传输将会使信号传输更加可靠。

针对于移动路由技术来说,如果要利用该技术来实现民航VHF语音信号的全程数字化传输,则需要通过一系列的技术来将其实现。

3.1 IP地址的选择和生成

如果要将飞行器当做IP网络中的移动路由设备来实现信号的存储和转发功能,那么每一个飞行器都要分配一个自己独立的IP的地址来实现路由功能。由于现在绝大多数飞行器来说都支持S模式的二次雷达工作模式,而且每一架飞行器针对于二次雷达的S模式来说,都会有一个独立的24位S模式代码,这个代码可以作为飞行器移动路由IP地址的一部分,而另一部分则可以由航班的出发地和目的地的机场终端区四字代码构成,将S模式代码和机场终端区四字代码经过相应的算法进行运算处理后,则可以得到飞行器执行此次飞行任务的一个IP地址,将其作为在飞行途中的固定地址对所经过其路由设备的数据进行存储和转发。而当飞行器结束飞行任务后,那么相应的IP地址也可以进行释放,以便可以使资源得到最大程度的利用,从而可实现资源的可重复利用使其更有效而合理。对于每一架航空器中移动路由器的路由表的更新,则可以通过IP网络技术中所描述的方式来进行,其通信和更新可完全仿效目前正在使用的路由器的通信和信息更新机制。

3.2 飞临管制区域信息的更新

对于飞行器执行飞行任务来说,从起飞到到达目的地,中间并不会只经历两个管制终端区,有时可能会飞临三个、四个甚至更多的管制区域,这些飞临的管制区域都会有自己的终端区信息,该区域接管所飞临的飞行器时,需要及时地将该管制区域的信息传送至飞行器,以便对飞行器进行管制。

目前很多面向民用航空领域的VHF电台制造商所提供的电台大多数都支持ACARS数字模式的播报,如德国R/S公司、英国PAE公司等,可以将这些电台以ACARS的工作模式加入到该无线路由技术中。当航空器飞临相应管制区域时,由所处管制区域的ACARS发射机广播该区域的终端管制区信息,包括终端管制区的IP地址、所处终端管制区的扇区区划等。对于终端管制区的IP地址可以是固定的一个或者几个,而相应的扇区区划则可以通过不同的端口号来进行识别,以便飞行器在同一终端管制区域的不同扇区飞行时可以进行区分,这种扇区的划分可以通过NAT技术得以实现,如图4所示。

3.3 无线数字频带调制方式的选择

民航VHF收发电台,无论是机载设备还是地面收发电台,其发射功率是需要达到一定标准的。传统的AM调制方式下,电台在区域管制阶段的载波平均功率为50瓦,而对于数字调制方式下的频带传输来说,发射功率可以实现降低从而对功放要求来说,其设计能够做到小型化,从而使无线数字式收发设备的尺寸小型化。

同时,由于传统的AM调制方式对于民航VHF传输的19MHz带宽来说容量非常有限,不利于大业务量的信息和数据的传输,而且对于资源的利用率也非常低。随着数字化技术的不断应用于民航通信业务中,VHF无线通信的频带传输方式也会向着数字化转变,例如多元相移键控(MPSK)、多元正交幅度调制(MQAM)、甚至正交频分多址接入(OFDM)技术也会应用于未来的调制方式中。这些数字化的频带传输方式不但能大大增加用户的容量,而且对于很多利用传统AM调制方式所产生的各种干扰都能做到很好的抑制作用。

3.4 远近效应

对于移动无线通信来说,各种衰落是造成通信质量下降的重要因素。距离长短会造成功率的下降,多径效应会造成信噪比的降低。对于上面所述的各种数字调制方式来说,无线通信传输中,不同的调制方式有着各自不同的信噪比要求,理论推导可知,阶数越高的调制方式,其星座图中坐落的相点就越多,其所需要的信噪比就越高,以此来获得更高的传输可靠性,如图5所示。

如果所有的数字无线通信设备都使用同一种形式的调制方式,那么则会出现距离较近的两台设备会相互通信正常,信号质量良好,但是对于距离较远的第三台设备也要加入通信,那么由于远近效应的影响,由于功率的下降而导致信噪比的降低从而使通信质量下降,中心站的大部分的信号处理总是会集中在功率较大的距离较近的无线通信设备中而会忽略掉远处的移动设备,这样不仅会使接入设备容量下降,而且也不利于提高通信的可靠性。尤其是在民航通信业务中,如果飞行器充当的移动路由设备只和相邻的路由设备相互通信,而丢掉较远处的信号,那么对于飞行安全是极为不利的。因此,从通信的有效性和可靠性两方面综合考虑来看,在距离较近的飞行器相互通信时,以牺牲可靠性来换取有效性,即使用高阶数的调制方式,如MQAM,而在距离较远的飞行器相互通信时,则以牺牲有效性来换取可靠性,即使用阶数较低的调制方式,如QPSK等。这样就能将所有的信号平均在一个相对固定的信噪比范围内,从而解决由于距离所带来的远近效应,如图6所示。

3.5 数字传输和IP数据交换的时延

对于propagation delay来说,其时延是由自由空间决定的,无论是数字传输还是模拟传输,其时延基本一致。而对于数字信号,尤其是IP交换技术来说,package delay通常会消耗更多的时间,而且时延的大部分时间都会是由数据的打包所消耗的时间决定的。不过值得庆幸的是,现在的IP技术对于这类技术来说,已经能够很好的解决这种由于数字化带来的时延问题,具有强大功能的DSP处理技术能够将处理时间定位在毫秒,甚至是微秒级别。所以,数字化会对时延产生一定的影响,但是现在的IP技术,已经能够很好地解决这一问题,并且能够随着技术的进一步发展,时延问题会得到更好的解决,其传输的实时性会进一步提高。

4 小结

数字化对于民航通信领域来说是未来发展的趋势,甚至在有些传输领域中已经进入了数字化模式。对于民航VHF地空通信领域来说,以IP网络技术为核心的传输模式将会在未来的语音传输技术中实现全程数字化起到关键的作用。移动互联技术在当今的民用通信领域的地位越来越高,应用也越来越广泛,对于民用航空领域的发展来说,能够将这种技术得以应用,也会使民航VHF通信领域得到长足的发展,许多在传统AM调制方式工作下无法解决的问题都将随着技术的进步得到解决,并且也会使通信质量得到提高,对于航空安全也会有实质性的进步。所以,在数字化发展的大背景下,移动路由技术的应用将会是民用航空事业发展的一种趋势,也必将开启民用航空电信发展新的研究和应用领域。

参考文献

[1]EESM 536'Digital CommunicationsS p r i n g 2 0 1 0',K h a l e d B e n Letaief,HKUST.

数字语音技术第5篇

应用MATLAB进行语音信号的处理是与我们所学课程及专业紧密相连的，有着很强的实践性。做这个课程设计的时候，并不是非常的顺利，我也有遇到很多困难。刚开始，我用自己的mp3录制的一个wav文件做语音信号处理，程序始终现实如下错误提示：

??? Error using ==> wavread Error using ==> wavread Data compression format(IMA ADPCM)is not supported.我在查阅了很多资料，在网上也查阅相关信息，花费了大量时间也没找出结果，最后发现在WAV格式的语音文件有两种格式，即PCM格式和IMA ADPCM格式，而在MATLAB中用wavread函数进行语音处理时，并不能直接处理IMA ADPCM格式的语音信号，经过格式转换之后（选择PCM格式），我运行出了正确的结果。刚开始由于对滤波器的滤波原理并不是很了解，于是我又翻出学过的数字信号处理课本，认真研究起各种滤波器了，这才使我明白了大多数滤波器是如何工作地，不再单单只是懂理论，理论与实际相结合是很重要的，只有理论知识是远远不够的，只有把所学的理论知识与实践相结合起来，从理论中得出结论。实验过程中，我感觉到初始语音信号和滤波输出后的语音信号在音色上有一定的差别，这说明了信号在处理、传输过程中有损耗。不管对于什么样的课题，其实也是有很多东西可以发掘的，这需要我们在平时多积累，多思考，只有这样，才能取得更大的进步，才能学有所用，学有所长。

通过这次设计，进一步加深了对数字信号处理的了解，让我对它有了更加浓厚的兴趣。通过这次课程设计使我懂得了，平时的理论知识只有通过自己动手做一个课题，从做这个课题的过程中发现问题，解决问题，这个学习的过程，会比我们平时只通过课堂上听讲得到的知识更加生动立体，跟让人记忆深刻。在设计的过程中，我发现同学间的互帮互助真的很重要。当我们有问题的时候，大家一起讨论，将自己的观点表达出来，当发现别人的观点与自己的不同的时候，我们通过查阅资料找到最终正确的答案，这个过程是互利互惠的。这也培养了我们以后走上工作岗位后的团队精神，对我们以后的为人处世都有很大帮助。同时我们在设计的过程中发现了自己的不足之处，对以前所学过的知识理解得不够深刻，掌握得不够牢固。

数字语音技术第6篇

关键词：小学；英语；计算机；语音室；建设；体会

中图分类号：TP3-4

多媒体计算机网络数字化语音室的优势毋庸置疑，对于提升英语教学有效性具有重要意义。但真正能建设配置多媒体计算机语音室的学校还是为数不多，主要原因还是资金投入不足，相信在教育信息化快速发展的未来，多媒体计算机网络数字化语音室将成為学校装备的一种标准配置。笔者做为一名学校的中层管理者，负责英语学科教学的管理，深感多媒体计算机语音室建设的迫切性和必要性，下面结合多次外出培训的学习体验以及装备条件良好的学校语音室建设现状，浅谈一下小学英语多媒体计算机语音室建设配置的几点体会。

1 多媒体计算机语音室是未来英语教育的一种硬件支撑

以前老版本的语言实验室都是基于模拟信号的系统，就像以前应用的卡式录音机，模拟手机等等，这种传统型语言实验室的系统稳定性较差，音质不理想，大多数为单声道，系统功能单一，教学交互性差，所有的传统型语言实验室在上课后只能闲置，没有任何利用的空间—前几年，本区域的几所学校还保存有老式语音室，但基本闲置淘汰。

而多媒体计算机语音室是建立在计算机网络协议的数据交换的基础上，在现有计算机网络操作环境的基础上，经过硬件的A/D语音数据转换或通过计算机多媒体教室功能软件等进行语音数据和影像资料的传送，实现良好的计算机音乐MP3的良好音质，满足英语教学多样化教学需要。未来的英语教育一定是有数字化计算机语音室的硬件支撑的，这是一种技术发展的趋势，也是教育现代化发展的必然目标，期待这种功能丰富、资源全面、操作简单、互动性强的全新多媒体计算机语音室带给英语教学的无限支撑服务，圆满辅助英语教学，全面提高学生英语听说素养。

2 达到多媒体计算机语音室基本建设与配置，满足教学需要就是最好的语音室

其实，多媒体计算机数字语音室（见图1）就是一个多功能计算机教室，换个角度就是在原有计算机网络教室升级建设成多媒体计算机数字语音室，首先这个计算机功能室是一个计算机网络教室，可在这里进行信息技术教学和网络教研等，在此基础上安装升级多媒体电子语音管理系统或多媒体电子教室系统，就可以转换为功能强大的多媒体计算机数字语音室。

图1

2.1 基础必备计算机数学语音室配置标准。多媒体计算机语音室就是在多媒体计算机功能基本上加上多媒体语文学习系统及配套的硬件：教师主计算机、多媒体语言教学平台、语言通信交换主机、信交换分机、主录音卡座、系统管理软件、语言学习终端、专用键盘、耳机、学生桌、系统电源、主控台、显示器、教师椅、其他语音室设备、功放、音箱等。具体配置情况针对多媒体计算机数字语音室建设的不同需求标准，不能同一而论。

2.2 安装配置好多媒体计算机语言学习系统软件。一般在多媒体计算机教室教师师和学生都安装有多媒体语言学习系统（见图2），教师主控计算机平台使教师和学生之间的交流一目了然。利用数字通讯及计算机联网技术，采用单线时分编码方式连接众多的学生机，简化结构，提高可靠性。并配有双向自动应答方式，实现师生对话。具有可靠的遥控、遥测方式，该方式对每一学生机遥控，能进行故障监测。

图2

3 多媒体计算机数字式语音室功能强大，可实现一对一、一对多或多对多的互动语言交流

（1）具备传统语音室的基本教学功能，如计算机教室的广播教学、2、3、4人小组讨论、示范教学、分班教学、电子举手、监听辅导、跟读与复读等。（2）多媒体计算机平台教学功能：可连接卡座、DVD、录像机、显示器、投影机、视频展示台等多媒体外设，由计算机集中控制播放声音与视频文件，关键是在教师计算机播放的视频资料时声音与图像必须同步，延迟不能超过100ms。（3）学生自主学习功能：大容量听力教材，供学生在空余时间自主选择收听，并可转录到自带的录音机中便于以后学习。（4）变速不变调功能：在保证语音不变调的条件下，语音播放速度+30%可调整，学生终端可自主调速。（5）网络管理功能：将计算机局域网中可实现包括自主学习计费计时功能、考试成绩统计功能、建立学生档案功能、学生认证功能、故障检测功能等。（6）丰富的资源库：可通过多媒体外设把新的教学资料添加到资源库中，可通过对校园网和互联网连接实现资源共享。以上功能可能过于理想化，最基本的功能就是多媒体计算机广播教学，可实现一对一、一对多或多对多的互动语言交流，可对语音和视频资料进行灵活控制，这是最初步的计算机数字语音室的功能需求。

4 加强多媒体计算机数字语音室的管理和维护工作

多媒体计算机数字语音室一次性投入大，使用周期长，所以一定要加强多媒体计算机数字语音室的管理和维护工作，建立健全管理制度和维护机制，像多媒体计算机机房一样专人负责管理，做好日常检查和维护工作，尤其是学生耳麦，这是计算机易损件，特别是接头或连接线位置造成接触不良。做为一项学校的重大资金投入，只有严格做好管理、维护、维护、保养工作，才能确保多媒体计算机数字语音室的应用率和开出率，真正为英语教学服务。

综上所述，多媒体计算机数字语音室是学校英语教师和学生的一种迫切需求，它带给英语教学的质量提升效果显著，因此，加强多媒体计算机数字语音室的建设和配置工作，才是未来英语教学的硬件技术发展的终极目标，让我们期待这一美好英语教学时代的到来。

参考文献：

[1]魏艳.多媒体语音室布局新探[J].才智，2012（19）.

[2]夏玉宏.多媒体语音室的科学管理[J].教学与管理.2005（27）.

作者简介：侯贺（1975.10-），女，吉林人，中级教师，研究方向：小学英语与信息技术整合，教材版本：PEP版本。

基于数字语音卡的智能语音外呼系统第7篇

电信公司的外呼需求是各式各样的。为适应本地网层面外呼的需求, 开发了本系统。系统设计的理念就是通用的外呼, 目前用于外呼的语音为手机用户余额不足的语音提醒。

系统硬件采用的是工控机+TWI-8E1A数字中继语音卡+后台数据库 (oracle) , 软件使用pb开发完成, 由通信子系统 (实现外呼后台服务) 和策略子系统 (负责外呼策略配置、各策略外呼数据导入以及查询统计等) 组成。一块TWI-8E1A数字中继语音卡最大支持8个2M电路, 按每个号码外呼耗时60秒计算, 系统的外呼能力为每小时呼出8×30×60=14400个电话。

2 数据支撑子系统

语音外呼子系统设计成一个通用的模块接口, 根据加载的数据直接外呼。数据支撑子系统提供需要外呼的手机数据, 并同步语音外呼系统的外呼结果数据, 提供外呼的结果查询及必要的数据分析功能。

数据支撑子系统的ETL通过PERL+SQLPLUS开发完成, 使用操作系统自带的“计划任务”定时抓取计费系统的余额不足及缴费短信提醒数据, 加载数据给语音外呼系统, 同时对外呼地结果进行分析, 统计出外呼数据的接通率、缴费率、接听用户的结构, 并回传给语音外呼系统, 修改外呼策略, 最终进一步提高余额不足用户的缴费率, 从而减少欠费、提升用户感知、增加企业收入。

3 外呼策略模型

(1) 由于计费系统的余额数据非常复杂, 本地直接通过余额账本判断取数过于复杂, 而且无法保证数据的实时性, 一致性。数据来源直接取自计费自动给用户发的余额不足提醒短信的数据。数据来源和计费系统的提醒服务保持一致, 保证数据的准确性和实时性。如图1所示。

(2) 根据用户的计费服务规则过滤掉不必外呼的数据。剔除:免催免停用户、余额不足的短信提醒已经失效、后付费用户。以上用户由于性质的特殊性, 不需要对用户做及时的提醒。

(3) 根据数据分析设置阈值, 对于高于此值的提醒用户不予外呼。

(4) 实时剔除已经有缴费短信提醒的用户, 以免对及时缴费的用户造成过扰。

4 语音外呼系统架构

(1) 数据支撑子系统通过管道送数据到语音外呼接口。

(2) 配置外呼策略, 所有话路根据外呼策略自动外呼, 外呼策略的目的是提高用户的接听率。

(3) 使用一块TWI-8E1A数字中继语音卡最大支持8个2M电路, 每个2M电路有30个话路, 系统可以同时外呼240个用户。

数字视频在线语音讲解系统第8篇

盲人因特殊的视觉障碍,无法欣赏影视艺术。当一个盲人观看电影时,必须有一个人随着剧情的发展给他讲述故事情节的发展。美国教授格雷戈里·弗雷泽对此感触很深,于是他创造了一种描述影像的理论:听视法。这种方法就是把人物、光线、布景、空间和场景分解,与对话进行同期录音。有了这套听视系统,盲人戴上一个装有红外线的头盔就可以独自一人去看电影了。

国内,还没有专门针对盲人研制类似的系统。2004年,北京的王伟力(又被亲切地称为大伟)开办“心目影院”,做盲人的眼睛,通过其娓娓道来的讲述,让盲人朋友看到精彩的电影。“心目影院”的故事经新闻联播报道后,在全国各地引起强反响,各地涌现出了许多类似的“心目影院”。

无论是国内或者国外的解决方案来说,均存在一定的不足,不便推广。

国外的视听系统需要相关的片源及硬件播放设备支持,成本较高,不便推广。

国内的“心目影院”虽然对片源及硬件播放设备没有什么特殊的要求,但由于对影片讲解者的素质有较高要求,且对于欲讲解的影视节目,讲解者需提前观看、准备,讲解时又受讲解者自身时间、地点、体力等因素制约,不能满足盲人朋友即时、个性化的影视欣赏需求。

目前,互联网宽带已进入千家万户,大街小巷网吧遍布,宽带影视伸手可及。而TTS语音合成技术又相当成熟,我们完全可以借助TTS语音技术实现宽带影视作品的自动讲解,也就是说利用TTS语音技术来代替“心目影院”的讲解者,来实现宽带影视作品的计算机自动讲解。

1 TTS语音技术

TTS(Text-to-Speech)语音合成又称为文语转换,是指计算机可以自动把输入的文本信息转换成语音的技术[1]。Microsoft、NeoSpeech等均推出了技术成熟的SDK开发包,Microsoft Speech SDK(5.1)开发包提供了英文语音合成引擎(TTS),支持C++、VB及Web编译开发环境,中文、日文的语音合成引擎需要另外下载安装SpeechSDK51LangPack.exe文件。[2]比较而言,NeoSpeech提供的中文Lilly(女声)、Wang(男声)语音库,更为丰富,最为流畅。考虑到Microsoft windows操作系统的市场覆盖面及NeoSpeech语音库的流畅性,我们采用Microsoft Speech SDK 5.1开发包与NeoSpeech的Chinese(Lilly、Wang)语音库相结合的技术来进行本系统的开发。

系统调用ActiveXObject对象,通过var VoiceObj=new ActiveXObject("Sapi.SpVoice")方法产生Sapi SpVoice对象VoiceObj。VoiceObj对象使用后,通过delete VoiceObj方法清除VoiceObj对象。VoiceObj对象通过VoiceObj.GetVoices().Item(i)方法取得语音引擎的Item序列号,通过VoiceObj.Voice方法设置语音引擎的具体类别(英文男声、英文女声、中文男声、中文女声等),通过VoiceObj.Rate方法设置或取得语音的语速,通过VoiceObj.Volume方法设置或取得语音的音量大小,通过VoiceObj.Speak方法进行文本到语音的转换输出。

影视作品播放时,是按顺序一个画面一个画面显示,这一个画面称为一帧。我们可以对影视作品进行“视听转换”处理,建立起影视作品的“视听转换”信息数据库,保存相关帧的需要讲解的文本信息。播放控制单元利用TTS语音合成技术,在相应帧位置处播放相应的“文本信息”,完成影视节目的“视听转化”,从而来实现宽带影视作品的自动讲解。

2 需求分析

系统参与者包括常人即视力正常的明眼人,以及盲人用户。常人可根据盲人朋友的需要,进行个性化的语音设置、音量设置、语速设置等系统设置。盲人朋友选择视频,播放视频,系统根据相应的语音、音量、语速等系统设置,对盲人朋友选择的数字视频进行在线语音自动讲解,实现系统功能。系统总体用例图如图1所示。

3 系统设计

FLV是随着Flash MX的推出而发展起来的一种新兴视频格式,它的文件小,加载速度快,FLV视频是当前互联网视频的主流视频格式文件。为支持FLV视频格式,系统通过Adobe Flash CS4技术,将选择欲播放的视频功能封装在一个flash文件flvplay中,系统参与者即盲人用户仅需通过上、下方向键即可选择欲播放的视频,并向web窗体发送FSCommand消息[3]。web窗体通过Internet Explorer的挂钩及DoFSCommand(command,args)处理Flash影片中的所有FSCommand消息,调用VoiceObj.Speak方法输出语音提示信息,告知盲人用户当前所选择的视频的名称,盲人用户可通过回车键,播放所选择的视频。播放过程中,flvplay向web窗体发送当前视频帧的帧数据FSCommand消息。web窗体通过Internet Explorer的挂钩及DoFSCommand处理获取的当前视频帧的帧数据FSCommand消息,在数据库中检索对应的讲解文本,调用VoiceObj.Speak方法输出即时讲解语音,实现系统功能。系统总体程序流程图如图2所示。

4 系统实现

NET Framework是微软用于Windows的新托管代码编程模型,它将强大的功能与新技术结合起来,用于构建具有视觉上引人注目的用户体验式的应用程序,实现了跨技术边界的无缝通信,并且能支持各种业务流程。本系统即采用.NET开发平台,asp.net结合jsp、JavaScript、ajax、flash等技术,配合SQL数据库,完成系统功能。相关程序代码如下:

5 总结

数字视频在线语音讲解系统,在线播放flv视频,借助TTS技术,为盲人朋友动态语音讲解视频,做盲人的眼睛,满足盲人朋友即时、个性化的影视欣赏需求。

参考文献

[1]袁嵩.一个TTS系统的实现方案.计算机工程与应用,2004,(21).

[2]李禹材,左友东,郑秀清等.基于Speech SDK的语音控制应用程序的设计与实现.计算机应用,2004,(06).

探讨数字化多媒体语音教学第9篇

数字化多媒体语音教学需要在一个教室里将学生单元、教师计算机和多媒体中央控制器等通过网络连接, 见图一系统连接图, 见图二学生终端连接。教师播放教学课件、视频、语音等教学节目通过网络给学生, 并且可对学生进行遥控辅导或让学生作示范, 实现计算机教学。

其实数字化多媒体语音教学采取的是信息化教学, 目的是为了教学效果的提高。这种信息化教学彻底突破了非人性化特点的只作单纯教学工具的传统语音室教学, 而信息化教学是符合教学习惯, 它包含丰富实用的教学功能, 丰富的学习资料, 并结合科学的辅助教学思想, 帮助老师教学, 帮助提高教学效果, 帮助学生提高学习效率。

1 实现数字化多媒体语音教学的三种方法

1) 采取纯硬件方法, 给计算机安装上多媒体硬件, 在计算机与计算机之间直接铺设非计算机网络多媒体的线路, 用之传输音频、视频, 再配上用于教学控制的操作面板。在计算机网络发展的今天, 这种方式大大落后, 它存在安装复杂、不可升级、成本高、维护困难等缺点。2) 采取软硬结合方法, 在纯硬件方法上再铺设网络, 软件部分参与数据转储、教学控制等。这一方式除了有纯硬件方法的缺点, 还增加了系统成本。虽然上述两种方法不需要太高的计算机配置、不依赖操作系统等优点, 但随着计算机网络性能、网络速度的提高以及网络操作系统的统一化趋势, 硬件方式的优势将日益弱化, 硬件多媒体语音教室将逐步被淘汰。3) 采取纯软件方法, 在纯软件构架的数字多媒体语音教室中, 教师和学生计算机通过标准以太网连接, 系统采用流行的tcp/ip协议, 实现语音、屏幕、视频的全数字传输和控制, 无需任何额外硬件终端或硬卡, 具有成本低、安装维护简单、开放性兼容性好、容易升级等优点。同时随着计算机及网络性能的提高, 系统运行速度将进一步提高。另外, 在语音教学上, 纯软件采用虚拟显示驱动, 实时性好, CPU占用低, 在局域网内能取得很好的效果, 并且几乎消除降低了硬件所带来的物理噪音。纯软件数字化多媒体语音教学是发展方向。

目前, 各级各类学校都配备有计算机教室, 并且绝大多数都是多媒体网络教室。而在语言教学方面, 均普遍存在原有模拟语音教室更新换代, 或者面临新的教学需求, 需要配备相当数量的新的语音教室, 相对于模拟语音教室故障率高, 设备淘汰过快, 维护麻烦的情况, 纯软件语音教室具有功能强大、便于维护、支持多种外语教学媒体资源、方便教师授课的任意分组教学、讨论、监视等多种优点。全数字多媒体语音教室, 具有以下多个方面的特点:

2 专业的数字语音质量

为了实现语言教学的核心功能, 纯软件语音教室的语音质量至关重要, 辅以全新语音处理算法, 令语音更加清晰真实。

3 优势功能

3.1 课堂教学

1) 广播教学:将多媒体教学中的最常用的“广播教学”功能应用到了数字化多媒体语音教学当中, 主要功能是广播教师机的屏幕, 可以直接把教师机屏幕清晰流畅同步的广播给所有的学生, 学生电脑可以以小窗口方式显示广播内容。实现教师机对学生机的广播、监控、语音教学等操作。2) 对讲、示范、监听:教师主控机能与任意终端学生对讲;教师和学生对话时, 能将对话内容广播示范给其他学生;教师教学过程中可插话讲解;教师主控端可显示学生终端的呼叫;教师可监听学生的讨论内容。3) 屏幕广播:实时性好, 可直接广播视频画面并传送语音, 将上课时教师机的屏幕画面及语音广播给学生机。4) 分班教学:可轻松实现合班授课或个性化分班教学。5) 分组讨论:分组不受人数的限制, 可以把任意人数分为一组。而且小组成员可以任意组合, 可以固定分组, 也可以系统随机分组, 教师也可以手动分组;可以实现自动分组、按行分组、按列分组、相邻学生分组、高级分组等分组模式。分组布局可以进行保存, 方便下次使用。6) 多频道广播:学生分组后, 每组完成不同的教学任务。7) 聊天室:课堂上教师建立不同的聊天频道, 学生自由选择交流。8) 抢答:强调教和学的乐趣, 再现课堂的生动。9) 复读教学:视频跟读、再利用波形比较。10) 全程录音:课堂教学的录音, 可以回放, 以便于学生复习。

3.2 个性化自学

学生终端一般支持影视资料点播, 可以点播本地资源服务器及校园网上任一共享资源服务器中的图、文、音、影和其他教学课件。学生通过终端显示器收看。学生自测 (自主考试、自动阅卷) 。可进行数字化录音。

3.3 无纸化考试

支持口语考试、听力/标准化考试、随堂测试、AB卷考试, 口语考试支持全班同时录音, 实时音频压缩存储。考试功能支持时间控制。

基于标准以太网的数字语言学习系统提供完善的网络考试解决方案, 能够自动阅卷、评分、打印及单卷分析, 支持多卷面文本考试。

3.4 口语考试

可进行问答式或讨论式口语考试, 并进行多人录音, 以音频格式存储在教师机上。

3.5 电子备课

教师可调用多媒体资料进行编辑, 制作电子教案及电子试卷, 专门开发的信息管理系统方便教师调用多媒体资料进行编辑, 制作电子教案及电子试卷。

3.6 同声传译

不同频道的同声翻译和自主收听。

3.7 局域网功能

资源共享功能, 教师机及学生终端采用标准以太网星型结构互连, 使用标准的以太网交换机及超五类网线, 教师机可登录因特网及校园网, 学生终端可登录到校园网的资源服务器上自由点播音、视频及文本资源统一管理功能, 终端登录过程自动显示, 登录状态及时反映到教师控制界面;计时、实名显示, 提供设备使用日志。专门开发的信息管理系统提供学籍管理、成绩管理以及实验管理性数据。提供相应的接口供管理人员打开、浏览、删除数据远程控制功能, 一个教师可同时给几个班级上课。

3.8 丰富的扩展接口

系统可接入录音机、影碟机、数字视频展台、投影仪、摄像机等多种设备, 并且通过多媒体中央控制器集中控制, 切换方便。

3.9 数字化音、视频资料库

丰富的音、视频资料库极大地满足了教学需求, 扩充、更新容易。

3.1 0 系统管理功能

终端登陆自动显示, 终端实名显示, 学生认证, 辅助记费, 多媒体课件的编辑、上传、管理。

随着现代科学技术的飞速发展, 数字化语音室凭借多媒体技术在教学应用方面具备了无可替代的强大功能, 成为现代教育推崇的教学设备, 语音教学是现代化教学手段之一, 它实现了从外部音频、视频设备、本地资源库、校园网等广播多媒体资料的功能, 提高了语音教室的利用率, 辅助了学生学习和使用。由于新科技的发展, 数字化多媒体语音教学领域在近几年来有了许多突破, 是新产品的代表, 正被商业和教育热切关注。

参考文献

数字语音技术第10篇

报业数字交互语音媒体作为报业运营的一种数字新媒体,报业一定会把握好这个新媒体的政治属性和文化属性,创造良好的社会效益。在保证社会效益的同时,报业还必须关注这个新媒体的经济属性兼顾其经济效益。事实上,经济效益的好坏往往是这个新媒体能否健康发展的决定因素。

呼叫中心一般都是一个企业或单位的“成本中心”,如何使这个“成本中心”变为“利润中心”,本文就数字交互语音媒体的信息服务和赢利模式进行探讨。

数字交互语音媒体的特点和提供的服务

社会公众对信息和知识的需求是多种多样的。数字交互语音媒体以满足社会信息和知识需求为出发点和落脚点,这就要求数字交互语音媒体依据自身条件,为社会提供多种多样的信息和知识服务。

数字交互语音媒体推出一项完善的服务功能是一个艰巨复杂、日积月累、循序渐进的过程,但真正踏踏实实做起来也远没想象的困难。为开展一项业务,首先要搜集整理学习并掌握这项服务的相关理论和知识,按照数字交互语音媒体的架构,建设该项业务所需的信息和知识仓储系统、知识转换系统和交互系统,其次是对座席人员进行系统培训。

囿于条件所限,对那些一时难于建设信息和知识仓储系统的业务,我们可以充分利用互联网的资源来开展。对有些业务,数字交互语音媒体还可以充分利用丰富的社会资源,与社会专业部门或职能部门合作共建来开展。

虽然数字交互语音媒体可以提供很多信息和知识服务,但它也有其自身的局限性。比较突出的是,它对提供系统信息和知识服务是比较欠缺的。我们很难想象人们通过它来学习数学、语文或其他任何一门系统知识。数字交互语音媒体的优势在于信息和知识的查询、业务咨询、信息中介等。我们对数字交互语音媒体应该扬长避短,依据自身优势来开展服务。

对繁繁总总的事物,人们都要进行梳理和分类。对数字交互语音媒体提供的服务我们也想进行详细的分类,但由于数字交互语音媒体的服务是包括人与人直接实时互动的信息服务,一次信息服务可能会包括很多类型的信息服务,这使分类变得十分困难。比如有人询问某一公司的招聘情况,这是一次典型的查询服务。由于该公司招聘行为已结束,他极可能会问是否还有其它公司在招聘,座席人员据他的要求提供一些相近的招聘情况后,还提供一些非常有建设性的就业参考。根据具体情况,座席人员甚至可能给他提供一些关怀。其实上面这样一次完整的信息服务,包括了信息查询、业务咨询、业务指导、人文关怀、中介服务和广告服务等等。

机械地划分信息和知识服务类型的意义并不大,问题的关键是数字交互语音媒体要能为公众提供符合他们需求的、高质量的、全面的、综合的、系统的信息和知识服务才是问题的根本所在。

数字交互语音媒体面向社会可提供的主要服务有:新闻信息查询、公众信息查询、法律咨询、综合调查服务、广告投放效果追踪、行风评比、社会投诉、旅游咨询、公交车次航班查询、政策法规查询、健康医疗咨询、票务服务、饭店和酒店查询及预订、家庭装修咨询、求职招聘、房产中介、家政服务、产品咨询、商家销售咨询、分类广告、影院放映信息查询、诗词查询、字词查询、英语语句翻译、谜语谜底查询等等。数字交互语音媒体还可以提供很多纯公益性的社会服务,如寻亲热线、失物招领等。遇到重大活动或遭遇突发事件,数字交互语音媒体还可以作为政府或社会的热线电话。

赢利模式

国内今晚报、扬子晚报、河北日报、文新集团、现代快报等多家报社的呼叫中心或数字交互语音媒体都探索了大量的可操作的赢利模式,如通信费分成、电信增值、电话销售和配送、座席外包等等,并取得了良好的效果。

每个报社自身的实际情况千差万别,每个报社所处的环境各式各样,适合某一报社的赢利模式多种多样,非要给出一个统一的、固定的赢利模式是不现实的。数字交互语音媒体的赢利关键在于创新,下面我们举三个简单的例子来说明如何从业务活动中觅出商机,愿能给大家带来一些启发。

业务咨询类

随着人民生活水平逐步提高,很多家庭的住房得到改善,家庭装修成为人们生活当中一项重要的活动。家庭装修涉及风格的选择、整体设计、材料的遴选和采购、施工等方面,它是一个复杂的“系统工程”。

家庭装修市场上,瓷砖可谓琳琅满目,价格迥异,质量也参差不齐。劣质瓷砖不仅质量差,有些瓷砖的辐射可能超过国家标准影响民众的健康。对这些琳琅满目的瓷砖,一般家庭一时是无法甄别其良莠的。所以社会和公众对家庭装修咨询是有殷切的需求。

数字交互语音媒体把家庭装修的综合知识、家庭装修产品的质量、价格、销售网点、售后服务等情况搜集整理,建立家庭装修咨询的信息和知识仓储系统,对座席人员进行了系统培训后,就可以开展惠民便民的家庭装修咨询。

在某次家庭装修咨询中,民众询问瓷砖相关情况。依据仓储系统的支持,座席人员为民众提供瓷砖质量等级、销售价格等详细情况,并把适合当地条件的、符合当前家庭装修趋势的、性价比高的产品作为建议性的意见提供给民众。

从上面咨询的过程中可以看出,在为百姓提供优质的咨询服务过程中,数字交互语音媒体可以挖掘出很多商机。只要我们的服务能得到老百姓认可和拥戴,那么瓷砖的生产厂家、销售网点,甚至家庭装修施工单位都会愿意与数字交互语音媒体合作,实现双赢。如果报社拥有家庭装修公司,甚至可以把业务延伸到家庭装修服务。

一般情况下,数字交互语音媒体可面向社会提供健康咨询、法律咨询、产品咨询、出行旅游咨询等业务。在向社会提供这些咨询的同时,可以向社会推介信誉好、质量好、服务好的医院、律师事务所、产品生产经营厂家、旅游公司等,在架起供需双方交流沟通桥梁的同时,还可以收获相当的经济效益。

中介服务类

中介在社会中起着合理调控社会资源、促进社会资源利用最大化的重要作用,是我国市场经济中非常重要的组成部分,是非常有发展前途的朝阳产业。中介最突出的作用就是桥梁和纽带作用,而这正与数字交互语音媒体的优势相契合。数字交互语音媒体可开展求职招聘、劳务、家政、房地产、二手交易等中介信息服务,下面我们以求职招聘中介信息服务为例来说明。

相对于报纸的招聘或求职广告,数字交互语音媒体的求职招聘信息中介服务具有明显的优势,一是它提供的求职招聘是24小时的实时服务;二是无论招聘方或是求职方,只要拨通电话说明需求后,他获得的是数字交互语音媒体提供的人性化的主动服务,而不需要花很多时间在报纸上搜寻信息并进行遴选和甄别;三是在计算机信息系统的支持下,它提供的服务是针对性很强的个性化服务;四是由于数字交互语音媒体是信息产业链的最上端,相对于报纸广告,它的费用低但效益高。考虑到求职招聘的市场规模,只要服务做得好,即使只从招聘方收取合理的费用,这项业务的经济效益也会十分明显。

当前国内规模化、综合性的中介公司还不多,报社可以根据自身情况和发展的目标,在数字交互语音媒体平台的支持下,有选择地直接开展一些中介业务,拓展报业的产业链条。

公众信息查询类

民众需要了解和获取的公众信息很多,但到目前为止,社会上没有一个机构可以提供较为全面的公众信息查询服务。数字交互语音媒体开展公众信息服务既可以便民惠民,也可以从中寻觅商机。

我们以影院放映信息查询为例子。晚饭后我们想到某电影院看场电影,先要查询电影院的电话,可查询到的极可能是影院的办公电话,且下班后早已无人值守,最后几经周折才能查询到影院的放映信息。如果数字交互语音媒体能提供影院放映信息服务的话,它的电话号码家喻户晓,而且是24小时随时可以提供咨询,优势自不待言。在实践中我们发现,只要我们牢固树立为民服务的意识,把服务做好,影院是非常乐意提供合适的费用进行合作。

产业拓展

数字交互语音媒体拓展产业链有两个扎实的基础,一是报业拥有丰富的信息资源,二是报业具有巨大的品牌价值,三是报业拥有别人不可复制的媒体群优势。

数字交互语音媒体在做好各类信息服务的同时,必然会聚集大量的、实用的、有价值的信息。这些信息除了自己本身拥有价值外,它可以衍生出很多的价值,大量汇聚的信息可以成为报业产业发展的倍增器。

国内报业集团的品牌价值一般都是以10亿人民币为单位计算,但这巨大的品牌价值在合理有效物化之前都是虚拟的。品牌只有与产品生产、销售或服务等业务活动有机结合起来,并完成其营销过程,品牌价值才能得到体现。

数字交互语音媒体的经营活动中,要充分利用报业的社会影响力和公信力,对那些有益社会的、积极的、能带来经济效益的、有助于报社品牌提升的业务活动都要大力扶持和支持,实现报社品牌价值的转换。

数字交互语音媒体在做好信息和知识服务的同时,依据数字交互语音媒体的技术优势、信息优势,结合报业拥有的媒体群优势,大力推进报业产业链拓展,以信息化带动报业产业链的延伸和扩大,比如开展实际的业务咨询、配送、社会服务、中介、票务等业务活动。

数字交互语音媒体的发展

如上面所述,数字交互语音媒体从开展的业务中都可以挖掘出很多商机,但要实现规模化的赢利,需要做到以下几点:

1、数字交互语音媒体从外部看,它必须要具备这样的特征:它提供的信息和知识既是准确的、可信的、细化的、概括的,又是优化的、系统的、全面的。

2、从内部看,数字交互语音媒体必须以服务社会和民众为其根本宗旨,以先进的理念和文化为依托,开拓创新,以健全高效的体制和机制按其发展规律来运营发展。

3、报业必须高度重视数字交互语音媒体的发展,把它当成报业新兴媒体、新产业、新经济增长点来培育发展,尤为重要的是大力促进报纸、网站和数字交互语音媒体相互协作和支持。

数字交互语音媒体和平面媒体具有很多共性,只要我们能越来越多地向社会提供及时、准确、有价值的信息和知识,对社会的贡献越来越大,在社会政治经济生活中的影响越来越大,获得的经济效益就会愈来愈好。

结束语

外语口语训练中语音识别技术研究第11篇

【关键词】外语口语训练语音识别技术关键技术研究

一、引言

随着我国外语教学的不断发展，各种外语口语教学工具与学习方法也应运而生。然而外语口语的学习对于学习者而言既是重点也是难点，当前的计算机辅助教学只是侧重于外语单词记忆教学与语法教学，并且因为外语口语学习者的学习水平不一，在学习过程中很难将自己的不正确发音找出来。于是，在外语口语学习中就可以应用语言识别技术，该系统具备外语口语发音的纠正功能，学习者通过该系统进行外语口语的学习与练习，就能纠正自己错误的发音，避免因为多次错误发音而形成不良习惯。因此，对外语口语训练中语音识别技术进行研究，能够提高外语口语学习者的学习效率。

二、外语口语学习中语音识别技术应用的重要意义

随着中国改革开放程度的深化以及全球经济一体化的飞速发展，世界各国的交往越来越频繁，学习并掌握一门外语，对于人们的工作与生活而言，已经成为必不可少的工具。在学习外语的需求不断增长的情况下，出现了各种外语教学方法、教学工具以及语言学校等，然而国人在外语学习过程中，外语的口语教学与学习一直是较难突破的难题，其主要原因有以下几个方面：

（一）各种外语发音的特点与汉语发音的特点存在较大差异，因而可能导致国人在学习外语时由于受到母语的深厚影响而犯下许多自己根本无法察觉或者是很难察觉的发音错误。

（二）目前在国内合格的外语口语教师还是很少，自己发音标准又能够准确地指导别人进行口语学习的外语教师，即便是在一些大中城市的中小学中也相当缺乏。同时，一般的媒体教学也不能够针对学生的特定情况，有效地让学生与教师互动进行口语训练，只能够单方面地进行传授，所以起到的作用也不是很有效。

外语口语训练中语音识别技术的应用，让软件具备了矫正错误发音的功能，能够为学习者及时改正错误的发音提供帮助，从而有效避免错误反复而变成一种恶性习惯，并使外语学习者口语学习的效率与效果得到一定程度的提高，获得更大的市场价值与社会效益。

三、外语口语训练中语音识别的关键技术

（一）语音识别

在语音识别技术中，语音识别是第一步也是最重要的一步，接下来几个步骤的精确度都会受其影响，它能够在语法与音素模型的基础上，将输入的语音信号翻译成单词串。同时，许多基于计算机的语言训练活动都可以应用这一部分，比如基于语音的选择题或者是与计算机的对话训练等等。

（二）语音评分

在基于语音识别技术的外语口语学习系统中，语音评分技术是最基本也是最核心的组成部分。语音评分技术能够评价并反馈学习者的口语发音情况，可以让学习者通过反馈的结果对自己的学习结果进行检查。通常情况下，按照语音评分技术，目前的外语口语学习系统主要可以分为两种：一种是基于语音特征比较的评分方法，它通过将学习者的发音与标准语音进行对比参考，从一个较为主观的角度对一段语音质量进行评价，通常采用动态时间规整技术实现，因为其具备运算量小的特点，因而在嵌入式系统与手持设备中运用较多;另一种是基于声学模型的评分方法，它能够通过语音识别技术将以计算发音质量所需的小单元切割出来，然后再通过事先训练好的声学模型与其进行对比，最后根据评分机制对其评分，因为该方式较为客观，目前主流的外语口语学习系统中均采用这种技术，其主要是基于隐马尔可夫模型（HMM）技术实现。

如图1，基于HMM的语音评分流程图所示，其语音评分的关键技术分为以下几步：

图1 基于HMM的语音评分流程图

1.首先，对学习者所输入的语音进行特征提取;

2.其次，将已经训练好的HMM作为模板，再采用Viterbi算法将语言以计算发音质量所需的小单元进行分割，并强制对齐;

3.最后，采用不同的评分机制对不同的需要进行评分，将评分结果得出。同时，在某些情况下，要注意将说话验证在语音评分开始时加入，从而将学习者发音内容与标准发音完全不同的部分挡下，保证整个口语学习系统的可信度更高。此外，由于同样的声音可能代表的意义不同，因而在这些更加复杂的应用中，需要将各种词发生概率的大小、上下文的关系进行综合考虑，并将语言模型加入，从而为声学模型的判断提供更好的辅助。

（三）发音错误检测与错误纠正

对于外语学习者而言，虽然知道系统能够评价其发音质量，但是单凭非母语学习者自己对其自身错误的所在还是不能清楚地了解到，对这个错误也不知道如何进行纠正。因而，外语口语学习者需要通过系统对发音的错误进行检测与定位，并将相应的错误纠正建议提供给学习者进行有效纠正。

1.发音错误的检测与定位

在外语口语训练中，导致错误发音的因素有很多。例如学习者不会发某种声音，或者是受到其他语言拼读方法的影响以及不能正确体会到两种声音的差别等等。语音识别器也是发音错误检测中使用的一种方法，比如用母语训练的语音识别器，但是因为在没有使用自适应技术的情况下，学习者发音的识别错误也有可能会当成是发音错误，因而这种方法就很难准确地检测到非母语学习者的发音是否正确。所以，目前对错误发音的检测比较合理的一种做法是：首先以发音专家的知识为依据，严格将容易出错的发音进行合理的分类，然后以不同的错误类型为依据，将其相应的检测算法设计出来，最后用各种错误检测算法对学习者的发音分别进行检测。

2.发音错误的纠正

系统将发音错误检测出来后，同时就对学习者所犯的错误根据专家关于发音错误的知识给出相应的错误提示与错误纠正建议。其中，对于这些发音专家知识的构建而言，是通过事先收集大量的经验数据而积累而成的，例如不同学习者的发音特点等，然后通过数据挖掘的聚类算法将不同学习者不同发音特征的聚类准确地计算出来，再由专家客观地评判分类的发音，最后将各聚类的改进建议提出来。

（四）回馈展示

在基于语音识别技术的外语口语学习系统中，这一部分是整个系统对用户的窗口，上述部分所产生的信息都可以通过分数条或者是数字的形式为外语学习者展示出来。同时只有通过这个模块，外语学习者才能够从基于语音识别技术的外语口语学习系统中获益，所以，整个系统的可用度都通过这一模块设计的好坏来决定。

四、结语

总而言之，随着社会经济与科学技术的快速发展，各种带有语音识别技术的便携式终端设备出现在人们的日常生活与学习中，为广大外语爱好者与学习者提供了不受教师资源、地点以及时间等限制的智能外语学习系统，有效地提高了外语学习者的学习效率与学习效果，相信在未来，也能够为外语学习者们提供更快、更好的电子学习手段。

【参考文献】

[1]卢永辉.语音识别技术在外语口语训练中的应用[J].电脑知识与技术，2014（04）：836-837，843.

[2]吴艳艳.孤立词语音识别的关键技术研究[D].青岛：青岛大学，2012.

[3]涂惠燕.移动设备平台上英语口语学习中的语音识别技术[D].上海：上海交通大学，2011.

[4]孔菊芳.基于语音识别技术的英语学习网站分析[J].哈尔滨职业技术学院学报，2012（05）：65-66.

浅谈网络数字语音实验室的维护第12篇

一、电脑病毒问题。

计算机病毒的一般特点有破坏性、传染性、隐蔽性及潜伏性。其传染渠道有外来光盘和U盘的使用, 或在校园网上和Internet下载资料, 使系统感染病毒, 表现为系统启动慢或提示错误, 甚至使机器瘫痪。

解决的步骤有: (一) 对于能够进入系统的, 可以在系统下用杀毒软件查杀病毒, 不能进入系统的, 可以用杀毒软盘或可引导光盘在纯DOS模式下启动后进行查杀病毒。 (二) 在查杀完病毒后进入系统, 为系统存在的漏洞打上补丁, 给杀毒软件升级到最新版本。 (三) 为系统装硬盘保护卡, 保护系统C:盘。设置成自动还原状态, 每次开机后, 都会自动恢复。

二、操作不当引起的故障问题。

对于初学电脑的学生, 由于其对计算机的操作过程不太熟悉, 经常会对R0M—B10S设置进行修改导致系统无法正常运行的现象, 此时, 恢复注册表往往是起不到作用的, 解决方法:是重新修改R0M—B10S里的设置, 给R0M—B10S设置管理员口令, 使学生无法进人设置画面、修改有关设置参数。

三、供电部分问题。

网络数字语言实验室在使用过程中, 因实验室计算机多在打开主控开关瞬间, 启动电流相当大, 经常会出现断电现象, 主要有以下几个方面引起: (一) 是保险丝熔断导致无电, 更换保险丝后故障即可排除; (二) 是主控开关经多次闭合后, 电磁继电器触点经长时间打火引起继电器触点接触不良而无电, 可以更换新品或者清洗触点排除故障; (三) 是电源坏了, 导致没电, 更换电源, 就能恢复正常。

四、显示器问题。

显示器常会出现以下问题 (一) 电脑启动后显示器无图像或偏色。其原因是一些国产的VGA分配器工作不稳定, 容易造成接触不良或接口线路烧断。选购时, 尽量选用名牌产品。一旦出现故障, 最好更换新的VGA分配器。 (二) 图像出现暗角或暗边。可能是偏转线圈与显像管配合较松。简单得很, 只需要将偏转线圈向屏幕方向推进, 并与显像管紧固、调节偏转线圈后面的中心位置调节器, 校正电子流运动轨迹, 可以消除暗角. (三) 色不稳定。故障发生在平衡电位器上。可以用酒精清洗或干脆换掉。 (四) 图像模糊不清。主要是显像管管座受潮, 导致聚焦电极与管座打火。应急办法用酒精清洗管座。根治还是要更换管座。 (五) 图像边缘有拖影或像蠕虫蠕动。检查180V滤波电容是否失效。

五、耳机故障问题。

由于网络数字语音实验室使用频繁, 部分耳机经常会发生“喳喳”噪音或无声, 这大多是耳机的插头和主机的连接处接触不良、松动造成的。再有可能是耳机插头连线内部断开造成的。还有是插头氧化造成的。解决的办法:首先用触点清洁润滑剂, 清洁连接处, 然后重新插紧插头;或取下带线一端的耳机套, 拆开塑料壳, 把耳机线从电路板上焊下, 截去约6-8厘米, 因这部分为断线的集中区, 然后用剥线钳剥开线头把耳机与话筒线焊好。耳机无声可检查耳机线有没有插好, 如果插着, 交换红线跟自线的位置, 检查计算机的音量控制是否打开。还没有声音的话把耳机换到有声音的地方试, 如果无声音, 是耳机坏了。

六、无法上网问题。

本文来自 99学术网(www.99xueshu.com)，转载请保留网址和出处

【数字语音技术】相关文章：

数字语音处理07-19