语音信号处理复习要点

2023-05-30

第一篇:语音信号处理复习要点

《公文写作与处理》复习要点

有关公文写作的题一般都是根据要求撰写公文或修改公文。作文分数约是这部分分数的一半左右,尤其要重视请示、通知、通报等公文的具体要求。

写作时要避免出现下面的错误:

1.标题部分:标题是由发文机关、事由、文种组成。有的标题不全;有的文种不对;有的批转性公文不是法规条文仍用《》。

2.主送机关:有的是多头主送;有的是请示平级;有的是直接送领导人。

3.正文:有的是一文多事;有的正文引用发文不规范;有的正文数字该用阿拉伯数字,却用汉字;有的是用词不当。

4.结尾:有的结尾不合作者本意;有的是不合公文格式要求。

5.标题上的发文机关与签署的发文机关不对应。

6.请示未获批准抄送下级。

7.该标明附件却未标出。

8.签署日期混用汉字与阿拉伯数字,或直接用阿拉伯数字。

近几年公务员考试中出现过的《公文写作及处理》的知识点:

1.公文纸一般采用什么型号?印章的正确位置?

2.办理公文综述包括拟办、批办、承办、查办,对吗?

3.会商就是开会协商公文的制发吗?

4.需要清退的公文有哪些?

5.公文的特点,公文根据行文方向可分几类?

6.国务院与省级人民政府可运用条例这一文种吗?

7.文摘与综述可适当作些评述吗?

8.合理的文件传阅路线形式是什么?

9.函、简报是否属于正式公文?

10.签发分为哪几种?

第二篇:DSP语音信号处理

语音信号处理是研究数字信号处理技术和语音信号进行处理的一门学科,是一门新型的学科,是在多门学科基础上发展起来的综合性技术,它涉及到数字信号处理、模式识别、语言学。语音信号处理是研究用数字信号处理技术对语音信号处理的一门学科。处理的目的是要得到一些语音参数以便高效的传输或存储;或者是通过处理的某种运算以达到某种用途的要求。语音信号处理又是一门边缘学科。如上所诉,它是“语言语音学”与“数字信号处理”两个学科相结合的产物。

语音信号处理属于信息科学的一个重要分支,大规模集成技术的高度发展和计算机技术的飞速前进,推动了这一技术的发展。在数字音频技术和多媒体技术迅速发展的今天,传统的磁带语音录放系统因体积大、使用不便、放音不清晰而受到了巨大挑战。本次课程设计提出的体积小巧,功耗低的数字化语音存储与回放系统,可以有效的解决传统的语音录放系统在电子与信息处理的使用中受到的限制。

本文提出了语音信号处理课程建设的实验环节中的一些考虑,作为专业课程的学习,实验内容不能仅仅停留在验证性实验上,还应增加实验延伸的设计要求,是学生加深对理论分析认识的同时,强调培养学生的实际动手能力和知识综合运用能力。从而提高语音信号的教学和实验的质量。实验内容采用MATLAB编程实现,不仅易于语音信号处理的实现,更易引导学生完成实验延伸的设计。

第一章 绪论

1.1选题背景

在我们的现实生活中从磁带、录像带到CD、VCD、DVD;从黑白电视机、彩色电视机、高清晰度电视机到具有数字信号处理功能的电视机;从留声机、录音机到语音信箱;现在正出在模拟信息到数字信息的变革之中,传统的磁带语音录放系统因其体积大,使用不便,在电子与信息处理的使用中受到许多限制。

虽然,目前广播电视系统尚未实现真正的数字化,相信在不久的将来,真正的数字电视、数字收音机、数字收录机将进入家庭。所以,研究音频信号的数字化存储、处理和回放系统有着很重要的现实意义。

通过设计语音信号实验箱可以对语音信号实现各种形式的变换,因此学会对语音信号的处理,也可自行研究将此语音处理技术应用到现实生活中。

1.2课题意义

语音信号处理的一门比较实用的电子工程的专业课程,语音是人类获取信息的重要来源和利用信息的重要手段,通过语言相互传递信息是人类最重要的基本功能之一,语音是人类特有的功能,它是创造和记载几千年来人类文明史的根本手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。

语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域刚也涉及面很广的交叉学科。

第二章 课程设计要求及系统原理

2.1 课程设计基本要求

(1)学会MATLAB的使用,掌握MATLAB的程序设计方法;

(2)掌握在windows环境下语音信号的采集方法;

(3)掌握数字信号处理的基本概念,基本理论和基本方法;

(4)掌握MATLAB设计方法;

(5)学会用MATLAB对信号进行分析和处理。

2.2 系统基本原理

语音采集原理是,人耳能听到的声音是一种范围为20Hz—20kHz,而一般语音频率最高为3.4kHz。语音的采集是指语音声波信号经麦克风和高频放大器转换成有一定幅度的模拟量电信号,然后再转换成数字量的全过程。

本次设计的基本原理是对语音的录音和放音进行数字化控制。其中,关键技术在于:为了增加语音存储时间,提高存储器的利用率,采用了非失真压缩算法对语音信号进行压缩后再存储,而在回放时再进行解压缩;同时,对输入语音信号进行数字滤波以抑制杂音和干扰,从而确保了语音回放的可靠质量。

通过设计一个GUI实验箱,并添加相应的控制控件,添加一个声音文件,通过MATLAB编程,使其通过各种按钮实现语音信号处理的各种功能,最后做成一个完整的语音信号处理实验箱。

第三章 设计方案论证

3.1 设计理论依据

3.1.1采样定理:

在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中最高频率fmax的2倍时,则采样之后的数字信号完整的保留了原始信号中的信号,一般实际应用中保证采样频率为信号最高频率的5—10倍;采样定理又称奈奎斯特定理。

3.1.2采样频率:

采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调、衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也就越精确,采样频率与声音频率之间有一定的关系,根据奈奎斯特理论,只有采样频率高于声音信号最高频率的2倍的时候,才能把数字信号表示的声音还原成为原来的声音,这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。

3.1.3采样位数与采样频率

采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时候使用数字声音信号的二进制为数。采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。

采样位数和采样频率对于音频接口来说是最为重要的两个基本指标,也是选择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机。显然采样率越高,计算机提取的声音越多,对于原始的还原也越加精确。

第四章 图形用户界面设计

4.1 图形用户界面概念

图形用户界面或图形用户接口是指采用图形方式显示的计算机操作环境由用户接口。与早期计算机使用的命令行界面相比,图形界面对于用户来说更为简便易用。

GUI是MATLAB提供的图形用户界面开发环境,提供了一系列用于创建图形用户界面的工具,从而简化界面布局和编程工作。

4.2用户界面设计

4.2.1 GUI设计模板

在MATLAB主窗口中,选择File菜单中的New菜单项,再选择其中的GUI命令,就会显示图形用户界面的设计模板。

MATLAB为GUI设计一共准备了四个模板,分别是Blank GUI、GUI with Uicontrols、GUI with Axes and Menu、Modal Question Dialog。

当用户选择不同的模板时,在GUI设计模板界面的右边就会显示出与该模板对应的GUI图形。

4.2.2 GUI设计窗口

在GUI设计模板中选中一个模板,然后单击OK按钮,就会显示GUI设计窗口,选择不同的GUI设计模式时,在GUI设计窗口中显示的结果是不一样的。

GUI设计窗口由菜单栏、工具栏、空间工具栏以及图形对象设计区等部分组成。GUI设计窗口的菜单栏有File、Edit、View、Layout、Tools和Help六个菜单项,使用其中的命令可以完成图形用户界面的设计操作。

4.2.3 GUI设计窗口的基本操作

(1)前面板的设计:在GUI设计窗口创建图形对象后,通过双击该对象,就会显示该对象的属性编辑器。如下图所示。例如,创建一个Push Button对象,并设计该对象的属性值。

图4-1 按钮属性编辑器

通过以上的按钮属性编辑器可以根据个人情况对按钮的名称、颜色、大小等方面的属性进行修改,使按钮在视觉上变的更加完美。

(2)按钮功能的实现:在GUI设计窗口创建按钮后,通过右键单击按钮,选择View callbacks下的callback对相应的按钮进行编程,使按钮实现相应的功能,如下图所示对按钮的响应功能进行设置。

图4-2 按钮功能编辑器

进入到按钮程序编辑窗口,通过编程即可实现按钮的相应功能,如下图:

图4-3 按钮的编程实现界面

通过对各个按钮控件的修改,和对m文件程序的添加就完成对GUI窗口的设计,最后得到的图形化操作界面如下图所示:

图4-4 图形化操作界面

4.2.4 语音的录入与打开

在MATLAB中,[y,fa,bits]=wavread(‘Blip’,[N1 N2]);用于读取语音, 7

采样值放在向y中,fs表示采样频率,bits表示采样位数。[N1 N2]表示读取从N1点到N2点的值。

Suond(x,fs,bits);用于对声音的回放,向量y则就代表了一个信号也就是说可以像处理一个信号表达式一样处理这个声音信号。

第五章 课程设计的软件实现

5.1 部分函数语法格式

读wav文件: x=wavread(‘filename’) 数组a及b中元素相乘: a.*b 创建图形窗口命令: figure 绘图函数: plot(x) 坐标轴: axis([xmin xmax ymin ymax]) 坐标轴注解: xlabel(‘„’) ylabel(‘„’) 图例注解: legend(‘„’) 一阶高通滤波器: y=filter([1-0.09375],1,x) 分帧函数: f=enframe(x,len,inc) x为输入语音信号,len指定了帧长,inc指定帧移,函数返回为nXlen的一个矩阵,每一行都是一帧数据。

5.2语音信号处理的相关函数

5.2.1语音信号的短时谱:

周期性声门波可表示为:

(5-1) 其中,g[n]是声门波的单周期的波形,p[n]是间隔为P的周期采样序列。当u[n]通过线性非时变声道,且该声道的单位冲击响应为h[n]时,声道输出为:

(5-2) 为了观察一段语音,需要降生到输出乘以一个一时刻τ 为中心的窗函数 w[n,τ] ,即得到:

(5-3)

这段语音信号的频域表达式为:

(5-4)

即语音信号的谱包络为

语谱图就是现实时变频谱幅度特征的图形表达式为:

(5-5)

将语音信号短时谱程序写入到MATLAB中得到单色语谱图的波形如下:

图5-1 语音信号单色语谱图

5.2.2 自相关方法估计语音信号的声道参数:

由均方预测误差最小的得到正则方程:

(5-6)

其中,

(5-7)

在最佳解时的误差为

(5-8)

在自相关法中式5-6,式5-8变为

(5-9)

(5-10) 由式5-9和式5-10可列出方程组式5-11

(5-11)

解方程组式5-9求出线性预测系数,通过误差式5-11可求出增益G

(5-12)

加窗后信号频谱图如下:

图5-2 加窗后信号频谱图

通过以上的方法,改变参数分别求得4极点模型频率响应和6极点模型频率响应,6极点波形如下图所示:

图5-3 六极点波形图

最后通过以上方法用一个函数分别实现以上三个功能,三个波形显示在一个界面,通过观察图形,查看它们之间的分别。三者比较所得到的波形如下:

图5-4 三者比较波形图

5.2.3 基音周期检测

数据为浊音语音信号speech1_10k(10000样点/秒)用25ms的汉明窗对语音信号speech1_10k进行加窗处理,并画出所得到的加窗信号的自相关函数,再用根据中心消波法及三电平中心消波法原理改进程序,最后对比中方法基音检测的效果并分析结果。

实验原理及方法

(1) 自相关检测原理:对于离散的数字语音信号序列x(n),如果周期N,则自相关函数也是同周期的周期函数。即:x(n)=x(n+N)。清音信号没有周期性,他的自相关函数也没有周期。浊音新海具有准周期性。自相关基音检测正是利用这一性质对语音信号进行基音检测的。

(2) 中心消波法检测原理:中心消波处理是使用如下图所示的中心消波函数进行处理的:

图5-5 中心消波检测图

(3) 三电平消波法原理:为了减少自相关计算中的乘法运算,可以把上述中心消波以后的信号y(n)的自相关用两个信号的互相关代替,其中一个信号是y(n)另一个信号是对y(n)进行三电平量化产生的结果。且这个信号有三种可能的取值,因而这里的互相关计算只需要做加减法,而这个互相关序列的周期性与y(n)的自相关序列是近似相同的。

三电平法对语音信号处理得到的波形如下:

图5-6 三电平法波形图

中心消波法得到的波形如下图:

图5-7 中心消波法波形图

5.3 GUI实验箱操作界面设计

通过对各个控件的编程和对参数的设计,最后得到的GUI实验箱操作界

面如下图所示,通过界面上的各个按钮即可实现相应的功能。

图5-8 GUI实验箱操作界面

第六章 心得体会

通过本次课程设计完成了对语音信号的读取与打开,与课题的要求十分相符;初略的完成了界面的设计,但也存在相当的不足,达到了打开语音文件,显示已定波形。语音信号处理时语音学与数字信号处理技术相结合的交叉学科,将语音当做一种特殊的信号,即一种“复杂向量”来看待。也就是说,体现了数字信号处理技术。

本次课程设计时希望将数字信号处理技术应用与某一实际领域,这里就是指对语音的处理。作为存储与计算机中的语音信号,其本身就是离散化了的向量,我们只需要将这些离散的量提取出来美酒可以对其进行处理了。

本次课设,用到了处理数字信号的强有力工具MATLAB,通过MATLAB李的几个命令函数的调用,很轻易的在实际化语音与数字信号的理论之间搭了一座桥。

最后,还利用了MATLAB的另一强大功能——GUI界面设计。设计出了一个建议的用户应用界面,可以让人实现界面操作。

通过本次课程设计让我更加了解了语音信号处理在现实中的强大的应用空间,同时查阅了很多相关的资料,应用MTALAB软件来完成,熟练掌握了MATLAB软件,本次课程设计要求用GUI设计模块,查阅了很多资料,更加深刻的陆奥了了这方面知识。

本次课程设计,我明白了理论的学习需要在实践中才能得到巩固。在课程设计中,只有动手慢慢研究,才能真正了解MATLAB软件平台中可以直接设计数字滤波器的各个函数的调用,对设计GUI实验箱的所有函数的运用有了比较好的认识。

通过这个课程设计,我学到了很多MATLAB和语音信号的知识,提高了自己在语音信号设计方面的知识能力,动手能力和思维能力都得到了一定的提升,希望自己以后可以更多的继续学习这一门课程设计方面的知识。

附 录

1. 源程序代码:

21

22

参考文献

[1] 刘庆华 陈紫强《基于MATLAB和DSP的语音信号处理课程的建设》 电气电子教学学报 2006 10(3):124-128 [2] 张力 《MATLAB在语音信号处理辅助教学中的应用》 电气电子教学学报 2005 27卷2期:96-99 [3] 邓立新 杨震《信息技术融入“语音信号处理”课程的教学实践》电气电子教学学报 2005 27卷5期:13-16 [4] 胡航,《语音信号处理》 哈尔滨工业大学出版社 2005年2月,第二版:135-137 [5] 张平,《MATLAB基础与应用》 北京航空航天大学出版社 2007,第二版:85-92 [6] 谢德芳 《数字信号处理》 北京科学出版社 2005,第一版

[7] 张雄伟 《现代语音处理技术及应用》 机械工业出版社 2006,第二版 [8] 吴家安 《语音编码技术及应用》 机械工业出版社 2006 第一版 [9] 刘幺和 宋庭新 《语音识别与控制应用技术》 科学出版社 2008 第二版

[10] 李昌立 吴善培 《数字语音编码实用教程》 人民邮电出版社 2004 第一版

[11] 姚天仁 《数字语音处理》 华中科技大学出版社 1992 第二版 [12] 朱敏雄 《计算机语音技术(修订版)》 北京航空航天大学出版社 2002 第一版

[13] 王炳锡 《语音编码》 西安电子科技大学出版社 2002 第一版

23

第三篇:专业英语7语音信号处理

1、演讲的目的是沟通。有几种方法表征语音通信的潜力。一个高度量化的方法是香农信息论思想的引入。根据信息变换理论,语音可以表示其消息内容或信息。语音特征的另一种表征方式是信号承载的消息信息,i.e.(注:i.e.意思是:即,也就是),如声波。虽然信息论思路在先进的通信系统中发挥了重要作用,但它是基于波形的语音表示,或一些在实际应用中一直是最有用的参数模型。

2、在考虑语音通信的过程中,开始在大脑中思考消息在扬声器中的一些抽象的表示形式是有帮助的。虽然产生语音的过程是复杂的,但该消息中的信息最终被转换成声学信号。在言语产生的过程中消息的信息可以被认为存在许多不同的表示方式。例如,该消息信息首先被转换成一组能控制发音机制的神经信号(即,运动舌头,嘴唇,声带等)。发音器官的运动响应于这些神经信号来完成一系列的手势,其结果是在原始消息中包含的信息的音响波形。

3、信息虽然连通但讲话本质上是一个离散的性质的信息,i.e.,即,它可以被有限集合中元素串联的符号表示,每一个声音的符号可以被分类,被称为音素。每种语言都有它自己的独特的音素,编号通常在30至50之间。例如英语可以表示为一组约42个编号的音素。

4、信息理论关注的中心问题是传达信息的速率。讲话的信息率可以通过发音器官物理上的运动速度粗略估计,人类讲话的平均速率每秒约10个音素。如果每个音素表示一个二进制数,那么6位数字代码足以代表所有的英语音素,设平均增长率为每秒10音素,并且忽略任何相邻音素的组合,我们得到了一个大约60比特/秒的平均信息语速。换句话说,书面讲话包含的信息相当于60位/秒正常讲话率。当然一个“真正”的语音信息内容的下界是大大高于这个速度的,上述估计确实需要考虑一些因素,如说话者的身份和情感状态,说话的速率,声音的响度,等。

5、在语音通信系统中,语音信号的传输、存储、和处理有许多方法。技术问题导致各种表示形式的语音信号的产生。一般来说,有两个主要的问题存在于任何一个系统中:一是保护消息内容的语音信号。另一个是语音信号便于传输和存储的表示形式。或者以一种灵活的形式表示,这样修改后不会对语音信号所表示的消息内容产生严重退化的影响。

6、语言信号必须这样表示,信息内容能被听众容易的提取,或自动被机器提取。

语音信号的表示形式(而不是消息的内容)可能需要从500到1百万比特每秒以上的提取速度。这些表示形式的设计和实现,信号处理的方法发挥基础性作用。

7、一般的信息处理问题可用图3-22描绘的框图表示。在语音信号的情况下,说话者就是信源。一般测量或观察声波的尺寸。

8、涉及信号处理,首先根据一个给定的模型获得信号,利用运用程序对信号进行一些更高层次的变换,以便把该信号转换成一个更方便的形式。在这个过程中的最后一步是报文信息的提取和利用。本步骤可以由人类听众或由机器自动进行。例如,一个系统,其功能是自动识别扬声器从一个给定的发言者发出的语音信号,该语音信号可能使用一个随时间变化的频谱表示。

9、因此,语音信号处理涉及两个任务。一,这是语音信号的波形或参数一般表示形式的获取手段;二,信号处理在转换的过程中提供函数帮助,这是信号一般性质的替代形式,但更适合特定的应用程序。

10、我们将探索数字技术在语音信号处理中的作用。数字信号处理涉及离散信号的获取与表示,伴随变换理论,涉及和数控程序的实施用来处理离散信号的表示。数字信号的处理目的类似于模拟信号的处理。因此,在语音通信的上下文中单独挑出数字信号处理技术做特别考虑是合理的。可以列举一些很重要的原因。首先,最重要的大概是一些极其复杂的信号处理功能可以用数字技术来实施的事实。此外,语音信号处理中常用的算法本质上是离散时间信号处理系统。它们大多不适合作为近似的模拟系统来观察,的确在许多情况下没有可用的模拟实施方案。

11、数字信号处理技术在语音处理问题中被首次运用,仿真复杂的模拟系统。最初的观点来看,模拟系统可以在计算机上进行模拟,避免为了试验参数选择和其他设计考虑系统建设的必要性。数字仿真模拟系统的首次应用,需要大量的处理时间。在1960年代中期,一次数字信号处理的革命发生了。主要的主要催化剂是发展快速的计算机和突飞猛进的数字信号处理技术理论。因此,数字信号处理系统具有的优点使得年轻一代有能力来模拟模拟系统的情况变得明朗。目前计算机语音处理系统在实验室中实现 ,他们作为一个数字系统,可以作为实施特殊用途的数字硬件或对专用的计算机系统进行精确模拟。

12、除理论发展外,伴随数字硬件的发展数字处理技术的优点进一步加强以致于超过模拟系统。数字系统非常可靠和紧凑。集成电路技术已经发展到可以把极其

复杂的系统实现在单个芯片上。逻辑运算的速度足以满足许多信号处理功能所需的巨大数量的计算,可以实现实时语音采样率。

13、在语音通信系统中使用数字技术有另外的原因。如,如果使用合适的编码,在非常嘈杂的信道,数字形式的语音信号能可靠地传输。语音信号的数字形式与其他形式的数据的相同。因此,可以使用一个通信网络同时传输话音和数据,除解码外没有必要区分它们。在安全方面语音信号的传输需要数字表示,它具有明显的优势超过了模拟系统。为了保密,对信息比特进行加扰,最终能在接收器解读。这些和许多其他的原因,数字技术正在被越来越多地应用于语音通信问题。

14、考虑应用数字信号处理技术来处理语音通信问题,专注于三个主题它是非常有帮助的:语音信号的数字表示形式,实施先进的处理技术和很大程度上依赖于数字信号处理的应用程序类。

第四篇:《语音信号处理及加密》课程总结

本学期,我选修了《语音信号处理及加密》这门课。在本门课程的学习中,我系统地学习了现代语音编码技术的基本概念和基本知识,如什么是语音编码、对语音编码的要求、现代语音编码技术的作用和意义、现代语音编码系统的构成、分类以及主要性能指标等等,使我对现代语音编码有了初步的概要的了解。 最近的二十几年来,随着数字通信、计算机、信号处理、微电子等相关技术的发展和广泛应用,语音编码技术发展非常迅速,取得了一系列突破性的成果,极大地促进了数字通信的发展和普及,是现代通信以及信息技术的一个亮点。所谓的现代语音编码技术,主要就是指最近二十几年发展起来并得到广泛应用的语音编码技术。

一、为什么要学习语音编码技术?

由于PCM的编码速率过高,不适应通信和信息技术发展的需要,为了压缩编码速率,减少传输占用的带宽,人们一直在致力于研究开发新的语音编码技术。这种强烈的客观需求是推动语音编码技术发展的巨大动力。另一方面,最近二十几年来,随着计算机、微电子、信号处理等相关技术的迅速发展和广泛应用,尤其是随着数字信号处理算法和器件(DSP芯片)的飞速发展和应用,为中、低速率语音编码器的发展和应用准备了必要条件。正是在这种情况下,从20世纪80年代以来的二十几年间,语音编码技术进入了一个飞速发展的时期。

现代语音编码技术就是指20世纪80年代以来发展起来的新的语音编码技术,这些新的语音编码技术的出现,极大地推动了通信和信息技术的发展,是现代通信发展史中的一个闪光点。

学习和掌握现代语音编码技术的基础知识、分析方法、关键技术和算法十分重要,只有了解和掌握这些已经成熟或基本成熟的方法和技术,才能很好地适应现代通信和信息技术发展的需要,才能研究开发新的方案和算法,提出具有自主知识产权的技术方案。

二、我学到了什么?

语音编码为信源编码,就是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并使之可以在数字信道中传输。语音编码的目的是在保持一定得算法复杂程度和通信时延的前提下,占用尽可能少的通信容量,传送尽肯能高质量的语音。

语音编码按照传统的分类方法通常分为三类:波形编码、参数编码和混合编码。 (一)波形编码

波形编码是将时间域或频率域或变换域信号直接编码为数字信号,力求使重建语音波形保持原始语音信号的波形形状。波形编码具有语音质量好、抗噪声性能强等优点。其缺点是所需用的编码速率高,一般在64~16Kb/s之间。波形编码是应用最早、人们最熟悉的语音编码技术。波形编码通常包括时域波形编码、频域波形编码和变换域波形编码三种类型。在课程学习中,我对这三种编码技术有了初步的了解。 1) 时域波形编码

课程中介绍了几种常用的时域波形编码,即脉冲编码调制(PCM)、增量调制(DM或∆M)、差分脉冲调制(DPCM)和自适应差分脉冲调制(ADPCM )。 PCM是应用最早和最广泛的语音编码技术,在很长一段时间内,它一直在语音编码中占据统治地位,对于通信的数字化起到过极为重要的推动作用。近年来语音编码技术取得一系列突破性进展,出现了许多崭新的编码算法和技术,已经动摇了PCM的统治地位,但在通信和信息系统中,PCM的应用依然相当普遍。其工作原理是:在译码端,输入模拟信号经过取样、量化和编码,实现模/数转换,变换成为数字信号;到了译码端,再将接收到的数字信号通过译码、低通平滑滤波实现数/模转换,恢复为模拟信号。

DPCM是对相邻样值之间的差值进行编码,而不是对取样值本身进行编码,这样就能够降低编码速率。由于它是对预测误差信号进行编码,而预测误差信号的能量比输入信号的能量小得多,因此量化限幅电平也可以小得多。这样,在量化电平数不变的条件下,量化器的量化间隔就比输入信号的量化间隔小得多,使得量化噪声减少。而在保持信噪比不变的情况下,DPCM就可以通过减少量化比特数,降低编码速率。

ADPCM是采用自适应量化及高阶自适应预测技术的DPCM。自适应线性预测以帧为单位进行,根据本帧语音波形的时间相关性确定预测系数,使得预测误差信号的方差最小。

DM是DPCM的一种特殊形式。当系统的取样品率大于Nyquist频率许多倍时,相邻取样值之间的相关性很强,差分信号的幅度值会在一个很小的范围内变化,于是就可以用正负两个固定的电平来表示差分信号。因此,在DM中仅用1bit即可对差分信号进行量化,也就是只需指示出极性即可。 2) 子带编码

子带编码是一种应用比较广泛的语音编码技术,也是一种典型的频域波形编码技术。它利用带通滤波器(BPF)组首先将输入信号分割成若干个不同的小的频带(称为子带),通过等效于单边带调幅的调制过程,将各子带搬移到零频率附近,形成低通信号后,再以Nyquist速率对各子带输出取样,并对这些取样值分别进行通常的数字编码。在接收端,将各子带编码信号进行译码,并重新调制回原始位置,再将所有子带输出相加,恢复出原始信号。把语音信号分成若干子带进行编码主要有三个优点。首先,如果对不同的子带合理的分配比特数,就可能分别控制各子带的量化电平数目以及相应的重建信号的量化误差方差值,使误码率更精确地与各子带的信源统计特性相匹配。其次,通过调整不同子带的比特分配数值,可以控制总的重建误差频谱形状,使误差谱的形状适应人耳听觉特性,获得更好的主观听音质量。第三,子带编码的另一个优点是各子带内的量化噪声相互独立,被束缚在自己的子带内,这样就能避免输入电平较低的子带信号被其他子带的量化噪声所淹没。这种情况在非子带编码中就会发生,除非专门采用噪声谱形形成等技术来控制。 3) 变换域编码。

变换域编码又称为变换域波形编码,是语音编码中经常使用的编码方式之一,尤其是在宽频带高音质声频编码中,变换编码应用更为广泛。

变换域编码是将通常在时域描写的语音信号变换到另外一些变换域中描写(这些变换通常采用正交变换),然后再对变换后的信号进行量化和编码。在接收端,首先对通过信道传输的接收信号进行译码,然后进行反变换以恢复出原始输入的语音信号。在文献资料中经常介绍并在实际中获得广泛应用的集中主要正交变换是:K-L变换(K-LT或KLT)、W-H变换(W-HT或WHT)、Haar变换(HT)、斜变换(ST)、离散余弦变换(DCT)和离散傅里叶变换(DFT)。 (二)参数编码

参数编码又称为声源编码或声码器,有时又成为分析-综合编码,它是将信源信号在频域或其他变换与提取特征参数,然后对这些特征参数进行编码或传输;在译码端再将收到的数字信号译成特征参数,根据这些特征参数重建语音信号。参数编码是通过对语音信号特征参数的提取和编码,力求使重建语音信号具有尽可能高的可懂度,即保持原语音信号的语意,但重建语音信号的波形语言语音信号波形却相差甚远。参数编码的有点是可实现低速率语音编码,其编码速率可低至2.4kb/s以下。其缺点是语音质量差,自然度较低,即使是熟人一般也定不出来讲话的人是谁。此外,参数编码的坚韧性也不够好。

参数编码的基础是语音的产生模型。根据这一模型对语音信号进行分析,就可以得到语音的谱包络、基音周期以及清浊音判决等参数。然后就可以对这些参数进行编码和传输。译码中所使用的声道滤波器的形式,与编码器中的谱包络分析器的形式必须相对应,才能够在同样的语音产生模型基础上合成出发送端的语音信号。 (三)混合编码

语音混合编码是在采用线性预测编码(LPC)技术的语音参数编码的基础上,通过采用许多改进措施,使用合成分析法而形成的一种新的编码技术,是最近二十几年来在语音编码技术上的一种突破性进展,收到人们的普遍重视,发展迅速,应用广泛。它克服了波形编码和参数编码的缺点,吸收了它们的长处,在16~4kb/s速率上能够得到高质量的合成语音。多脉冲激励线性预测(MPE-LP)编码、规则脉冲激励线性预测(RPE-LP)编码和码激励线性预测(CELP)编码等都属于混合编码。

多脉冲激励线性预测(MPE-LP)编码是一种高音质语音编码算法,是第一个实用、有效的ABS-LPC类型的算法。在MPELPC中,不论是清音还是浊音,都用一帧中的有限多个脉冲经过最优化估值后作为激励信号。

规则脉冲激励线性预测(RPE-LP)编码是在MPELPC的基础上进一步改进而得到的。RPE-LTP编码方案的特点是算法简单,语音质量好,MOS分为4.0分。它是利用预测残差、感觉加权滤波器的单位冲击响应、位置脉冲模式等信息通过解线性方程组求得激励脉冲序列的,因此其算法较简单。

码激励线性预测(CELP)编码是目前应用最多的混合编码技术。CELPC采用分帧技术进行编码,帧长一般为20~30ms。CELPC基于合成分析(ABS)法的搜索过程、感觉加权、矢量量化(VQ)和线性预测(LP)技术。它用从码书中搜索出来的最佳码矢量,乘以最佳增益,代替线性预测的残差信号(余量信号)作为激励信号源。CELPC通常将每一语音帧分为2~5个子帧,在每个子帧内搜索最佳的码矢量最为激励信号。

三.学习体会

在现代通信中,随着科学技术的迅速发展,图像、数据等非话音信息在通信信息中所占的比例大大提高,而且这种提高的趋势仍然会继续下去。但是,到目前为止,在大多数通信系统中,传输醉倒的信息仍然是语音信号。在可以预见的未来的通信中,尽管语音信号在通信信息总量中所占的比例会有所下降,但仍然会是传输最多的信息。

语音编码技术在数字通信中的作用至关重要,现代语音编码技术已经成为通信技术中一个相当重要的学科,在各种通信网络中都得到广泛应用。在学习了这门课程之后,我对语音编码技术有了粗略的概念性的了解,并通过实验深入理解了语音编码及处理的基本原理,更加深刻地认识到语音编码的作用与意义。只有学习和掌握现代语音编码技术,我们才能更好地向着“降低编码速率,减少传输占用的带宽”的目标前进,推动语音编码技术的发展。

第五篇:数字信号处理教语音信号处理课程设计心得

这次课程设计虽然遇到了很多问题,很多困难,但是也学到了很多东西。不仅学到了书本上的东西,而且学到了很多课本上没有的东西,很多程序里的东西,特别是程序语法,总是有错误,但是总是不知道错在哪里,在细心的检查下,终于找出了错误和警告,排除困难后,程序编译就通过了,心里终于舒了一口气。还有各种各样问题,通过查网络和请教同学来弄明白,这个过程是痛苦的,有时候有些问题不能马上解决,感到很头痛,真想放弃这个问题,但是坚持下来,并且解决这些问题的时候,真的有种苦尽甘来的感觉。

应用MATLAB进行语音信号的处理是与我们所学课程及专业紧密相连的,有着很强的实践性。做这个课程设计的时候,并不是非常的顺利,我也有遇到很多困难。刚开始,我用自己的mp3录制的一个wav文件做语音信号处理,程序始终现实如下错误提示:

??? Error using ==> wavread Error using ==> wavread Data compression format (IMA ADPCM) is not supported.

我在查阅了很多资料,在网上也查阅相关信息,花费了大量时间也没找出结果,最后发现在WAV格式的语音文件有两种格式,即PCM格式和IMA ADPCM格式,而在MATLAB中用wavread函数进行语音处理时,并不能直接处理IMA ADPCM格式的语音信号,经过格式转换之后(选择PCM格式),我运行出了正确的结果。刚开始由于对滤波器的滤波原理并不是很了解,于是我又翻出学过的数字信号处理课本,认真研究起各种滤波器了,这才使我明白了大多数滤波器是如何工作地,不再单单只是懂理论,理论与实际相结合是很重要的,只有理论知识是远远不够的,只有把所学的理论知识与实践相结合起来,从理论中得出结论。实验过程中,我感觉到初始语音信号和滤波输出后的语音信号在音色上有一定的差别,这说明了信号在处理、传输过程中有损耗。不管对于什么样的课题,其实也是有很多东西可以发掘的,这需要我们在平时多积累,多思考,只有这样,才能取得更大的进步,才能学有所用,学有所长。

通过这次设计,进一步加深了对数字信号处理的了解,让我对它有了更加浓厚的兴趣。通过这次课程设计使我懂得了,平时的理论知识只有通过自己动手做一个课题,从做这个课题的过程中发现问题,解决问题,这个学习的过程,会比我们平时只通过课堂上听讲得到的知识更加生动立体,跟让人记忆深刻。在设计的过程中,我发现同学间的互帮互助真的很重要。当我们有问题的时候,大家一起讨论,将自己的观点表达出来,当发现别人的观点与自己的不同的时候,我们通过查阅资料找到最终正确的答案,这个过程是互利互惠的。这也培养了我们以后走上工作岗位后的团队精神,对我们以后的为人处世都有很大帮助。同时我们在设计的过程中发现了自己的不足之处,对以前所学过的知识理解得不够深刻,掌握得不够牢固。

总的来说,通过这次的课程设计我对语音信号有了全面的认识,对数字信号处理的知识又有了深刻的理解,让我感受到只有在充分理解课本知识的前提下,才能更好的应用这个工具;并且熟练的应用MATLAB也可以很好的加深我对课程的理解,方便我的思维。这次设计使我了解了MATLAB的使用方法,学会分析滤波器的优劣和性能,提高了分析和动手实践能力。同时我相信,进一步加强对MATLAB的学习与研究对我今后的学习将会起到很大的帮助!

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:英语学校教师工资制度下一篇:医院消防安全隐患排查