你正在下载：《

语音信号处理-语音信号的线性分析.doc

》 [预览]

格式：DOC ，页数：8 ，大小：245.50KB ,
资源ID：9254619 下载积分：10 金币

快捷注册下载

登录下载

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

开通VIP

温馨提示：由于个人手机设置不同，如果发现不能下载，请复制以下地址【https://www.zixin.com.cn/docdown/9254619.html】到电脑端继续下载（重复下载【60天内】不扣币）。

已注册用户请登录：

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

三方登录：

1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，个别因单元格分列造成显示页码不一将协商解决，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时联系平台进行协调解决，联系【微信客服】、【QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”，意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：0574-28810668；投诉电话：18658249818。

本文（语音信号处理-语音信号的线性分析.doc）为本站上传会员【仙人****88】主动上传，咨信网仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知咨信网（发送邮件至1219186828@qq.com、拔打电话4009-655-100或【微信客服】、【 QQ客服】），核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载【60天内】不扣币。【服务填表】

语音信号处理-语音信号的线性分析.doc

1、 2015.10.14 1.介绍语音是人类相互交流和通信最方便快捷的手段。如何高效地实现语音传输、存储或通过语音实现人机交互，是语音信号处理领域中的重要研究课题。语音信号处理涉及数字信号处理、语言学、语音学、生理学、心理学、计算机科学以及模式识别、人工智能等诸多学科领域，是目前信息科学技术学科中发展最为迅速的一个领域。在语音处理技术中，线性预测是第一个真正得到实际应用的技术，可以用于估计基本的语音参数，如基因周期、共振峰频率、频谱特征及声道面积函数等。线性预测的基本原理是把待分析的信号用一个模型表示出来，信号

2、是这个模型的输出，构成这个模型的参数是这个信号的重要特征，称为线性预测系数。一个语音取样的现在值可以用若干个语音取样的过去值的加权线性组合来逼近。加权系数称为预测系数。如果利用过去 p个样点值来进行预测，称为p 阶线性预测。线性预测编码就是利用过去的样值对新鲜值进行预测，然后将样值的实际值与其预测值相减得到一个误差信号，显然误差信号的动态范围小于原始语音信号的动态范围，对误差信号进行量化编码，可大大减少量化所需的比特数，使编码速率降低。通常情况下，随着线性预测阶数p的增大，预测误差也将会越来越小，但是p也不是一直增加的，随着线性预测阶数p的增大，信号中的可预测部分也将越来越少，预测误差的变化趋

3、于平稳，误差减小不再明显。此时，伴随着预测阶数p的增大，整个系统的计算量将会越来越大。为此，对于不同的信号，我们需要确定一个最优的预测阶数p，进而进行预测分析。在对原始语音信号进行处理之前我们要对信号进行预处理，语音信号的预处理也叫作前端处理,是指在特征提取之前,先对原始语音进行处理,使处理后的信号更能满足实际的需要,对提高处理精确度有重要的意义。一般预处理的步骤包括采样、预加重、加窗分帧和去噪等，本文采取分帧去除直流分量后再剔除噪声帧来进行预处理，本文求阈值的方法就是求出语音信号中的高斯白噪声，然后设置阈值，将没帧信号和阈值进行比较，如果比阈值小的就是噪声帧，直接去除。预处理结束后，我们

4、对语音信号进行LPC分析，本文中通过Levinson-Durbin算法求出预测系数，在通过不同阶数P的滤波器得到预测误差从而找出最小误差值下的最优阶数P，最后作出最小误差与P的关系曲线图。 2.LPC基本原理（1）语音信号的样值序列为s(n)，n=1,2,3……n，s(n)的预测值为（1）线性误差为e(n) （2）设计传递函数为A(z)，为LPC误差

5、滤波器，设计预测误差滤波器A(z)就是求解预测系数，使得误差在预定准则下最小（3）（2）理论上常用的是均方误差最小的准则，对各个系数求偏导，另其结果为0，得到（4） S(n)的自相关序列为（5）因为它是偶对称，因此（6）

6、所以上式可以表示为，（7）设，，式子（7）的矩阵形式为，所以就可以求出P个线性预测系数。 3. Levinson-Durbin算法杜宾算法是一种有效计算预测系数的算法，它主要是采用递归算法求解，基本思想是：递归解法分步进行。在某一步已经有了一个解，这是第（i-1）阶预测器的系数。然后利用（i-1）阶方程组的解来表示，（i-1）阶方程组的解又可以用（i-2）阶方程组的解表示，依此类推。因此只要解出任意一阶方程的解，就可以通过递推解出任意方程组的解。利用杜宾算法我们从最低阶开始，从低阶到高阶逐阶递推。过程

7、如下：（8）（9）（10）（11）（12）（13）上式（8）—（13）对i=1,2,……,p进行递推求解，其最终解为（14）在上面的一组式子中，i表示预测器阶数，如表示i阶预测器的

8、第j个预测系数。对于p阶预测器，在上述求解预测器系数的过程中，阶数低于p的各个阶预测器系数也同时得到。 4.结果图像分析 5.结论图像结果最佳预测点P值如下表所示语音文件最佳系数P Bird 26 Dog 14 GirlEng 13 MaleChns 9 从上图中我们可以看出来不同的语言信号在相同的算法下得到的最佳预测阶数是不同的，鸟儿语音所要的阶数是最高的，其余三个语音

9、的阶数相差不大。 6.附加程序 BIRD语音程序 clear all; clc; filename='Bird'; load Bird wavedata;%读入语音 %对语音进行分帧 len=200;inc=80; %设置帧长，帧移 wavesize=size(wavedata,2); fsum=fix((wavesize-len+inc)/inc);%计算帧数 f=zeros(fsum,len);%初始化 i=1;n=1; while i<=fsum j=1; while j<=len f(i,j)=wave

10、data(1,n); n=n+1; j=j+1; end n=n+inc-len; i=i+1; end %去除噪声帧 if size(wavedata,1)<=1 %求出鸟鸣语音的直流量 dc=sum(wavedata(30000:34000))/4000; else a=wavedata(1,:); for i=2:size(wavedata,1) a=cat(2,a,wavedata(i,:)); end d

11、c=sum(a(1:4000))/4000; end wavesize1=size(f,2); n=1; for i=1:size(f,1) fp=sum((f(1:wavesize1)-dc).^2)/(wavesize1-1);%帧信号的平均能量 eva=sum((wavedata(30000:34000)-dc).^2)/4000;%鸟鸣语音求出高斯白噪声的估计方差 threshold=2*wavesize1*eva*(erfcinv(10^-3))^2/(wavesize1-1);%求阈值 if fp>=threshold%阈值进行比较，比阈值大的就是有效帧

12、 wvalid(n,:)=f(i,:);%设置有效语音矩阵 n=n+1 end end vs=n-1;%将有效帧的个数赋给vs for k=1:vs [ap(1:50,1:50,k),g(k,1:50),ep(k,1:50),r0(1,k)]=levinson_durbin(wvalid(k,:),50,dc);%调用函数求得预测系数，增益G，以及误差值 end div=zeros(2,50); for p=1:50 div(1,p)=sum((ep(1:vs,p)')./r0(1,1:vs))/vs;%使用方法一来获取最小均方误差与帧能量的比

13、值 end %绘制图形 plot((1:1:50),div(1,:),'-*k'); title(['归一化误差与阶数关系','(',filename,')']); xlabel('线性预测阶数p');ylabel('归一化误差') axis([1,50,0,1]); grid on; 杜宾算法函数 function [ap,g,ep,r0]=levinson_durbin(waveframe,p,dc) fl =size(waveframe,2);%求帧信号的长度 r=zeros(1,p);%自相关序列 wave=waveframe-dc;%帧信号减去直流量 f

14、or k=1:fl r(k) =wave(1:fl-k+1)*(wave(k:fl))'/fl; %求自相关函数的渐近无偏估计 end k=zeros(1,p);%反射系数 e=zeros(1,p);%最小均方误差 a=zeros(p,p);%线性预测系数矩阵 k(1)=r(2)/r(1);%初始化 e(1)=(1-k(1)^2)*r(1); a(1,1)=k(1); for i=2:p%levinson_durbin递推算法 k(i)=(r(i+1)-a(i-1,1:i-1)*fliplr(r(1+1:i))')/e(i-1); a(i,i)=k

15、i); for j=1:i-1 a(i,j)=a(i-1,j)-k(i)*a(i-1,i-j); end e(i)=(1-k(i)^2)*e(i-1); end ap=a; g=sqrt(e(1:p)); ep=e(1:p); r0=r(1); 犬吠的高斯白噪声部分在10000~14000部分人声的部分在1~4000部分，所以上述程序中只要将白噪声部分数据更换就可以得到其余的图像。 7.参考文献 [1]宋知用. MATLAB在语音信号分析与合成中的应用 [M] 北京:北京航空航天大学出版社,2013. [2]张雪英.数字语音处理及MATLAB仿真 [M] 北京:电子工业出版社,2010.