语声信号数字化编码.pptx_咨信网zixin.com.cn

资源描述

Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,点击此处结束放映,单击此处编辑母版标题样式,人民邮电出版社,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,点击此处结束放映,单击此处编辑母版标题样式,人民邮电出版社,语声信号数字化编码,第一节语声信号编码基本概念及分类,第二节脉冲编码调制,PCM,第三节差值脉冲编码调制,DPCM,第四节子带编码,SBC,第五节参量编码,第六节,GSM,及,IP,电话系统语声编码技术应用及标准,语声信号数字化编码,第1页,第一节语声信号编码基本概念及分类,一、语声信号编码概念,现以一个简单语声信号脉冲编码调制(,PCM),编码，解码过程说明语声信号编码概念，示意图如图2.1所表示。,语声信号数字化编码,第2页,图2.1,PCM,编解码框图,语声信号数字化编码,第3页,图中,A/D,变换包含三个部分：抽样、量化和编码。,(1)抽样,抽样是将模拟信号在时间上离散化过程。,(2)量化,量化是将模拟信号在幅度上离散化过程。,语声信号数字化编码,第4页,(3)编码,编码是指将每个量化后样值用一定二进制代码来表示。,二、语声信号编码分类,语声信号编码可划分为三大类型。,波形编码，是对信号波形进行编码，前述,PCM,方式即为波形编码一个。,语声信号数字化编码,第5页,参量编码是提取语声信号一些特征参量，对其进行编码。,混合编码，介于波形编码与参量编码之间一个编码，即在参量编码基础上，引入了一定波形编码特征，以到达改进自然度目标。,语声信号数字化编码,第6页,第二节脉冲编码调制PCM,一、概述,脉冲编码调制系统中信号变换和处理过程如图2.2所表示。,图2.2,PCM,系统中信号处理过程,语声信号数字化编码,第7页,二、抽样,模拟信号数字化第一步是在时间上对信号进行离散化处理，即将时间上连续信号处理成时间上离散信号，这一过程称之为抽样。,1.抽样定义及实现抽样电路模型,连续信号在时间上离散化抽样过程如图2.3所表示。,语声信号数字化编码,第8页,图2.3 连续信号抽样示意图,语声信号数字化编码,第9页,图2.4 抽样器及抽样波形示意,语声信号数字化编码,第10页,图2.5 相乘器抽样模型,语声信号数字化编码,第11页,图2.6 开关函数,语声信号数字化编码,第12页,2.抽样定理,(1)低通型信号抽样,设时间连续信号,f,(t)，,其最高截止频率为,f,M,。,假如用时间间隔为,T,S,1/2,f,M,开关信号对,f,(t),进行抽样，则,f(t),就可被样值信号,f,S,(,t,)=,f,(,nT,S,),来唯一地表示。或者说，要从样值序列无失真地恢复原时间连续信号，其抽样频率应选为,f,S,2,f,M,。,这就是著名奈奎斯特抽样定理，简称抽样定理。,语声信号数字化编码,第13页,所谓理想抽样是指以式2.1中开关函数,S,T,(t),为单位高度周期冲激脉冲序列，其波形图如图2.7所表示。,图2.7 单位冲激脉冲序列,语声信号数字化编码,第14页,图2.8 理想抽样样值序列频谱,语声信号数字化编码,第15页,图2.9 三种不一样抽样频率时样值序列频谱,语声信号数字化编码,第16页,至此，我们能够用下述两种被此等价方式来表示有限能量频带受限信号抽样定理。,对于频谱分量低于,f,M,有限能量信号，能够用间隔小于或等于1/2,f,M,该信号瞬时样值来完全描述。,对于频谱分量低于,f,M,有限能量信号，能够从抽样速率大于或等于2,f,M,该信号瞬时样值序列中完全地恢复，即抽样频率应为,f,S,2,f,M,。,语声信号数字化编码,第17页,(2)带通型信号抽样,图2.10 带通型信号示意,语声信号数字化编码,第18页,图2.11 带通型信号样值序频谱,语声信号数字化编码,第19页,(3)与抽样相关误差,前面所讨论抽样定理是基于以下三个前提：,对语声信号带宽限制是充分；,实施抽样开关函数是单位冲激脉冲序列，即理想抽样；,经过理想低通滤波器恢复原语声信号。,语声信号数字化编码,第20页,抽样折叠噪声,抽样定理指出，抽样序列无失真恢复原信号条件是,f,S,2,f,M,。,为了满足抽样定理，对语声信号抽样时先将语声信号频谱限制在,f,M,以内。为此，在抽样之前，先设置一个前置低通滤波器将输入信号频带限制在3400,Hz,以下，然后再进行抽样。,抽样展宽孔径效应失真,语声信号数字化编码,第21页,图2.12抽样折叠噪声示意,语声信号数字化编码,第22页,图2.13 自然抽样与抽样展宽,语声信号数字化编码,第23页,图2.14 抽样展宽电路框图,语声信号数字化编码,第24页,图2.15 展宽孔径效应失真,语声信号数字化编码,第25页,三、量化,1.量化定义及描述,量化是把信号在幅度域上连续取值变换为幅度域上离散取值过程。,量化过程是一个近似表示过程，即无限个数取值模拟信号用有限个数值离散信号近似表示。,语声信号数字化编码,第26页,图2.16 量化示意图,语声信号数字化编码,第27页,2.均匀量化及量化噪声计算,量化就是将幅度值为连续信号变换为幅度值为有限个离散值过程。,各量化分级间隔相等量化方式即为均匀量化。,图2.17(,a,),所表示阶梯状特征中一个台阶高度称为一个量化级。如图所表示，均匀量化时在整个输入信号幅度范围内量化级大小都是相等。量化误差所产生量化噪声也应有两部分：非过载量化噪声和过载量化噪声。,语声信号数字化编码,第28页,图2.17 均匀量化特征与量化误差特征,语声信号数字化编码,第29页,设量化间隔为,，,则,=2,U,/,N,在非过载区内最大量化误差为,e,max,(,u,)=,/2,语声信号数字化编码,第30页,图2.18 语声信号幅度概率分布,语声信号数字化编码,第31页,图2.19 语声信号分级间隔及量化值,语声信号数字化编码,第32页,图2.20 量化信噪比随,l,、,X,e,关系曲线,语声信号数字化编码,第33页,3.非均匀量化及压缩扩张技术,(1)非均匀量化及实现,采取均匀分级量化时其量化信噪比随信号电平减小而下降。,非均匀量化特点是：信号幅度小时，量化间隔小，其量化误差也小；信号幅度大时，量化间隔大，其量化误差也大。,非均匀量化特点是：信号幅度小时，量化间隔小，其量化误差也小；信号幅度大时，量化间隔大，其量化误差也大。,语声信号数字化编码,第34页,图2.21非均匀量化特征及量化误差,语声信号数字化编码,第35页,图2.22 非均匀量化实现框图,语声信号数字化编码,第36页,图2.23 压缩扩张特征,语声信号数字化编码,第37页,(2),律和,A,律压缩特征,律压扩特征,A,律压扩特征,语声信号数字化编码,第38页,图2.24,语声信号数字化编码,第39页,图2.25,A,=87.6,时(,S,/,N,q,),dB,(,A,),曲线,语声信号数字化编码,第40页,A,律13折线压扩特征,详细实现方法是：对,X,轴在01(归一化)范围内以1/2递减规律分成8个不均匀段，其分段点是1/2、1/4、1/8、1/16、1/32、1/64和1/128。,语声信号数字化编码,第41页,图2.26 8段折线分段示意,语声信号数字化编码,第42页,图2.27,A,律13折线压缩特征,语声信号数字化编码,第43页,图2.28,A,律13折线量化信噪比,语声信号数字化编码,第44页,四、编码与解码,1.二进制码组及编码基本概念,当前使用二进制码组编码关系有3种：,普通二进制码编码,循环码编码,折叠二进制码编码,语声信号数字化编码,第45页,图2.29 几个编码方案误码信噪比,语声信号数字化编码,第46页,图2.30 天平称重示意图,语声信号数字化编码,第47页,2.线性编码与解码,(1)级联逐次比较型编码电路,级联逐次比较型编码器就是参考前述天平称重原理组成。,语声信号数字化编码,第48页,图2.31 级联逐次比较编码器原理框图,语声信号数字化编码,第49页,(2)反馈型线性编码器,反馈型线性编码器原理框图如图2.32所表示。,反馈型编码器是采取样值与当地解码输出逐次比较方法进行编码，每一比特比较一次并编出一个码元，这种编码器编码过程是逐次迫近。,语声信号数字化编码,第50页,图2.32反馈型线性编码器原理框图,语声信号数字化编码,第51页,图2.33 编码过程波形,语声信号数字化编码,第52页,(3)加权求和解码网络,解码网络作用是把,PCM,数字码组转换成对应电压或电流幅度。前述反馈型线性编码器中当地解码所用解码网络是电流相加型解码网络，它是加权求和解码网络变型。,语声信号数字化编码,第53页,图2.34 加权求和解码网络,语声信号数字化编码,第54页,图2.35 电流相加型解码网络,语声信号数字化编码,第55页,3.非线性编码与解码,含有均匀量化特征编码叫做线性编码，与之对应含有非均匀量化特征编码就叫做非线性编码。,(1),A,律13折线编码码字安排,前述已说明,A,律13折线分段是对输入信号归一化范围(01)分为8个不均匀段，故要表示不一样段落号就需要有三位码。,语声信号数字化编码,第56页,采取,A,律13折线编码时所需码位数是8，其详细安排是：,a,1,a,2,a,3,a,4,a,5,a,6,a,7,a,8,极性码段落码段内电平码,a,1,=1，,表示正极性；,a,1,=0，,表示负极性；,a,2,a,3,a,4,为000111共有8种组合，分别表示对应8个分段，即第1段至第8段；,a,5,a,6,a,7,a,8,为00001111共有16种组合，表示每段16个分级。,语声信号数字化编码,第57页,(2),A,律13折线编码方法,判定值确实定规律和提供方法,极性码判决：,极性码判定值为零，它依据输入信号,I,S,(,以电流表示)极性来决定，即,I,S,0,时，,a,1,=“1”,码；,I,S,0,时，,a,1,=“0”,码。,语声信号数字化编码,第58页,段落码判决：,对,A,律13折线编码是将编码电平范围(归一化01)以量化段或量化级为单位，逐次对分，对分点电流(或电压)即为判定值,I,R,。,段内电平码判决：,当段落码确定之后，接着确定出该量化段起始电平,I,Bi,和该量化段量化间隔,i,，,由此，就能够进行段内电平码判决了。,语声信号数字化编码,第59页,图2.36 段落码码字判决过程,语声信号数字化编码,第60页,编码方法,A,律13折线编码采取逐次反馈编码。,逐次渐近型编码器,比较判决和码形成电路,判定值提供电路当地解码器,语声信号数字化编码,第61页,图2.37 逐次渐近型编码器原理框图,语声信号数字化编码,第62页,图2.38,D,1,D,8,时序关系,语声信号数字化编码,第63页,编码端量化误差分析,A,律13折线解码,增加了极性控制部分,数字扩张部分由7/11变换变为7/12变换,增加了读出控制电路,语声信号数字化编码,第64页,图2.39,A,律13折线解码器方框图,语声信号数字化编码,第65页,五、单片集成,PCM,编解码器,发送部分,发送部分包含：输入运放、带通滤波器、抽样保持和,DAC,(,数模转换)、比较器、逐次迫近存放器、输出存放器以及,A,/,D,控制逻辑、参考电源等。,语声信号数字化编码,第66页,图2.40 2914功效框图,语声信号数字化编码,第67页,接收部分,接收部分包含：输入存放器、,D/A,控制逻辑、抽样保持和,DAC、,低通滤波器和输出功放等。,控制部分,控制部分主要是一个控制逻辑单元，经过,PDN(,低功耗选择)、,CLKO(,主时钟选择)、,LOOP(,模拟信号环回)三个外接控制端控制芯片工作状态。,语声信号数字化编码,第68页,图2.41 2914经典实用电路,语声信号数字化编码,第69页,第三节差值脉冲编码调制,DPCM,一、,DPCM,原理及实现,DPCM,就是考虑利用语声信号相关性找出可反应信号改变特征一个差值量进行编码。,差值编码普通是以预测方式来实现。,语声信号数字化编码,第70页,图2.42 实现预测横截滤波器,语声信号数字化编码,第71页,图2.43是,DPCM,实现原理框图。如前面所述，,DPCM,方式发送端就是将现有样值与预测值之差进行量化编码方式来实现，而在接收端为了恢复原信号也必须进行与发送端相同预测。,语声信号数字化编码,第72页,图2.43,DPCM,系统原理框图,语声信号数字化编码,第73页,二、自适应差值脉冲编码调制,ADPCM,自适应量化基本思想是：让量化间隔,(,t,),改变，与输入信号方差相匹配，即量化器阶距随输入信号方差而改变，它正比于量化器输入信号方差。,语声信号数字化编码,第74页,图2.44前馈自适应量化,ADPCM,语声信号数字化编码,第75页,图2.45反馈自适应量化,ADPCM,语声信号数字化编码,第76页,图2.46 固定和自适应,DPCM,系统性能,语声信号数字化编码,第77页,三、32,kbit/sADPCM,系统,1984年,ITU-T,公布了,G.721 32kbit/s ADPCM,标准，并于1986年做了深入修改。,语声信号数字化编码,第78页,图2.47,G.721 32kbit/s ADPCM,工作原理框图,语声信号数字化编码,第79页,四、单片集成,ADPCM,编解码器,1.,MC145532 ADPCM,代码转换器,(1)技术特点,满足,ITU-T,提议,G.7211988；,全双工、单信道工作；,选择引脚,律或,A,律编码；,同时或异步工作；,语声信号数字化编码,第80页,轻易与摩托罗拉,PCM,编解码器、滤波器等接口；,串行,PCM,和,ADPCM,数据传输速率为64,kbit/s5120kbit/s；,省电能力用于低电流消耗；,简单时隙分配定时用于代码转换器；,单5,V,电源。,(2),MC145532,引脚符号与功效,(3)应用电路,语声信号数字化编码,第81页,图2.48,MC145532,引脚排列图,语声信号数字化编码,第82页,图2.49,MC145532ADPCM,应用电路,语声信号数字化编码,第83页,2.,MC145540ADPCM,编/解码器,(1)技术特点,单电源工作(2.75.25,V)；,3V,时经典功耗为60,mW，,省电时为15,W；,最小噪音差分模拟电路设计；,完全,律或,A,律压扩,PCM,编解码器滤波器；,语声信号数字化编码,第84页,64，32，24和16,kbit/s,数据率,ADPCM,代码转换器；,通用可编程双音频发生器；,可编程发送增益、接收增益和侧音增益；,用于与话筒接口低噪声、高增益、三端输入运算放大器；,(2),MC145540,引脚符号与功效,(3)应用电路,语声信号数字化编码,第85页,图2.50,MC145540,引脚排列图,语声信号数字化编码,第86页,图2.51,MC14550,手持机应用电路,语声信号数字化编码,第87页,第四节子带编码,SBC,一、子带编码基本概念及工作原理,子带编码是首先将输入信号分割成几个不一样频带分量，然后再分别进行编码，这类编码方式称为频域编码。,把语声信号分成若干子带进行编码主要有两个优点。,语声信号数字化编码,第88页,子带编码实现原理框图如图2.52所表示。在子带编码中，用带通滤波器将语声频带分割为若干个子带，每个子带经过调制将各子带变成低通型信号(图中未画出)。这么就可使抽样速率降低到各子带频宽两倍。,语声信号数字化编码,第89页,图2.52 子带编码原理方框图,语声信号数字化编码,第90页,二、子带编码比特分配及编码速率,在子带编码中，各子带带宽,B,k,能够是相同，也能够是不一样。前者称为等带宽子带编码，后者称为变带宽子带编码。等带宽子带编码优点是易于用硬件实现，也便于进行理论分析。在这种情况下带宽,B,k,等于,B,k,=,B,=,B,/,m,式中，,k,=1,2,3,m,m,是子带总数，,B,是编码信号总带宽。,语声信号数字化编码,第91页,三、子带划分,语声信号各子带带宽应考虑到各频段对主观听觉贡献相等标准做合理分配。,四、16、24、32,kbit/s,电话语声子带编码,该标准采取三种编码速率，即48、56及64,kbit/s。,输入语声信号带宽为507000,Hz，,分成两个等宽子带。,语声信号数字化编码,第92页,第五节参量编码,参量编码原理和设计思想与波形编码完全不一样。波形编码基本思绪是忠实地再现话音时域波形，为了降低比特率，可充分利用抽样点之间信息冗余性对差分信号进行编码，在不影响话音质量前提下，比特率能够降至32,kbit/s。,语声信号数字化编码,第93页,一、语声形成机理及语声信号分析,语声形成大致过程可如图2.54所表示。,从语声信号分析可知，音素分为两类：伴有声带振动音称为浊音；声带不振动音称为清音。,语声信号数字化编码,第94页,图2.54 语声形成过程,语声信号数字化编码,第95页,1.浊音与基音,浊音又称有声音，语声发声时声带在气流作用下激励起准周期声波，如图2.55所表示。由图可见浊音声波含有显著准周期特征，这一准周期音称为基音，其基音周期为418,ms,相当于基音频率在50250,Hz,范围内。,语声信号数字化编码,第96页,图2.55 波音声波波形图,语声信号数字化编码,第97页,图2.56 浊音频谱示意,语声信号数字化编码,第98页,2.清音,清音又称无声音。,图2.57 清音波形图,语声信号数字化编码,第99页,清音没有周期特征，经典清音波形频谱如图2.58所表示。从清音频谱分析可知，清音中不含含有周期或准周期特征基音及其谐波成份。,图2.58 清音频谱示意,语声信号数字化编码,第100页,3.语声信号产生模型,图2.59 语声信号产生模型,语声信号数字化编码,第101页,二、线性预测编码(,LPC),基本概念,在发送端，原始语声输入,A/D,变换器，以8,kHz,速率抽样并变换成数字化语声。然后以每180个样值为一帧(帧周期22.5,ms)，,以帧为处理单元逐帧进行线性预测系数分析，并作对应清/浊音判决和基音提取，最终把这些参量进行量化、编码并送入信道传送。,语声信号数字化编码,第102页,图2.60 线性预测,LPC,编译码方框图,语声信号数字化编码,第103页,在接收端，经参量解码分出参量,a,i,、,G,、,P,和,u,/,v,等。,G,、,P,以及,u,/,v,用作语声信号合成产生，,a,i,用作形成合成滤波器参数。最终将合成产生数字化语声信号再经,D,/,A,变换即还原为接收端合成产生语声信号。,图2.61所表示是简化,LPC,原理框图。,语声信号数字化编码,第104页,图2.61 简化,LPC,原理框图,语声信号数字化编码,第105页,三、线性预测合成份析编码,1.结构原理,激励生成器产生激励信号经线性预测器后得到重构话音信号(,i,)，,线性预测器模拟声道特征，加强了激励信号一些频率域，减弱了另一些频率域，表达了语声信号短时相关性。激励信号则表达了语声信号长时相关性，输入线性预测器激励信号是量化后增益和基音信号。,语声信号数字化编码,第106页,图2.62,LPAS,声码器原理结构,语声信号数字化编码,第107页,2.激励信号生成及表示,激励信号产生有以下几个：,(1)多脉冲激励(,MPE,),(2)规则脉冲激励(,RPE,),语声信号数字化编码,第108页,(3)码本激励,激励信号最终要量化后以二进制形式发送出去。量化有两种类型。一个是标量量化，也就是对每个参数独立地进行量化，然后经过组合确定参数集。另一个是矢量量化，也就是将全部参数组合起来作为一个整体进行量化，在数学上就用矢量来表示参数组合。,语声信号数字化编码,第109页,第六节 GSM及IP电话系统语声编码技术应用及标准,一、,G.728,声码器,G.728,是16,kbit/s,LPAS,声码器，采取低时延码本激励线性预测(,LD-CELP),方式。,1.,G.728,编码器,G.728,LD-CELP,编码器简化结构如图2.63所表示。,语声信号数字化编码,第110页,图2.63,G,.728,编码器结构,语声信号数字化编码,第111页,2.,G,.728,解码器,图2.64,G,.728,解码器结构,语声信号数字化编码,第112页,二、,G.729,声码器,1.,G.729,声码器性能特点,G.729,是8,kbit/s,LPAS,声码器，线性预测采取前馈型前向自适应技术。,2.,G.729,编码器,G.729,编码器如图2.65所表示。模拟话音信号经话带滤波后，按8,kHz,频率抽样并变换成16,bit,线性,PCM,信号，这就是图中编码器输入话音信号。,语声信号数字化编码,第113页,图2.65,G,.729,编码器结构,语声信号数字化编码,第114页,3.,G,.729,解码器,图2.66,G,.729,解码器结构,语声信号数字化编码,第115页,三、,G.723.1,声码器,G.723.1,是双速率,LPAS,声码，低速率编码比特率为5.3,kbit/s，,高速率为6.3,kbit/s，,线性预测也是采取前馈型前向自适应，并使用了预视技术。,语声信号数字化编码,第116页,

展开阅读全文