收藏 分销(赏)

语音编码技术PPT.ppt

上传人:快乐****生活 文档编号:10144297 上传时间:2025-04-23 格式:PPT 页数:128 大小:2.84MB
下载 相关 举报
语音编码技术PPT.ppt_第1页
第1页 / 共128页
语音编码技术PPT.ppt_第2页
第2页 / 共128页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,2,章语音编码技术,1,第,2,章语音编码技术,本章主要内容,语音编码方法、性能及标准,语音信号的采样和量化,语音模型和,LPC,声码器,数字音频编码标准,语音编码器的实时实现,2,2.1,引言,语音、图像采集,3,语音波形,“,象棋是中国古代战争的艺术再现,它的棋盘就象一个古战场,”,波形,4,语音波形,“,中国,”,语音波形,5,语音波形,“,国,”,字语音波形,6,语音波形,“,国,”,部分,语音波形,7,语音波形,“,audio,”,语音波形,8,语音、图像属模拟信号范畴。,语音、图像通过编码实现数字化是必然趋势。,数字化的语音和图像需要用较高的数码率,需占用较大的带宽和存储空间。,压缩数字化语音和图像信号的数码率是实现语音和图像通信数字化的关键。,编码技术的核心就是研究压缩编码算法用尽可能低的数码率获得尽可能好的语音和图像质量。,9,压缩编码的,3,类方法,(1),概率匹配编码:根据编码对象出现的概率分别给予不同长度的代码,以保证总的代码最短,.,(2),变换编码:将信号从一种信号空间变换到另一种更有利于压缩编码的信号空间,然后进行编码,.,(3),识别编码:分解文字、话音、图形和图像的基本特征,与汇集这些基本特征的样本集对照识别,选择失真最小的样本编码传送。,10,变换编码分为两类,.,一类是预测变换,利用信号的相关性,预测将来的信号,对预测的误差,(,余量、残差,),进行编码。,另一类是函数变换,利用信号在不同函数空间分布的不同,选择合适的函数变换后进行编码。,有的文献只将函数变换编码称为变换编码,而将预测变换称为预测编码。,11,本章主要研究的对象是电话语音信号,带宽:,300Hz,3400Hz,宽带语音及声频信号编码方法要求不同,12,2.2,语音编码方法、性能及标准,2,2,1,语音编码的方法,语音信号编码分别沿着两个方向发展:,一个方向是从语音信号波形的特点出发,对波形的采样值,或其预测值,或其预测误差值进行编码,称为语音信号的,波形编码,。,另一个方向是从语音信号的产生机理出发,构造语音信号的模型,提取描述语音信号的特征参数,对模型参数或其预测值进行编码、称为,参数编码,或,模型编码,。,13,三类语音编码器,波形编码,参数编码,混合编码,14,波形编码,波形编码以重构语音波形为目的,力图使重建语音波形保持原话音信号的波形。,编码时用数据表示语音信号的时间波形,在解码端通过重构与原始语音信号相似的波形来得到近似的话音。,般具有适应能力强、话音质量好等优点,但所需用的编码速率高。,如脉冲编码调制,(PCM),。自适增量调制,(ADM),、自适差分编码,(ADPCM),、自适预测编码,(APC),、子带编码,(SBC,、自适应变换编码,(ATC),等都属于这类编码。,它们能在,64Kb,s,一,16Kb,s,的速率上获得较高的编码质量。,15,参数编码,参数编码不以重构原始信号波形为目的,它将语音信号分段,提取能表征语音段特征的参数、在解码端重构一个新的有相似声音但波形不尽相同的语音信号。,声码器所用的参数,有的表明声音的短时谱、有的描述语音产生的数学模型。,编码速率低,可以低到,2.4Kb,s,以下,甚至达到,800 b,s,。,传统声码器由于参数较少,难以重新产生与原始语音相近的声音,合成的语音质量差,通道声码器、共振蜂声码器以及线性预测声码器是传统的参数编码器。,16,混合编码,结合了原有波形编码器质量好和声码器速率低的持点克服了它们各自的弱点,称为,混合编码算法,。,最典型的算法都利用线性预测,(LP),,采用分析合成方法,(Analysis,by,Syntheie,AbS),构成,能在,4Kb,s,一,16Kb,s,的中速率上得到高质量合成语音,如多脉冲激励线性预测编码,(MPLPS),、规则脉冲激励线性预测编码,(RPELPC),、码本激励线性预测编码,(CELP),等。,17,混合编码算法,80,年代以来,低速率,(1.2Kb,s,一,4Kb,s),的参数编码技术也在迅速发展,对传统声码器不断改进,提出了一些新的语音模型和方法,,如混合激励线性预测,(MELP),声码器、正弦变换编码器,(STC),和多带激励,(MBE),声码器。,有的声码器已经可以在,2.4Kb/s,速率提供满足通信质量的语音。,18,2.2.2,语音编码性能的评价,语音编码的性能可以从,4,个方面来评价,比特率,语音质量,信号延时,复杂度。,语音编码质量,数字通信中,语音质量可以分为广播级质量、长途通信质量或称网络质量、通信质量以及合成语音质量等,4,级。,19,4,级语音质量,广播级质量是高质量的宽带,(8kHz),广播解说语音。,长途电话质量或网络质量是指和传统的电话带宽语音信号,(300 Hz,一,3400 Hz),相当的质量。,通信质量是指语音质量有点下降,但仍然保证足够高的自然度和可懂度,可满足大多数专用通信要求。,合成语音质量是指语音保持足够高的可懂度,但自然度及讲话人辨认等方面不够好,一般当编码速率低于,4Kb,s,或,2.4Kb,s,时,产生合成语音质量,20,话音编码研究的目标,在,4Kb,s,时达到长途电话质量,在,2.4Kb,s,左右达到通信质量,21,语音质量,评定方法,主观评定方法是以人类听话时对语音质量的感觉来评定。,客观评定方法有信噪比、加权信噪比、平均分段信噪比等时域的测量方法,还有谱失真测度和,LPC,倒谱距离测度等频域测量方法。,22,主观评定,:,平均意见得分,(Mean Opinion score,,,MOS),23,2,编码速率,编码速率可以用,“,比特秒,(b,s),”,度量,它代表编码的总速率,.,编码速率也可以用,“,比特样点,(b,p),”,度量,它代表平均每个语音样点用多少比特编码,.,平均每样点的比特数越高,语音波形或参数量化越精细,语音质员也就越容易做高,相应地对传输带宽或存储容量的要求也越高,.,24,3,编解码的复杂程度,采用复杂一些的算法能获得较好的话音质量或较低的编码速率。,4,编解码延时,有回声的系统中,往返总延时超过约,100ms,时,回声将干扰正常接收的声音。,对于公用电话网,可能会有几次音频转接也就是会有多次语音编解码,因此对单次语音编解码的延时通常要求不超过,5ms,10 ms,。,通常允许话音编码延时在几十,ms,到,100 ms,之间。当总延时超过,100 Ms,时,一般需要采取回声抵消或回声抑制。,25,2.2.3,语音编码技术的发展和语音编码标准,长途通信网语言编码标准,数字蜂窝系统的语音编码标准,保密电话语音编码标准,26,现有,ITUT,语音编码标准,1.,长途通信网语言编码标准,27,2.,数字蜂窝系统的语音编码标准,数字蜂窝语音编码标准,28,3.,保密电话语音编码标准,窄带保密电话应用于带宽受限信通,如短波信道、有线模拟话路、中小功率卫星信道等。,只有美国公布了所用保密电话的标准。,FS,1015,是美国联邦标准,2,4Kb,s LPC,声码器,该标准由美国国防部,(DOD),制定。,对它的研究始于,20,世纪,70,年代末期,它采用,10,阶,LPC,预测器。,29,各种语音编码标准的效果,30,2.3,语音信号的采样和量化,2.3.1,信号采样,理想冲激抽样,31,矩形脉冲抽样,32,信号的重建,33,对于电话带宽的语音信号,其带宽限制为,300 Hz,一,3400 Hz,,采样频率均为,8000 Hz,。,34,2.3.2,标量量化,量化是把幅度连续的信号转换成幅度离散的信号,,对每个离散值分别进行量化称为标量量化,。,均匀量化器,非均匀量化器之一,最佳量化器,非均匀量化器之二,对数量化器,自适应量化器,差分量化器,35,均匀量化曲线,36,均匀量化器,均匀量化器广泛应用于线性,A/D,变换接口,,例如在计算机的,A/D,变换中,常用的有,8,位、,12,位、,16,位等不同精度。,另外,在遥测遥控系统、仪表、图像信号的数字化接口等中,也都使用均匀量化器。,语音信号数字化通信中,均匀量化则有一个明显的不足:量化噪比随信号电平的减小而下降。,产生这一现象的原因是均匀量化的量化间隔,为固定值量化电平分布均匀,因而无论信号大小如何,量化噪声功率固定不变,这样,小信号时的量化信噪比就难以达到给定的要求。,37,最佳量化器,采用非均匀量化器,其量化特性同输入信号的概率密度函数相匹配可降低量化噪声。,在,P,(,x,)相对比较高的区域内选择较小的量化间隔,在其他区域选择较大的量化间隔,以降低总的噪声水平。,38,对数量化器,39,40,压缩特性,41,两种对数压缩特性,42,13,折线,A,律压扩曲线,43,A,律,13,折线,44,律,15,折线,45,G.7ll,关于,PCM,的建议,常用的,N=8,位,,f,s,=8kHz,,,实际应用的,B=N,f,s,=64 kHz,46,自适应量化器,自适应量化中,量阶不再是固定的,它根据输入信号的短时方差进行调整使量阶的大小和输入信号电平相匹配,前向自适应量化,(AQF),后向自适应量化,(AQB),47,前向自适应量化,(AQF),48,后向自适应量化,(AQB),49,差分量化器,量化之前预处理。对预测后的残差,(,或余置,),信号进行量化的称为差分量化器,可以提高量化精度或减少编码比特数,后向自适应差分量化器,前向自适应差分量化器,50,后向自适应差分量化器,51,前向自适应差分量化器,52,.,.,矢量量化,矢量量化,(vector Quantation),是一种高效的数据压缩技术。,它将若干个时间离散幅度连续的采样值分为一组,形成多维空间的一个矢量,再将此矢量进行量化处理。,提高量化效率,降低数码率。,53,矢量量化,简单矢量量化结构,54,矢量量化,设,X,x,1,x,2,x,N,T,是一个,N,维实数矢量,其中的元素是幅度连续的随机变量。,在矢量量化器中,X,矢量用另一个幅度离散的,N,维实数矢量,Y,匹配,即用,Y,表示,X,,或者说,X,被量化成,Y,。,Y,选自一有限集合,S=Y,i,(1i M),,,Y,i,y,i1,y,i2,y,iN,T,。,集合,S,称为码本,(codebook),或参考模板,(reference template),。,M,称为码本容量。相当于标量量化中的量化电平数。,设计一个码本,使,N,维矢量空间划分为,M,个区域或单元,C,i,(1i M),,并且每一个单元,C,i,对应一个矢量,Y,i,如果有一个矢量,X,在,C,i,中,量化器就以码本矢量,Y,i,表示。,55,矢量量化的,2,维空间,一个,2,维空间划分为,18,个单元,56,实现矢量量化的两个原则,一,如何划分,M,个区域边界。这需要用大量的输入信号矢量经过统计实验确定这个过程称为,“,训练,”,或,“,建立,”,码本。,“,最近邻原则,”,二,设区域内所有输入矢量,X,的集合为,S,l,那么该区域的码本矢量,Y,l,应使此集合中所有矢量与,Y,l,之间的畸变平均值最小。,Y,l,应等于,S,l,中所有矢量的,“,质心,”,57,失真准则,均方误差,(MSE),58,码本设计,根据介绍的两条原则可以形成一种码本设计的递推算法。,这种算法是基于,S,P,Lloyd,的标量量化递推算法,由,Y,Linde,、,A,Buzo,和,R,M,Gray,推广至多维空间后形成的,所以常称为,LBG,算法或,GLA(Generalized Lloyd Algorithm,)。,59,码本类型和码本搜索,树状码本,VQ,系统,多级,VQ,系统,分裂式,VQ,60,树状码本,VQ,系统,61,2.4,语音模型和,LPC,声码器,2.4.1,语音信号的基本特性,语音信号是一个非稳态信号。,其特征是随时间变化的,但在一个很短的时间段内,可以认为具有相对稳定的特征,故称为准平稳信号。,这个时间段约,5ms-50 ms,。,语音可以分为浊音、清音和混合音。,62,浊音、清音,浊音语音在时域上具有准周期特性,在频域上具有谐波结构。,清音语音类似于随机噪声,其频带较宽。,63,语音信号波形及其短时谱,64,浊音声波波形图,65,浊音段窗取波形及典型频谱,(a),汉明窗取浊音波形;,(b),浊音典型频谱,66,清音波形图,清音典型频谱,67,浊音的频谱结构,浊音的频谱结构有两个特点,:,第一,它的精细谱具明显的周期性起伏的谐波特点;,第二,它的谱包络具有所谓的共振峰结构即其谱包络中有几个明显的突起点,称为,“,共振峰,(Formant),”,,其位置称为共振峰频率。,68,语音产生的机理,语音信号的特点是由语音产生的机理造成的。,发浊音时,气管的气流冲击声带,使声带振动,形成一串周期性的脉冲气流送入声道。,脉冲气流叫做声门脉冲。,声门脉冲激励声道产生浊音,声门脉冲的频率叫做基音频率。,发清音时,声带不振动,声道紧缩成窄通道,气流通过时产生湍流,因而明显地具有随机噪声的特性。,69,2.4.2,语音信号的线性预测模型,LPC,:线性预测编码,(Linear Predictive coding),模型化的激励信号分为浊音和清音,浊音语音用周期脉冲序列表示,周期脉冲序列的周期叫做基音周期,清音语音用随机噪声表示,声门气流、声道以及唇辐射的联合作用由一个时变数字滤波器表示,70,时变数字滤波器,零极点模型,全极点模型,LPC,差分方程,71,简化语音信号产生模型,72,LPC,声码器,LPC,差分方程,表明当前的输出值,s(n),可以用当前的输入值,Gx(n),和过去输出采样值的加权和来表示,即具有线性可预测性。,LPC,分析问题可以表述为:给定信号,s(n),,求参数,a,j,(j,1,,,,,p),,用求出的结果作为模型的传递函数参数。,与激励参数,(,清、浊音的产生与判别,),一起构成员基本的声码器,称为,LPC,声码器。,73,最小均方估计 信号设为平稳的(,20ms,语音段),74,预测器系数,3,种求解方法,自相关方法,(AM,,,Auto-correlation Method),、,协方差法,(CM,,,Covariance Method),格型方法,(LM,,,Lattic Methods),。,75,2.4.3,基音检测,利用语音信号时域持性检测,利用语音信号频域特性检测,同时利用语音信号时域和频域特性检测,短时自相关函数,短时平均幅度差函数,(AMDF),76,基于求短时自关函数的基音周期估计,基于短时平均幅度差函数,(AMDF),的基音周期估计,s,w,(n),是一段加窗语音信号,非零区域为,n=0-N,一,1,s,w,(n),的自相关函数称为语音信号,s,(n),的短时相关函数,77,周期性语音信号短时自相关函数和,AMDF,78,进行非线性变换后再求自相关函数,语音信号经过中心削波后的自相关函数,79,示例:自相关法提取基音,系统框图,80,2.4.4,LPC,声码器,在发送端,逐帧地分析并提取声源和声道的有关特征参数,编码后输出。,在接收端,解码后获得相应的特征参数,重新合成语音信号。,81,LPC,10,声码器,LPC,声码器速率,:2,4Kb,s,或者更低,在,LPC,声码器中,描述语音的特征参数是,p,阶全极点模型的谱参数,a,i,(i=1,p),增益,清浊音判决信息,浊音时的基音音调,82,LPC,l0,发送端框图,83,LPC,10,接收端框图,84,LPC,声码器主要存在下面几个问题,(1),由于,LPC,10,声码器采用过分简化的二元激励,使合成的语音自然度较低。,(2),由于在噪声的影响下不易准确提取基音周期和不能正确判决清浊音,当背景噪声较强时,系统性能显著恶化。,(3)LPC,10,的语音谱共振峰位置及带宽估值有时会产生很大的失真,从而影响语音的质量。,85,LPC,10,声码器的改善,1,激励源的改善,(1),采用混合激励代替简单的二元激励,(2),激励脉冲加抖动,2,基音提取方法的改善,3,声道滤波器参数的改善,86,2,5,语音的合成分析编码,合成分析法(,ABS,)的基本思想是用合成来指导分析。,将合成器引入编码瑞,使之与分析器相结台,在编码器中产生与译码器端完全一致的合成语音,将此合成语音与原始语音相比较,根据一定的误差准则调整计算各个参数,使得二者之间的误差达到最小。,将误差最小时的系统参数传送到接收端,可以合成较高质量的语音。,87,AbS,LPC,编码方法,(1),缓存一帧语音采样值通道,LPC,分析得到一组,LPC,系数。,(2),通过,LPC,逆滤波计算不量化的残差信号。,(3),由于,LPC,分析帧通常较长,确定激励信号时需要把一帧分成几个子帧。,(4),对每个子帧计算基音滤波器,(,长时预测器,),参数。,(5),将基音和,LPC,合成滤波器级联起来,选择最佳激励信号。,(6),接收端根据收到的码字或数据求得最佳激励信号,通过级联滤波器产生与原始语音误差最小的合成语音。,88,AbS,LPC,89,2.6,多带激励,(MBE),和混合激励线性预测,(MELP),编码,多带激励,(MBE),语音编码,混合激励线性预测,(MELP),编码,90,多带激励,(MBE),语音编码,MBE,编码算法首先由美国的,MIT,大学林肯实验室的,P.W.Griffin,和,J.S.Lim,于,1984,年提出的。,算法的关键是提出了一种基于频域的、新的语音信号产生模型,多带激励模型,进而提高了合成语音的自然度。,91,MBE,语音模型,MBE,模型与传统的声码器模型的突出区别在激励模型的表示上。,传统的声码器模型整个频带不是清音就是浊音激励谱由全频带的清浊音判决并由基音周期表示。,这种描述方法不能反映语音的复杂构成,合成语音自然度差。,MBE,模型,将整个频带以基音谐波为中心以基音频率为带宽划分为若干频带,在每个频带根据频谱特征进行清浊音判决,形成多带激励谱。,整个激励谱由基音频率和它的谐波以及一组清浊音判决参数表示,能较好地反映语音特征。,92,混合激励线性预测,(MELP),编码,MELP,算法的基本特点:采用了混合激励的形式代替基本,LPC,模型的二元激励形式将周期脉冲激励源和白噪声源混合作为激励信号,解决了二元激励模式不能准确描述过渡帧和弱浊音帧的问题,使合成激励信号谱与残差信号谱更加匹配,吸取,MBE,模型的思想,对激励信号进行分带处理,MELP,声码器的质量大大超过,LPC,10,声码器,,是一种较理想的低速率语音编码算法,93,MELP,简要框图,94,1.,分析部分,基音提取分为几个步骤:首先是用自相关法进行整数基音初估,得到整数基音初值;然后利用内插公式提高输入基音值的准确度。,分带话音分析首先将输入语音信号滤成,5,个子频带的信号,计算,5,个子带的分带话音强度井以此为依据进行分带清浊音判决。,线性预测分析用,L,D,算法进行自相关分析。对线性预测系数的量化使用多级矢量量化技术。,计算残差谐波谱时,首先使用量化后的,LSF,参数计算线性预测系数,并用它产生残差信号,对其进行,FFT,变换。利用频谱峰点检测算法找到与前,10,次谐波对应的傅里叶系数输出。,95,2.,合成部分,合成部分仍然采取,LPC,合成的形式,不同的是激励信号的合成方式和后处理。,MELP,算法中,混合激励为合成分带滤波后的脉冲与噪声激励之和。,脉冲激励是用长度为,个基音周期的残差谱博里叶系数的离散博里叶反变换计算出来。,噪声激励是首先产,0,,,1,间均匀分布的白噪声源,再对其进行电平调整和限幅。,脉冲和噪声源各自滤波后加在一 起合成混合激励。,混合激励信号合成后经自适应谱增强滤波器处理,用于改善共振峰的形状。,随后,激励信号进行,LPC,合成得到合成语音。,96,3.,参数量化编码部分,MELP,算法的参数包括,LPC,参数、基音周期、模式分类参数、分带混合比例、残差谐波谱参数和增益。,97,数字音频编码标准,话音音频编码标准,1.G.711,标准,CCITT,(国际电报电话咨询委员会)于,1972,年对话音频谱的模拟信号用脉冲编码调制(,PCM,)编码时的特性进行了规范,速率为,64 kb/s,适合于电话质量的语言信号编码,(,频率范围,300 Hz3.4 kHz),98,2.G.721,标准,G.721,标准是,CCITT1988,年制订的,速率为,32 kb/s,采用自适应差分脉码调制,(ADPCM),算法,适合于中等质量音频信号编码,同时也应用于调幅广播质量的音频信号编码,99,3.G.722,标准,G.722,标准是,CCITT1988,年制订的,该标准规范了一种音频(,50,7000Hz,)编码系统的特性,速率为,64 kb/s,采用子带自适应差分脉码制,(SB-ADPCM),算法,具有数据插入的功能,适合于调幅广播质量的音频信号编码,也适合于需要存储大量高质量音频信号的多媒体系统,例如视听多媒体、会议电视等具有调幅广播质量的音频,100,G.722,编,/,解码器原理框图,(a),发端编码器;,(b),收端解码器,101,4.G.728,标准,速率为,16 kb/s,采用短时码本激励线性预测编码,(LD-CELP),算法,适合于高质量的语音信号编码,102,5.G.729,标准,G.729,标准提出了一种采用共轭结构代数码激励线性预测(,CSACELP,)方法,是以,8kb/s,速率对语音信号编码的算法,它是由,ITUT,于,1995,年制订的,该算法应用在多媒体通信和,IP,电话等领域,103,CSACELP,编码器原理,104,GSM,标准,由欧洲数字移动特别工作组制订,速率为,13 kb/s,采用长时线性预测规则码本激励,(RPE-LTP),算法,适合于移动通信的低速语音编码,编码净比特率为,K b/s,,加上信道抗干扰编码后为,22.8 K b/s,,再加上管理信息等,信道传送速率为,24.7K b/s,RPE-LTP,方案由预处理、,LPC,分析、短时分析滤波、长时预测和规则激励码编码五大部分构成,105,GSM,标准的长时线性预测规则码本激励,(RPE-LTP),编码原理图,方案由预处理、,LPC,分析、短时分析滤波、长时预测和规则激励码编码五大部分构成,106,GSM,的,RPE-LTP,方案的一帧中各参数编码比特分配如表,每帧,20ms,,共,260bit,量化编码,所以净编码速率为,13 kb/s,107,CTIA,标准,美国数字移动通信标准,速率为,8 kb/s,采用矢量和激励线性预测,(VSELP),算法,压缩率大,计算量适中,同,GSM,的,13 kb/s,标准一样,应用在低速语音编码领域,108,NSA,标准,美国国家安全局标准,速率为,4.8 kb/s,和,2.4 kb/s,分别采用码本激励,(CELP),和线性预测,(LPC),编码方案,。,109,高保真立体声音频编码标准,1.MPEG1,音频编码标准,是国际上第一个高保真立体声音频编码标准,以,MUSICAM,(,Masking Pattern Universal Subband Integrated Coding And Multiplexing,)为基础的三层编码结构,根据不同的应用要求,使用不同的层来构成其音频编码器,110,2.MPEG2,音频编码标准,在,MPEG1,音频编码方案,MUSICAM,只能传送左、右两个声道,MPEG2,在其基础上扩展了低码率多声道编码,称为,MUSICAM,环绕声,该方案将声道数扩展至,5.1,个,即,3,个前声道(左,L,、中,C,和右,R,)、,2,个环绕声道(左,LS,、右,RS,)和,1,个超低音声道,LFE,(常称为,0.1,声道),它于,1994,年公布,111,3.MPEG4,音频编码标准,MPEG4,定义了,3,种类型的编码器,低速率音频编码,对,8kHz,取样的语音的,2,4kb/s,速率的编码,中速率音频编码,对,8,或,16kHz,取样的语音的,4,16kb/s,速率的编码,高速率音频编码,指,16kb/s,以上速率的编码,112,4.AC3,系统,AC3,系统是,Dolby,公司开发的新一代高保真立体声音频编码系统。,目的是为美国的全数字式高清晰度电视(,HDTV,)提供高质量的伴音。,1993,年,11,月,美国高级电视系统委员会(,ATSC,)正式批准其大联盟高清晰度电视(,GAHDTV,)系统采用,AC3,音频编码方案。,113,AC3,系统音频编码原理,114,2.7,语音编码器的实时实现,语音编码器的实时实现除采用专用芯片外还有两种方法。,一种是计算机主机上用计算机本身的主处理器完成语音信号实时编解码。,另一种方法是用数字信号处理器,(DSP),实现,这是各种独立工作系统以及研究开发时采用的方法。,115,基于,DSP,的语音编码器实时实现,2.7.1 DSP,芯片,1.,首先应该考虑是选用浮点还是定点,DSP,。,2.,其次要根据语音编码算法的复杂度选择所需的,DSP,芯片运算速度。,3.DSP,芯片的功耗是一个非常重要的选择因素。,4.,还应该考虑,DSP,芯片提供的硬件资源。,116,2.7.2,声码器实时实现的实例,系统硬件设计,系统软件设计,系统硬件设计,1.TMS320C31,为主处理器,完成语音编码算法以及通信和控制任务。,2.,模拟接口部分完成语音,A,D,、,D,A,等功能。,3.,数据接口完成一个标准的同步接口,输入、输出编解码参数。,4.,控制接口控制选择不同速率。,117,多速编码器硬件结构,118,多速编码器硬件单元,处理器部分,模拟接口部分,数据接口部分,速率控制口,119,系统软件设计,整个系统软件全部由,TMS320C31,完成。,全部软件包括,3,个模块,即主模块、话音输入输出模块和数据通信模块。,120,声码器软件各模块的工作时序,121,2.7.3,语音编码器的应用技术,同步,回波抵消技术,话音激活检测,(VAD),122,回波抵消技术,所谓回波,是指在二四线转换的混合电路中,由于阻抗不匹配,使得四线接收通路的信号泄露到四线发送通路,使得对方讲话者能听见自己延时的声音。,在延时短并放适当衰减的情况下,这种回被一般觉察不到。,低速的语音编码器往往会带来较大的编解码延时,加上系统本身的传输延时,回波可能影响正常通话,而需要采用回波抵消技术。,回波抵消功能一般都在语音编码器中实现。,123,没有回波的电话通信(阻抗匹配),2/4,线转换装置,-,混合电路,124,电话通信中电回波产生机理,125,单向回波抵消原理(一个回波抵消器),126,自适应横向滤波技术实现回波抵消,127,两端使用回波抵消器(二,个回波抵消器),第二章完,128,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服