ImageVerifierCode 换一换
格式:PDF , 页数:148 ,大小:6.02MB ,
资源ID:5691127      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/5691127.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(音频编码(高泽华)上.pdf)为本站上传会员【xrp****65】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

音频编码(高泽华)上.pdf

1、前言 第一部分:基本原理 第二部分:主流标准 第三部分:技术分析 音频编码的分类 按照编码的采样率分 语音编码(小于8khz)音频编码(大于8khz)按照编码的方法分 波形编码器 感知编码器 参数编码器 不同编码方法的应用 波形编码器 ADPCM,G.721,G.722,G.726等 特点:基于ADPCM编码.简单预测编码器.感知编码器 mp2,AAC,WMA,ATRAC,AC3等 特点:基于人耳建模,属于变换编码器.编码内核基于T+SQ.应用:大于8khz的音频编码.参数编码器 G.723.1,G.729,G.728,CELP,AMR,EVRC等 特点:基于人口建模,属于预测编码器.编码内核

2、基于P+VQ.应用:小于8khz的语音编码.人耳模型 人耳的听隔 sound pressure level(SPL)Absolute Threshold of Hearing Critical Bands Simultaneous Masking Non-simultaneous Masking Perceptual Entropy 外耳 中耳 内耳 组成 耳翼,外耳道,鼓膜 听小骨 半规管,前庭窗,耳蜗 作用 1.声源定位,2.放大20db,共振,头部衍射 作用:1.放大声压.2.保护内耳.半规管,前庭窗属于主体感受器.耳蜗是听觉受纳器.基底膜:带通特性 Absolute Threshold

3、 of Hearing:一个纯音在无声环境下可以被人听到的能量大小 巴克谱 巴克谱是根据人耳的带通特性总结出的公式.step 1:FFT Analysis step 2:Determination of the sound pressure level step 3:Considering the threshold in quiet step 4:Finding of tonal and non-tonal components step 5:Decimation of tonal and non-tonal masking components step 6:Calculation of

4、individual masking thresholds step 7:Calculation of the global masking threshold LTg step 8:Determination of the minimum masking threshold step 9:Calculation of the signal-to-mask-ratio 第一心理声学模型Pre-echo的产生 无损解码模块量化模块时频变换模块其他处理模块无损解码模块量化模块时频变换模块其他处理模块心理声学模型PCMBitstreamBitstreamPCMMPEG1/2 AUDIO MPEG2/

5、4 AAC MPEG4 AUDIO(1)TwinVQ,BSAC MPEG4 AUDIO(2)HE-AAC,HE-AACv2,AC3/EAC3,DTS/DTS-HD AVSA,DRA Vorbis,WMA and WMA pro Qdesign,Cook 背景:为了在1.5Mbps码率对视频和伴音进行高质量压缩,MPEG于1992年制订完成了MPEG-1标准,MPEG-1音频编解码标准分为三层,复杂度和音质逐层提高,MP3即为其中的第三层,MPEG-1 layer3.层3的算法组要是靠ASPEC算法和OCF算法进行加强的.技术指标:采样率:32、44.1、48 kHz 码率:32kbps-160

6、kbps/声道 声道:单声道、立体声 编码器技术框架 层1/层2编码器 层3编码器 Layer 1 and 2 技术特点 IS+MS PQF SQ Bit Allocation Header解析与解码bit stream 格式infoScalefactor解码Huffman解码Alias cancellationIMDCT分析子带滤波器立体声解码反量化 REORDER mp3比特流输入输出PCM数据Layer 3 技术特点 IS+PQF PQF+MDCT SQ Huffman Coding Part2_3_lengthPart3_lengthPart2_length子区0子区1子区21 or

7、0Big valueCount10000000Zero区576个频率线的huffman码字Scalefactor无损解码模块 层1/2 采用定长位分配指示方法对残差谱线进行编码.解码时,通过获得每个采样的编码位宽,依次读取码流中码字.完成解码.L2和L1不同的是,层二对3个数据进行打包处理,每3个残差谱线分成一组,统一编码.而L3只对spectral使用了huffman编码的方法对scalefactor使用定长码编码.反量化Scalefactor反量化残差谱线De-scaleDemux 量化模块 MPEG1/2 Audio 编码端通过在每个子带中取一个scalerfactor,并始每个谱线都除

8、以scalefactor减小谱线的动态幅值范围,降低量化噪声,并且使用非均匀量化进一步减小频率谱线的幅值,便于进行huffman编码时减小码表。所以解码中反量化模块由2级组成,一级残差谱反量化,一级是sfb反量化.量化公式 xri=sign isi*isi43214global_gaingr-210-8subblock_ gainwindowgr2 scalefac _ multiplier*scalefac _ sgrchsfb window xri=sign isi*isi43*214global_ gaingr-2102 scalefac _ multiplier*scalefac _

9、lsfbchgr preflag grpretabsfb(1)long block:(2)short block:s 2nb2nb1*s 2nb1where,s is the fractional num ber,s is the requantized value,andnbis the number of bits allocated to samples in the subband.层3 层1 s factor*s s C*s Dwhere,s is the fractional number,and s is the requantized value.层2 立体声处理模块 MS s

10、tereo and Intensity stereo MS和IS应用范围 MS立体在左右声道所传送的分别为 middle和side,要经过以下的公式才能重建出左右声道:LiMiSi2 and RiMi Si2.人类听觉系统一般对低频信号而言,其对信号的能量与相位皆较敏感,相对于在高频信号,人耳只对其能量较为敏感,而相位较不敏感。Intensity Stereo coding就是利用此一人耳的特性,被使用在高频区域里。其中is_possb 在scale factor中指定 时频变换模块 层1/2的T模块由PQMF和WOA(window-overlap-add)组成.层3在进行PQMF之前还要有I

11、MDCT和WOA子模块.10/2 10cos()(21)4cos()(21)4NkiiNikkNXxikNNxXikNMPEG1/2 Audio都采用了一种PQMF变换进行时频分析.一帧数据以12个样本为一组,层1有32个组,层2,3有36个样本为一组.编码时每帧数据加窗和将采样后的数据的进入32个滤波器,得到频域数据.解码时 Filter Bank N=32 N-1kii=0N/2-1ikk=01NX=x cos(i+)(2k+1)N241Nx=X cos(i+)(2k+1)N24(I)MDCT 层3在PQMF基础上增加了MDCT来提高频率分辨率.公式如下.而且针对稳态帧和瞬态帧层3使用不同

12、的分析长度.N=36 长窗 12 短窗 WOA:de-windowed 层3使用正弦窗.规定了4种窗型分别是开始,结束,长窗和短窗.层使用当前帧的前半帧数据和前一帧的后半帧数据叠加消除频域混叠.(如图)当使用短窗时,3个短窗是在码流中是interlace存储的.首先要进行解交织处理.处理方法如图.zi xisin36i12 for i=0 to 35zixisin36i 12for i=0 to 17xifor i=18 to 23xisin12i 1812for i=24 to 290for i=30 to 35zi0for i=0 to 5xisin12i 612for i=6 to 11

13、xifor i=12 to 17xisin36i 12 for i=18 to 35yij xij sin12i 12for i=0 to 11,j=0 to 2a)block_type=0(normal window)b)block_type=1(start block)c)block_type=3(stop block)d)block_type=2(short block)背景:针对标准清晰度数字电视和高等清晰度数字电视应用下制定的方案1992年正式发布,标准号是ISO/IEC13818-3.他能够提供CD级的音质.MPEG2 BC是针对MPEG-1音频兼容的多声道和低码率的扩展.技术背景

14、采样率:16,22.05,24,32,44.1,48khz 比特率:8384kbps(2声道)通道 :5.1声道 Prediction 利用预测技术减少通道间冗余.使用通道1和通道2的采样预测通道3,4,5的采样数据.T2(n)pred_coef_T2_0sbgr,pci T0(ndelay_comppci)pred_coef_T2_1sbgr,pci T1(ndelay_comppci)pci 0pci=022T3(n)pred_coef_T3_0sbgr,pci T0(ndelay_comppci)pred_coef_T3_1sbgr,pci T1(ndelay_comppci)pci

15、0pci=022T4(n)pred_coef_T4_0sbgr,pci T0(ndelay_comppci)pred_coef_T4_1sbgr,pci T1(ndelay_comppci)pci 0pci=022T2(n)=T2(n)-T2(n)T3(n)=T3(n)-T3(n)T4(n)=T4(n)-T4(n)背景 1997年制订不兼容MPEG-1的音频标准MPEG-2 NBC,即MPEG-2 AAC 1999年MPEG-2 AAC增加LTP和PNS工具,形成MPEG-4 AAC v1 2002年MPEG-4 AAC v1增加了SBR和错误鲁棒性工具,形成MPEG-4 HE-AAC 200

16、4年MPEG-4 HE-AAC引入PS模块,提升低码率性能,形成EAAC+技术指标 采样率:8kHz-96kHz 码率:8kbps-576kbps 声道:最多支持48个主声道,16个低频增强声道 MPEG2 AAC技术特点 IS+MS+Coupling MDCT SQ Huffman Coding GC,TNS,Prediction DRC Bitstream deformaterSpectrum normalization and interleaved VQScalefactor coding Huffman codingQuantizationScalefactor coding Ari

17、thmetic codingQuantizationM/SPNSPredictionIntensityCodingLTPTNSFilterbankGain ControlTwinVQAACBSACSSRLC/LD/LTPUnused featuresOptional featuresMandatory featuresMPEG4 AAC技术特点 MPEG2 AAC +LTP +PNS 无损解码模块 MPEG2/4 AAC标准的也应用了huffman编码算法到无损编码模块.但与mp3不同的是.MPEG2 AAC对scalefactor也使用了huffman编码.并且码本更加合理.量化模块 MPE

18、G2/4 AAC标准中的量化部分也是用了非均匀量化器.公式如下.41(_)34_()0.4054)*()0.4054)*2scalefactor common scalefacmdctlinesign q iabs q i时频转换模块 MPEG2/4 AAC只应用了MDCT算法把时域数据转换到频域数据,没有使用MP3的PQMF模块.而且,AAC中一帧的数据是1024个采样,并对每帧的信号类型进行分析,分为和mp3相似的4个类型编码,长窗,短窗,开始窗和结束窗.AAC长窗1024个数据,短窗256个数据,当当前帧为短窗时,每帧有8个短窗数据.而且在AAC中,标准提供了2中基本窗函数,一种是和mp

19、3一样的正弦窗,一种是KBD窗.其他模块 MPEG2 AAC使用了TNS算法降低编码系统的pre-echo噪音,使用了prediction算法开发信号频域的帧间特性,提高编码效率.MPEG4 AAC使用了LTP代替MPEG2 AAC的prediction算法,力图在获得同样编码质量的同时降低编码复杂度.MPEG4 AAC也应用了PNS算法提高系统对高频部分信号编码的质量.Prediction 帧间预测 后向自适应格型预测 LMS自适应原理 只在非短窗内使用 应用单位为sfb,分组复位 RECONSTRUCTION CONTROL IF(PDP&PU)xi,rec(n)=yi,rec(n)+xi

20、est(n)ELSE xi,rec(n)=yi,rec(n)Pi xi,est(n)xi,rec(n)Qi-1 yi,q(n)yi,rec(n)Predictor Side Info z-1 xi,rec(n-1)Coeff计算应用预测预测器更新)()()1()(0,10,1,nenkbnranrqqq naxnrrecq)(0,)()()(2,1,nxnxnxestestest)1()()(1,nrnkbnxmqmmest)()()(,1,nxnenemestmqmq()()()recestqxnxne n重建公式 预测公式 Reset group number Predictors of

21、 reset group 1 P0,P30,P60,P90,.2 P1,P31,P61,P91,.3 P2,P32,P62,P92,.30 P29,P59,P89,P119,.如果是固定的信号(指有规则的周期的信号)则a=b=1,1,1,0,0221,1,12()(1),1,2,()()()()(1)q mq mmqqrecq mq mE enrnkmenrnxnE enE rn,1,122,1,1()(1)()()(1)(1)()()(1)0.5(1)()0.90625mmmmmq mq mmmq mq mCORnknVARnCORnCORnrnenVARnVARnrnen自适应公式 如果要

22、自适应的调整系数适应当前信号的属性则 预测器复位 自相关函数LevinsonDurbin(order-12)量化反射系数截断系数计算LPC系数TNS滤波(MA)/R0errorgainR(s)Index,orderLPC系数TruncateCoeffsComputeLPCCoeffsTNS滤波(AR)Spectral dataIndex,TNS orderTNS decode coeffsLPC coeffsSpec dataRef.coefCoefEncodeDecodeTNS Temporal Noise Shaping(TNS)是一种能够自适应于 入信号特性来降低pre-echo 效应的

23、新技术。它利用应用 于信号频谱的处理来实现时 域噪声形状的控制,能够对 量化噪声的细微时域结构(甚至在一个滤波器组窗口 内)进行控制.TNS技术特点 帧内预测 任意窗使用 L-D算法 可以在任意地方使用,可以跨越SFB 8个side info.Coeff计算边界确定应用滤波Gain Conctrol组件有3子模块组成.(1)GC数据解析 (2)GC函数设置 (3)GC WOA与综合 原理:类音调信号与类噪声信号相比需要更高的编码精度 Long Term Prediction 是一种时域帧间1阶前相自适应IIR滤波器.目的在于减少信号的时域帧间冗余.LTP 模块码流解析预测计算时频转换TNS编码

24、时频转换TNS解码数据重建LTP采样更新在每帧有一个ltp参数,用ltp参数查表可以得到ltp预测系数.并在该sfb内执行时域预测.当前帧内可以有偏移参数.由于LTP是时域预测,要用前一帧的时域数据乘以预测系数得到当前预测值.再经过时频变换转换到频域系数和TNS编码(如果使用)才能和当前码流中的残差值相加重构.ltp从sfb 0开始执行重构,最多执行40个sfb.LTP和PNS不可同时使用,如果码流中同时标识LTP和PNS同时有效,优先节目PNS,不解码LTP.偏移Pred_bufEst_bufSfb_coefX时频转换T_Est_coefF_Est_coefF_Cur_coef+F_Rec_

25、coefLtp_max_sfb原理:Perceptual Noise Substitution(PNS)在每个sfb内检测类噪声信号.在流中解析噪声替代标志和替代信号带宽的功率.解码器按照功率谱插入伪随机矢量来替代谱线信号.背景 三星在ISO制定MPEG4 音频标准时提交了自己的音频编码方案.该方案使用Bit Slice Arithmetic Coding代替了MPEG2 AAC的huffman解码单元.该方案被MPEG4音频标准工作组采纳,应用到MPEG4 音频标准中.该方案能够实现精细可扩展编码.被应用于T-DMB和S-DMB系统.技术框架 Bitstream deformaterSpec

26、trum normalization and interleaved VQScalefactor coding Huffman codingQuantizationScalefactor coding Arithmetic codingQuantizationM/SPNSPredictionIntensityCodingLTPTNSFilterbankGain ControlSBRPSTwinVQAACBSACSSRHE-AACAAC+LC/LD/LTPUnused featuresOptional featuresMandatory features技术特点:1.比特率可分级:分层实现比特率

27、16(基本层),24,32,40,48,56,64kbps.2.带宽可分级:对每层,仅仅受限的频率带宽才被编码.每层的可分级增量带宽是3.5khz.1.BSAC的调整步长:基本层:16k bps 每个增加层:1 kbps 2.每32个谱线数据形成一个处理单元,有相同的算法编码模型索引.被称为codeband 3.4维比特片矢量分为2个子矢量(矢量0和矢量1).4.立体声编码和PNS使用不同的编码模型 5.差分编码的Scale-factor使用许多不同的编码模型.6.不同的codeband可以有共同的Scale-factor但是有不同的算术模型.背景 NTT在ISO制定MPEG4 音频标准时提交

28、了自己的音频编码方案.该方案使用Twin-Vector Quant代替了MPEG2 AAC的huffman解码单元.该方案被MPEG4音频标准工作组采纳,应用到MPEG4 音频标准中.该方案能够实现精细可扩展编码.技术框架 Bitstream deformaterSpectrum normalization and interleaved VQScalefactor coding Huffman codingQuantizationScalefactor coding Arithmetic codingQuantizationM/SPNSPredictionIntensityCodingLTP

29、TNSFilterbankGain ControlSBRPSTwinVQAACBSACSSRHE-AACAAC+LC/LD/LTPUnused featuresOptional featuresMandatory featuresTwinVQ解码框图 LPC coefficientcalculationLPC cepstrumcalculationLPC coefficienttoLSP coefficientLSP VQLPC cepstrumcalculationMDCTBark calculationBark VQBark envelopecalculationPowercalculat

30、ionPower VQInterleaveWeightedVQWeightedVQIMDCTLPC spectrumcalculationDecoderDecoderDecoderDecoderDecoderDe-interleaveXXXEncodeDecode背景:HE-AACv1/v2是三种MPEG技术的整合体,包括高级音频编码(Advanced Audio Coding,AAC),以及科玎技术有限公司(Coding Technologies)的谱带复制(Spectral Band Replication,SBR)和参量立体声(Parametric Stereo,PS)技术。SBR是一种

31、独特的带宽扩展技术,它能够仅仅使用一半的比特速率带宽来进行音频编解码,而传输质量却一致。PS则能够使低比特速率的立体声信号,在编解码的效率上增加一倍。HE-AACv1/v2在许多的国际标准化组织中都已经被广泛采用。性能:支持多声道5.1,7.1以及更多(总支持信道数可达48)以48kbps速率传输CD音质立体声,以32kbps速率传输准CD音质立体声,以24kbps速率 传输准优质立体声.低至8kbps的速率单声道优化传输话音、话音/音乐混合音频 遵从ISO/IEC 14496-3 SBR技术 SBR工具用于重建音频信号的高频区域成分,这种重建是基于对在编码过程中被截断的谐波序列的复制而进行的

32、SBR首先对生成的高频成分的谱包络进行调整,然后对经过调整的谱包络进行综合滤波,再加上噪声处理和正弦成分,从而重构出原始音频信号的谱特征。SBR技术由4个模块组成分别是:谱线解码模块.分析综合滤波器模块.HF产生模块.HF调整模块.BitstreamPayloadDeformatterAnalysisQMF BankHuffmanDecoding&DequantizationBitstreamParserAAC CoreDecoderHF GeneratorEnvelopeAdjusterSynthesisQMF BankHE-AACv1比特流OutputPCM Samples HF adj

33、ustment模块HF generation模块时频变换模块时频变换模块残差谱线解码Y分析QMFMPEG4 AAC解码器加躁谱线分析反量化码流解析线性预测组装调整正弦调制W2W1XXHigh综合QMFXHighEorigQorig比特流输入XLow时域PCM信号Huffman解码子带1子带5子带4子带3子带2子带6子带10子带9子带8子带7子带11子带16子带14子带15子带12子带N子带N-1频带复制Huffman解码有数解码有数据的据的区域区域960samples/frame时N=301024samples/frame时N=32时域频域残差谱线解码模块 该模块实现确定非零谱线位置和非零谱线

34、的解码.在确定非零谱线位置,标准采取的方法很灵活.在解码谱线数据时依然采用差分huffman解码.反量化 反量化 QMF Analysis SBR工具的第一个模块就是首先把解码后的时域数据转换到频域,这个功能是通过复数分析滤波器组实现的.复数矩阵如下:QMF Synthesis:频带复制后的数据还要统一转换到时域.复数矩阵如下:QMF 将采样综合 SBR内部还有一种子带综合模式,既是降采样综合,其变换矩阵如下:HF 产生模块 HF生成器的目的是将一定数目 的由从矩阵X XLow的一些连续子带 通过合成滤波器组得到的子带信号 复制到矩阵X XHigh的一些连续子带 中去。计算协方差矩阵计算线性预

35、测系数计算chirp factors 计算patch信息计算Xhigh预测值输入参数和矢量输出参数和矢量XHighbwArray a0(k),a1(k)patchStartSubband 和patchNumSubbandsk(i,j)XLowHF 产生模块公式推导 Step5:HF信号组装Step4:增益计算Step3:谱线估计Step2:附加HF信号计算Step1:MappingGenerate SinusoidHarmonicMap SinusoidHarmonicEstimation of current envelopeXhighECurrEOrigMappedQMappedSInde

36、xMappedSMapped计算HF信号的幅值QMSM增益计算GLimBoostQMLimBoostSMBoost计算HF信号加躁波加正弦谐波XhighGFilt参数计算W1W2YQFiltReSMBoostQMLimBoostGLimBoost谱线和噪声地址映射QOrigEOrig输入参数与矢量输出参数与矢量HF 调整 在预测了高频数据以后.预测出的数据和原始数据差异还有很大,HF调整模块就是利用码流中的参数信息,解析出附加激励信号,附加噪声信号和附加正弦信号,再把这些信号值加到预测值上,近似还原得到原始高频数据.映射 频谱评定 噪声谱正规化 正弦谱正规化 正弦产生 增益计算 能量补偿 增益

37、限制 各种增益计算 平滑滤波 加躁 正弦调制 HF调整后得到的矢量即可和源低频矢量合并,统一进入QMF综合滤波器组,进行频时转换,得到时域数据输出,完成解码过程.HE-AACv2=HE-AACv1+Parametric stereo 解码器结构如下 HE-AACv1解码器QMF Analysis(64 bands)HybridanalysisDelayLFHFDe-correlationStereo ProcessingHybridsynthesisHybridsynthesisQMF systhesis(64 bands)QMF systhesis(64 bands)s(k,n)d(k,n)

38、LRParametric stereo MPEG4 AAC解码器Other SBR ToolDe-correlationLow frequency filteringFramingPerform transient detectionStereo ProcessingMixingApply transient reduction to decorrelated signalCalculate decorrelated signalInterpolationPhase parametersHi,j(k,ne)dk(z)DemuxerSk(n)Hybrid QMF synthesis filter

39、bankMixinglk(n),rk(n)L,ReAAC+码流 PS PS技术由4个模块组成.码流解析,混合QMF分析与综合模块,立体声处理模块,解相关模块.PS单元的码流解析相对简单,除了要解码出相应的定长sideinfo数据以外,主要是解码参数立体声的4个参数iid,iic,opd和ipd以及它们的位置信息.这4个参数都是使用差分huffman编码.混合QMF分析与综合模块 对经过QMF处理的频谱,PS模块要做进一步谱线分析,把1024个谱线分成10,20或34个子带.分组方式和公式如下,根据码流中不同的信息选择相应的QMF.Hybrid QMF analysis filterbank f

40、or the 10 and 20 stereo-bands configuration 1.计算传输函数q(m)fcenter(k)2.瞬态信号检测3.计算相关信号解相关模块 目的:是预测参数通道数据d(z).1.计算传输函数q(m)fcenter(k)2.瞬态信号检测立体声处理模块 目的:实现计算相位和振幅参数,调整目标通道幅值和相位,还原立体生数据.iid,iic,ipd,opd参数h(z)H(z,ne)H(z,n)由立体声参数推导参数矩阵的过程如下 icc_mode=0,1,2时振幅参数的计算 icc_mode=3,4,5时振幅参数的计算 当IPD.OPD有效时当IPD.OPD无效时12

41、34exp()exp()exp()exp()jb kjb kjb kjb k1234exp()1exp()1exp()1exp()1jb kjb kjb kjb k相位参数计算于立体声参数矩阵计算 参数内插 立体声重建 重建后的左右频带数据别再经过PS内部的混合滤波器组和SBR的QMF滤波器器组还原时域信号.AAC_LC MP3 背景:AC3的前身还包括AC1和AC2,只不过因为效果不是很好没有得到广泛应用.1994年12月27日,日本先锋公司宣布与美国的杜比实验室合作在之前AC2的基础上研制成功新的环绕声制式,并命名为“杜比AC-3(Dolby Surround Audio Coding-3

42、1997年初,杜比实验室已正式将杜比AC-3环绕声改称为杜比数码环绕声(Dolby Surround Digital),简称为Dolby Digital.现被广泛应用于DVD影碟,ATSC 数字地面电视,DLNA 家庭互联,有线电视,卫星电视.技术特点:采样率:32、44.1、48 kHz 码率 :96Kbps-640Kbps 声道数:6声道 AC3编码器 AC3技术特点 MS+Coupling MDCT SQ Bit allocation DRC Synthesis FilterBankSpectralEnvelopdecodingBit allocationPCM time samp

43、lesExponentmantissaBit allocation infomationQuantizedmantissasEncoded SpectralenvelopAC-3 frame synchronization,error detection,and frame de-formattingEncoded AC3BitstreamMantissaDe-quantizationBit Allocation AC3的Bit Allocation技术和MPEG1/2 层1/2的位分配技术相似.但与之不同的是AC3算法通过传输编码参数,在解码端进行心理声学模型的逆运算计算每个采样需要的分配位

44、数.比特指派对音频信号从掩蔽效应分析它的频谱包络,以确定分配给各频谱系数的尾数所需要的比特数。谱包络变换谱包络变换频带划分频带划分扩展函数扩展函数听阈听阈掩蔽比较掩蔽比较指数功率谱密度带化的功率谱密度激励函数掩蔽曲线比特分配Mantissa Decode AC3中mantissa的意义和其他编码标准的残差谱线意义是一样的.尾数的量化和解码根据比特指派计算出的BAP值将所有尾数量化到同一等级精度上。该步骤先从码流中取出尾数信息,再将尾数信息和指数解码解出的频谱指数信息组合成频谱系数,在解码时,将BAP值作为索引在量化表格中查出尾数占用的比特数,根据该比特数将尾数从码流中取出,在根据BAP值对尾数

45、进行反量化.最后乘以指数值.AC3对尾数的组装也是有分组解码的,一切都根据bap值的提示进行.而且根据bap值的不同,量化器的选择也不同,AC3即使用了均匀量化器也是用了非均匀量化器.Exponent Decode AC3的Exponent 参数的意义和其他编码标准的scalefactor是一样的,都是起到按照bark谱量化的目的.对exponent的编码AC3采用差分分组的方式编码.而每个码字表示二进制表达式中前导零的个数,AC3标准采用了一些共享策略.指数信息在一个数据帧内的各个音频块之间可以共享,即根据不同指数共享策略数据块1到数据块5可以重复使用以前数据块的指数信息。开始是否重用上一块

46、指数获得指数策略和指数组编码值分解指数包,得到编码值序列求指数差分值序列差分解码,得到实际指数结束N指数解码策略Yleftleftrightrightleftright解码耦合系数解码参考声道数据Demux耦合声道重建Stereo Process AC3使用了2种技术对通道对进行处理.一种是 耦合技术一种是rematrixing技术.其中rematrixing技 术和其他标准中的ms技术是完全一样的.coupling技 术在其后的AAC标准种也有使用.Coupling 耦合是对IS编码的推广.Rematrixing Rematrixing和Coupling有冲突.应用频带范围有限制.注意AC3

47、和AAC的在耦合上的差别 1.AAC可以在时域和频域2个方向上应用耦和.ac3只在频域上使用耦合.2.AC3没有sfb的概念,所以有独立的coupling sub-band和band。每个 耦合band有一个耦合系数。sub-band是频带系数。n个subband可以组成一个band。码流中有一个标志位指示分组方式。这个标志位的解码和AAC中窗分组的方式是一样。AAC有sfb的概念,每个sfb一个耦合因子。3.AAC的解耦合公式是dst+=src*cscale AC3的解耦合公式是dst=src*cscale 4.AAC是全频带,一直到max_sfb AC3是部分频带,系数地址是37252 M

48、DCT AC3的时频变换模块和AAC的类似,解码时也是要经过3步处理,IMDCT,加窗和交叠加.只不过AC3的MDCT窗长度分别是256和512.而且窗类型稍有差别.2005年为了迎接即将到来的HD/蓝光高清时代,杜比公司推出了全新的DOLBY DIGITAL PLUS音效格式。该格式最高能够支持多达13.1声道的环绕声音效,而最低能够支持7.1声道。高码率的DD PLUS音效将用于以HD/蓝光光盘为介质的电影中使用,而码律较低的DD PLUS音效将用于电视台的电视信号传输.码率 32Kbps-6Mbps 声道数 最高13.1声道,最低7.1声道.采样率16khz,22.05khz,24khz

49、32khz,44.1khz,48khz NBC AHT 模块bit allocationVQ decoderExponent decodeGAQ decoderEnhanced channel coupling(ECC)Spectral Extension(SE)IMDCTHE-bit allocationMantissa decodeIDCT瞬态噪声处理(TNP)EAC3技术特点 关键模块有 AHT模块 ECC模块 SE模块 TNP模块 技术框图 AHT EAC3 的Adaptive Hybrid Transform(AHT)模块只有当码流中的标识位有效时,该模块才有效。该模块包含3个子单

50、元,参数位分配,改进的量化单元和DCT单元。当标识位指示使用AHT模块时,比特流先进入参数比特分配单元,提取位分配信息.使用GAQ或是VQ的方法反量化重构残差谱线,再结合exponent参数重构频域谱线,最后经过IDCT变换,产生低分辨率频域谱线.参数位分配与量化 AHT模块中的位分配技术与AC3中的位分配技术类似但并不相同,只是对bap的表做了改进.当使用AHT模块时使用hebap表.反量化前,先要根据每个bap值选择反量化模块(如图).EAC3使用了VQ和GAQ的方法对频域谱线进行量化.当使用VQ进行量化时6个交叉块的mantissa数据组成一个矢量,统一分配量化.解码时从码流中获得vq索

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服