收藏 分销(赏)

自适应动态范围.doc

上传人:仙人****88 文档编号:11227022 上传时间:2025-07-08 格式:DOC 页数:11 大小:1.70MB 下载积分:10 金币
下载 相关 举报
自适应动态范围.doc_第1页
第1页 / 共11页
自适应动态范围.doc_第2页
第2页 / 共11页


点击查看更多>>
资源描述
高水平增益 高阈值 低阈值 低水平增益 扩展阈值 动态范围控制(Dynamic Range Control, DRC)广泛应用于音频信号处理领域,例如助听器中最常见的宽动态范围压缩方法(Wide Dynamic Range Compression, WDRC)、音频信号处理中最常用的自动增益控制(Automatic Gain Control, AGC)方法等。动态范围控制,顾名思义,是将输入音频信号的动态范围映射到指定的动态范围。通常映射后的动态范围小于映射前的动态范围,因此称之为动态范围压缩。音频信号可以进行整体的动态范围控制;也可以划分为若干子带,并对各个子带分别进行动态范围控制。一个典型的动态范围控制方法的处理效果示意图如图1所示。 自动增益控制输出 压缩比 扩展比 图1中,横坐标表示输入信号的声压级(Sound Pressure Level, SPL,单位为dB),纵坐标表示输出信号的声压级;黄色对角线表示输入信号与输出信号的声压级相等,即无动态范围控制处理;红色折线表示动态范围控制处理曲线。动态范围压缩处理曲线按照输入信号SPL从低到高的顺序依次包括如下折线段:(1)扩展段:由扩展比(Expansion Ratio, ER)和扩展阈值(Expansion Threshold, ET)参数确定;图1中,;表示扩展段内输出SPL的动态范围是输入SPL的动态范围的3倍(扩展了3倍);表示SPL小于20dBSPL的输入信号属于扩展段。(2)低水平段:由低水平增益(Low Level Gain,LLG)、低阈值(Lower Threshold,LT)和ET参数确定;图1中,;横坐标的输入SPL从ET到LT的区间属于低水平段;该段内只对输入信号信号进行线性增益处理,即对于不同SPL的输入信号都采用相同的增益,图1中该增益为,其中Level表示系统的其他模块提供的增益。(3)压缩段:由压缩比(Compression Ratio, CR)、高阈值(Upper Threshold,UT)和LT参数确定;图1中,;横坐标的输入SPL从LT到UT的区间属于压缩段;该段内对输入信号进行动态范围压缩处理,图1中输入SPL的动态范围是输出SPL的动态范围的2.5倍(压缩了2.5倍)。(4)高水平段:由高水平增益(High Level Gain,HLG)、高阈值(Upper Threshold,UT)和自动增益控制输出(Automatic Gain Control Output, AGCO)值确定;图1中,,;横坐标的输入SPL从UT到120dBSPL的区间属于高水平段;该段对输入信号进行线性增益处理,并且带有AGCO功能;AGCO判断输出信号的SPL是否超出预先指定的阈值(图1中,对应120dB SPL),若超出该阈值则置为该阈值;与低水平段的处理相同,对于不同SPL的输入信号都采用相同的增益,图1中该增益为,其中Level表示系统的其他模块提供的增益。图2给出了图1所示的输入/输出函数关系曲线图对应的输入/增益函数关系示意图。从图2可明显观察到扩展段、低水平段、压缩段和高水平段的增益特点。图1所示的输入/输出函数关系图可总结为如式(1)所示的数学表达式;相应的图2所示的输入/增益函数关系图可总结为如式(2)所示的数学表达式,其中表示dB单位的增益,表示表示线性的增益。 图2 (1) (2) DRC方法的原理框图如图3和4所示, 图3 图四 其中图3表示前馈动态范围控制,图4表示反馈动态范围控制。图中,表示输入信号,表示输出信号,n表示时间帧,k表示频域子带。不失一般性,我们以图3的前馈动态范围控制为例对处理流程进行说明。信号幅度检测可为幅度的均方根(Root Mean Square,RMS)检测或峰值检测。常用的均方根检测的数学表达式如式(3)所示;采用平滑滤波器替代平均计算,平滑系数为;为输入信号的幅度。常用的峰值检测方法有:标准峰值检测如式(4)所示,修正峰值检测I型如式(5)所示,修正峰值检测II型如式(6)所示,平滑峰值检测I型如式(7)所示,平滑峰值检测II型如式(8)所示;其中为跟踪时间(Attack Time)系数,为释放时间(Release Time)系数,它们的取值区间为[0,1]。计算增益步骤中,首先将转化为dB值得到,然后根据式(2)的输入/增益函数关系计算得到。最后将与输入信号相乘得到输出信号。 (3) (4) (5) (6) (7) (8) 上述动态范围控制方法中,信号幅度检测步骤中所采用的和参数通常为预先设定的固定数值;和参数小,表示幅度检测对输入声音信号的幅度变化跟踪速度快,其带来的问题是可能导致输出信号不平稳变化,从而影响音质;和参数大,表示幅度检测对输入声音信号的幅度变化跟踪速度慢,其带来的问题是可能导致无法跟踪上输入声音信号的幅度变化,从而达不到动态范围控制的目的。 如图2所示,上述的动态范围控制方法产生的增益曲线是由若干的折线段构成的,折线段之间的拐点使得听着明显感受到声音被压缩处理,从而影响听感质量。 自适应动态范围控制方法 1. 音频信号输入 经过前期处理的数字音频信号直接输入,或该输入音频信号经过时频变换得到频域的数字音频信号,时频变换处理可为离散傅里叶变换(Discrete Fourier Transform, DFT)或加权重叠相加(Weighted OverLap Add, WOLA)分解等时频变换操作。不失一般性,这里以采用WOLA分解方法为实施例得到。 2. 自适应信号幅度检测 对输入信号进行如式(3)所示的均方根检测或如式(4)-(8)所示的任一种峰值检测。不是一般性,这里采用式(7)的平滑峰值检测I型为实施例进行信号幅度检测;其中跟踪时间系数,;释放时间系数,;其中;;其中和为表征输入信号波动性的参数;越大表示输入信号的波动性越大,则和越小,也即和越小,信号幅度检测的跟踪速度越快;反之,越小表示输入信号的波动性越小,则和越大,也即和越大,信号幅度检测的跟踪速度越慢。和的表达式可为式(9)或式(10)所示,但并不限于这两种形式。式(9)中远小于;式(10)中和为平滑系数,用于对进行平滑处理。 提出依据、原理、符号说明 (9) (10) 3. 自适应增益 如图5所示, 图5 我们采用图中黑色的平滑曲线作为输入/输出函数关系曲线。采用该种平滑的输入/输出函数关系曲线使得处理后的声音信号在听感上更舒适。该平滑曲线的输入/输出曲线的数学表达式如(11)所示,相应平滑的输入/增益曲线的数学表达式如式(12)所示。其中,、和分别代表扩展段到低水平段、低水平段到压缩段、压缩段到高水平段的平滑窗的窗宽参数,它们的取值范围如式(11)和式(12)中所示。 (11) (12) 4. 增益应用 将步骤3得到的增益与步骤1中的输入信号相乘得到,如式(13)所示。 (13) 5. 音频信号输出 将步骤4输出的进行逆变换(逆离散傅里叶变换或WOLA综合)后输出得到最终处理后的数字音频信号。 附图 图1 图2 图3 图4 图5 图6 11
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服