音频压缩编码原理及标准.ppt

资源描述

教育电声系统教育电声系统三、音频压缩编码原理及标准三、音频压缩编码原理及标准 1编辑ppt音频压缩编码原理及标准音频压缩编码原理及标准本章知识要点本章知识要点1、音频压缩编码的基本原理、音频压缩编码的基本原理 2、MPEG-1音频压缩编码标准音频压缩编码标准 3、杜比、杜比AC-3音频压缩算法音频压缩算法 4、其他其他MPEG音频压缩编码音频压缩编码 2编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频信号压缩编码的必要性音频信号压缩编码的必要性数字音频的质量取决于：采样频率和量化位数这两个参数，为数字音频的质量取决于：采样频率和量化位数这两个参数，为了保真在时间变化方向上取样点尽量密，取样频率要高；在幅度取了保真在时间变化方向上取样点尽量密，取样频率要高；在幅度取值上尽量细，量化比特率要高值上尽量细，量化比特率要高，直接的结果就是存储容量及传输信，直接的结果就是存储容量及传输信道容量要求的压力道容量要求的压力音频信号的传输率音频信号的传输率 =取样频率取样频率*样本的量化比特数样本的量化比特数*通道数通道数音频压缩编码原理及标准音频压缩编码原理及标准取样频率取样频率=44.1KHz样本值的量化比特数样本值的量化比特数=16普通立体声的信号通道数普通立体声的信号通道数=2数字信号传输码流大约数字信号传输码流大约1.4Mbit/s 一秒钟的数据量为一秒钟的数据量为1.4Mbit/（8/Byte）达达176.4KByte（字节），等于（字节），等于88200个汉字的数据量个汉字的数据量 3编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频信号压缩编码的必要性音频信号压缩编码的必要性数字音频的出现，是为了满足复制、存储、传输的需求，音频数字音频的出现，是为了满足复制、存储、传输的需求，音频信号的数据量对于进行传输或存储形成巨大的压力信号的数据量对于进行传输或存储形成巨大的压力音频信号的压缩是在保证一定声音质量的条件下，尽可能以最音频信号的压缩是在保证一定声音质量的条件下，尽可能以最小的数据率来表达和传送声音信息小的数据率来表达和传送声音信息音频压缩编码原理及标准音频压缩编码原理及标准信号压缩过程是对采样、量化后的原始数字音频信号流运用适信号压缩过程是对采样、量化后的原始数字音频信号流运用适当的数字信号处理技术进行信号数据的处理，将音频信号中去除对当的数字信号处理技术进行信号数据的处理，将音频信号中去除对人们感受信息影响可以忽略的成分，仅仅对有用的那部分音频信号人们感受信息影响可以忽略的成分，仅仅对有用的那部分音频信号进行编排，从而降低了参与编码的数据量进行编排，从而降低了参与编码的数据量4编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频信号压缩编码的可能性音频信号压缩编码的可能性数字音频信号中包含的对人们感受信息影响可以忽略的成分称数字音频信号中包含的对人们感受信息影响可以忽略的成分称为冗余，包括时域冗余、频域冗余和听觉冗余为冗余，包括时域冗余、频域冗余和听觉冗余音频压缩编码原理及标准音频压缩编码原理及标准时域冗余时域冗余时域冗余的表现形式时域冗余的表现形式1、幅度分布的非均匀性、幅度分布的非均匀性信号的量化比特分布是针对信号的整个动态范围而设定的，对信号的量化比特分布是针对信号的整个动态范围而设定的，对于小幅度信号而言，大量的比特数据位被闲置于小幅度信号而言，大量的比特数据位被闲置2、样值间的相关性、样值间的相关性声音信号是一个连续表达过程，通过采样之后，相邻的信号具声音信号是一个连续表达过程，通过采样之后，相邻的信号具有极强的相似性，信号差值与信号本身相比，数据量要小的多有极强的相似性，信号差值与信号本身相比，数据量要小的多5编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频信号压缩编码的可能性音频信号压缩编码的可能性音频压缩编码原理及标准音频压缩编码原理及标准时域冗余的表现形式时域冗余的表现形式3、信号周期的相关性、信号周期的相关性声音信息在整个可闻域的范围内，每个瞬间只有部分频率成分声音信息在整个可闻域的范围内，每个瞬间只有部分频率成分在起作用，即特征频率，这些特征频率会以一定的周期反复出现，在起作用，即特征频率，这些特征频率会以一定的周期反复出现，周期之间具有相关关系周期之间具有相关关系4、长时自我相关性、长时自我相关性声音信息序列的样值、周期相关性，在一个相对较长的时间间声音信息序列的样值、周期相关性，在一个相对较长的时间间隔也会是相对稳定的，这种稳定关系具有很高的相关系数隔也会是相对稳定的，这种稳定关系具有很高的相关系数5、静音、静音声音信息中的停顿间歇，无论是采样还是量化都会形成冗余，声音信息中的停顿间歇，无论是采样还是量化都会形成冗余，找出停顿间歇并将其样值数据去除，可以减少数据量找出停顿间歇并将其样值数据去除，可以减少数据量6编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频信号压缩编码的可能性音频信号压缩编码的可能性音频压缩编码原理及标准音频压缩编码原理及标准频域冗余频域冗余频域冗余的表现形式频域冗余的表现形式1、长时功率谱密度的非均匀性、长时功率谱密度的非均匀性任何一种声音信息，在相当长的时间间隔内，功率分布在低频任何一种声音信息，在相当长的时间间隔内，功率分布在低频部分大于高频部分，功率谱具有明显的非平坦性，对于给定的频段部分大于高频部分，功率谱具有明显的非平坦性，对于给定的频段而言，存在相应的冗余而言，存在相应的冗余2、语言特有的短时功率谱密度、语言特有的短时功率谱密度语音信号在某些频率上会出现峰值，而在另一些频率上出现谷语音信号在某些频率上会出现峰值，而在另一些频率上出现谷值，这些共振峰频率具有较大的能量，由它们决定了不同的语音特值，这些共振峰频率具有较大的能量，由它们决定了不同的语音特征，整个语言的功率谱以基音频率为基础，形成了向高次谐波递减征，整个语言的功率谱以基音频率为基础，形成了向高次谐波递减的结构的结构 7编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频信号压缩编码的可能性音频信号压缩编码的可能性音频压缩编码原理及标准音频压缩编码原理及标准听觉冗余听觉冗余根据分析人耳对信号频率、时间等方面具有有限分辨能力而设根据分析人耳对信号频率、时间等方面具有有限分辨能力而设计的心理声学模型，将通过听觉领悟信息的复杂过程，包括接受信计的心理声学模型，将通过听觉领悟信息的复杂过程，包括接受信息，识别判断和理解信号内容等几个层次的心理活动，形成相应的息，识别判断和理解信号内容等几个层次的心理活动，形成相应的连觉和意境连觉和意境由此构成声音信息集合中的所以数据，并非对人耳辨别声音的由此构成声音信息集合中的所以数据，并非对人耳辨别声音的强度、音调、方位都产生作用，形成听觉冗余强度、音调、方位都产生作用，形成听觉冗余由听觉冗余引出了降低数据率由听觉冗余引出了降低数据率，实现更高效率的数字音频传输，实现更高效率的数字音频传输的可能的可能 8编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准编码编码信号系统如何把一定的信息内容包含在少量特定信号的排列组信号系统如何把一定的信息内容包含在少量特定信号的排列组合之中合之中 1、采用一定的格式来记录数字数据、采用一定的格式来记录数字数据2、采用一定的算法来压缩数字数据以减少存贮空间和提高传、采用一定的算法来压缩数字数据以减少存贮空间和提高传输效率输效率音频信号编码按照压缩原理不同，分为波形编码、参数编码以音频信号编码按照压缩原理不同，分为波形编码、参数编码以及多种技术相互融合的编码形式及多种技术相互融合的编码形式 9编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准波形编码波形编码直接对音频信号的时域或频域波形按一定速率采样，然后将幅直接对音频信号的时域或频域波形按一定速率采样，然后将幅度样本分层量化，变换为数字代码，度样本分层量化，变换为数字代码，由波形数据产生一种重构信号由波形数据产生一种重构信号编码系统源于信号原始样值，编码系统源于信号原始样值，波形与原始声音波形尽可能地一波形与原始声音波形尽可能地一致，致，保留了信号的细节变化和各种过渡特征保留了信号的细节变化和各种过渡特征波形编码类型波形编码类型脉冲编码调制脉冲编码调制差分脉冲编码调制差分脉冲编码调制自适应差分脉冲编码调制自适应差分脉冲编码调制（PCM）（DPCM）（ADPCM)子带编码（子带编码（Sub-BandCoding,SBC)自适应变换编码自适应变换编码(AdaptiveTransformCoding,ATC)10编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准脉冲编码调制（脉冲编码调制（PCM)最简单的波形编码，仅仅是对输入信号进行采样和量化最简单的波形编码，仅仅是对输入信号进行采样和量化声声音带宽受采样频率限制，采样频率与信号带宽的通过防失真音带宽受采样频率限制，采样频率与信号带宽的通过防失真滤波器进行匹配滤波器进行匹配运用非均匀量化，对幅度大的输入信号采用大的量化间隔，幅运用非均匀量化，对幅度大的输入信号采用大的量化间隔，幅度小的输入信号采用小的量化间隔，在满足量化精度要求的情况下度小的输入信号采用小的量化间隔，在满足量化精度要求的情况下用较少的位数来表示信号用较少的位数来表示信号 11编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准差分编码调制（差分编码调制（DPCM)源于源于PCM，根据声音信号相邻采样值之间呈现明显的相关性，根据声音信号相邻采样值之间呈现明显的相关性，利用利用前一个采样样本估算下一个样本信号的幅度大小，形成预测值前一个采样样本估算下一个样本信号的幅度大小，形成预测值对预测的样本值与原始的样本值之差进行量化对预测的样本值与原始的样本值之差进行量化如果样本的预测值与样本的实际值比较接近，它们之间的差值如果样本的预测值与样本的实际值比较接近，它们之间的差值幅度的变化就比原始声音样本幅度值的变化小，因此量化这种差值幅度的变化就比原始声音样本幅度值的变化小，因此量化这种差值信号时就可以用比较少的位数来表示差值信号时就可以用比较少的位数来表示差值 12编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准自适应自适应差分编码调制（差分编码调制（ADPCM)综合了综合了根据输入信号幅度大小来改变量化阶大小根据输入信号幅度大小来改变量化阶大小的自适应特性的自适应特性和差分特性，和差分特性，核心思想是核心思想是：使用小的量化等级去量化小的差值，使用大的量化等级去量化使用小的量化等级去量化小的差值，使用大的量化等级去量化大的差值大的差值使用过去的采样样本值估算下一个采样样本的预测值，使实际使用过去的采样样本值估算下一个采样样本的预测值，使实际样本值和预测值之间的差值总是最小样本值和预测值之间的差值总是最小13编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准子带编码（子带编码（SBC)属于依据感知特性的频域编码属于依据感知特性的频域编码将音频信号进行时间足够短的分段，通过分段块由时间域转变将音频信号进行时间足够短的分段，通过分段块由时间域转变为频率域，利用带通滤波器为频率域，利用带通滤波器(BPF)组把原始信号的频带分割为若干组把原始信号的频带分割为若干子频带子频带对听觉感知比较重要的子频带，编码器分配比较多的位数来表对听觉感知比较重要的子频带，编码器分配比较多的位数来表示它们，对于其他的子带编码器就可以分配比较少的位数来表示示它们，对于其他的子带编码器就可以分配比较少的位数来表示音频信号音频信号采样时钟采样时钟频率分布频率分布f采样块分割采样块分割n个个BPF14编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准子带编码（子带编码（SBC)由于各子带频率范围不同，通过由于各子带频率范围不同，通过对每个子频带中的音频信号对每个子频带中的音频信号运运用不同采样频率和不同量化间隔用不同采样频率和不同量化间隔的自适应控制的自适应控制在信道上传送时在信道上传送时设置设置m路数字编码器，将各路路数字编码器，将各路子带的代码复合子带的代码复合起来起来通过多路复用器输出子带编码数据通过多路复用器输出子带编码数据将各路子带输出信号送到将各路子带输出信号送到m路并联数字解码后同步相加，相加路并联数字解码后同步相加，相加恢复为原始信号恢复为原始信号分分频频段段滤滤波波器器子子带带量量化化编编码码器器合合成成解解码码器器15编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准自适应变换编码（自适应变换编码（ATC)变换编码是先对信号进行某种函数变换，从一种信号（空间）变换编码是先对信号进行某种函数变换，从一种信号（空间）变换到另一种（空间），然后再对信号进行编码变换到另一种（空间），然后再对信号进行编码音频信号大部分都是低频信号，在频域中信号的能量较集中，音频信号大部分都是低频信号，在频域中信号的能量较集中，将时域信号变换到频域再进行采样、编码，那么可以肯定能够减少将时域信号变换到频域再进行采样、编码，那么可以肯定能够减少数据数据变换编码最典型是应用离散余弦变换（变换编码最典型是应用离散余弦变换（DCT)或改进的离散余或改进的离散余弦变换（弦变换（DCT)16编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准自适应变换编码（自适应变换编码（ATC)变换编码过程是将音频信号进行时间足够短的采样，通过采样变换编码过程是将音频信号进行时间足够短的采样，通过采样块由时间域变换为频率域，采样块的作用相当于将连续的音频呈现块由时间域变换为频率域，采样块的作用相当于将连续的音频呈现在一个在一个“窗口窗口”进行处理进行处理在变换系统中，用于量化一组变换样值的比特总数是固定的，在变换系统中，用于量化一组变换样值的比特总数是固定的，所以选择变换的采样块（窗口）长度，就可以调整时域分辨率和编所以选择变换的采样块（窗口）长度，就可以调整时域分辨率和编码压缩比，采用短的采样块能够提高时域分辨率，长的采样块能够码压缩比，采用短的采样块能够提高时域分辨率，长的采样块能够获得较高的压缩比获得较高的压缩比17编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准自适应变换编码（自适应变换编码（ATC)自适应的概念主要表现在配合声学心理模型，根据音频信号的自适应的概念主要表现在配合声学心理模型，根据音频信号的特性进行采样块（窗口）长度切换，缓解时域分辨率与编码压缩比特性进行采样块（窗口）长度切换，缓解时域分辨率与编码压缩比的冲突的冲突变换编码与子带变换都是针对一定的采样块进行工作，子带编变换编码与子带变换都是针对一定的采样块进行工作，子带编码具有出色的时间分辨率，但频率分辨率差；而变换编码有出色的码具有出色的时间分辨率，但频率分辨率差；而变换编码有出色的频率分辨率，但时间分辨率差频率分辨率，但时间分辨率差18编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准参数编码参数编码首先根据不同的信号源，如语言信号、自然声音等形式建立特首先根据不同的信号源，如语言信号、自然声音等形式建立特征模型，通过提取特征参数和编码处理，力图使重建的声音信号尽征模型，通过提取特征参数和编码处理，力图使重建的声音信号尽可能高的保持原声音的语意，但重建信号的波形同原声音信号的波可能高的保持原声音的语意，但重建信号的波形同原声音信号的波形可能会有相当大的差别形可能会有相当大的差别常用的特征参数有共振峰、线性预测系数、频带划分滤波器等常用的特征参数有共振峰、线性预测系数、频带划分滤波器等参数编码技术可实现低速率的声音信号编码，比特率可压缩到参数编码技术可实现低速率的声音信号编码，比特率可压缩到2Kbit/s-4.8Kbit/s，但声音的质量只能达到中等，特别是自然度较，但声音的质量只能达到中等，特别是自然度较低，仅适合语言语言的传递与表达低，仅适合语言语言的传递与表达19编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音频压缩编码方法的分类及典型代表音频压缩编码方法的分类及典型代表音频压缩编码原理及标准音频压缩编码原理及标准混合编码混合编码将波形编码和参量编码组合起来的编码形式将波形编码和参量编码组合起来的编码形式克服了原有波形编码和参量编码的弱点，力图保持波形编码的克服了原有波形编码和参量编码的弱点，力图保持波形编码的高质量和参量编码的低速率，在高质量和参量编码的低速率，在4-16Kbit/s速率上能够得到高质量速率上能够得到高质量的合成声音信号的合成声音信号混合编码的基础是线性预测编码（混合编码的基础是线性预测编码（LPC），常用脉冲激励线性），常用脉冲激励线性预测编码（预测编码（MPLPC）、规划脉冲激励线性预测编码（）、规划脉冲激励线性预测编码（KPELPC）码本激励线性预测编码（码本激励线性预测编码（CELPC）等编码方式）等编码方式 20编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理人耳的听觉感知特性人耳的听觉感知特性音频压缩编码原理及标准音频压缩编码原理及标准声音信号最终是传递到人的听觉系统，对声音信号所作的所有声音信号最终是传递到人的听觉系统，对声音信号所作的所有处理，是通过人耳听到的一切主观感受而产生的作用为目的处理，是通过人耳听到的一切主观感受而产生的作用为目的人耳的听觉是一个复杂的过程，即包括系统的复杂性，又包括人耳的听觉是一个复杂的过程，即包括系统的复杂性，又包括过程的复杂性过程的复杂性实际播放信号实际播放信号听觉感受效果听觉感受效果人的听觉主观感受包括声音的人的听觉主观感受包括声音的“三要素三要素”、声音的掩蔽效应及、声音的掩蔽效应及声声音的空间定位特性音的空间定位特性21编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理声音的声音的“三要素三要素”音频压缩编码原理及标准音频压缩编码原理及标准人耳对声音的感知包括响度、音高、音色三个听感要素人耳对声音的感知包括响度、音高、音色三个听感要素响度响度听觉的基础，表示人耳对声音强弱的主观感受程度听觉的基础，表示人耳对声音强弱的主观感受程度声音的响度用声压或声强来计量声音的响度用声压或声强来计量声压表示原来静止气压上附加的压力起伏变化，单位声压表示原来静止气压上附加的压力起伏变化，单位Pa1Pa=1N/m由于声波能量正比于声压幅度由于声波能量正比于声压幅度的平方的平方所以声压级所以声压级SPL=10Lg（Pe/Po）2SPL=20LgPe/Po用分贝用分贝dB dB 表示表示声压变化声压变化2X10-52X10-42X10-32X10-22X10-12X1002X1012X102基准声压基准声压22编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理响度响度音频压缩编码原理及标准音频压缩编码原理及标准人耳刚能感受的声压为人耳刚能感受的声压为“闻域闻域”，在频率，在频率1KHz时声压等于时声压等于0dB人耳感到刺耳疼痛的听觉阈值为人耳感到刺耳疼痛的听觉阈值为“痛域痛域”，在频率，在频率1KHz时声压时声压达达到到130140dB刚能听到的声音刚能听到的声音闻闻域域刺耳疼痛的声音刺耳疼痛的声音痛痛域域23编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理响度响度音频压缩编码原理及标准音频压缩编码原理及标准响度不仅取决于声音振幅的大小，而且和声音的频率有关响度不仅取决于声音振幅的大小，而且和声音的频率有关刚能听到的声音刚能听到的声音闻闻域域刺耳疼痛的声音刺耳疼痛的声音痛痛域域不同频率点闻域的声压有着很大差别，同时痛域也随着频率不不同频率点闻域的声压有着很大差别，同时痛域也随着频率不同呈非线性同呈非线性24编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理响度响度音频压缩编码原理及标准音频压缩编码原理及标准响度的表示单位是响度级，单位为响度的表示单位是响度级，单位为“方方”（Phon)，表示某响度，表示某响度与与基准响度比值的对数值基准响度比值的对数值在纯音频率在纯音频率1KHz时声压级时声压级0dB为为0“方方”，响度级也是随频率不，响度级也是随频率不同呈非线性同呈非线性25编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音高音高音频压缩编码原理及标准音频压缩编码原理及标准表示人耳对声音频率高低的主观感受表示人耳对声音频率高低的主观感受音高与声音基波频率的高低有关，基波频率高则音调高亢，基音高与声音基波频率的高低有关，基波频率高则音调高亢，基波频率低则音调低沉波频率低则音调低沉由于声音频率与听觉感知不是线性关系，由于声音频率与听觉感知不是线性关系，人耳对分辨声音不同人耳对分辨声音不同的频率差值不敏感，起决定作用的是两组声音频率的彼此比值，频的频率差值不敏感，起决定作用的是两组声音频率的彼此比值，频率相差一倍（一个倍频程）感觉声音相差八度率相差一倍（一个倍频程）感觉声音相差八度C D E F G A B C26编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音高音高音频压缩编码原理及标准音频压缩编码原理及标准临界频带的规律临界频带的规律声音频率的声音频率的感知单位是感知单位是Bark，一个临界频带具有一个一个临界频带具有一个Bark的的宽度，宽度，从从20Hz到到16kHz范围内分成范围内分成24个临界频带个临界频带f500Hz：1Bark9+4log(f/1000)27编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理音色音色音频压缩编码原理及标准音频压缩编码原理及标准表示人耳对多种频率、多种强度复合声波综合作用的主观感受表示人耳对多种频率、多种强度复合声波综合作用的主观感受音色与形成声音发音复合振动谐波的多少和谐波之间的相对位音色与形成声音发音复合振动谐波的多少和谐波之间的相对位置有关置有关声音的谐波呈倍率离散形式，谐波的分布状态称为谱线分布声音的谐波呈倍率离散形式，谐波的分布状态称为谱线分布将形成声音频谱所有谱线的端点连接起来就形成了声音的频域将形成声音频谱所有谱线的端点连接起来就形成了声音的频域包络包络音色无法应用一个物理量进行量化，只能够通过听觉感受和通音色无法应用一个物理量进行量化，只能够通过听觉感受和通过频谱图进行比较对照过频谱图进行比较对照1001k10k6028编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理人耳的掩蔽效应人耳的掩蔽效应音频压缩编码原理及标准音频压缩编码原理及标准表示一种频率的声音阻碍听觉系统感受另一种频率的声音表示一种频率的声音阻碍听觉系统感受另一种频率的声音造成影响的声音称为掩蔽声，受影响的声音称为被掩蔽声造成影响的声音称为掩蔽声，受影响的声音称为被掩蔽声掩蔽效应就象一道屏障，被掩蔽声要突破屏障就要提高声压，掩蔽效应就象一道屏障，被掩蔽声要突破屏障就要提高声压，提高的声压级称为屏蔽量提高的声压级称为屏蔽量纯音的掩蔽规律纯音的掩蔽规律1、在一个纯音附近会形成掩蔽效应，距离纯音越近作用越明显、在一个纯音附近会形成掩蔽效应，距离纯音越近作用越明显2、纯音形成的掩蔽效应会在纯音频率两侧分布扩散，尤其在纯、纯音形成的掩蔽效应会在纯音频率两侧分布扩散，尤其在纯音频率以上形成的影响显著音频率以上形成的影响显著29编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理人耳的掩蔽效应人耳的掩蔽效应音频压缩编码原理及标准音频压缩编码原理及标准复音的掩蔽规律复音的掩蔽规律1、复音中包含几个频率分量，可能会造成最高的频率成分被、复音中包含几个频率分量，可能会造成最高的频率成分被掩蔽，而中频成分被掩蔽一部分掩蔽，而中频成分被掩蔽一部分 2、复音掩蔽声形成的掩蔽效应将以若干个临界频带向高端延、复音掩蔽声形成的掩蔽效应将以若干个临界频带向高端延伸，同样中心频率，窄带复音的掩蔽作用大于纯音，宽带复音大于伸，同样中心频率，窄带复音的掩蔽作用大于纯音，宽带复音大于窄带复音窄带复音30编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理人耳的掩蔽效应人耳的掩蔽效应音频压缩编码原理及标准音频压缩编码原理及标准时域的掩蔽规律时域的掩蔽规律1、一个强的声音信号出现之前，掩蔽效应已经发生，称为前、一个强的声音信号出现之前，掩蔽效应已经发生，称为前掩蔽掩蔽 2 2、当掩蔽声消除后，掩蔽效应并不是立即消除的，听阈的复当掩蔽声消除后，掩蔽效应并不是立即消除的，听阈的复原到原来没有掩蔽声时的值需要一段时间原到原来没有掩蔽声时的值需要一段时间，称为后掩蔽，称为后掩蔽后掩蔽后掩蔽现象称为听觉暂时损失，其量值可代表听觉疲劳程度现象称为听觉暂时损失，其量值可代表听觉疲劳程度，掩蔽声刺激的时间越长，强度越强，疲劳程度也就越厉害掩蔽声刺激的时间越长，强度越强，疲劳程度也就越厉害 0100t31编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理人耳的听觉定位特性人耳的听觉定位特性音频压缩编码原理及标准音频压缩编码原理及标准自然界一切声源有确定的空间位置，声音有确定的方向来源自然界一切声源有确定的空间位置，声音有确定的方向来源当人耳直接听到空间中的声音时，除了能感受到声音的强度、当人耳直接听到空间中的声音时，除了能感受到声音的强度、音调和音色外，还能感受到各个声源在空间的方位和层次的位置分音调和音色外，还能感受到各个声源在空间的方位和层次的位置分布状况布状况听觉辨别声源方位的能力听觉辨别声源方位的能力听觉辨别声源方位的能力听觉辨别声源方位的能力声音组成中的直达声、反射声、混响声声音组成中的直达声、反射声、混响声利用听觉的空间、方向、层次感受效果利用听觉的空间、方向、层次感受效果形成声音的临场透视感形成声音的临场透视感32编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理人耳的听觉定位特性人耳的听觉定位特性音频压缩编码原理及标准音频压缩编码原理及标准人耳对声音的立体感觉主要依赖双耳效应，利用其对称分布特人耳对声音的立体感觉主要依赖双耳效应，利用其对称分布特征，解释前方水平方向上的声音定位，判定依据包括声级差征，解释前方水平方向上的声音定位，判定依据包括声级差Lp、时间差时间差t、相位差、相位差t1t2pp33编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理人耳的听觉定位特性人耳的听觉定位特性音频压缩编码原理及标准音频压缩编码原理及标准声级差声级差Lp头颅阻隔形成的双耳声强差异头颅阻隔形成的双耳声强差异人耳的平面空间间距人耳的平面空间间距H=20cm对应的波长频率对应的波长频率=1.7KHz1.7KHz声波无法饶过头部到达另一侧耳部声波无法饶过头部到达另一侧耳部,，形成高，形成高频遮挡区频遮挡区,导致两耳的声压级差导致两耳的声压级差Lp较大较大Lp最大可达最大可达25dBH34编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理人耳的听觉定位特性人耳的听觉定位特性音频压缩编码原理及标准音频压缩编码原理及标准时间差时间差t空间距离因素形成的双耳听觉时差空间距离因素形成的双耳听觉时差时间差与平面空间的方向角时间差与平面空间的方向角有关有关t=Hsin/声速声速C0.6sin(ms)当当=3，tmia=0.03ms当当=90，tmax=0.58ms时间差表现出声音信号的建立与入射角度的变化关系时间差表现出声音信号的建立与入射角度的变化关系35编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理人耳的听觉定位特性人耳的听觉定位特性音频压缩编码原理及标准音频压缩编码原理及标准相位差相位差空间距离因素形成的双耳听觉相位差异空间距离因素形成的双耳听觉相位差异相位差与平面空间的方向角相位差与平面空间的方向角有关有关=2ft当声音频率当声音频率1500Hz，其波长较短，因而形成的相位差会超，其波长较短，因而形成的相位差会超出出2，无法确定相位是超前还是滞后，所以人耳无法根据相位差，无法确定相位是超前还是滞后，所以人耳无法根据相位差来判断声源的方位来判断声源的方位声级差是高音定位的主要依据声级差是高音定位的主要依据相位差是低音定位的主要依据相位差是低音定位的主要依据36编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理声像及声像定位声像及声像定位音频压缩编码原理及标准音频压缩编码原理及标准声像声像通过声音聆听，在听音感受中所展现的各声部排布形式在发声通过声音聆听，在听音感受中所展现的各声部排布形式在发声方向的位置关系，并由此形成的虚拟声画面方向的位置关系，并由此形成的虚拟声画面能够通过从记录到重放恢复声音自然的空间感，最有效的方式能够通过从记录到重放恢复声音自然的空间感，最有效的方式就是就是R、L双声道立体声系统双声道立体声系统声像的修正与调整可以通过哈斯效应声像的修正与调整可以通过哈斯效应和德。波埃效应得以证实和德。波埃效应得以证实37编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理声像及声像定位声像及声像定位音频压缩编码原理及标准音频压缩编码原理及标准哈斯效应哈斯效应提供同声源、不同期声造成的听音效果提供同声源、不同期声造成的听音效果同一声信号不同的延时传递，能够形成明显的听音差异，差异同一声信号不同的延时传递，能够形成明显的听音差异，差异感受主要由时间差形成感受主要由时间差形成t相差在相差在535ms范围范围,无法区分两个声信号无法区分两个声信号t相差在相差在3550ms范围范围,开始感知滞后声信号，但仍以前期开始感知滞后声信号，但仍以前期声信号确定听感方位声信号确定听感方位t50ms时时,能够分辨前导声信号与滞后声信号的各自作用能够分辨前导声信号与滞后声信号的各自作用38编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理声像及声像定位声像及声像定位音频压缩编码原理及标准音频压缩编码原理及标准哈斯效应哈斯效应意义：意义：t相差在相差在535ms范围的直达声与延时声信号不会造成听觉范围的直达声与延时声信号不会造成听觉影响影响30ms t50ms,延时声无法清晰分辨，由于延迟声加强了延时声无法清晰分辨，由于延迟声加强了声音的响度，使声音音色变得更丰满声音的响度，使声音音色变得更丰满 t50ms,能够将直达声与延时声清晰分辨，获得明显的两个能够将直达声与延时声清晰分辨，获得明显的两个声信号的作用效果声信号的作用效果39编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理声像及声像定位声像及声像定位音频压缩编码原理及标准音频压缩编码原理及标准德。波埃效应德。波埃效应立体声系统定向的另一基础立体声系统定向的另一基础两个发声源馈入相同的信号，即声级差两个发声源馈入相同的信号，即声级差L=0，时间差，时间差t=0，此时只感觉到一个声音，且来自两个发声源的对称线上此时只感觉到一个声音，且来自两个发声源的对称线上两个发声源的声级差两个发声源的声级差L不为不为0，此时听觉感受声音偏向较响的，此时听觉感受声音偏向较响的一个发声源，如果声级差一个发声源，如果声级差L大于等于大于等于15dB，此时感觉声音完全来，此时感觉声音完全来自较响的那一个发声源自较响的那一个发声源两个发声源的声级差两个发声源的声级差L=0，但两个发声源的时间差，但两个发声源的时间差t不为不为0，声音向超前的那个声源方向移动，声音向超前的那个声源方向移动，如果时间差如果时间差t大于等于大于等于3ms，声音完全来自超前的声源方向声音完全来自超前的声源方向40编辑ppt音频压缩编码的基本原理音频压缩编码的基本原理声像及声像定位声像及声像定位音频压缩编码原理及标准音频压缩编码原理及标准德。波埃效应德。波埃效应两个发声源馈入的信号时间差与声压差的综合作用两个发声源馈入的信号时间差与声压差的综合作用不同程度改变输送给两个声源的的声压或者两个信号的时间差，不同程度改变输送给两个声源的的声压或者两个信号的时间差，声像将在声像将在y1、y2间移动，在声像定位时，声级差间移动，在声像定位时，声级差Lp与时间差与时间差t的作用类似，大致对应关系的作用类似，大致对应关系5dB=1ms德德波埃效应与哈斯效应的差异波埃效应与哈斯效应的差异哈斯效应是讨论一个声源产生的声音到达两耳所引起的差别对哈斯效应是讨论一个声源产生的声音到达两耳所引起的差别对声定位的影响，德声定位的影响，德波埃效应则是讨论当人耳同时倾听两个声波埃效应则是讨论当人耳同时倾听两个声源时，两个声源所发出声音的原始差别对人耳源时，两个声源所发出声音的原始差别对人耳方向性感觉的影响方向性感觉的影响 41编辑ppt音频压缩编码原理及标准音频压缩编码原理及标准 MPEG-1是以人类听觉系统的心理声学原理为基础的感知编码，是以人类听觉系统的心理声学原理为基础的感知编码，应用应用MUSCAM(掩蔽型通用子带综合编码和复用掩蔽型通用子带综合编码和复用)和和ASPEC（自适（自适应频谱心理声学熵编码）应频谱心理声学熵编码）算法，算法，利用最小听阈和掩蔽特性创建的编利用最小听阈和掩蔽特性创建的编码模型来进行数据压缩码模型来进行数据压缩为了保证实际应用条件和算法的可实现性为了保证实际应用条件和算法的可实现性，系统提供系统提供3个独立个独立的压缩层次，的压缩层次，MPEG-1音频压缩编码标准音频压缩编码标准第一个高保真音频数据压缩标准第一个高保真音频数据压缩标准，是，是MPEG-1标准的一部分，标准的一部分，但它完全可独立应用但它完全可独立应用层层1(Layer1)：编码简单，用于数字盒式录音磁带：编码简单，用于数字盒式录音磁带层层2(Layer2)：算法复杂度中等，用于数字音频广播：算法复杂度中等，用于数字音频广播(DAB)和和数字演播室数字演播室层层3(Layer3)：编码复杂，用于互联网上的高质量声音的传：编码复杂，用于互联网上的高质量声音的传输输和数字音频专业的制作、交流、存储，如和数字音频专业的制作、交流、存储，如MP3音乐音乐42编辑pptMPEG-1音频压缩编码标准音频压缩编码标准MPEG-1音频压缩算法的特点音频压缩算法的特点音频压缩编码原理及标准音频压缩编码原理及标准 1、编码器输入为线性、编码器输入为线性PCM信号，音频信号采样频率为信号，音频信号采样频率为32kHz、44.1kHz或或48kHz 2、压缩后的比特流可按单声道模式、压缩后的比特流可按单声道模式(monophonicmode)、两个、两个独立单音频通道的双单声道模式独立单音频通道的双单声道模式(dual-monophonicmode)、立体、立体声通道的立体声模式声通道的立体声模式(stereomode，通道之间有比特共享）、联合立，通道之间有比特共享）、联合立体声模式体声模式(jointstereomode，利用立体声之间的关联或通道之间的，利用立

展开阅读全文