收藏 分销(赏)

第二章声卡与音频信息.ppt

上传人:xrp****65 文档编号:13195048 上传时间:2026-02-02 格式:PPT 页数:97 大小:7.64MB 下载积分:10 金币
下载 相关 举报
第二章声卡与音频信息.ppt_第1页
第1页 / 共97页
第二章声卡与音频信息.ppt_第2页
第2页 / 共97页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,MTI,声卡与音频信息,多媒体技术,第二讲,1,主要内容,数字音频基础,声卡,音频编码基础和标准,音乐合成与,midi,接口标准介绍,音频编辑软件介绍,复习与练习,2,1.,数字音频基础,模拟音频与数字音频,音频数字化,数字音频的文件格式,音频信号的特点,3,1.,数字音频基础,模拟音频,时间和幅值连续的音频信号,数字音频,时间和幅值离散的音频信号,抗干扰、远距离传输、便于加密更安全,模拟音频与数字音频,4,1.,数字音频基础,计算机内的音频必须是数字形式的,因此必须把模拟音频信号转换成有限个数字表示的离散序列,即实现音频数字化。在这一处理技术中,涉及到音频的采样、量化和编码。,音频数字化,5,1.,数字音频基础,采样(,sampling),:,将声音信号在时间上离散化,即每隔相等的一段时间抽取一个信号样本。,音频数字化,6,1.,数字音频基础,音频数字化,量化(,quantization):,将连续的信号幅度离散化。如果幅度的划分是等间隔的,称为线性量化,否则为非线性量化。,7,1.,数字音频基础,音频数字化,采样频率,奈奎斯特理论指出:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,称为无损数字化。,fs,=2fmax,话音信号最高频率约为3.4,kHz,,所以采样频率取为8,kHz。,8,1.,数字音频基础,量化位数,每个声音样本的数字化位数反映了声音波形幅度的采样精度。,音频数字化,质量,采样频率,(,kHz),样本精度,单道声/,立体声,数据率,(,kb/s),频率范围(,kHz),电话,8,8,单道声,64,2003400,AM,11.025,8,单道声,88,507000,FM,22.050,16,立体声,705.6,2015000,CD,44.1,16,立体声,1411.2,2020000,DAT,48,16,立体声,1536,2020000,9,1.,数字音频基础,音频数字化,编码,所谓编码,就是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于纠错、同步和控制的数据。在数据回放时,可以根据所记录的纠错数据判别读出的声音数据是否有错,如在一定范围内有错,可加以纠正。,编码的形式比较多,常用的编码方式是,PCM,脉冲调制。脉冲编码调制(,PCM,),是把模拟信号变换为数字信号的一种调制方式,即把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储。,10,1.,数字音频基础,数字音频的文件格式,文件扩展名,说明,VOC Creative,公司的波形音频文件格式。,WAV Microsoft,公司的波形音频文件格式。,AIF Apple,计算机的波形音频文件格式。,MID MIDI,文件格式。,RM,一种网络音频格式,MP3,(,12:1,)目前主要的声音压缩格式,11,1.,数字音频基础,音频信号的特点,音频信号处理的特点如下:,(1),音频信号是时间依赖的连续媒体。,(2),理想的合成声音应是立体声。,(3),对语音信号的处理,要抽取语意等其它信息,如可能会涉及到语言学、社会学、声学,等。,12,1.,数字音频基础,音频信号的特点,从人与计算机交互的角度来看音频信号相应的处理如下:,人与计算机通信,即计算机接收音频信号,包括音频获取、语音识别与理解。,计算机与人通信,即计算机输出音频,包括:音频合成、声音定位和音频,/,视频同步。,人,计算机,人通信,即人通过网络,与处于异地的人进行语音通信,需要的音频处理包括:语音采集、音频编码,/,解码、音频传输等。这里音频编,/,解码技术是信道利用率的关键。,13,2.,声卡,声卡的功能,声卡的工作原理,14,2.,声卡,声卡的功能,音频的录制与播放、,编辑与合成、,MIDI,接口、,文语转换、,CD-ROM,接口及游戏接口等。,15,公司,产品,声音类型,FM,通道数,最大分辨、采样率,立体声,(s)/,单声道,(M),SCSI,接口,MIDI,Creative,Labs Inc.,Sound Blaster 2.0,FM/2,11,8,位,22kHz,M,无,无,Sound Blaster Pro,FM/4,22,8,位,44kHz,S,有,有,Sound Blaster 16,FM/4,22,16,位,44kHz,S,有,有,Sound Blaster AWE32,波表,32,16,位,44kHz,M,有,有,Thunder Board,FM/2,11,8,位,22kHz,M,无,无,Media Vision,Spectrum Plus,FM/2,22,8,位,44kHz,S,有,有,Inc.,Spectrum 16,FM/4,20,16,位,44kHz,S,有,有,Microsoft Crop.,Windows Sound,FM/4,20,16,位,44kHz,S,无,无,AZTECT,BX III,FM/2,11,8,位,22kHz,S,无,有,Waverider,Pro32-3D,波表,32,16,位,44kHz,S,无,有,Nova 16Extra,-3D,FM/2,16,16,位,44kHz,S,无,有,PRO 16 II,FM/4,20,16,位,44kHz,M,有,有,NOVA 16 EXTRA II,FM/4,20,16,位,44kHz,M,有,有,WAVERIDER 32+,波表,32,16,位,44kHz,M,有,有,Addtech,Research Inc.,SC EX,Lite,OPL2,11,8,位,22kHz,M,无,无,Scommander,Pro,OPL3,22,8,位,44kHz,S,有,有,音频卡型号和厂家概况,16,2.,声卡,声卡的工作原理,开发生产音频卡的公司很多,其中最有影响的公司是新加坡创新科技有限公司,(Creative,Labs.Inc,.),开发的系列产品,Sound,laster,系列音频卡,它是集语音与音乐于一体的多煤体音频卡,它不但具有优良稳定的硬件特性,而且还有丰富的软件。,17,2.,声卡,声卡的工作原理,音频卡原理框图,18,2.,声卡,声卡的工作原理,典型音频卡的平面图,19,2.,声卡,音频卡的接口,20,3.,音频编码基础和标准,音频编码基础,音频编码标准,21,音频编码基础,从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。根据统计分析结果,语音信号存在着多种冗余度,其最主要部分可以分别从时域和频域来考虑。另外由于语音主要是给人听的,所以考虑了人的听觉机理,也能对语音信号实行压缩。,时域信息的冗余度,1.,幅度的非均匀分布,2.,样本间的相关,3.,周期之间的相关,4.,基音之间的相关,5.,静音系数,6.,长时自相关函数,23,频域信息的冗余度,1.,非均匀的长时功率谱密度,2.,语音特有的短时功率谱密度,人的听觉感知机理,1.,人的听觉具有掩蔽效应,2.,人耳对不同频段的声音敏感,度不同,3.,人耳对语音信号的相位变化,不敏感,24,音频编码的分类如下:,基于音频数据的统计特性进行编码,其 典型技术是波形编码。,基于音频的声学参数,进行参数编码,可进一步降低数据率。其目标是使重 建音频保持原音频的特性。,基于人的听觉特性进行编码:从人的听觉系统出发,利用掩蔽效应,设计心理声学模型,从而实现更高效率的数字音频的压缩。,音频编码标准,当前编码技术发展的一个重要的方向就是综合现有的编码技术,制定全球的统一标准,使信息管理系统具有普遍的互操作性并确保了未来的兼容性。国际上,对于语音信号压缩编码的审议在,CCITT,下设的第十五研究组进行,相应的建议为,G,系列,多由,ITU,发表。,音频编码算法和标准,27,音频编码算法和标准,1,G.711,2,G.721,3,G.722,4,G.728,5.,MPEG,中的音频编码,6,AC-3,编码和解码,28,1.G.711,本建议公布于,1972,年,它给出语音信号的编码的推荐特性。,语音的采样率为,8KHz,,允许的偏差是,50p/m,。每个样值采用,8,位二进制编码,推荐使用,A,律和,律编码。,A,律(,13,:,8,):它是将,13,位的,PCM,按,A,律转化成,8,位二进制编码。,律(,14,:,8,):它是将,14,位的,PCM,按,律转化成,8,位二进制编码。,29,1,G.711,正输入码与,A,律输出码的关系,30,2,G.721,ADPCM,编码器和解码器框图,31,3,G.722,G.722,建议的带宽音频压缩仍采用波形编码技术,因为要保证既能适用于话音,又能用于其他方式的音频,只能考虑波形编码。,G.722,编码采用了高低两个子带内的,ADPCM,方案,高低子带的划分以,4KHz,为界。然后再对每个子带内采用类似,G.721,建议的,ADPCM,编码,因此,G.722,建议的技术方案可以简写为,SB-ADPCM,(子带,-,自适应差分脉冲码调制)。,32,4,G.728,G.728,建议的技术基础是美国,AT&T,公司贝尔实验室提出的,LD-CELP,(低延时,-,码激励线性预测)算法。该算法考虑了听觉特性,其特点是:,以块为单位的后向自适应高阶预测;,后向自适应型增益量化;,以适应为单位的激励信号量化。,33,CELP,编码器,34,CELP,解码器,35,5.,MPEG,中的音频编码,音频编码器基本结构框图,36,音频解码器结构框图,37,6,AC-3,编码和解码,AC-3,音频编码标准的起源是,DOLBY AC-1,。,AC-1,应用的编码技术是自适应增量调制(,ADM,),它把,20kHz,的宽带立体声音频信号编码成,512kbps,的数据流。,AC-1,曾在卫星电视和调频广播上得到广泛应用。,1990,年,DOLBY,实验室推出了立体声编码标准,AC-2,,它采用类似,MDCT,的重叠窗口的快速傅立叶变换(,FFT,)编码技术,其数据率在,256kbps,以下。,AC-2,被应用在,PC,声卡和综合业务数字网等方面。,38,AC-3 5.1,声道,39,AC-3,可编程解码器,40,AC-3,编码器框图,分析,滤波器组,指数,分析,滤波器组,尾数,位分配,位分配信息,已量化的,尾数,尾数,量化器,AC-3,帧格式,已编码的,AC-3,位流,已编码的,谱包络,PCM,抽样,41,AC-3,编码流程图,42,AC-3,解码器框图,43,4.,音乐合成与,midi,接口规范介绍,44,声音的本质,声音是携带信息的极其重要的媒体(20),声音是通过空气传播的一种连续的波,叫声波,也具有反射、折射和衍射现象。,声音信号是由许多频率不同的分量信号组成的复合信号。复合信号的频率范围称为,带宽,。,带宽为20,Hz20kHz,的信号称为音频(,audio),信号,可以被人的耳朵感知。,声音是时基类媒体。,45,声音的分类,波形声音,语音 803400,Hz,音乐,46,声音的三要素,音调、音强、音色为声音的,三要素,。,音强(响度)取决于声音的幅度(分贝)。,音调取决于声音的频率。,音色是由混入基音的泛音所决定的。,47,声音的听觉特性,人的耳朵对声音强度的反应成,对数形式,声音的方向性,声音的掩蔽特性(时域掩蔽、频域掩蔽,),48,声音质量的度量,声音的质量与声音的带宽有关,一般来说频率范围越宽,声音质量也就越高。,声音类型,带 宽,电话语音,200,Hz3.4kHz,调幅广播,50,Hz7kHz,调频广播,20,Hz15kHz,CD,20,Hz20kHz,信噪比(,SNR)、,主观平均判分法(,MOS)。,49,音乐,音乐,起初是与巫术和宗教活动联系在一起的,舜作“韶”、禹作“大夏”、武王作“大武”,“乐”被孔夫子列为“六艺”之一。后来,,音乐从宗教中渐渐脱离出来,成为一种独立的艺术。,以小提琴为例,当它的,A,弦振动时,并不仅仅是整根弦在振动,这根弦的二分之一、三分之一、四分之一、五分之一,处都在振动着。于是,整根弦的振动产生了最主要的频率,我们称之为,基音,,而弦长的二分之一、三分之一、四分之一等处的振动则产生了一些次要的频率,我们称之为,泛音,。,如果一个物体振动所发出的泛音为基音的整数倍,这个音就会具有清晰可辨的音高,我们称之为乐音,如钢琴,小提琴等发出的都是,乐音,;如果泛音是基音的非整数倍,这个音就不具备清晰可辨的音高,我们称之为,噪音,,如汽车发动机、计算机风扇等发出的都是噪音。,50,音乐的四要素,音高,:由基音的频率决定。即“哆”“唻”“咪”等音符。,响度,:由声波的振幅决定。,音色,:由基音与泛音的比例、泛音的分布、泛音随时间的衰减变化决定。,不同发音源(乐器)的材质、形状不同,其泛音的排列组合也不同,也就构成了这一物体特殊的音色。,时值,:乐音振动的持续时间,即节奏。,51,电子音乐合成,使用电子元器件(计算机)生成音乐的技术称为电子音乐合成。电子音乐合成器又称为“魔音琴”。,电子音乐合成方法分为两大类:,模拟合成法:,减法合成,加法合成,数字合成法:,FM,频,率调制合成,音乐样本合成,52,频率调制(,FM),合成法,数字式频率调制合成法,简称为,FM,合成法。,FM,电子合成器先由震荡器产生一个载波作为基音,然后再产生若干个调制波带着许多泛音加在载波之上,您可以对这个组合加以任意调整,然后加上典型的声音包络线(,ADSR),,再通过数控滤波器和数控放大器送往数字/模拟转换器,从而形成最后的音响。,由于一个物体不可能总是一成不变的振动,所以它的频率和振幅都会随着时间的改变而改变,并最终趋于静止。我们把一声音的发展过程分为四个阶段,分别是触发、衰减、保持和消失。这四个阶段我们统称为,“,包络,”。,包络的发生时间,也决定了一个乐音的时值。,53,由以下五部分组成:,数字载波器,调制器,声音包络发生器,数字运算器,模数转换器,频率调制(,FM),合成法,FM,声音合成器的工作原理,从理论上讲,,FM,合成方法可以产生任何乐音,但是,这种“物理课式”的合成方法合成出来的声音不够真实。,54,乐音样本合成法,乐音样本合成法是把真实乐器发出的声音以数字的形式记录下来,播放时再加以调整、修饰和放大,生成各种音阶的音符。,乐音样本通常放在,ROM,芯片上,播放时以查表的方式给出,所以这种合成器又叫做波表(,wave table),合成器。,55,Wavetable,合成器的工作原理,Wavetable,合成器所需要的输入控制参数比较少,可控的数字音效也不多,大多数采用这种合成方法的声音设备都可以控制声音包络的,ADSR,参数,产生的声音质量比,FM,合成方法产生的声音质量要高。,乐音样本合成法,56,波表库容量,音调数(复音数),音色数,特殊效果,Wavetable,合成器的衡量标准,57,软件波表与,DLS,软件波表,故名思义就是用软件来模拟硬件波表合成器,它的原理跟硬件波表完全一样,只不过硬波表是把乐器的波形存放到,ROM,里,在需要的时候直接调用;而软波表是把乐器的波形存到硬盘上的某一个文件里,在需要的时候通过,CPU,运算调用。所以,软波表会占用比较多的,CPU,资源。著名的软波表有,YAMAHA,公司,的,S-YXG,系列,和,ROLAND,公司的,VSC,系列,还有韩国,COWON,公司的,JET-MIDI。,由于硬波表价格难以令大众接受并且不易升级,于是就有了价格便宜的,DLS(Downloadable Sound Modules),波表合成技术,这是个介于硬波表和软波表之间的东西。虽然它能把波表存储在硬盘上,但使用时再调入内存然后通过声卡上的专用音效芯片来处理。,58,电子乐器数字接口(,MIDI),电子乐器数字接口(,musical instrument digital interface,MIDI),是用于在音乐合成器、电子乐器、音序器和计算机之间交换音乐信息的一种标准协议。,从,1984,年问世至今,,MIDI,经历了长时间的发展,现已成为电脑音乐的代名词。,59,电子乐器数字接口(,MIDI),MIDI,实质上是由,MIDI,控制器(或,MIDI,文件)产生的指示电子音乐合成器要做什么、怎么做(如演奏某个音符、加大音量、生成音响效果)的一套标准指令。,MIDI,不是声音信号,在,MIDI,电缆上传送的不是声音,而是动作指令。,60,电子乐器数字接口(,MIDI),由于,MIDI,只是记录音乐信息的数字代码,所以生成的文件比较小,便于传播,也便于编辑修改。,MIDI,音乐常作为背景音乐。,与,Mp3、Wav,等音频格式不同的是,MIDI,的播放质量很大程度上取决于硬件或软件的音源环境,也就是说同样的,MIDI,文件在不同的电脑上可能有非常明显的效果差别,究其原因是因为它们调用的波表音色库不一样。,61,各个,MIDI,设备通过专用的串行电缆(,MIDI,线)连接,并以 31.25,kbps(,每字节10位)的速度传送着数字音乐信息。,MIDI,Thru Out In,MIDI,的物理接口标准,62,MIDI,设备,的连接,不妨把,MIDI,理解成一种局域网,网络的各个部分通过专用的串行电缆,(,MIDI,线,),连接,,并以,31.25,kbps,的速度传送着数字音乐信息。,63,MIDI,的通道概念,单个物理,MIDI,通道分为16个逻辑通道,每个逻辑通道可指定一种乐器。,MIDI,键盘可设置在这16个通道中的任何一个,,MIDI,合成器可以被设置在指定的通道上接受。,64,由于早期的,MIDI,设备在乐器的音色排列上没有统一的标准,造成不同型号的设备回放同一首乐曲时也会出现音色偏差。为了弥补这一不足,便出现了,GS、GM,和,XG,这类音色排列方式的标准。,GS,排在第一位是由于它最早出台,并且是由业界大名鼎鼎的,ROLAND,公司制定并推出的。,ROLAND,是日本非常出名的电子乐器厂商,其生产开发的电子键盘、,MIDI,音源以及软波表都享有盛誉。所以,GS,颇具权威性,它完整的定义了128种乐器的统一排列方式,并规定了,MIDI,设备的最大复音数不可少于24个等详尽的规范。,GM,标准则是在,GS,的基础上,加以适当简化而成的。由于它比较符合众多中小厂商的口味,成为了业界广泛接受的标准。,在电子乐器方面唯一可与,ROLAND,相匹敌的,YAMAHA,公司也不甘示弱,于94年推出自己的标准,XG。,与,GM、GS,相比,XG,提供了更为强劲的功能和一流的扩展能力,并且完全兼容以上两大标准。而且凭借,YAMAHA,公司在电脑声卡方面的优势,使得,XG,在,PC,上有着广阔的用户群。,三个标准,65,声音美学,影响声音美感的因素,1,清晰度,录制水平、载体材质、采样频率、采样位数,2,噪音,录制本底噪声、介质附加噪声,3,音色,混响时间、声源特质、,MIDI,、,WAV,、,MP3,4,旋律,作曲、演奏等音乐本身的属性,声音运用,1,采用一个以上声源的场合,采用交叉或者响度区分的方法,2,语音采用单声道,乐曲采用立体声,3,适当添加声音效果,弥补不足。例如混响时间、音调高低,噪声,增加混响时间,正常,音色表现,Stop,66,5.,音频编辑软件介绍,goldwave,cooledit,67,6.,复习与练习,复习,练习,68,复习,复习目的,复习的知识点,复习要求,复习目的:,对数字音频获取与处理的基本原理、采样量化的基本原理、音频卡的组成及工作原理、音频编码标准以及音乐合成原理的理解和掌握。,70,复习的知识点:,什么是数字音频、数字音频采样和量化的基本原理、音频卡的工作原理、音频编码标准和音乐合成的原理。,71,复习要求:,掌握:数字音频信息的获取与处理的原理过程、音频卡的工作原理。,理解:数字音频采样量化的原理过程、音乐合成的原理。,了解:数字音频编码的标准。,72,练习,数字音频采样和量化过程所用的主要硬件是,。,(A),数字编码器,(B),数字解码器,(C),模拟到数字的转换器(,A,D,转换器),(D),数字到模拟的转换器(,D,A,转换器),73,数字音频采样和量化过程所用的主要硬件是,。,(A),数字编码器,(B),数字解码器,(C),模拟到数字的转换器(,A,D,转换器),(D),数字到模拟的转换器(,D,A,转换器),74,音频卡是按,分类的。,(A),采样频率,(B),声道数,(C),采样量化位数,(D),压缩方式,75,音频卡是按,分类的。,(A),采样频率,(B),声道数,(C),采样量化位数,(D),压缩方式,76,两分钟双声道,,16,位采样位数,,22.05KHz,采样频率声音的不压缩的数据量,是,。,(A)5.05MB,(B)10.58MB,(C)10.35MB,(D)10.09MB,77,两分钟双声道,,16,位采样位数,,22.05KHz,采样频率声音的不压缩的数据量,是,。,(A)5.05MB,(B)10.58MB,(C)10.35MB,(D)10.09MB,78,目前音频卡具备以下哪些功能,?,录制和回放数字音频文件,混音,语音特征识别,实时解压缩数字单频文件,(A),(B),(C),(D),全部,79,目前音频卡具备以下哪些功能,?,录制和回放数字音频文件,混音,语音特征识别,实时解压缩数字单频文件,(A),(B),(C),(D),全部,80,以下的采样频率中哪个是目前音频卡所支持的,。,(A)20KHz,(B)11.025KHz,(C)10KHz,(D)50KHz,81,以下的采样频率中哪个是目前音频卡所支持的,。,(A)20KHz,(B)11.025KHz,(C)10KHz,(D)50KHz,82,1984,年公布的音频编码标准,G.721,,它采用的是,编码。,(A),均匀量化,(B),自适应量化,(C),自适应差分脉冲,(D),线性预测,83,1984,年公布的音频编码标准,G.721,,它采用的是,编码。,(A),均匀量化,(B),自适应量化,(C),自适应差分脉冲,(D),线性预测,84,AC,3,数字音频编码提供了五个声道的频率范围是。,(A)20Hz,到,2KHz,(B)100Hz,到,1KHz,(C)20Hz,到,20KHz,(D)20Hz,到,200KHz,85,AC,3,数字音频编码提供了五个声道的频率范围是。,(A)20Hz,到,2KHz,(B)100Hz,到,1KHz,(C)20Hz,到,20KHz,(D)20Hz,到,200KHz,86,MIDI,的音乐合成器有,。,FM,波表,复音,音轨,(A),(B),(C),(D),全部,87,MIDI,的音乐合成器有,。,FM,波表,复音,音轨,(A),(B),(C),(D),全部,88,下列采集的波形声音哪个质量最好,。,(A),单声道、,8,位量化、,22.05KHz,采样频率,(B),双声道、,8,位量化、,44.1KHz,采样频率,(C),单声道、,16,位量化、,22.051KHz,采样频率,(D),双声道、,16,位量化、,44.1KHz,采样频率,89,下列采集的波形声音哪个质量最好,。,(A),单声道、,8,位量化、,22.05KHz,采样频率,(B),双声道、,8,位量化、,44.1KHz,采样频率,(C),单声道、,16,位量化、,22.051KHz,采样频率,(D),双声道、,16,位量化、,44.1KHz,采样频率,90,10,简述音频编码的分类及常用编码算法和标准。,91,10,简述音频编码的分类及常用编码算法和标准,。,答:音频编码分为:,(,1,)基于音频数据的统计特性进行编码,其典型技术是波形编码。其目标是使重建语音波形保持原波形的形状,,PCM,(脉冲编码调制)是最简单的编码方法。还有差值量化(,DPCM,)、自适应量化(,APCM,)和自适应预测编码(,ADPCM,)等算法。,92,10,简述音频编码的分类及常用编码算法和标准。,答:音频编码分为:,(,2,)基于音频声学参数,进行参数编码,可进一步降低数据率。其目标是使重建音频保持原音频特性。常用的音频参数有共振峰、线性预测系数、滤波器组等。这种编码技术的优点数据率低,但还原信号的质量较差,自然度低。,93,10,简述音频编码的分类及常用编码算法和标准。,答:(,3,)基于人的听觉特性进行编码。从人的听觉系统出发,利用掩蔽效应设计心理声学模型,从而实现更高效率的数字音频压缩。而最有代表性的是,MPEG,标准中的高频编码和,Dolby AC-3,。,94,10,简述音频编码的分类及常用编码算法和标准。,答:国际电报电话咨询委员会(,CCITT,)和国际标准化组织(,ISO,)提出了一系列有关音频编码算法和国际标准。如,G.711 64Kbps(A),律,PCM,编码标准、,G7.21,采用,ADPCM,数据率为,32Kbps,。还有,G.722,、,G.723,、,G.727,和,G.728,等。,95,练习参考答案,1(C)2(C)3(D)4(B)5(B)6(C)7(C)8(B)9(D),10,答:音频编码分为:,(,1,)基于音频数据的统计特性进行编码,其典型技术是波形编码。其目标是使重建语音波形保持原波形的形状,,PCM,(脉冲编码调制)是最简单的编码方法。还有差值量化(,DPCM,)、自适应量化(,APCM,)和自适应预测编码(,ADPCM,)等算法。,(,2,)基于音频声学参数,进行参数编码,可进一步降低数据率。其目标是使重建音频保持原音频特性。常用的音频参数有共振峰、线性预测系数、滤波器组等。这种编码技术的优点数据率低,但还原信号的质量较差,自然度低。,(,3,)基于人的听觉特性进行编码。从人的听觉系统出发,利用掩蔽效应设计心理声学模型,从而实现更高效率的数字音频压缩。而最有代表性的是,MPEG,标准中的高频编码和,Dolby AC-3,。,国际电报电话咨询委员会(,CCITT,)和国际标准化组织(,ISO,)提出了一系列有关音频编码算法和国际标准。如,G.711 64Kbps(A),律,PCM,编码标准、,G7.21,采用,ADPCM,数据率为,32bps,。还有,G.722,、,G.723,、,G.727,和,G.728,等。,MTI,结束,97,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服