资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第6章 音频处理技术,6.1 基本概念,6.2 音频数据采样与简单处理,6.3 数字音频处理软件,GoldWave,6.1 基本概念,声音是振动的波,是随时间连续变化的物理量。,声音有三个重要指标:,振幅(,Amplitude),波的高低幅度,表示声音的强弱;,周期(,Period),两个相邻波之问的时间长度;,频率(,Frequency),每秒钟振动的次数,以,Hz,为单位。,6.1.1 声音基本特点,1声音的传播与可听域,2声音的方向,3声音的三要素,4声音的频谱,5声音的质量,6声音的连续时基性,7数字化声音,1声音的传播与可听域,声音依靠介质的振动进行传播。声源实际上是一个振动源,它使周围的介质(空气、液体、固体)产生振动,并以波的形式进行传播,人耳如果感觉到这种传播过来的振动,再反映到大脑,就意味着听到了声音。,人耳听到的声音是有限的,频率低于20,Hz,和高于20,kHz,的声音人类听不到,换言之,人耳的可听域在2020,kHz,之间。频率低于20,Hz,的声音叫做“次声”,高于20,kHz,的声音是“超声”。,频率范围又叫“频域”或“频带”,不同种类的声源其频带也不同,表6.,l,列出了部分常见声源的频带宽度。,2声音的方向,声音以振动波的形式从声源向四周传播,人类在辨别声源位置时,首先依靠声音到达左、右两耳的微小时间差和强度差异进行辨别,然后经过大脑综合分析而判断出声音来自何方。,3声音的三要素,声音的三要素是音调、音色和音强。就听觉特性而言,声音质量的高低主要取决于该三要素。,(1)音调代表了声音的高低。音调与频率有关,频率越高,音调越高,反之亦然。,(2)音色具有特色的声音。,(3)音强声音的强度,也被称为声音的响度,常说的“音量”也是指音强。,4声音的频谱,声音的频谱有线性频谱和连续频谱之分。,线性频谱是具有周期性的单一频率声波;,连续频谱是具有非周期性的带有一定频带所有频率分量的声波。,5声音的质量,声音的质量简称“音质”,音质的好坏与音色和频率范围有关。影响音质的因素还有很多,常见的有:,(1)对于数字音频信号,音质的好坏与数据采样频率和数据位数有关。采样频率越低,位数越少,音质越差。,(2)音质与声音还原设备有关,音响放大器和扬声器的质量能够直接影响重放的音质。,(3)音质与信号噪声比有关。,6声音的连续时基性,声音在时间轴上是连续信号,具有连续性和过程性,属于连续时基性媒体形式。,7数字化声音,为了用计算机表示和处理声音,必须将声音进行数字化,即用数字表示声波。,数字化了的声音叫做“数字音频信号”,它除了包含有自然界中所有的声音之外,还具有经过计算机处理的独特的音色和特质,6.1.2 数字音频文件的种类,1,WAV,文件,2,MIDI,文件,3光盘数字音频文件(,CD-DA),4.,压缩音频文件,5其他文件格式,1,WAV,文件,WAV,文件也称为波形文件,是,Windows,所使用的标准数字音频,文件的扩展名是,WAV。,它是对实际声音进行采样所得到的数据。,使用波形文件最大的缺点是文件太大,不适合长时间记录声音,例如,同样半小时的立体声音乐,,MIDI,文件只有200,KB,左右,而,WAV,文件则要差不多300,MB。,波形音频文件占存储空间很大,每秒钟音频文件的字节数可用如下公式计算:,(采样频率采样精度)/8,2,MIDI,文件,MIDI,是,Musical Instrument Digital Interface(,乐器数字接口)的缩写,,MIDI,文件的扩展名为,MID。,与波形文件不同,,MIDI,文件不对音乐进行采样,而是对音乐的每个音符记录为一个数字,所以与波形文件相比要小得多,可以满足长时间音乐的需要。,MIDI,标准规定了各种音调的混合及发音,通过输出装置可以将这些数字重新合成为音乐。,3光盘数字音频文件(,CD-DA),其采样频率为43.1,KHz,,每个采样使用16位存储信息。,它不仅为开发者提供了高质量的音源,还无需硬盘存储声音文件,声音直接通过光盘由,CD-ROM,驱动器中特定芯片处理后发出。,4.压缩音频文件,在数字音频领域,,mp3,格式的压缩数字音频文件很流行。由于该格式文件采用,MPEG,数据压缩技术,压缩比高,目前已经有一些多媒体平台软件和算法语言支持该格式的音频文件,为制作多媒体产品提供了非常有效的文件格式。,mp3,格式的音频文件具有如下特点:,数据源取自波形音频文件,可获得非常好的音质。,数据压缩比非常高,数据量较小。,通过专用软件,可以很方便地在个人计算机上制作和播放,mp3,格式的音频文件。,播放设备多样化,目前市售的微型,mp3,播放机和,mp3,激光盘播放机都可以播放,mp3,格式的音频文件。,5其他文件格式,其他格式文件还包括,VOC,文件、,AU,文件和,CIF,等。,VOC,文件是随声霸卡一起诞生的常用的声音文件,主要用于,DOS,程序(特别是游戏)中,,VOC,文件和波形文件可互相转换。,AU,文件是,UNIX,操作系下的数字声音文件,由于早期在,Internet,上的,Web,服务器主要是基于,UNIXR,的,所以这种文件成为,WWW,上使用的标准声音文件。,MOD,文件最初产生于,Commodore,公司的,AMIGA,计算机。,6.1.3 数字音频的音质与数据量,数字音频主要指,wav,格式的波形音频文件。,数字音频的声音质量好坏,取决于采样频率的高低、表示声音的基本数据位数和声道形式。,音频的数据量由下式算出:,式中,,V,代表数据量;,f,是采样频率;,b,是数据位数;,s,是声道数。例如,CD,质量的参数为,,f=43.1kHz,b=16bit,s=2,,则每秒钟的数据量为:,v=(44100Hz16bit2)8=176400B(,约合172,KB),如果以,CD,激光盘音质(44100,kHz,的采样频率、16位立体声形式)记录一首5,min(300,秒)的乐曲,参照表6.2,计算的数据量是:,172,KB/s300s=51600KB(,合50.39,MB),由计算结果看出,音频文件的数据量问题不容忽视。为了节省存储空间,通常在保证基本音质的前提下,可以采用稍低一些的采样频率。,一般而言,在要求不高的场合,人的语音采用11.025,kHz,的采样频率、8,bit、,单声道已经足够;如果是乐曲,22.05,kHz,的采样频率、8,bit、,立体声形式已能满足一般播放场合的需要。,6.2 音频数据采样与简单处理,6.2.1 采样基本原理,6.2.2,CD,音乐采样,6.2.3 自然声采样,6.2.1 采样基本原理,声音采样的作用是:把自然界中的模拟量声音转换成计算机能够处理的数字化声音,该过程称为“,A/D,转换(模,/,数转换)”。,1,数字采样,声音采样的基本原理是:首先输入模拟声音信号,然后按照固定的时间间隔截取该信号的振幅值,每个波形周期内截取两次,以取得正、负向的振幅值。该振幅值采用若干位二进制数表示,从而将模拟声音信号变成数字音频信号。模拟声音信号是连续变化的振动波,而数字音频信号则是阶跃变化的离散信号。,截取模拟声音信号振幅值的过程叫做“采样”,得到的振幅值叫做“采样值”,采样值用二进制数的形式表示,该表示形式叫做“量化编码”。,2,采样频率,在一定的时间间隔内采集的样本数叫做“采样频率”。采样频率越高,在一定的时间间隔内采集的样本数越多,音质就越好。当然,采集的样本数量越多,数字化声音的数据量也越大。如果为了减少数据量而过分降低采样频率,音频信号增加了失真,音质就会变得很差。,音频数据的采样频率与声音还原频率还原的关系如下:,从上式中看出,音频数据的采样频率是还原模拟声音频率的两倍。例如,要求还原的声音频率为,22.05,kHz,,,则采样频率应取,43.1,kHz,。,3.,声道数,声道数是声音通道的个数,指一次采样的声音波形个数。,单声道一次采样一个声音波形,双声道则被人们称为“立体声”,一次采样两个声音波形。双声道比单声道多一倍的数据量,多声道的数据量更大。,6.2.2,CD,音乐采样,所谓,CD,音乐采样,是指使用专用软件对,CD,盘上的音乐、语言以及其他形式的声音进行数字转换,生成多种格式的数字音频信号。,用于转换的专用软件很多,本节以,Easy CD-DA Extractor,软件为例介绍,CD,音乐的采样方法(自学),6.2.3 自然声采样,自然声不同于光盘音乐,获得自然声的途径只能是直接录音。,在录音过程中,实时地完成采样,形成数字音频信号。,具备录音和采样功能的软件非常多,最常见的软件是,Windows,中的“录音机”应用软件。但该软件对录音时间有限制,一次录音最长不能超过,1,min,。,若想录制大于,1,min,的声音,只能使用其他软件。,1录音的技术问题,录制自然声,一般需要专业的录音设备,以便保证良好的信噪比。,采用计算机进行录音,应配备质量较好的声卡和话筒。,如果到野外录音的话,一般采用便携式录音设备录制前期声,然后在室内进行后期加工和处理。,在录音时,应注意调整输入信号的强度,使其不超过录音设备的动态范围,否则将产生削顶失真,音感阻塞,严重时无法辨别声音的内容。信号强度过低,也不能获得满意的声音,原因是信号与噪声的比值小,噪声相对比较明显,影响了音质。,录音的技术问题(续),话筒是录制自然声所必需的。,话筒主要有动圈话筒和电容话筒等类型。,动圈话筒的音质好,动态范围宽,适于录制音乐;,电容话筒灵敏度高,频率范围窄,适于录制语音。,由于话筒的输出信号非常微弱,因此话筒的输出信号线不宜过长。如果使用无线话筒,则话筒与接收装置的距离不宜太远。,2使用“录音机”录音,在使用计算机进行录音时,话筒的插头应插入声卡,的,MIC(,话筒)输入插座内。,质量较好的声卡有两个输入插座,一个用于话筒,一个用于线路输入。用于话筒的插座灵敏度高,一般为0.53,mv,,,适于输入微弱的信号;用于线路输入的插座灵敏度低,主要与音响设备的线路输出端连接,适于输入强度较大的信号,一般为5001000,mv,。,上述两个插座不要混淆。如果把话筒插在线路输入插座内,将录不到声音。,使用“录音机”录音(续),把话筒插入声卡的话筒插座后,在,Windows,的桌面上,单击【开始】按钮,然后选用菜单【程序】|【附件】|【娱乐】|【录音机】命令,打开录音机应用程序,鼠标单击录音机上的录音按钮,开始录音。一分钟后,录音自动停止。注意,录音机录制的声音只能采用“,.,wav”,格式。,3录音失败的处理,如果录音失败,应检查以下几个方面:,(1)话筒的开关是否打开,很多话筒带有开关。,(2)话筒是否正确地连接在声卡的,MIC,输入端。,(3)双击屏幕右下角的音量图标(小喇叭),在随后显示出来的音量控制画面中,选择菜单【选项】|【属性】,显示【属性】对话框。在【属性】对话框中,单击【录音】选项,在音量控制清单中,检查“录音控制”、“线路输入”和“麦克风”三项均应有“”,如果没有,单击该项。最后单击“确定”按钮。,4保存声音,在录音机中录制声音后,可单击播放按钮聆听录制效果。然后选用菜单【文件】|【另存为】命令,选择文件夹、输入文件名,最后单击【保存】按钮。保存后的文件采用“.,wav”,格式。,5采样频率与声道形式的转换,这里所说的转换主要针对.,wav,格式的音频文件。在制作多媒体产品时,受到存储空间的限制,有时需要降低采样频率或者把双声道改成单声道,以减少数据量,Windows,的“录音机”可以实现此目的,方法是:打开录音机应用程序,选用菜单【文件】|【打开】命令,打开任意一个波形音频文件,单击【播放】按钮,确认该文件是否是需要转换的文件。然后选用菜单【文件】|【属性】菜单,显示【声音的属性】对话框,在该对话框中单击【立即转换】按钮,显示【声音选定】对话框,6.3 数字音频处理软件,GoldWave,6.3.1 简介,6.3.2 调入与保存文件,6.3.3 数字录音采样,6.3.4 编辑区域,6.3.5 简单音频编辑,6.3.6 声道编辑,6.3.7 淡人淡出,6.3.8 频率均衡控制,6.3.9 混响时间,6.3.10 特殊音效,6.3.11 时间调整,6.3.12 响度控制,6.3.13 编辑和保存,MP3,文件,6.3.14 巧用,GoldWave,软件,6.3.1 简介,GoldWave,软件的主要功能,GoldWave,软件的界面,GoldWave,软件的主要功能有:,(1)以不同的采样频率录制声音信号。录制声音时,声源可以,是,CD-ROM,播放的,CD,音乐,可以是音频电缆传送过来的录音机信号,也可以通过麦克风直接进行现场录音。,(2)声音剪辑。去掉一段不需要的声音。截取一段声音,并复制到另外的位置。将某段声音移到另外的位置。连接两段声音。把多种声音合成在一起等等。,(3)增加特殊效果。增加混响时间;生成回声效果;改变声音的频率;制作声音的淡入、淡出效果;产生“倒序音乐”。,(4)文件操作。新建数字音频文件,调入数字音频文件。保存数字音频文件。删除数字音频文件。,GoldWave,软件的界面,6.3.2 调入与保存文件,1调入文件,音频文件被调入编辑器,显示该文件的波形图。如果该文件是双声道的,则波形图有两个,上面是左声道,下面是右声道。若音频文件是单声道的,则波形图只有一个。编辑器状态栏显示该音频文件的采样频率、总时间长度、当前选择区域的时间长度等信息。,音频文件被调入编辑器后,若该文件的时间长度较长,将只显示开头一小段声音的波形,通常单击【全部】按钮,显示全部音频波形。这样便于在整段波形中确定某个区域,从而对该区域的波形进行编辑。,2保存文件,6.3.3 数字录音采样,1确定录音质量,2录音,1确定录音质量,在【新声音】对话框中,根据录音要求,选择【语音音质】、【收音机音质】和【,CD,音质】三个按钮中的一个,快速确定数字声音的音质。当然,也可以直接选择【采样比率】,精确地确定录音音质。,选择声道。通常选择立体声。如果采用话筒录音,应在声卡的,MIC,插口上插入立体声话筒。,在【初始化长度】输入框中,输入录音时间的长度,其格式是:分:秒.毫秒。例如5:12.88(即5分12秒88)。,设定结束后,编辑器各声道中的波形应为一条直线。,确定录音质量,(续),2录音,首先检查硬件连接,例如:话筒是否连接在声卡的,MIC,输入端上;如果进行线路录音,其他音响设备的输出信号线是否连接在声卡的线路输入端上。然后在播放器中,单击录音按钮,开始录音。,6.3.4 编辑区域,1编辑区域的确定,2展开编辑区域,值得指出的是,在编辑器中,编辑区域只能定义一个,当定义新的编辑区域时,原有的区域自动消失。,6.3.5 简单音频编辑,音频编辑的最简单形式是删除片段、静音处理和剪贴片段。其中,删除片段用于取消不需要的部分,例如噪声、噼啪声、各种杂音,以及录制时产生的口误等;静音处理用于把声音片段变成无声的静音;剪贴片段则用于重新组合声音,将某段“剪”下来的声音粘贴到当前声音的其他位置,或者粘贴到其他声音素材中。,简单音频编辑操作,1删除声音片段,2静音处理,3剪贴片段,4恢复操作,6.3.6 声道编辑,声道编辑的内容包括:选择声道、对声道进行各种编辑、左右声道对调,6.3.7 淡人淡出,所谓“淡入”和“淡出”,是指声音的渐强和渐弱,通常用于两个声音素材的交替切换、产生渐近渐远的音响效果等场合。淡入效果使声音从无到有、由弱到强。而淡出效果则正好相反,声音逐渐消失。淡入与淡出的过渡时间长度由编辑区域的宽窄决定。,制作淡入效果,单击【渐大】按钮,2.制作淡出效果,单击【渐小】按钮,淡入与淡出效果,6.3.8 频率均衡控制,所谓频率均衡控制,是指对声音素材的低音区、中音区、高音区各个频段进行提升和衰减等控制,使声音的层次和频段分布更符合要求,单击【均衡器】按钮,6.3.9 混响时间,混响时间的长短能部分地改变音色。混响时间短,声音干涩;声音就像在近前发生的一样;混响时间长,声音圆润,具有空旷感。,产生混响效果的基本原理是:把指定编辑区域内的声音滞后一小段时间再叠加到原来的声音上,叠加声音的音量和滞后时间长度均可进行调整,以产生不同的混响效果。,单击【回声】按钮,调整延迟滑块,6.3.10 特殊音效,特殊音效是计算机可以通过各种复杂的数字运算,对声音进行特殊处理所产生特殊的声音效果。典型的特殊声音效果有机器人声音和倒序声音。,1机器人声音,所谓机器人声音,是把原始声音加工成类似机器发出的声音。某些科幻影片中的机器人发出的就是这种声音。,单击【机械化】按钮,2倒序声音,倒序声音的基本原理是:将声音数据反向排列,播放出来的效果像宇宙语,谁也听不懂,这是计算机独有的声音效果。,倒序声音可用于声音的加密传送,只有对方采用相同的软件,进行相同的倒序处理,才能把声音还原。,确定编辑区域,然后单击【反向】按钮,编辑区域内的声音被改变,即得到相应的效果。,6.3.11 时间调整,在制作多媒体产品时,有时为了和画面同步,需要改变声音的长度,这就需要进行时间的调整。将一段声音调入编辑器,并纳入编辑区域中。然后,单击【时间弯曲】按钮,显示如图6-15所示的时间调整画面,当前是【速度】选项卡。,调整【变化】滑快,改变声音的速度值。如果希望改变时间,单击【长度】单选钮,然后调整【长度】滑块,改变声音的时间长度。不论是改变速度还是改变时间,最终的效果都是使声音的总时间长度得到改变。声音时间长度的改变,将影响声音的频率。倘若缩短时间长度,将使频率升高,反之亦然。,为了在改变时间的同时,频率不发生明显变化,选择【,FFT】,选项卡。如图6-16所示。设定,FFT,的值应大于等于10,重叠量的值应大于等于88。然后调整【变化】和【长度】,最后单击【确定】按钮。,6.3.12 响度控制,声音素材的响度在播放时可以进行调整,但不能改变素材本身固有的响度。响度控制的目的是:有的放矢地控制素材固有的响度值,在需要插入解说时,降低响度,解说结束后恢复响度。,设置编辑区域,该区域应开始于声音响度降低的起点,结束于声音还原的那一点。用鼠标单击【样式】按钮,显示图6-17所示的外形音量控制画面。,6.3.13 编辑和保存,MP3,文件,Goldwave,软件带有压缩算法编译器,不仅可以编辑和保存,wav,格式的波形音频文件,而且还可以编辑和保存,MP3,格式的压缩音频文件,这是该软件的特色之一。,1打开,MP3,文件,选择菜单【文件】|【打开】命令,显示【打开】文件对话框,如图6-18所示。随后,,,GoldWave,软件经过片刻的解压缩,打开,MP3,文件。,2编辑,MP3,文件,MP3,格式的声音文件被调入音频编辑器后,编辑手段与编辑,wav,格式文件时完全相同。值得注意的是,有些,MP3,音乐的音质较差,明显听到噪音和“噼啪”爆音,应首先将其删除或变成静音,然后再进行其他编辑。,3保存,MP3,文件,选择菜单【文件】|【另存为】命令,显示【保存】文件对话框。在对话框中选择需要的文件格式,指定路径和文件夹,并输入文件名,最后单击【确定】按钮。当选择,MP3,格式保存时,需要的时间较长。,6.3.14 巧用,GoldWave,软件,利用,GoldWave,软件,可以方便地实现文件格式转换、自制,MP3,音乐等功能。,1将,wav,格式文件压缩成,MP3,格式的文件,利用,GoldWave,软件的文件操作,可以方便地实现此功能。选择菜单【文件】|【打开】命令,显示【打开】对话框,打开,wav,格式的声音文件。选择菜单【文件】|【另存为】命令,并在【保存】对话框中,选择“,MPEG Audio(*.MP3)”,文件类型,单击【确定】按钮。稍候片刻,即可得到,MP3,格式的文件。,2直接从,CD,盘上获得声音文件,GoldWave,软件具有声音采样功能,可直接从,CD,盘上获得,wav,格式的声音文件。选择菜单【工具】|【,CD,读取器】命令,显示图6-19所示的【,CD,读取器】对话框。在对话框的【选择,CD-ROM,驱动器】下拉列表框中,选择正在使用的,CD-ROM,驱动器。,在【读取时间范围】选项卡的【从:】和【到:】下拉列表框中,指定获取音轨号的范围。最后单击【保存】按钮,即可得到,wav,格式的声音文件。,3自制,MP3,声音文件,在制作,MP3,声音文件之前,应加工和整理好各种声音素材,然后逐一将各种声音素材打开,形成各自的波形音频窗口。然后利用编辑手段对背景音乐、自己录制的话语,以及各种素材进行处理。最后以“,MPEG Audio(*.MP3)”,文件类型进行保存,即可得到自制的,MP3,格式声音文件。保存过程可能稍长,如图6-20所示。,
展开阅读全文