第6章音频处理技术.ppt_咨信网zixin.com.cn

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第6章音频处理技术,6.1 基本概念,6.2 音频数据采样与简单处理,6.3 数字音频处理软件,GoldWave,6.1 基本概念,声音是振动的波，是随时间连续变化的物理量。,声音有三个重要指标：,振幅（,Amplitude）,波的高低幅度，表示声音的强弱；,周期（,Period）,两个相邻波之问的时间长度；,频率（,Frequency）,每秒钟振动的次数，以,Hz,为单位。,6.1.1 声音基本特点,1声音的传播与可听域,2声音的方向,3声音的三要素,4声音的频谱,5声音的质量,6声音的连续时基性,7数字化声音,1声音的传播与可听域,声音依靠介质的振动进行传播。声源实际上是一个振动源，它使周围的介质（空气、液体、固体）产生振动，并以波的形式进行传播，人耳如果感觉到这种传播过来的振动，再反映到大脑，就意味着听到了声音。,人耳听到的声音是有限的，频率低于20,Hz,和高于20,kHz,的声音人类听不到，换言之，人耳的可听域在2020,kHz,之间。频率低于20,Hz,的声音叫做“次声”，高于20,kHz,的声音是“超声”。,频率范围又叫“频域”或“频带”，不同种类的声源其频带也不同，表6.,l,列出了部分常见声源的频带宽度。,2声音的方向,声音以振动波的形式从声源向四周传播，人类在辨别声源位置时，首先依靠声音到达左、右两耳的微小时间差和强度差异进行辨别，然后经过大脑综合分析而判断出声音来自何方。,3声音的三要素,声音的三要素是音调、音色和音强。就听觉特性而言，声音质量的高低主要取决于该三要素。,（1）音调代表了声音的高低。音调与频率有关，频率越高，音调越高，反之亦然。,（2）音色具有特色的声音。,（3）音强声音的强度，也被称为声音的响度，常说的“音量”也是指音强。,4声音的频谱,声音的频谱有线性频谱和连续频谱之分。,线性频谱是具有周期性的单一频率声波；,连续频谱是具有非周期性的带有一定频带所有频率分量的声波。,5声音的质量,声音的质量简称“音质”，音质的好坏与音色和频率范围有关。影响音质的因素还有很多，常见的有：,（1）对于数字音频信号，音质的好坏与数据采样频率和数据位数有关。采样频率越低，位数越少，音质越差。,（2）音质与声音还原设备有关，音响放大器和扬声器的质量能够直接影响重放的音质。,（3）音质与信号噪声比有关。,6声音的连续时基性,声音在时间轴上是连续信号，具有连续性和过程性，属于连续时基性媒体形式。,7数字化声音,为了用计算机表示和处理声音，必须将声音进行数字化，即用数字表示声波。,数字化了的声音叫做“数字音频信号”，它除了包含有自然界中所有的声音之外，还具有经过计算机处理的独特的音色和特质,6.1.2 数字音频文件的种类,1,WAV,文件,2,MIDI,文件,3光盘数字音频文件（,CD-DA）,4.,压缩音频文件,5其他文件格式,1,WAV,文件,WAV,文件也称为波形文件，是,Windows,所使用的标准数字音频，文件的扩展名是,WAV。,它是对实际声音进行采样所得到的数据。,使用波形文件最大的缺点是文件太大，不适合长时间记录声音，例如，同样半小时的立体声音乐，,MIDI,文件只有200,KB,左右，而,WAV,文件则要差不多300,MB。,波形音频文件占存储空间很大，每秒钟音频文件的字节数可用如下公式计算：,（采样频率采样精度）/8,2,MIDI,文件,MIDI,是,Musical Instrument Digital Interface（,乐器数字接口）的缩写，,MIDI,文件的扩展名为,MID。,与波形文件不同，,MIDI,文件不对音乐进行采样，而是对音乐的每个音符记录为一个数字，所以与波形文件相比要小得多，可以满足长时间音乐的需要。,MIDI,标准规定了各种音调的混合及发音，通过输出装置可以将这些数字重新合成为音乐。,3光盘数字音频文件（,CD-DA）,其采样频率为43.1,KHz，,每个采样使用16位存储信息。,它不仅为开发者提供了高质量的音源，还无需硬盘存储声音文件，声音直接通过光盘由,CD-ROM,驱动器中特定芯片处理后发出。,4.压缩音频文件,在数字音频领域，,mp3,格式的压缩数字音频文件很流行。由于该格式文件采用,MPEG,数据压缩技术，压缩比高,目前已经有一些多媒体平台软件和算法语言支持该格式的音频文件，为制作多媒体产品提供了非常有效的文件格式。,mp3,格式的音频文件具有如下特点：,数据源取自波形音频文件，可获得非常好的音质。,数据压缩比非常高，数据量较小。,通过专用软件，可以很方便地在个人计算机上制作和播放,mp3,格式的音频文件。,播放设备多样化，目前市售的微型,mp3,播放机和,mp3,激光盘播放机都可以播放,mp3,格式的音频文件。,5其他文件格式,其他格式文件还包括,VOC,文件、,AU,文件和,CIF,等。,VOC,文件是随声霸卡一起诞生的常用的声音文件，主要用于,DOS,程序（特别是游戏）中，,VOC,文件和波形文件可互相转换。,AU,文件是,UNIX,操作系下的数字声音文件，由于早期在,Internet,上的,Web,服务器主要是基于,UNIXR,的，所以这种文件成为,WWW,上使用的标准声音文件。,MOD,文件最初产生于,Commodore,公司的,AMIGA,计算机。,6.1.3 数字音频的音质与数据量,数字音频主要指,wav,格式的波形音频文件。,数字音频的声音质量好坏，取决于采样频率的高低、表示声音的基本数据位数和声道形式。,音频的数据量由下式算出：,式中，,V,代表数据量；,f,是采样频率；,b,是数据位数；,s,是声道数。例如,CD,质量的参数为，,f=43.1kHz，b=16bit，s=2，,则每秒钟的数据量为：,v=（44100Hz16bit2）8=176400B（,约合172,KB）,如果以,CD,激光盘音质（44100,kHz,的采样频率、16位立体声形式）记录一首5,min（300,秒）的乐曲，参照表6.2，计算的数据量是：,172,KB/s300s=51600KB（,合50.39,MB）,由计算结果看出，音频文件的数据量问题不容忽视。为了节省存储空间，通常在保证基本音质的前提下，可以采用稍低一些的采样频率。,一般而言，在要求不高的场合，人的语音采用11.025,kHz,的采样频率、8,bit、,单声道已经足够；如果是乐曲，22.05,kHz,的采样频率、8,bit、,立体声形式已能满足一般播放场合的需要。,6.2 音频数据采样与简单处理,6.2.1 采样基本原理,6.2.2,CD,音乐采样,6.2.3 自然声采样,6.2.1 采样基本原理,声音采样的作用是：把自然界中的模拟量声音转换成计算机能够处理的数字化声音，该过程称为“,A/D,转换（模,/,数转换）”。,1,数字采样,声音采样的基本原理是：首先输入模拟声音信号，然后按照固定的时间间隔截取该信号的振幅值，每个波形周期内截取两次，以取得正、负向的振幅值。该振幅值采用若干位二进制数表示，从而将模拟声音信号变成数字音频信号。模拟声音信号是连续变化的振动波，而数字音频信号则是阶跃变化的离散信号。,截取模拟声音信号振幅值的过程叫做“采样”，得到的振幅值叫做“采样值”，采样值用二进制数的形式表示，该表示形式叫做“量化编码”。,2,采样频率,在一定的时间间隔内采集的样本数叫做“采样频率”。采样频率越高，在一定的时间间隔内采集的样本数越多，音质就越好。当然，采集的样本数量越多，数字化声音的数据量也越大。如果为了减少数据量而过分降低采样频率，音频信号增加了失真，音质就会变得很差。,音频数据的采样频率与声音还原频率还原的关系如下：,从上式中看出，音频数据的采样频率是还原模拟声音频率的两倍。例如，要求还原的声音频率为,22.05,kHz,，,则采样频率应取,43.1,kHz,。,3.,声道数,声道数是声音通道的个数，指一次采样的声音波形个数。,单声道一次采样一个声音波形，双声道则被人们称为“立体声”，一次采样两个声音波形。双声道比单声道多一倍的数据量，多声道的数据量更大。,6.2.2,CD,音乐采样,所谓,CD,音乐采样，是指使用专用软件对,CD,盘上的音乐、语言以及其他形式的声音进行数字转换，生成多种格式的数字音频信号。,用于转换的专用软件很多，本节以,Easy CD-DA Extractor,软件为例介绍,CD,音乐的采样方法（自学）,6.2.3 自然声采样,自然声不同于光盘音乐，获得自然声的途径只能是直接录音。,在录音过程中，实时地完成采样，形成数字音频信号。,具备录音和采样功能的软件非常多，最常见的软件是,Windows,中的“录音机”应用软件。但该软件对录音时间有限制，一次录音最长不能超过,1,min,。,若想录制大于,1,min,的声音，只能使用其他软件。,1录音的技术问题,录制自然声，一般需要专业的录音设备，以便保证良好的信噪比。,采用计算机进行录音，应配备质量较好的声卡和话筒。,如果到野外录音的话，一般采用便携式录音设备录制前期声，然后在室内进行后期加工和处理。,在录音时，应注意调整输入信号的强度，使其不超过录音设备的动态范围，否则将产生削顶失真，音感阻塞，严重时无法辨别声音的内容。信号强度过低，也不能获得满意的声音，原因是信号与噪声的比值小，噪声相对比较明显，影响了音质。,录音的技术问题（续）,话筒是录制自然声所必需的。,话筒主要有动圈话筒和电容话筒等类型。,动圈话筒的音质好，动态范围宽，适于录制音乐；,电容话筒灵敏度高，频率范围窄，适于录制语音。,由于话筒的输出信号非常微弱，因此话筒的输出信号线不宜过长。如果使用无线话筒，则话筒与接收装置的距离不宜太远。,2使用“录音机”录音,在使用计算机进行录音时，话筒的插头应插入声卡,的,MIC（,话筒）输入插座内。,质量较好的声卡有两个输入插座，一个用于话筒，一个用于线路输入。用于话筒的插座灵敏度高，一般为0.53,mv,，,适于输入微弱的信号；用于线路输入的插座灵敏度低，主要与音响设备的线路输出端连接，适于输入强度较大的信号，一般为5001000,mv,。,上述两个插座不要混淆。如果把话筒插在线路输入插座内，将录不到声音。,使用“录音机”录音（续）,把话筒插入声卡的话筒插座后，在,Windows,的桌面上，单击【开始】按钮，然后选用菜单【程序】|【附件】|【娱乐】|【录音机】命令，打开录音机应用程序，鼠标单击录音机上的录音按钮，开始录音。一分钟后，录音自动停止。注意，录音机录制的声音只能采用“,.,wav”,格式。,3录音失败的处理,如果录音失败，应检查以下几个方面：,（1）话筒的开关是否打开，很多话筒带有开关。,（2）话筒是否正确地连接在声卡的,MIC,输入端。,（3）双击屏幕右下角的音量图标（小喇叭），在随后显示出来的音量控制画面中，选择菜单【选项】|【属性】，显示【属性】对话框。在【属性】对话框中，单击【录音】选项，在音量控制清单中，检查“录音控制”、“线路输入”和“麦克风”三项均应有“”，如果没有，单击该项。最后单击“确定”按钮。,4保存声音,在录音机中录制声音后，可单击播放按钮聆听录制效果。然后选用菜单【文件】|【另存为】命令，选择文件夹、输入文件名，最后单击【保存】按钮。保存后的文件采用“.,wav”,格式。,5采样频率与声道形式的转换,这里所说的转换主要针对.,wav,格式的音频文件。在制作多媒体产品时，受到存储空间的限制，有时需要降低采样频率或者把双声道改成单声道，以减少数据量,Windows,的“录音机”可以实现此目的，方法是：打开录音机应用程序，选用菜单【文件】|【打开】命令，打开任意一个波形音频文件，单击【播放】按钮，确认该文件是否是需要转换的文件。然后选用菜单【文件】|【属性】菜单，显示【声音的属性】对话框，在该对话框中单击【立即转换】按钮，显示【声音选定】对话框,6.3 数字音频处理软件,GoldWave,6.3.1 简介,6.3.2 调入与保存文件,6.3.3 数字录音采样,6.3.4 编辑区域,6.3.5 简单音频编辑,6.3.6 声道编辑,6.3.7 淡人淡出,6.3.8 频率均衡控制,6.3.9 混响时间,6.3.10 特殊音效,6.3.11 时间调整,6.3.12 响度控制,6.3.13 编辑和保存,MP3,文件,6.3.14 巧用,GoldWave,软件,6.3.1 简介,GoldWave,软件的主要功能,GoldWave,软件的界面,GoldWave,软件的主要功能有：,（1）以不同的采样频率录制声音信号。录制声音时，声源可以,是,CD-ROM,播放的,CD,音乐，可以是音频电缆传送过来的录音机信号，也可以通过麦克风直接进行现场录音。,（2）声音剪辑。去掉一段不需要的声音。截取一段声音，并复制到另外的位置。将某段声音移到另外的位置。连接两段声音。把多种声音合成在一起等等。,（3）增加特殊效果。增加混响时间；生成回声效果；改变声音的频率；制作声音的淡入、淡出效果；产生“倒序音乐”。,（4）文件操作。新建数字音频文件，调入数字音频文件。保存数字音频文件。删除数字音频文件。,GoldWave,软件的界面,6.3.2 调入与保存文件,1调入文件,音频文件被调入编辑器，显示该文件的波形图。如果该文件是双声道的，则波形图有两个，上面是左声道，下面是右声道。若音频文件是单声道的，则波形图只有一个。编辑器状态栏显示该音频文件的采样频率、总时间长度、当前选择区域的时间长度等信息。,音频文件被调入编辑器后，若该文件的时间长度较长，将只显示开头一小段声音的波形，通常单击【全部】按钮，显示全部音频波形。这样便于在整段波形中确定某个区域，从而对该区域的波形进行编辑。,2保存文件,6.3.3 数字录音采样,1确定录音质量,2录音,1确定录音质量,在【新声音】对话框中，根据录音要求，选择【语音音质】、【收音机音质】和【,CD,音质】三个按钮中的一个，快速确定数字声音的音质。当然，也可以直接选择【采样比率】，精确地确定录音音质。,选择声道。通常选择立体声。如果采用话筒录音，应在声卡的,MIC,插口上插入立体声话筒。,在【初始化长度】输入框中，输入录音时间的长度，其格式是：分:秒.毫秒。例如5:12.88（即5分12秒88）。,设定结束后，编辑器各声道中的波形应为一条直线。,确定录音质量,（续）,2录音,首先检查硬件连接，例如：话筒是否连接在声卡的,MIC,输入端上；如果进行线路录音，其他音响设备的输出信号线是否连接在声卡的线路输入端上。然后在播放器中，单击录音按钮，开始录音。,6.3.4 编辑区域,1编辑区域的确定,2展开编辑区域,值得指出的是，在编辑器中，编辑区域只能定义一个，当定义新的编辑区域时，原有的区域自动消失。,6.3.5 简单音频编辑,音频编辑的最简单形式是删除片段、静音处理和剪贴片段。其中，删除片段用于取消不需要的部分，例如噪声、噼啪声、各种杂音，以及录制时产生的口误等；静音处理用于把声音片段变成无声的静音；剪贴片段则用于重新组合声音，将某段“剪”下来的声音粘贴到当前声音的其他位置，或者粘贴到其他声音素材中。,简单音频编辑操作,1删除声音片段,2静音处理,3剪贴片段,4恢复操作,6.3.6 声道编辑,声道编辑的内容包括：选择声道、对声道进行各种编辑、左右声道对调,6.3.7 淡人淡出,所谓“淡入”和“淡出”，是指声音的渐强和渐弱，通常用于两个声音素材的交替切换、产生渐近渐远的音响效果等场合。淡入效果使声音从无到有、由弱到强。而淡出效果则正好相反，声音逐渐消失。淡入与淡出的过渡时间长度由编辑区域的宽窄决定。,制作淡入效果,单击【渐大】按钮,2.制作淡出效果,单击【渐小】按钮,淡入与淡出效果,6.3.8 频率均衡控制,所谓频率均衡控制，是指对声音素材的低音区、中音区、高音区各个频段进行提升和衰减等控制，使声音的层次和频段分布更符合要求,单击【均衡器】按钮,6.3.9 混响时间,混响时间的长短能部分地改变音色。混响时间短，声音干涩；声音就像在近前发生的一样；混响时间长，声音圆润，具有空旷感。,产生混响效果的基本原理是：把指定编辑区域内的声音滞后一小段时间再叠加到原来的声音上，叠加声音的音量和滞后时间长度均可进行调整，以产生不同的混响效果。,单击【回声】按钮,调整延迟滑块,6.3.10 特殊音效,特殊音效是计算机可以通过各种复杂的数字运算，对声音进行特殊处理所产生特殊的声音效果。典型的特殊声音效果有机器人声音和倒序声音。,1机器人声音,所谓机器人声音，是把原始声音加工成类似机器发出的声音。某些科幻影片中的机器人发出的就是这种声音。,单击【机械化】按钮,2倒序声音,倒序声音的基本原理是：将声音数据反向排列，播放出来的效果像宇宙语，谁也听不懂，这是计算机独有的声音效果。,倒序声音可用于声音的加密传送，只有对方采用相同的软件，进行相同的倒序处理，才能把声音还原。,确定编辑区域，然后单击【反向】按钮，编辑区域内的声音被改变，即得到相应的效果。,6.3.11 时间调整,在制作多媒体产品时，有时为了和画面同步，需要改变声音的长度，这就需要进行时间的调整。将一段声音调入编辑器，并纳入编辑区域中。然后，单击【时间弯曲】按钮，显示如图6-15所示的时间调整画面，当前是【速度】选项卡。,调整【变化】滑快，改变声音的速度值。如果希望改变时间，单击【长度】单选钮，然后调整【长度】滑块，改变声音的时间长度。不论是改变速度还是改变时间，最终的效果都是使声音的总时间长度得到改变。声音时间长度的改变，将影响声音的频率。倘若缩短时间长度，将使频率升高，反之亦然。,为了在改变时间的同时，频率不发生明显变化，选择【,FFT】,选项卡。如图6-16所示。设定,FFT,的值应大于等于10，重叠量的值应大于等于88。然后调整【变化】和【长度】，最后单击【确定】按钮。,6.3.12 响度控制,声音素材的响度在播放时可以进行调整，但不能改变素材本身固有的响度。响度控制的目的是：有的放矢地控制素材固有的响度值，在需要插入解说时，降低响度，解说结束后恢复响度。,设置编辑区域，该区域应开始于声音响度降低的起点，结束于声音还原的那一点。用鼠标单击【样式】按钮，显示图6-17所示的外形音量控制画面。,6.3.13 编辑和保存,MP3,文件,Goldwave,软件带有压缩算法编译器，不仅可以编辑和保存,wav,格式的波形音频文件，而且还可以编辑和保存,MP3,格式的压缩音频文件，这是该软件的特色之一。,1打开,MP3,文件,选择菜单【文件】|【打开】命令，显示【打开】文件对话框，如图6-18所示。随后,，,GoldWave,软件经过片刻的解压缩，打开,MP3,文件。,2编辑,MP3,文件,MP3,格式的声音文件被调入音频编辑器后，编辑手段与编辑,wav,格式文件时完全相同。值得注意的是，有些,MP3,音乐的音质较差，明显听到噪音和“噼啪”爆音，应首先将其删除或变成静音，然后再进行其他编辑。,3保存,MP3,文件,选择菜单【文件】|【另存为】命令，显示【保存】文件对话框。在对话框中选择需要的文件格式，指定路径和文件夹，并输入文件名，最后单击【确定】按钮。当选择,MP3,格式保存时，需要的时间较长。,6.3.14 巧用,GoldWave,软件,利用,GoldWave,软件，可以方便地实现文件格式转换、自制,MP3,音乐等功能。,1将,wav,格式文件压缩成,MP3,格式的文件,利用,GoldWave,软件的文件操作，可以方便地实现此功能。选择菜单【文件】|【打开】命令，显示【打开】对话框，打开,wav,格式的声音文件。选择菜单【文件】|【另存为】命令，并在【保存】对话框中，选择“,MPEG Audio（*.MP3）”,文件类型，单击【确定】按钮。稍候片刻，即可得到,MP3,格式的文件。,2直接从,CD,盘上获得声音文件,GoldWave,软件具有声音采样功能，可直接从,CD,盘上获得,wav,格式的声音文件。选择菜单【工具】|【,CD,读取器】命令，显示图6-19所示的【,CD,读取器】对话框。在对话框的【选择,CD-ROM,驱动器】下拉列表框中，选择正在使用的,CD-ROM,驱动器。,在【读取时间范围】选项卡的【从：】和【到：】下拉列表框中，指定获取音轨号的范围。最后单击【保存】按钮，即可得到,wav,格式的声音文件。,3自制,MP3,声音文件,在制作,MP3,声音文件之前，应加工和整理好各种声音素材，然后逐一将各种声音素材打开，形成各自的波形音频窗口。然后利用编辑手段对背景音乐、自己录制的话语，以及各种素材进行处理。最后以“,MPEG Audio（*.MP3）”,文件类型进行保存，即可得到自制的,MP3,格式声音文件。保存过程可能稍长，如图6-20所示。,

展开阅读全文

第6章 音频处理技术.ppt

第6章音频处理技术.ppt