资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,音频(一),声音与听觉器官,声音,是携带信息的极其重要的媒体,是多媒体技术研究中的一个重要内容。,声音是通过空气传播的一种连续的波,叫,声波,。声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。,声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号,,如下图所示,。,声波,音频(二),人们是否能够听到音频信号,主要取决于个人的年龄和耳朵的特性。人的听觉器官能感知的声音频率大约在,20,20000 Hz,之间,感知的声音幅度大约在,0,120 dB,之间。,声音信号的两个基本参数是,频率,和,幅度,。信号的频率是指信号每秒钟变化的次数,用,Hz,表示。频率范围为,20Hz,20kHz,的信号称为音频,(Audio),信号;人的发音器官发出的声音频率大约是,80,3400Hz,,人说话的信号频率通常为,300,3000 Hz,,,人们把在这种频率范围的信号称为话音,(speech),信号;高于,20kHz,的信号称为超音频信号或称超声波。,音频(三),声波具有波的特性,,如反射,(,reflection,),、,折射,(,refraction,),和衍射,(,diffraction,),等。,对声音信号的分析表明,声音信号由许多频率不同的信号组成,这类信号称为,复合信号,,而单一频率的信号称为,分量信号,。声音信号的一个重要参数就是,带宽,,它用来描述组成复合信号的频率范围。如高保真声音信号,(high-fidelity audio),的频率范围为,10Hz,20000 Hz,,,它的带宽约为,20kHz,,,而视频信号的带宽是,6 MHz,。,音频(四),音频属于听觉类媒体,包括,波形声音,、,语音,和,音乐,。,人们能够感知的音频信号称为,波形声音,,它可包含所有的声音形式;,人类发出的声音不仅可以看成是一种波形声音,而且还具有其内在的语言、语言学的内涵,这就是,语音,,语音可以使用特殊的方法进行提取,它也被视为是一种媒体;,音乐,是符号化的声音,这种符号就是乐谱,乐谱是转化为符号的声音,,MIDI,就是其一种形式。,数字音频(一),声音进入计算机的第一步就是数字化,数字化实际上是对声音信号的,采样,和,量化,。连续信号的离散化通过采样来实现,就是每隔相等的一小段时间间隔对信号测量一次,这种采样称为,均匀采样,(uniform sampling),;,对连续幅度声音信号的离散化通过,量化,(quantization),来实现,就是把信号的强度划分成一小段一小段的,如果幅度的划分是等间隔的,就称为,线性量化,,否则就称为,非线性量化,。下图表示了声音信号数字化的概念。,声音的量化,数字音频(二),1,、声音的数字化过程,开始,音频信号频率,采样频率,采样,量化,保存为声音文件,结束,数字音频(三),2,、声音的采样频率与量化分辨率,我们把在时间和幅度上都是连续的信号称为模拟信号。,而在某些特定的时刻对这种模拟信号进行的测量叫做采样,(sampling),,采样重复的频率称为采样频率,由这些特定时刻采样得到的信号称为离散时间信号。,如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅度信号。显而易见,反映某一瞬间信号幅度的二进制编码位数越多,其可分辨的模拟信号的幅度就越精细,也就是分辨率越高。,数字音频(四),采样速率,分辨率,立体声或单声道,1,分钟所需字节,44.1kHz,16,位,立体声,10.5MB,44.1kHz,16,位,单声道,5.25MB,44.1kHz,8,位,立体声,5.25MB,44.1kHz,8,位,单声道,2.6MB,22.05kHz,16,位,立体声,5.25MB,22.05kHz,16,位,单声道,2.5MB,22.05kHz,8,位,立体声,2.6MB,22.05kHz,8,位,单声道,1.3MB,常用声音信号数字化时使用的采样速率与分辨率指标如下:,数字音频(五),3,、声音文件,将数字化的声音信号保存成计算机文件的形式,这种文件就是,声音文件,。,声音文件的大小与下列因素相关:,分辨率,r(BIT,),采样速率,R(KHz,),声道数,声音文件的大小按下式计算,S=R*D(r/8)*1 (,单声道,),S=R*D(r/8)*2,(立体声),数字音频(六),声音文件的存储格式,存储声音数据的文件也需要特定的存储格式。目前比较流行的声音文件格式有(文件的扩展名):,.wav(waveform),;,.,au(audio,),;,.,aiff(Audio,Interchangeable File Format),;,.,snd(sound,),。,.wav,格式主要用在,PC,上,,.au,主要用在,Unix,工作站上,,.,aiff,和,snd,主要用在苹果机和美国视算科技有限公司,(Silicon Graphics,,,Inc.,,,SGI),的工作站上。,数字音频(七),(,1,),WAV,文件,又称波形文件,是,Microsoft,公司的音频文件格式,由采样数据组成,没有经过压缩处理。,(,2,),VOC,文件,是,Creative,公司的波形文件格式,由文件头块和音频数据块组成。,(,3,),MIDI,文件,是英文,M,usical,I,nstrument,D,igital,I,nterface,的缩写,是一种应用于音乐的技术规范。,(,4,)其它(,PCM,、,AIF,等),乐器数字接口(,MIDI,),M,usical,I,nstrument,D,igital,I,nterface,的缩写,MIDI,提供了描述合成音乐的乐谱的协议,规定了各种电子乐器和计算机之间连接的物理接口和数据传输的规程。,MIDI,文件,是记录,MIDI,信息的标准格式文件,包含音符、定时和,16,个通道的乐器定义以及键号、通道号、持续时间、音量和击键力度等每个音符的有关信息。,MIDI,文件使用音序器(一种为,MIDI,作曲而设计的软件或硬件设备)来进行记录、播放和编辑。,MIDI,文件保存的是演奏音乐的指令而不是波形数据,因此比波形文件要求的存储空间要小的多。,MIDI,作品,以,MIDI,文件的形式保存的音乐作品,数字化声音和,MIDI,的比较,数字化的声音是声音的实际表示,代表了声音的瞬时幅度,与设备无关,每次播放都发出相同的声音;,MIDI,数据是与设备相关的,产生的声音与用来播放它的特定,MIDI,设备有关。,MIDI,数据优点,文件紧凑,文件大小与回放质量无关;,声音的回放质量取决于,MIDI,回放设备;,MIDI,数据是完全可编辑的;,创建,MIDI,作品需要较多的音乐理论知识;,音序器的使用要简易的多。,MIDI,数据缺点,MIDI,数据不是声音的真实描述,只有产生它的设备与回放它的设备一致时,回放的结果才是精确的;,MIDI,主要用来处理音乐,语音和直接获取的声音是很难使用的。,MP3,文件,利用人耳的掩蔽效应对原始声音信号进行压缩,以获得不失真的声音信号,。,声音的编辑与各式转换,使用声音制作工具软件,Adobe Audition,cakewalk pro audio,
展开阅读全文