收藏 分销(赏)

第四章 数字音频处理技术.ppt

上传人:pc****0 文档编号:13179434 上传时间:2026-01-30 格式:PPT 页数:47 大小:394.50KB 下载积分:10 金币
下载 相关 举报
第四章 数字音频处理技术.ppt_第1页
第1页 / 共47页
第四章 数字音频处理技术.ppt_第2页
第2页 / 共47页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,4,章 数字音频处理技术,本章重点:,声音概述,音乐合成与,MIDI,数字音频压缩标准,数字音频处理实例,声音在本质上是一种机械振动,它通过空气传播到人耳,刺激神经后使大脑产生一种感觉。在一些专业场合,声音通常被称为声波或音频。,4.1,声,音概,述,声音在物理学上称之为声波,是通过一定介质(如空气、水等)传播的一种连续振动的波,也称为声波。,通常把频率范围为,20Hz,20kHz,的信号称为音频信号。低于,20Hz,的信号为亚音信号或者称为次音信号;高于,20kHz,的信号称为超音频信号,或称为超声波信号。,常见声源及其频率范围:,声音的特征:,声音有,3,个重要指标即振幅、周期和频率。振幅是波的高低幅度,表示声音的强弱;周期指两个相邻波之间的时间长度;频率指每秒振动的次数,以,Hz,为单位。,声音的,3,要素是音调、音色、强度,它们分别与声波的频率、波形、振幅等相关,4.2,数字化音频,声音信号是时间和幅度上都连续的模拟信号。而计算机只认识“,0”,和“,1”,,或者说计算机只能处理一个个数据,尽管数据量可能是巨大的。所以,计算机处理声音的第一步是将声音数字化,将模拟信号变为数字信号。,4.2.1,音频的数字化,把模拟声音(音频)信号转换位数字化声音(音频)的过程称为声音(音频)的数字化,或称为模,/,数(,A/D,)变换。,1.,采样,在音频数字化过程中,采样指的是以固定的时间间隔,T,对模拟信号(音频信号)进行取值。固定的时间间隔,T,称为采样周期,,1/T,称为采样频率(,fs,)。采样后得到的是一个离散时间信号。采样时间间隔,T,越短,也就是采样频率越高,声音数据在后期播放时保真度越好。,2.,量化,采样后的音频信号需要经过量化,使信号幅度转变为有限的离散数值。这种由有限个数值组成的信号就称为离散幅度信号。,例如,假设输入电压的范围是,0V,7V,,并假设它的取值只限定在,0,,,1,,,2,,,,,7,共,8,个值。如果采样得到的幅度值是,1.2V,,则它的取值就应是,1V,,如果采样得到的幅度值是,2.6V,,则它的取值就应是,3V,等。,这种数值就称为离散数值,即量化值。量化之后得到的是时间离散、幅度离散的数字信号。,3.,编码,编码,即是将量化值表示成为二进制数的形式,以便于计算机存储和处理。例如,上面量化规定的,8,个取值,就可以用,3,位二进制数表示,从,000,111,,,2V,可以表示为,001,,,3V,可以表示位,011,,,6V,可以表示位,101,。,计算机可以对数字化之后的音频信号进行存储、编辑和处理,并可以还原成原始的波形进行播放,这个还原的过程称为解码,它是模,/,数(,A/D,)变换的逆过程,及数,/,模(,D/A,)变换。,4.2.2,数字音频音质与数据量,采样频率和采样量化级数是数字化声音的两个最基本要求,直接影响数字化音频的质量和数据量。一般而言,采样频率越高声音失真越小,但用于存储音频的数据量也越大。量化位数越高音质越好,数据量越大。,通常有,3,中采样频率:,44.1kHz,(取样,44 100,次每秒,用于,CD,品质的音乐)、,22.05kHz,(适用于语音和中等品质的音乐)、,11.025kHz,(低品质),量化精度分别为,8,位字长(,256,阶)量化(低品质)和,16,位字长(,65 535,阶)量化(高品质)。,4.2.2,数字音频音质与数据量,反映音频数字化质量的另一个因素是通道(或声道)个数。一次采样一个声音波形,称为,“,单声道,”,;一次采样两个声音波形,称为,“,双声道,”,(即人们常说的立体声)。立体声更能反映人的听觉感受。但数据量比单声道多一倍,这样需要的存储空间是单声道的两倍。对声音的采样可以使用不同的采样频率、采样量化级数和声道,但实际上为了节省存储空间,经常要在数字化音频数据量的的大小与声音回放质量之间进行权衡。,声音信息数字化后的数据量计算公式为:,数据量,=,采样频率*量化位数*声道数,/8,数据量的单位:,B/s,(字节,/,秒),音质与数字音频参数的关系,4.2.3,数字音频文件格式,数字音频数据是以文件的形式保存在计算机中的。数字音频的文件格式主要又,CD,、,WAVE,、,MP3,、,WMA,、,MIDI,等。,CD,文件:*,.,cda,格式,采用,44.1kHz,的采样频率,速率为,88kbps,。具有,16,位量化位数,,CD,音轨近似无损,声音基本上终于忠于原声。,WAV,文件:微软公司开发的一种声音文件格式,也称波形声音文件,是最早的数字音频格式,被,Windows,平台及其应用程序广泛支持。,4.2.3,数字音频文件格式,MP3,音频文件:全称为,MPEG-1 audio layer3,,其压缩率为,12,:,1,。优势是在高压缩比的情况下,还能拥有优美的音质。它利用知觉音频编码技术,即利用了人耳的特性,消减音乐中人耳的特性,消减音乐中人耳听不到的成分,同时尽可能地维持原来的声音质量。,WMA,文件:,Windows Media Audio,,通过减少数据流量但保持音质的方法来达到比,MP3,压缩率更高的目的。,WMA,的一个优点是压缩率高,一般都在,18,:,1.,其次,,WMA,的内容提供商可以加入防复制保护。,4.2.3,数字音频文件格式,MID,:,Musical Instrument Digital Interface,,允许数字合成器和其他设备交换数据。,MIDI,文件格式由,MIDI,继承而来。,MIDI,文件并不是一段录制好的声音,而是记录声音的信息,每个音符记录为一个数字,然后是告诉声卡如何再现音乐的一组指令。,1,分钟,MIDI,音乐文件的大小只有,510KB,。,Real Audio,:,Real network,推出的一种音乐压缩格式;它的压缩比可达到,96,:,1,,因此在网上比较流行。经过压缩的音乐文件可以通过速率为,14.4kb/s,的,MODEM,上网的计算机中流畅回放。,4.2.4,数字音频获取,声音文件的获取是为音频的编辑进行素材积累阶段。声音的获取途径很多,可以采用以下方式进行获取。,自己亲自录制,从,CD,唱盘获得,从网上和素材库获取,4.2.5,数字音频的处理,专业的音频编辑软件,GoldWave,功能强大,可以对音乐进行播放、录制、编辑、转换格式、特技处理等。,GoldWave,支持多种声音格式,如,WAV,、,MP3,、,AU,、,AVI,、,MPEG,、,MOV,、,RAW,、,SDS,等。其主要功能有:,音频文件的格式转换:,它还支持,MAC,计算机所使用的声音文件。因此,通过,GoldWave,可以实现这种格式的转换。,音频数据的简单编辑,声音效果的处理,音频的修复,CD,音乐提取,声音文件的生成,声音文件的录制,GoldWaved,的界面与窗口,GoldWaved,的界面,4.3,音乐合成与,MIDI,音乐合成的方式根据一定的协议标准,使用音乐符号来记录和解释乐谱,并组合成相应的音乐信号,这就是,MIDI,(,musical instrument digital interface,,乐器数字接口)。,MIDI,不是把音乐的波形进行数字化采样和编码,而是将数字式电子乐器的弹奏过程以命令符号的形式记录下来,如按了哪个键、力度多大、时间多长等。当需要播放出这首乐曲时,根据记录的乐谱指令,通过音乐合成器生成音乐声波,经放大后由扬声器播出。,1.,电子音乐中常用的术语,(,1,)音乐合成器(,musical synthesizer,),音乐合成器是由数字信号处理器(,DSP,)和其他集成电路芯片构成的电子设备,用来产生并修改正弦波形,然后通过声音产生器和扬声器发出特定的声音。不同的合成器根据,MIDI,乐谱指令产生的音色和音质都可不同,其发声的质量和声部取决于合成器能够同时播放的独立波形的个数、控制软件的能力,以及合成器电路中的存储空间大小。,(,2,)复调(,polyphony,),复调也称复音,指合成乐器同时演奏若干音符时发出的声音。如钢琴、吉他等乐器可以同时演奏几种音符,而双簧管就不能。复调着重于同时演奏的音符数,如钢琴的合弦音符。,(,3,)多音色(,timbre,),多音色指同时演奏几种不同乐器时发出的声音。它着重于同时演奏的乐器数。例如,具有,6,音符复音的,4,种乐器合成器,可以同时演奏,4,种不同声音的,6,个音符,如,3,个钢琴的合弦音符、一个长笛、一个小提琴和一个萨克斯管的音符。要改善合成音乐的真实感,必须把许多合成器连接起来,以产生复调声音和多音色声音。,2.MIDI,标准相关的术语,MIDI,电子乐器:它是能产生特定声音的合成器,如电子键盘、吉他、萨克斯管等;它们相互间的数据传送符合,MIDI,的通信约定。,MIDI,消息(,message,)或指令:,MIDI,软件通信协议,实际上是用数字指令描述的音乐乐谱,其中包括音符、强度、定时及乐器的指派等。,MIDI,接口(,interface,):,MIDI,硬件通信协议,可使电子乐器互联或与计算机硬件端口相连,可发送和接收,MIDI,消息。,MIDI,通道(,channel,):,MIDI,标准提供了,16,个通道,每种通道对应一种逻辑的合成器,即对应一种乐器的合成。,音序器:它指可用来记录、编辑和播放,MIDI,文件的计算机程序。,4.3.2 MIDI,音乐的制作原理,1.MIDI,音乐的产生过程,2.MIDI,通道,当,MIDI,设备交流信息时,需要遵循一定的事件序列。例如,两个,MIDI,设备在建立连接之后首先要做的事情就是在使用相同的,MIDI,通道方面达成一致。,MIDI,可以在,16,个这样的通道上进行操作,这些通道用数字分别标记为,0,15,。只要两个,MIDI,设备进行交流,就必须使用相同的通道。对电脑合成音乐,每个逻辑通道可指定一种乐器,音乐键盘可设置在这,16,个通道之中的任何一个,而,MIDI,声源或者声音模块可被设置在指定的,MIDI,通道上接收。,3.MIDI,接口和计算机的连接,MIDI,接口由,3,个端口组成:输入端口(,In,)、输出端口(,Out,)和直达端口(,Thru,)。其中,输入端口处理接收的字节,即那些发自其他,MIDI,设备。,为了将两个,MIDI,设备连在一起,可以将其中一个的输出端口和另一个的输入端口相连,这样第一个设备就可以控制第二个设备同时发生。,MIDI,设备可以级联,即第一个设备的输出连接第二个设备的输入,第二个的输出再连接第三个的输入等。,4.MIDI,音乐合成器,MIDI,制造商协会制定了通用,MIDI,规格,简称,GM,规格。通用,MIDI,规格同时定义了,GM,音色库(一个音色库,也被称为音色映射,支持,128,种乐器声音)和,GM,打击音色库(只包含打击乐器发出的声音),另外还定义了其他一些与音乐相关的性能,如每个,GM,设备应支持的声音数量和,MIDI,消息种类。,MIDI,合成的产生方式有两种:,FM,合成和波表合成。,4.3.3 MIDI,文件的特点,用乐谱指令代替声音数据,有效记录和重现各种乐器声音,占用存储空间极小,适合乐曲创作和远距离传输,4.4,数字音频压缩标准,音频压缩方法是指对原始数字音频信号流(,PCM,编码)运用适当的数字信号处理技术,在不损失有用信息量,或者所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。逆变换的过程,称为解压缩或解码。,4.4.2,数字音频压缩标准,音频信号是多媒体信息的重要组成部分。音频信号分为电话质量的语言、调幅广播质量的音频信号和高保真立体声信号。针对不同的质量标准,制定了相应的压缩标准。,1.,电话质量的音频压缩编码技术标准,由于数字音频压缩技术具有广阔的应用范围和良好的市场前景,因而音频压缩技术的标准化工作显得十分重要。,CCITT,(现,ITU-T,)在语音信号压缩的标准化方面做了大量的工作,制定了,G.771,、,G.721,、,G.728,等标准,并逐渐受到业界的认同,其他语音相关标准有:,H.221,、,H.222,、,H.223,、,H.233,、,H.231,、,H.242,、,H.245,、,H.261,、,H.263,等。,2.,调幅广播质量的音频压缩编码技术 标准,调幅广播质量音频信号的频率范围为,50Hz,7kHz,。,CCITT,在,1988,年制定了、,G.722,标准。此,标准采用,16kHz,采样频率,,14bit,量化,信号数据,传输速率为,224kbps,,并采用子带编码方法,将,输入音频信号经滤波器分成高子带和低子带两个,部分,分别进行,ADPCM,编码,再混合形成输出,码。,3.,高保真度立体声音频压缩编码技术 标准,高保真立体声音频信号频率范围为,50Hz20kHz,,采用,44.1kHz,采样频率,,16bit,量化,进行数字化转换,其数据传输速率每声道达,705kbps,。,一般语音信号的动态范围和频响比较小,采用,8kHz,采样频率,每样值用,8bit,表示,现在的语音压缩技术可把码率从原来的,64kbps,压缩到,4kbps,左右。但多媒体通信中的声音要比语音复杂的多,它的动态范围可达,100db,,频响范围可达,20Hz20kHz,。因此,声音数字化后的信息量非常达。为了更有效地利用宝贵的信道资源,必须对声音进行数字压缩编码。,目前世界上第一个高保真立体声音频压缩标准为,MPEG,音频压缩算法。虽然,MPEG,音频标准是,MPEG,标准的一部分,但它也完全可以独立使用。表,4-2,中列出了,ISO,和,ITU,先后建议的用于电话质量的语音压缩标准。,4.4.3,音频压缩工具,由于存在不同格式的音频文件,在不同场合对于音频素材的格式要求也不尽相同,因此需要有专门的工具对它们进行格式转换,从而满足不同场合对音频文件的需要。,AVI MPEG WMV RM to MP3 Converter,是一个好用的音频转换工具,可以将通用的视频和音频文件转换成,MP3,、,WAV,、,WMA,和,OGG,格式,支持,AVI,、,MPEG,、,RM/RMVB,、,WMV/ASF,、,MOV,的视频和音频格式。,对于想从视频文件中抓取音频和想把,RM,格式转换成,MP3/WAV,格式的用户来说非常有用。,音频压缩工具界面,4.5,数字音频处理实例,利用,GoldWave,软件录制一首自己演唱的歌曲,采样频率设为,44.1kHz,,生成,.wav,文件;并为生成的音乐文件添加混响效果,对声音进行简单的编辑与特殊处理,为音乐文件添加淡入淡出效果,最后将文件压缩成,.mp3,格式的文件。,4.5.1,利用,GoldWave,进行录音,1),将麦克风插入计算机声卡的麦克风插口。,2),执行,“,开始,”,“,程序,”,“,GoldWave,”,命令,打开,GoldWave,程序,设定录音源为,“,麦克风,”,,进行参 数适当设置。,3),在主窗口执行,“,文件,”,“,新建,”,菜单命令,打开,“,新建声音,”,对话框,在对话框中对参数进行设置。,4),在播放器中,单击,“,录音,”,按钮开始录音,录制过程中一条从左至右的垂直线指示录音的进程。,5),录音结束后,播放录音,录音效果满意后,执行,“,文,件,”,“,另存为,”,菜单命令。将声音文件保存为,.wav,格式,文件名称为,“,我的音乐,”,。,4.5.2,为音乐文件添加混响效果,1),在,GoldWave,窗口中,执行,“,文件,”,“,打 开,”,菜单命令,打开录制好的,“,我的音乐,.wav,”,文件。,2),确定编辑区域,单击,GoldWave,编辑器工具栏中的,“,混响,”,按钮,打开,“,回声,”,对话框。,3),在回声对话框中,调整两次声音的延迟时间,和音量。,4),混响效果制作结束后,执行,“,文件,”,“,另,存为,”,命令,保存为,“,我的音乐,2.wav,”,。,4.5.3,将文件转换为,.mp3,格式的文件,1),在,GoldWave,主窗口中执行,“,文件,”,“,打开,”,命令,打开调整好的,“,我的音乐,2.wav,”,文件。,2),选择,“,文件,”,“,另存为,”,菜单命令,并在保存文件画面中,选择,“,MPEG,音频,(*.mp3,),”,文件类型,单击,“,确定,”,按钮。,谢谢,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 百科休闲 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服