ImageVerifierCode 换一换
格式:PPT , 页数:59 ,大小:2.63MB ,
资源ID:13184201      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/13184201.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(第5章数据音频技术.ppt)为本站上传会员【xrp****65】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

第5章数据音频技术.ppt

1、单击此处编辑标题文的格式,单击此处编辑大纲正文的格式,第二个大纲级,第三个大纲级,第四个大纲级,第五个大纲级,第六个大纲级,第七个大纲级,第八个大纲级,第九个大纲级,单击此处编辑标题文的格式,单击此处编辑大纲正文的格式,第二个大纲级,第三个大纲级,第四个大纲级,第五个大纲级,第六个大纲级,第七个大纲级,第八个大纲级,第九个大纲级,2011-11-4,*,2011-11-4,*,*,单击此处编辑标题文的格式,单击此处编辑大纲正文的格式,第二个大纲级,第三个大纲级,第四个大纲级,第五个大纲级,第六个大纲级,第七个大纲级,第八个大纲级,第九个大纲级,2011-11-4,*,单击此处编辑标题文的格式,

2、单击此处编辑大纲正文的格式,第二个大纲级,第三个大纲级,第四个大纲级,第五个大纲级,第六个大纲级,第七个大纲级,第八个大纲级,第九个大纲级,多媒体技术与应用,第,3,章 数据压缩技术,第,4,章 数据存储技术,第,5,章 数字音频技术,第,6,章 数字图形图像技术,第,7,章 数字视频技术,第,8,章 网络多媒体技术,第,9,章 多媒体操作系统,第,5,章 数据音频技术,声音是多媒体技术研究中的一个重要内容。声音的种类繁多,如人的话音、乐器的声响、动物的叫声、机器产生的声音以及自然界的雷声、风声、雨声、闪电声等。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们各自的特性。,自从,19

3、69,年,Bell,实验室开始数字语音的研究以来,计算机产生音乐以及语音识别、语音合成技术得到了越来越广泛的研究和应用。多媒体数字音频处理技术在音频数字化、语音处理、合成及识别等各个方面都有着很好的发展。,5.1,声音与声音信号数字化,作为一种模拟信号,声音在时间和振幅上都是连续的,即它的振幅能以任意精度并在任何一个时刻进行测量。与之不同的是,数字信号只能在确定的时刻才有意义,其数值也只能取有限的量。,5.1.1,声音与听觉器官,声音的强弱表现在声波压力的大小上,音调的高低表现在声音的频率上。当声音用电信号表示时,在时间和幅度上都是连续的模拟信号。对声音信号的分析表明,声音信号由许多频率不同的

4、信号组成,这类信号称为复合信号,而单一频率的信号称为分量信号。声音信号的一个重要参数就是带宽,用来描述组成复合信号的频率范围,如高保真声音的频率范围为,1020000Hz,,带宽约为,20kHz,,而视频信号的带宽是,6MHz,。,5.1.1,声音与听觉器官,声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒钟变化的次数,用,Hz,表示。频率小于,20Hz,的信号称为亚音信号,或称为次音信号;频率范围为,20Hz20kHz,的信号称为音频(,Audio,)信号。虽然人的发音器官发出的声音频率大约是,803400Hz,,但人说话的信号频率通常为,3003000Hz,,在这种频率范围的信号

5、称为话音信号;高于,20kHz,的信号称为超音频信号,或称超声波信号。一般来说,人的听觉器官能感知的声音频率大约在,2020000Hz,之间,在这种频率范围里感知的声音幅度大约在,0120db,之间。多媒体技术中处理的主要是音频信号,包括音乐、语音和音效(风雨声、鸟叫声、机器声)等。,5.1.2,模拟信号与数字信号,大多数电信号(模拟信号)过去一直是用模拟元部件(如晶体管、变压器、电阻、电容等)进行处理的。但是,开发一个具有相当精度、且几乎不受环境变化影响的模拟信号处理元部件相当困难,成本也很高。,话音信号是典型的连续信号,不仅在时间上,而且在幅度上也是连续的。时间上“连续”是指在一个指定的时

6、间范围内声音信号的幅值有无穷多个,在幅度上“连续”是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。,5.1.2,模拟信号与数字信号,如果把模拟信号转变成数字信号,用数字来表示模拟量和对数字信号做计算,那么开发模拟运算部件的问题就转变成了开发数字运算部件的问题,这就出现了数字信号处理器(,digital signal processor,,,DSP,)。,DSP,与通用微处理器相比,除了结构不同外,它们的基本差别是,,DSP,有能力响应和处理采样模拟信号得到的数据流,如做乘法和累加求和运算等。,5.1.2,模拟信号与数字信号,在数字环境进行信号处理的主要优点是:首先,数

7、字信号计算是一种精确的运算方法,它不受时间和环境变化的影响;其次,表示部件功能的数学运算不是物理上实现的功能部件,而仅仅是用数学运算来模拟,相对容易实现;此外,可以对数字运算部件进行编程,如欲改变算法或改变某些功能,还可对数字部件进行再编程。,5.1.3,声音信号数字化,计算机要处理或合成声音,就必须把模拟的(连续的)声音波形转换成数字(离散化),这个过程称为声音采样(图,5-1,),它是把连续的声波信号通过一种称为模数(,A/D,)转换器的部件转换成数字信号,供计算机处理,如果需要的话,这种转换后的数字信号又可以通过数模转换(,D/A,)器,经过放大输出,变成人耳能够听到的声音。,图,5-1

8、声音信号数字化的过程,5.1.3,声音信号数字化,连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样;连续幅度的离散化通过量化来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。图,5-2,表示了声音数字化的概念。,图,5-2,声音的采样和量化,5.1.3,声音信号数字化,我们把时间和幅度都用离散的数字表示的信号称为数字信号。声音数字化需要回答两个问题:每秒钟采集多少个声音样本,也就是采样频率是多少;每个声音样本的位数(,bit per sample,,,bps,)应该是多少,也就是量化精度。,采样的

9、速度决定了录制声音的准确性,而采样值的精度则决定了录制声音的精确性。实践证明,采样速度越快,采样值越准确,声音特征复原得就会越好。,5.1.3,声音信号数字化,常用的几种音频信号数字化的采样率标准是:,44.2kHz,(,CD,音质)、,22.05kHz,(,FM,音质)、,11.025kHz,(,AM,音质)等。为了追求音响品质的完美,减少噪声的干扰,达到理想的传播声音的环境,国际上制定了一系列判断音质的标准,图,5-3,给出了几种数字声音质量等级的国际标准所对应的频率范围。,图,5-3,数字声音质量等级对应的频率范围,5.1.3,声音信号数字化,样本大小是用每个声音样本的位数(,bit/s

10、或,b/s,)表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用,16,位(,2,字节)表示,测得的声音样本值是在,065 536,的范围里,它的精度就是输入信号的,1/65536,。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。,采样精度的另一种表示方法是信号噪声比。,5.1.3,声音信号数字化,原始的音频数据一般需进行编辑加工才能使用。通过编辑可以实现各种声音混合以及消除或降低声音中的畸变等。一般的音频编辑软件都具有设置音量、渐强渐弱处理及多通道混合等常用功能。音频处理主要集中在音频压缩上,最新的语

11、音压缩算法可将原始声音数据压缩,6 8,倍以上。,5.1.4,声音质量与数据率,数字化音频的质量取决于采样频率和量化位数这两个重要参数,反映音频数字化质量的另一个因素是通道(或声道)个数。记录声音时,如果每次生成一个声波数据,称为单声道;每次生成二个声波数据,称为立体声(双声道),立体声更能反映人的听觉感受。音频数字化的采样频率和量化级越高,结果越接近原始声音,除此之外,数字化音频的质量还受其他一些因素(如扬声器的质量等)的影响。,根据声音的频带,通常把声音的质量分成,5,个等级,由低到高分别是电话、调幅广播(,AM,)、调频广播(,FM,)、光盘(,CD,)和数字录音带(,digital a

12、udio tape,,,DAT,)的声音。在这,5,个等级中,使用的采样频率、样本精度、通道数和数据率见表,5-1,。,表,5-1,声音质量和数据率,5.2,音乐合成和,MIDI,多媒体音频数据的一个重要来源是,MIDI,(乐器数字接口)。从,20,世纪,80,年代初期开始,,MIDI,逐步为音乐界广泛接受和使用。,MIDI,是乐器和计算机使用的标准语言,是一套指令(即命令)的约定,它指示乐器(即,MIDI,设备)要做什么,怎么做,如演奏音符、加大音量、生成音响效果等。,MIDI,不是声音信号,它传送的是发给,MIDI,设备或其他装置让其产生声音或执行某个动作的指令。,5.2,音乐合成和,MI

13、DI,作为数字音乐的一个国际标准,,MIDI,标准规定了电子乐器与计算机之间传送数据的通信协议等规范。,MIDI,标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。随着,MIDI,标准的施行,计算机成为电子合成乐器间的控制环节,出现了大量可进行记录、存储、编辑和播放乐谱(音符表或音符序列)的计算机软件。,MIDI,音频的处理过程如图,5-4,所示,其主要优点是:,1,)生成的文件比较小。由于,MIDI,文件存储的是命令,而不是声音本身,因此它比较节省空间。例如,同样半小时的立体声音乐,,MIDI,文件只有,200KB,左右,而波形文件(,WAV,)则要差不多,300MB,。,图,5-

14、4 MIDI,音频的处理过程,5.2,音乐合成和,MIDI,2,)容易编辑。因为编辑命令比编辑声音波形要容易得多。,3,)可以作为背景音乐。,MIDI,音乐可以和其他的媒体,如数字电视、图形、动画、话音等一起播放,这样可以加强演示效果。,产生,MIDI,乐音的方法很多,主要有两种:一种是频率调制(,frequency modulation,,,FM,)合成法,另一种是乐音样本合成法,也称为波形表(,wave table,)合成法。,5.3,数码音乐,MP3,MP3,的全称是,MPEG-1 Layer3,音频文件。,MPEG-1,是活动影音压缩标准,其中的声音部分称为,MPEG-1,音频层,它根

15、据压缩质量和编码复杂度划分为三层,即,Layer1,、,Layer2,和,Layer3,,分别对应,MP1,、,MP2,和,MP3,这,3,种声音文件,并根据不同的用途,使用不同层次的编码。,MPEG,音频编码的层次越高,对应的编码器越复杂,压缩率也越高,,MP1,和,MP2,的压缩率分别为,4:1,和,6:1 8:1,,而,MP3,的压缩率则高达,10:1 12:1,。也就是说,,分钟,CD,音质的音乐,未经压缩需要,10MB,的存储空间,而经过,MP3,压缩编码后只有,1MB,左右。,5.3,数码音乐,MP3,不过,MP3,对音频信号采用的是有损压缩方式,为了降低失真度,,MP3,采取了“

16、感官编码技术”,即编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,再通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的,MP3,文件,使压缩后的文件在回放时能达到比较接近原音源的声音效果。虽然它是一种有损压缩方式,但它以极小的声音失真换取了较高的压缩比,使得,MP3,能够在因特网上广泛传播。,5.3,数码音乐,MP3,MP3,这种压缩比非常高的数字音频文件不仅能在网上传播,而且还能容易地下载到便携式数字音频设备(,MP3,随身听)中。,MP3,随身听基于,DSP,(数字信号处理器),无需计算机支持便可以实现,MP3,文件的存储、解码和播放。事先可以将创建好的,MP3,文件

17、从计算机或因特网上下载到,MP3,随身听内置的存储器中,当从中选择播放一首,MP3,歌曲时,文件数据将被传送给,DSP,,通过它来对文件进行解压缩。所需的解压缩软件被置入,DSP,处理器内部,或者存放在存储体中。,DSP,将处理完的数据传给数模转换器,它将二进制的数码信息转换成模拟信号,然后再输出到耳机或扬声器中。,5.4,语音信号与处理,语音是人类沟通的主要方式,可以被人或机器来处理,后者就称为数字语音处理。,语音理解意味着要有效地适应说话人及其说话习惯,包括不同方言和情绪化的发音。语音信号有两个重要的特点可以用在语音处理应用中:,1,)浊语音信号(相对于清语音)在某一个确定的时间间隔上有一

18、个几乎是周期性的结构,因此这种信号保持大约,30ms,的准稳态。,2,)一些声音的频谱具有特征最大值,通常包括多达,5,个频率。这些在说话时生成的频率最大值被称作共振峰。根据定义,共振峰是一段语音质量的特征成分。,5.4.1,语音输出,语音输出涉及到机器如何生成语音的问题,在这方面的主要挑战是,如何使得语音输出系统能够实时地生成语音信号,例如,自动地把文字转化为语音。某些应用(如语音报时)采用有限的词汇表来处理这一任务,但大多数采用的是广泛的词汇表。,机器输出的语音必须是可以听懂的,而且应该听起来很自然。其中可懂性是强制而自然的事情,可以增加用户的接受度。,5.4.1,语音输出,与语音输出相关

19、的几个重要术语是:,1,)语音基本频率,是语音信号中最低周期信号部分。它体现在嗓音中。,2,)音素,是最小的语音单位之一,用于区分语言或方言中的两个发音。它是最小的有意义的语言学单位,但并不携带内容。,3,)音位变体,确定了作为语音环境的函数的音素变化。,4,)词素,是有意义的语音学单位,在自由或受限的形式中都包含的最小且有意义的部分。,5,)嗓音,由声带的振动产生。嗓音强烈地依赖于说话者。,6,)非嗓音,由声带张开产生,这些声音相对独立于说话者。,5.4.2,语音合成,音频技术的一个重要方面是语音合成,即将普通正文合成为语音。如图,5-5,所示。,图,5-5,使用时间域声音连接的语音合成系统

20、5.4.2,语音合成,第一步涉及到转录,或将文本翻译成相应的音标。大部分方法使用一个包含大量单词或仅仅是音节或音调组的词典。这样的词典创建非常复杂,可以是单独实现的或是几个人使用的普通词典,其质量可通过相互作用的用户干预而不断提高。这意味着由用户识别出转换公式的缺陷,人工地改进发音,他们的发现逐渐成为词典的一个集成部分。,第二步将音素记录转换成声学的语音信号,其中连接可以发生在时域或频域。通常第一步用软件来解决,第二步则涉及信号处理器或专门的处理器。,5.4.2,语音合成,除了副发音和韵律产生的问题外,语音识别还必须注意发音模糊问题。解决这个问题的惟一方式就是提供有关上下文的附加信息。,5.

21、4.3,语音输入与识别,在语音输入处理的各种应用中,需要正确回答,3,个问题,即:,1,)谁?语音输入依赖说话者的某种特性,这意味着语音输入能识别出说话者。计算机可用于识别说话者的声音指纹。,2,)什么?语音输入的关键是检测语音内容本身。通常输入的语音序列产生一块文本。典型的应用有语言翻译系统。,3,)怎么样?第三个问题有关如何研究语音采样。其典型应用如测谎仪。,音频技术中难度最大、也最具应用前景的当属语音识别,其潜在的商业应用前景使之一直是音频技术研究关注的热点。语音识别和语音合成相结合,实现了媒体转换。,5.4.3,语音输入与识别,语音识别一般是通过各种比较来完成的。利用现有技术,可以实现

22、一个包含有大约,25 000,词汇的依赖于讲话者的识别系统。语音识别中影响识别质量的问题主要是方言、情绪化的发音以及环境噪声等。要改善语音识别和语音生成的质量,需要弥合人类大脑与高性能计算机之间的相当大的性能差异,这仍需要一定的时间。,5.4.3,语音输入与识别,语音识别的原理如图,5-6,所示,是将个人发音的特殊特征和由以前抽取的语音元素组成的句子做比较。这意味着这些特征通常被量化,用于被研究的语音序列。这,结果与现有的参考做比较,以将它定位于现有的语言单元之一。识别出的言词作为参数化的语言单元序列被存储,传输或处理。,图,5-6,语音识别原理,5.4.3,语音输入与识别,具体操作通常使用专

23、门的元件或信号处理器抽取特征信息。比较和决定一般由系统的主处理器处理,但具有参考特征的词典通常位于计算机的二级存储单元。大多数具体的实现方法在如何定义特征信息时会有所不同。如图,5-7,所示。,图,5-7,语音识别组成部分,5.4.3,语音输入与识别,语音输入中的一个特殊问题是房间的声学特性,即环境噪声,此外,必须定义字边界,但这并不容易做到,因为大多数人说话并不强调一个字的开始和结束,同一个字也可以被说得有快有慢。,依赖于特定人的识别系统比独立于讲话者的系统能识别更多的字,但这是以提前“训练”系统为代价的。为训练系统使之适应说话者,通常要求他读特定的语音序列。目前的语音识别系统有大约半个小时

24、的训练时间。大多数依赖说话者的系统能识别出,25 000,个字或者更多,而独立于说话者的系统则命中率接近,l 000,个字。注意,现实的系统评估还应包括环境因素。,5.5,声音文件的存储格式,在因特网和各种计算机上使用的声音文件格式很多,但比较流行的主要是,WAV,、,AU,(,audio,)、,AIFF,(,audio interchangeable file format,)和,SND,(,sound,)文件格式。,WAV,格式用于,PC,机,,AU,用于,Unix,工作站,,AIFF,和,SND,用于苹果机和,SGI,工作站。,为便于读者辨认文件的属性,表,5-2,列出了部分声音文件的后

25、缀。,表,5-2,常见的声音文件扩展名,5.6,声 卡,在多媒体计算机中,所有的音乐与音效都需要经过声卡来处理。声卡使用大规模集成电路技术,将音频技术范围的各类电路制成芯片而组成,以便直接插入计算机的扩展槽里,使用方便。声卡的主要工作就是把数字信号转换成模拟信号,然后送到喇叭上发出声音;另一方面,声卡也可以对计算机上的各种音频进行“混音”,例如串联电子合成乐器,或是从麦克风输入声音后与,CD,音乐一起由喇叭放出来等。,5.6,声 卡,声卡通过反复地检测和记录声音信号的幅度来实现称为“采样”(实际上每秒种要做几万次这样的操作)的录音过程,将声音信号转化为大量的幅度随时间变化的数字,并存储在磁盘上

26、播放声音的过程与录音正好相反,计算机将一串数字传给声卡,声卡将它们转换成模拟信号,根据数字量的大小改变模拟信号的幅度,经放大后由音箱播出。,5.6.1,主要技术指标,评价声卡的主要技术指标是:,1,)采样频率:为记录信号的精确细节,声卡必须以极快的速率进行采样。声卡的采样频率通常有三个标准:,11.025kHz,、,22.05kHz,和,44.1kHz,,目前一般的声卡都能达到,44.1kHz,的采样频率。,2,)采样位数(量化位数):另一个影响声音质量的重要因素是每个采样点幅度的准确性。采样位数越多,声音的幅度就会越精确,但占用的存储空间也就越多。目前通常使用的有,8,位(低档)、,16

27、位(中档)和,32,位(高档),3,种量化精度的声卡。,3,)声道数:分单声道和双声道,双声道可以播放立体声信号。一般的声卡都是双声道的。,5.6.1,主要技术指标,4,),MIDI,(数字化乐器接口)和游戏杆接口:该接口能够利用计算机控制和演奏电子乐器,或利用诸如,Windows,提供的实用程序记录电子乐器演奏的音乐,然后进行回放。游戏杆接口用来与游戏操纵杆相接,在声卡上一般与,MIDI,接口共享。,5,)合成器:音色是区别不同乐器的重要特征之一,声卡上的合成器能将各种不同频率的声音混合起来,形成某种特定乐器的音色。例如安装在计算机上的控制软件对于同一组电子琴乐曲,可以同时选择小号演奏效果

28、和钢琴演奏效果。,合成器的主要参数是合成的复音数和用语音合成的操作数目。一般有,20,种复音就可以满足大多数用户的需要了,复音成分越多越适合于专业音乐工作者。,5.6.1,主要技术指标,6,)内部声音混合调节器:主要功能是将来自不同输入源的声音信号进行混合和音量调节。该混合器可以编程和控制。,7,),CD-ROM,接口:若用户需要使用,CD-ROM,来播放,CD,、,VCD,节目,应将声卡上的,CD-ROM,接口和,CD-ROM,上的声卡接口用专用的三芯电缆连接起来。连接时应注意各接口的规格,因为不同的,CD-ROM,声卡接口标准可能略有不同。,5.6.2,功能和分类,声卡的心脏是音效芯片,它

29、有多个音频接口,通过音频线和光驱或其他的音频输入相连。一般声卡上都有,CD-ROM,接口,在声卡的档板上,可以看见一排输出,/,入端子及游戏杆连接口。,声卡的主要功能包括录音、编辑和回放数字音频文件;控制各声源的音量并加以混合;在记录和回放数字音频文件时进行压缩和解压缩;采用语音合成技术让计算机朗读文本;具有初步的语音识别功能;具有,MIDI,接口、输出功率放大等。,5.6.2,功能和分类,声卡主要根据其数据采样量位数来确定其分类,通常分为,8,位、,16,位和,32,位等。位数越大,其量化精度越高,音质就越好。声卡通常带有自己的,CPU,,具有较高的智能性和灵活性。声卡的关键技术包括数字音频

30、音乐合成、,MIDI,与音效。数字音频部分具有的基本功能有,44.1kHz,的采样率,,8,位以上的分辨率,录音和播放声音信号,同时具有压缩采样信号的能力。最常用的压缩方法是自适应脉冲编码调制。数字音频的实现有不同的方法和芯片,大多数采用的是,CODEC,芯片,它具有硬件压缩功能,部分采用的是,DSP+ADC,方法,利用软件方法压缩数字音频信号。,5.6.2,功能和分类,声卡上的音乐合成器也有许多不同的类型,目前主要采用两种合成技术:,FM,与波形表。波形表合成使用了,DSP,技术,它要求大容量的,ROM,,以获得高质量的演奏效果;通用,MIDI,要求支持,128,种乐器;不少声卡采用音效芯

31、片,从硬件上实现回声、混响、和声等,使声卡发出的声音更生动。,5.6.2,功能和分类,声卡的种类很多,其功能不尽相同,但在相应软件支持下,应具备以下大部分或全部功能:,1,)录制、编辑和回放数字声音文件。声卡可将来自话筒、收录音机以及激光唱盘等的声源采样,保存成数字文件,并由相应的软件对声音文件的数据进行编辑、混合或回放。,2,)控制、混合各声源的音量。通常随声卡提供的软件有一个,Mixer,程序,它显示有多个滑键的控制板,用来控制和混合各声源的音量,用鼠标可调节话筒、激光唱盘和其他音源的输入音量,以及调节,MIDI,、,WAV,文件回放和主输出电路音量,除话筒之外均为双通道立体声调节。,5.

32、6.2,功能和分类,3,)在记录和回放数字文件时压缩和解压缩。在记录和回放数字文件时进行压缩和解压缩可以节省存储空间。以立体声为例,其数字声音文件每分钟可占多达,10 MB,的磁盘空间,因此,声音文件的压缩与解压缩是多媒体领域研究的一个重要课题。一般声卡的压缩算法固化在卡上,也有的以软件形式提供给用户。,5.6.2,功能和分类,4,)采用语音合成技术让电脑朗读文本。在相应软件的支持下,采用语音合成技术,可让大部分声卡朗读英文或中文文本,用来帮助用户检查文章中的句法和语法错误,这是一般的拼写检查功能所无法做到的。常用的语音合成技术有两种:一种是基于字典技术,根据单词查到发音代码并送到合成器上去,

33、另一种是基于规则将文本转换成语音。,声卡一般只能合成英文语音,国内在汉语语音识别、汉语语音合成方面做了多年的研究,已经取得了较好的成果。一般能够利用声卡通过软件把汉字国标代码置换成较自然的汉语语音,并具有语音信箱的功能,大大扩展了语音合成技术的应用范围。,5.6.2,功能和分类,5,)具有,MIDI,接口。一台计算机可以控制多台带,MIDI,接口的电子乐器,利用计算机发送,MIDI,信息就可以控制具有,MIDI,接口的乐器。如果把计算机与具有,MIDI,接口的电子琴、电吉他相连,它们就会在计算机的控制下发出美妙的音乐。,5.7,获取声音素材,声音、音乐和各种音效可以丰富多媒体产品的表现能力,使

34、多媒体产品更富有活力。获取声音素材的方法很多,除了购买声效库光盘外,还可以借助各种多媒体软件工具来录制和加工。,1.,购买声效库光盘,市场上有很多声效库光碟出售,提供了各种各样的音乐和自然语音,其中既有,WAVE,文件格式,也有,MIDI,文件格式,且声效的质量也比较高,这是获取音频资料的最简单而直接的方法,另外,还可以从网上下载所需要的声音文件(提示:试试在,Google,搜索引擎中打入“音效素材”进行搜索)。,5.7,获取声音素材,2.,录制,WAVE,声音,可以利用电脑声卡来录制声音,并以,WAVE,文件格式保存。电脑可以通过麦克风录音,也可以通过声卡上的线路输入端口录下电视机、收音机、

35、录像机里的声音,还可以把电脑里播放的,CD,、,MIDI,音乐和,VCD,影碟的配音录制下来。,3.,录制,MIDI,音乐,利用具有乐器数字化接口的,MIDI,乐器(如,MIDI,电子键盘、合成器等)或具有,MIDI,创作功能的软件(如,Cakewalk pro,),可以制作或编辑,MIDI,音乐,当然,这需要使用者精通音律而且能熟练演奏电子乐器。,5.7,获取声音素材,常用的录音方法包括:,1,)使用,Windows,中的“录音机”程序。,2,)使用声卡自带的录音程序。,3,)使用专用的录音软件。很多专业录音软件都提供了高水准的录制效果,并且可以对录制的声音进行复杂的编辑,添加各种音效特技,如对立体声进行空间移动效果处理,使声音渐进、渐远、产生回声等。,4,)租用数字录音棚。这种方式不但可以大大减少环境噪音,而且可以获得与,CD,相等的高保真音质。但成本比较高,而且需要能熟练操作数字录音设备的技术人员。,5.8,实验:,Sound Forge,数字音频处理,5.8.1,工具,/,准备工作,5.8.2,实验内容与步骤,5.8.3,实验总结,5.8.4,实验评价(教师),

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服