资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,2,章 多媒体技术基础,1,2.1,多媒体音频处理技术,多媒体计算机系统中,处理音频信息的硬件是音频卡,又叫声音卡,简称声卡,是多媒体计算机系统不可缺少的组成部分。,2.1.1,声音与计算机音频处理,1.,声音的产生,来自两方面决定因素:,震动,和,介质,。,空气压强振荡的波形示意图,2,声音的三要素,音调,:指声音的高低,主要取决于声波频率的高低。频率越高,音调越高,在音乐中称为音高,反之亦然。,音强,:是指声音的强度或者响度,由声音震动的的振幅决定。正常人的耳朵可以感觉到的最低声级是分贝的零标准。,音色,:即声音的品质或者声音的独特性,与发音体产生的波形有关。,3,2.,声音的计算机处理,声音(模拟信号)经过计算机处理并回放的过程是:声音信号经过模,/,数转换电路,将模拟信号转换成数字信号,经过计算机处理后,再经过数,/,模转换还原为声音。这一过程就是音频的数字化技术。音频的数字化转换技术是多媒体声音处理技术中最基本的也是最主要的技术。,4,模拟信号到数字信号的转换过程包括采样、量化及编码三个步骤。,模拟信号,数字信号,(,1,)采样,采样的过程就是每隔一段相同的时间间隔读取一次声音波形的振幅,将读取的时间和波形的振幅记录下来。,(,2,)量化,采样所得到的数据是一定的离散值,将这些离散值用若干二进制的位来表示,这一过程称为量化。量化是将采样所得到的信号振幅值用一组二进制脉冲序列来表示。,采样,量化,编码,5,模拟信号的采样,6,(,3,)编码,采样量化后的二进制音频数据还要按一定的规则进行组织,以利于计算机处理,这就是编码。最简单的编码方案是直接用二进制的补码表示,也称作脉冲编码调制。,2.1.2,声卡的功能,1.,录制(采集)、编辑、还原数字声音文件,2.,压缩音频信号,3.,语音合成,4.,语音识别,5.,提供,MIDI,功能,7,金手指考试网,科目四元贝驾考网,科目一科目四仿真考试题,C1,Grammar,8,2.1.3,声卡的组成,1.,声音处理芯片,2.,功率放大芯片,3.,总线接口,4.,输入,/,输出端口,声音适配器,主机箱,主板,音箱,音频信号,数字信号,音箱,(,声卡,),1.,录制(采集)、编辑、还原数字 声音文件,2.,压缩音频信号,3.,语音合成,4.,语音识别,5.,提供,MIDI,功能,9,2.1.4,声音的压缩与合成,1.,声音压缩,声音信号数据化处理后得到的数据量可用下式来计算:,数据量,采样频率,采样精度,/8,通道个数,时间,(秒)(单位:字节),举例:,一般的音乐文件,采样大小,16,位、采样级别,44.1kHZ,、立体声,对于一首,5,分钟的歌曲,计算其未压缩的数据量是多少?,思考:,电脑中找到一个音乐文件,右键单击、查看属性、观察文件大小,在摘要中查看音频属性,思考一些音频属性与数据量的关系,是否符合数据量计算公式,为什么?,10,2.1.4,声音的压缩与合成,2.,数据压缩的方法,(,1,)无损压缩:压缩后信息没有损失的压缩方法。,(,2,)有损压缩:压缩后的信息有一些损失的压缩方法。,3.,声音合成,在计算机中对声音信号处理时会产生大量的数据量,在数据传输时,还必须考虑传输速度问题,为了达到使用少量的数据来记录音乐的目的,产生了合成音效技术。目前常用的有调频合成(,FM,,,Frepuency,Modulation,)和波表合成(,WT,,,Wave Table,)两种方式。,11,2.1.5,常见的声音文件格式,WAV,格式:波形文件、无压缩。,MP3,格式:较高压缩比(,1,:,101,:,12,)。,WMA,格式:压缩比,18,:,1,。,MIDI,格式:,是一串时序命令,记录下音乐的行为,例如记录下钢琴的按键,播放时在模拟钢琴的声音,因此不能记录人声。,RealAudio,(即时音乐系统):适用于网络上的在线播放。,12,2.2,常用音频工具软件,2.2.1,录音机,录音机是,Windows,操作系统中自带的声音处理程序。录音机提供了录音、混合声音、添加回音、加速等最基本的操作,。,录音机程序界面,例,1,:使用,windows,录音机录制声音。,13,2.2.2 Cool Edit Pro V2.0,CEP,具备各种专业的音频处理功能和很高的取样速率支持。,安装后运行,Cool Edit Pro V2.0,,它有两种窗口界面:多轨混音窗和单轨音频编辑窗,如下图所示。顾名思义,对一个波形文件录制编辑操作用单轨音频编辑窗,多轨录制或混合用多轨混音窗。可以用左上角的转换按钮在两个窗口之间互换。,14,CEP,多轨混音窗口,15,CEP,单音频编辑窗口,16,常用及实用功能,1.,录制音频,2.,降噪处理,3.,音调调整,4.,美化声音,例,2,、制作淡入淡出效果。,步骤:,a,、打开一个音乐文件,,b,、选取开头,5,秒,,c,、点击菜单效果、波形与振幅、渐变、淡入淡出、,Fade In,,,d,、选取结尾,5,秒,,e,、点击菜单效果、波形与振幅、渐变、淡入淡出、,Fade Out,,,f,、保存。,例,3,、音频剪切与组合,。,步骤:,a,、打开两个音频文件,,b,、新建一个音频文件,,c,、分别复制两个音频文件相关片段,粘贴到新音频文件中,,d,、必要处理,保存。,17,作业,1,1,、音频处理,操作内容,使用,Cool Edit,音频处理软件,录制或其他方式获取一段声音,命名为“音频,.wav”,,进行淡入淡出效果处理。,操作要求,导入声音文件“音频,.wav”,。,开始两秒采用声音淡入效果,最后两秒钟采用声音淡出效果。,保存新音频文件为:姓名,+,音频处理,.wav,。,注:作业提交时包括:原音频文件和新音频文件,18,2.3,多媒体图像处理技术,2.3.1,图形和图像,在计算机领域,图形(,Graphics,)和图像(,Picture,或,Image,)是两个不同的概念。,1,图形,图形又称矢量图形。是计算机根据数学模型计算而生成的几何图形,如直线、圆、矩形、任意曲线和图表等。图形是由点、线、二维或三维图片构成的,构成图形的点、线和图片由坐标及相关参数生,成。,19,2,图像,图像是指由输入设备捕获的实际场景画面或以数字化形式存储的任一画面,是真实物体重现的影像。对图片逐行、逐列进行采样(取样点),并用光点(称为象素点)表示并存储,即为数字图像,又称为位图或点阵图。,3.,图形与图像的异同点,(,1,)共同点:二者都是静态的,和时序无关。,20,(,2,)不同点:,图形是用一组命令通过数学计算生成的,这些命令用来描述画面的直线、圆、曲线等的形状、位置、颜色等各种属性和参数;而图像是通过画面上的每一个像素的亮度或颜色来形成画面的;,图形可以容易地分解成不同成分单元,分解后的成分间有明显的界限,而要将图像分解成不同的成分则较难,各个成分间的分界往往有模糊之处,有些区间很难区分该属于哪个成分,它们彼此平滑地连接在一起。,21,2.3.2,图像的文件格式,1.GIF,格式(,Graphics Interchange Format,),2.BMP,格式(,Bitmap,),3.PCX,格式,4.TIFF,格式(,Tagged Image File Format,),5.JPG,格式(,Joint Photographic Expert Group,),6.PSD,格式,7.PCD,格式,8.EPS,格式(,Encapsulated PostScript,),9.WMF,格式,22,2.3.3,图像的获取方法,计算机获取图像的方法常用的有以下几种。,用图形工具软件生成,图像扫描,数字摄像输入,利用录像机和电视机捕获图像,视频抓帧,从图片库中获取,23,2.4,图像的数字化,2.4.1,图像技术基础,光,眼,神经,感知色彩,1.,光,光源光、透射光、反射光,2.,三原色,色光三原色:红、绿、蓝,颜料三原色:黄、品红、青,3.,色彩三要素,明度:色彩的明暗强度,色相:色彩的名称,由波长决定,纯度:色彩的鲜艳程度,24,3.,色彩三要素,明度:色彩的明暗强度,色相:色彩的名称,由波长决定,纯度:色彩的鲜艳程度,4.,色彩模式,RGB,模式,:,红,R,、绿,G,、蓝,B,。,CMYK,模式:青,C,、品红,M,、黄,Y,、黑,K,。,Lab,模式、,Crayscale,灰度模式、,Bitmap,模式。,25,2.4.2,图像的属性参数,1.,分辨率,常见的分辨率有三种:,显示分辨率、图像分辨率和 像素分辨率。,(,1,)显示分辨率:显示分辨率又称屏幕分辨率,是指显示屏幕上能够显示出的像素数目,具体显示模式有关。,(,2,)图像分辨率:,图像分辨率是指组成一幅图像的像素密度,即数字化图像的大小,以水平和垂直的像素点数来表示。,26,图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是确定显示图像的区域大小。,(,3,)像素分辨率:像素分辨率是指一个像素的宽和高之比,通常为,1,:,1,,不同的像素宽高比将导致图像变形,因此在这种情况下必须进行比例调整。,2.,色彩深度,指存储每个像素所用的二进制位(,bit,)数,用来度量图像的颜色数,也叫色像素深度。,27,3.,图像数据量,一幅位图图像在计算机中所需的存储空间也叫图像数据量,可用下式计算:,图像文件的数据量位图高度(像素数),位图宽度(像素数),色彩深度(位),8,例如,一幅分辨率为,640480,的,256,色原始图像(未经压缩)的数据量为:,(,640,像素,480,像素,8,位),8,307200,(,Byte,),28,2.4.2,图像数字化过程,要在计算机中处理图像,必须先把真实的图像(照片、画报、图书、图纸等)通过数字化转变成计算机能够接受的显示和存储格式,然后再用计算机进行分析处现。,图像的数字化过程主要分为采样、量化与压缩编码,3,个步骤。,29,2.5,多媒体视频处理技术,2.5.1,多媒体视频,1.,视频基础知识,(,1,)视频(,Video,),(,2,)模拟视频(,Analog Video-AV,),(,3,)数字视频(,Digital Video-DV,),(,4,)全动态和全屏幕视频,30,2,.,视频文件格式,视频信号数字化后的数据以不同的文件格式存储。常用的视频文件格式有以下几种。,(,1,),AVI,文件 (,2,),MPEG,文件,(,3,),DAT,文件 (,4,),MOV,文件,(,5,),Dir,文件,3.,电视视频制式标准,(,1,),NTSC,制式,(,2,),PAL,制式,(,3,),SECAM,制式,(,4,)数字高清晰度电视,HDTV,31,2.5.2,视频信号的压缩,视频信号所占用的存储空间远远大于声音和图形图像文件,因此必须进行压缩处理,以减少存储空间和传输时间。压缩方式有硬件压缩和软件压缩,现在主要采用软件的方式进行压缩。软件压缩包括有损压缩和无损压缩。,32,2.6,多媒体光盘制作技术,CD,光盘,CD,原来是指激光唱盘,即,CD-,DA(Compact,Disc-Digital Audio),,用于存放数字化的音乐节目,DVD,光盘,DVD,的英文全名是,Digital Video Disk,,即数字视频光盘或数字影盘,它利用,MPEG2,的压缩标准来储存影像。,33,可刻录光盘,常见的可刻录光盘有,:,CD-R CD-RW DVD-R,。,(,1,),CD-R,:,CD Recordable,的简写,它属于“,WORM”(Write,Once,,,Read Multiple),盘片的一种。它只能一次写入但可多次读取,在刻录完成后它可以象一般标准的,CD,盘片一样使用。,(,2,),CD-RW,:兼容,CD-ROM,和,CD-R,,,CD-RW,驱动器允许用户读取,CD-ROM,、,CD-R,和,CD-RW,盘,可以刻录,CD-R,盘,擦除和重写,CD-RW,盘。,(,3,),DVD-R,:,DVD-R,是可以写入一次数字信息的,DVD,规格。,34,
展开阅读全文