1、 教师授课教案 / 学年 第 学期 课程 多媒体技术 章节课题 第二章 多媒体信息的表示 授课方法 讲授 所需教具 授课时间 月 日 节 月 日 节 月 日 节 授课班级 目的要求: 掌握:音频信号的数字化处理各种音频文件 旧知复习:多媒体系统的分类和组成 重点难点:多媒体信息(文字、音频)在计算机中是如何表示的 教学过程:(包括主要教学环节、时间分配) 一、 复习提问(5分) 二、 讲授新课 1. 文字(30分) 2. 音频(48分) 三
2、 总结(5分) 四、 布置作业(2分) 课后作业: 教学后记: 任课教师: 教研室主任 新课导入:多媒体信息是如何表示的 第二章 多媒体信息的表示 一、多媒体数据具有以下特点: ① 数据量巨大 ② 数据类型多 ③ 数据类型间区别大 ④ 多媒体数据的输入和输出复杂 二、多媒体数据的输入方式:多通道异步输入(目前较流行)和多通道同步输入 1.多通道异步输入:在通道、时间都不相同的情况下,输入各种多媒体数据并存储,最后按合成效果在不同的设备上表现出来 2.多通道同步输入: 2.1文字 在现
3、实世界中,文字是人们进行通讯的主要形式,文字包括西文与汉字。计算机中,文字用二进制的编码表示 2.1.1 西文 在计算机中,西文用ASCII码表示:7个二进制位组成色字符编码系统。128个字符 2.1.2 汉字 1. 汉字的输入编码 (1) 数字编码 (2) 拼音码 (3) 自行编码 2. 汉字内码 是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示 3. 汉字字模码 用点阵表示的汉字自行代码,是汉字的输出方式 2.2 音频 指的是大约在20HZ~20KHZ的频率范围,属于听觉类媒体,主要分为波形声音、语音和音乐。 1. 波形声音 包含
4、了所有的声音形式,声音数字化,并能准确恢复 2. 语音 声音是一种波形,而且还有内在的语言、语音学的内涵,可以利用特殊的方法进行抽取。 3. 音乐 符号化的声音(乐曲) 4. 声音的特点: (1) 有音调(与频率有关)、音强(与幅度有关)、音色(由混入基音的泛音所决定)三要素 具有很强的前后相关性,数据量大、实时性强,通常把其称之为连续型时基媒体类型 2.2.1 数字音频 数字音频是指音频信号用一系列的数字表示,特点是保真度好,动态范围大。 音频数字化:把模拟音频信号转换成有限个数字表示的离散序列,主要技术问题:采样(选择采样频率)、量化(选择分辨率)和编码(形成声音文
5、件) 1. 采样:把时间上连续的信号,变成在时间上不连续的信号序列 原则:采样频率至少高于信号最高频率的2倍,采样的频率越高,声音“回放”出来的质量也越高,但是要求的存储容量也越大 常用采样频率:44.1kHz、22.05 kHz、11.025kHz 2. 分辨率 指把采样所得的值(通常为反映某一瞬间声波幅度的电压值)数字化,即用二进制来表示模拟量,进而实现模/数转换,用来表示一个电压模拟值的二进制数位越多,其分辨率也越高。 国际标准的语音编码采用8位,可有256个量化值 3. 声音文件 (1)声音通道的个数:表明声音记录是只产生一个波形(单声道)还是产生两个波形(立体声双声道
6、立体声的声音有空间感,但需要两倍的存储空间 (2)声音文件容量计算: S=R×D×(r/8)×声道数 S:表示文件大小,单位为字节 R:采样速率,单位为HZ D:录音的时间,单位为秒 r:分辨率,单位为二进制位 (3)存储声音信息的常用文件格式主要有:WAV、VOC、MIDI、AIF、SNO、RMI l WAV文件:为微软的音频文件格式,来源于对声音模拟波形的采样,由采样数据组成,所需存储容量较大;如果对声音质量要求不高,可以通过采用降低采样频率,采用较低的量化为数或利用单声道来录制WAV文件,文件可以成倍减小 l VOC文件:是CREATIVE公司波形音频文件格式,也是
7、声霸卡使用的音频文件格式。由文件头块和音频数据块组成;转换: l MIDI文件:用于音乐 l PCM格式:模拟的音频信号经数模转换直接形成的二进制序列 l 在WINDOWS中,配置声音文件的操作: l “控制面板”-“多媒体”-“多媒体属性”-“录音” 2.2.2 乐器数字接口 两类声音:直接获取的、合成声音(与MIDI有密切联系,并已形成标准) MIDI是乐器数字接口的英文缩写,80年代提出来的,是数字音乐的国际标准。 MIDI 信息实际上是一段音乐的描述 1. MIDI文件:记录MIDI信息的标准格式文件,其中包括音符、定时和多达16个通道的乐器定义及键号、通道号、持
8、续时间、音量和击键力度等各个音符的有关信息 2. 音序器:为MIDI作曲而设计的软件或设备,可用来记录、播放及编辑MIDI事件 3. 合成器:使用数字信号出来器或其它音乐和声音芯片的设备,将信息转换成某种乐器的声音、合成音色及持续时间,再通过生成并修改波形将它们送至声音发生器和扬声器中输出。 4. 特点:由于MIDI文件是一系列指令而不是波形数据的集合,所以其要求的存储空间较小 5. MIDI作品:可以购买或自己制作 6. MIDI文件的三种存放格式:格式0、1、2 2.2.3 数字化声音和MIDI的比较 1. MIDI数据优点 2. MIDI数据缺点 3. 数字化声音和
9、MIDI之间的选择 教师授课教案 / 学年 第 学期 课程 多媒体技术 章节课题 第二章 多媒体信息的表示 授课方法 讲授 所需教具 授课时间 月 日 节 月 日 节 月 日 节 授课班级 目的要求: 掌握图像数字化过程及图像文件格式 旧知复习:声音文件的大小是由哪些因素决定的? 重点难点:多媒体信息(视觉媒体)在计算机中是如何表示的 教学过程:(包括主要教学环节、时间分配) 五、 复习提问(5分) 六、 讲授新课 1
10、数字图像处理概述(10分) 2 图像与图像数字化过程(30分) 3 图像处理中的色彩学知识(10分) 4 分辨率(20分) 5 图像文件格式(10分) 七、 总结(5分) 八、 布置作业(2分) 课后作业: 教学后记: 任课教师: 教研室主任 新课导入:多媒体信息是如何表示的 第二章 多媒体信息的表示 客观世界中,图可以分为两类。一类是可见的图像,例如照片、图纸和人们创作的各种美术作品等,对于这一类图,只能靠扫描仪、数字照相机或者摄影机进行数字化后,才能由计算机进行简介处理。另一类是可以用数学公式或者模型描述的图
11、形,这一类图可以由计算机直接进行创作和处理。由此对应的图的文件有两种,一种是存储图形信息的矢量图文件,简成为图形,另一种是存储图像信息的位图文件,一般成为图像。 2.1图像的概述 图像是人类视觉所感受到的一种形象化的信息,其最大的特点是直观可见、形象生动。图像处理是一门非常成熟而发展有十分迅速的实用性科学,其应用范围遍及科技、教育、商业和艺术领域。图像又与视频技术关系密切,实际应用中的许多图像就来源于视频采集。 2. 1.1 图像的表示 在日常生活中当人们从某点观察某一景象时,物体所发出的光线(发光物的辐射光或物体受光源照射后反射或透射的光)进人人眼,在人眼的视网膜上成像,这就是人眼
12、所看到的客观世界,可将它称之为景象。这个“象”反映了客观景物的亮度和颜色随空间位置和方向的变化特征,因此“象”是空间坐标的函数。视网膜成像是一种自然生理现象,人类文明发展到一定时期才意识到它的存在,并设法用各种手段将其记录下来,这种记录下来的各种各样的“象”则称之为图像。 图像是人类用来表达和传递信息的最重要手段。现代图像既包括可见光范围的图像(能被人眼观察到的各种图像),也包括不可见光范围内借助于适当转换装置转换成人眼可见的图像(如红外成像技术);还包括人眼无法观察的其他物理图像和空间物体图像,以及由数学函数和离散数据所描述的连续或离散图像。 在空间图像信息中,光强(Intensivet
13、y)是其基本要素,它随图像空间坐标(z,y,z),光线的波长λ和时间t的变化而变化,因此空间图像函数可表示为: g = ƒ(x,y,z,λ,t) 二维平面图像隐式地包含着景深z的信息,它以x和y的某种函数的形式,即z=ƒ(x,y),隐含在x,y平面之中。因此平面图像同样可表示为: g = ƒ(x,y,z,λ,t) 在大多数情况下,要采用离散的技术来处理来自连续世界的图像。实际图像是连续的,而计算机只能处理离散的数字图像,所以要对连续图像经过采样和量化以得到离散的数字图像。 2.1.2图像中的色彩学知识 1. 认识色彩 在现实世界中,大自然赋予了万物以绚丽的色彩,给人们以美的感受。
14、颜色是图像至关重要的组成部分,那么色彩是如何产生的呢?色彩始于光。1672年牛顿用三棱镜将太阳光(白光)分解成红、橙、黄、绿、青、蓝、紫(品红)七种按顺序排列的彩带,这种现象称做色散(Dispemion)(图2-14)。 图2-14 太阳光经三棱镜后会产生色散现象 一般的光源是由不同波长的单色光所混合而成的复色光,所谓的“单色光”是通过三棱镜也不会再分解为其他的色光;而由“单色光”所混合的光称为“复色光”。自然界中的太阳光及人工制造的一些光源所发出的光都是复色光。 人眼根据光线的波长来感觉颜色,有色物体对光线具有选择性吸收的特性,即光线照射到有色物体上时,入射光中被吸收的各种波
15、长的色光是不等量的,有的被多吸收,有的被少吸收。 包含全部颜色光谱的光是白色,白光照射到有色物体上,其反射或透射的光线与入射光线相比,不仅亮度有所减弱,光谱成分也改变了,因而物体呈现出各种不同的颜色(图2-15)。而当没有光线时,人眼感觉的颜色是黑色的。 图2-15 物体呈现出的颜色是由于光的反射作用 色彩的产生主要是因为人眼接收来自物体表面或内部对于光源的反射或透射,因此色彩是由光、物体特性与人眼视觉机构等3大因素所涵盖。色彩可用亮度、色调和饱和度来描述,人眼所看到的任一色彩都是这3个特性的综合效果。 2.色彩的三要素 视觉所感知的一切色彩现象,都具有亮度、色度和饱和度三种
16、性质,这三种性质又称为色彩的三要素。 亮度(Lightness)是指光作用于人眼时所引起的明亮程度的感觉。它与被观察物体的发光强度有关。颜色作用于人眼所引起的明暗视觉程度。对于色调和饱和度固定的光而言,当其全部能量增强时,亮度增加,因此亮度与光功率有关。 光谱中各种颜色散发着色彩的原始光辉,它们构成了色彩体系中的基本色调(图2-16)。在可见光谱中,红、橙、黄、绿、青、蓝、紫每一种色调都有自己的波长和频率,人们在给这些可以相互区别的色定出名称,当人们称呼某一种颜色的名称时,就会有一个特定的色彩印象,这就是色调的概念。 物体的色调(Hue)与光波的波长有关,不同的波长反映不同的颜色感,是物
17、体在日光照射下,所反射的光谱成分作用到人眼的综合效果;或者说色调是当人们看到一种或多种波长的光时所产生的彩色感觉。它反映颜色的种类,是决定颜色的基本特性。 饱和度(Saturation)是指颜色的纯度,或者说是指颜色的深浅程度,即掺人白光的程度。对于同一色调的彩色光,饱和度越深,颜色越鲜明(图2-17)。例如,当红色加进白光之后,由于饱和度降低,红色被冲淡成粉红色。饱和度的增减还会影响到颜色的亮度,例如,在红色中增加白光成分后,增加了光能,因而变得更亮了。在某色调的彩色光中,掺人别的彩色光,会引起色调的变化,而掺人白光时仅引起饱和度的变化。 图2-16 光谱中的基本色调 图2
18、17 掺入白光对饱和度的影响 3.色彩的基色 人眼的视觉是主观视感对客观色存在的反映,视觉包括光觉和色觉,也就是亮度视觉和彩色视觉基色(Primary Color)。基色是指互为独立的单色,任一基色都不能由其他两种基色混合产生。 三基色(Tri—chrominance Primary)是根据人眼对彩色视觉的大量实验得出的。实验证明选择红色、绿色和蓝色这三种相互独立的基色,按照不同比例组合,可以配出的大部分与自然界色彩相符的颜色,能引起人眼各种不同的彩色感。同样绝大多数颜色也可以分解成红、绿、蓝三种色光。 将三种基色光,按时间顺序轮流投射到同一表面上,只要轮换速度足够快,由于视觉残留特
19、性,将同样会产生相加混色的效果。人眼就辨别出各自不同的颜色。 根据三基色原理,任意给定的彩色光F的配色关系式为: F=R[R]+G[G]+B[B] 其中:系数R、G、B称为(绝对)三色系数,[R]、[G]、[B]表示各个基色的单位量。以上配色关系又称为RGB彩色空间。 4.色彩模型 在进行视频图像处理时,常常会涉及到用几种不同色彩模型(或颜色模型)来表示图像的颜色。使用色彩模型的目的是尽可能多地及有效地描述各种颜色,以便需要时能方便地加以选择。各个应用领域一般使用不同的色彩模型,如计算机显示时采用的是RGB模型,彩色电视信号传输时采用YUV模型,打印输出彩色图像时用C
20、MY模型,还有另外一些色彩模型的表示方法,下面将讨论几种常见的颜色模式。 (1)RGB模型 自然界常见的各种颜色,都可以由红(R)、绿(G)、蓝(B)三种中颜色光按不同比例相配而成(图2-18)。同样,绝大多数颜色光也可以分解成红、绿、蓝三种色彩。由于人眼对这三种色光最为敏感,R、C、B三种颜色相配所得到的彩色范围也最广,所以一般都选这3种颜色作为基色,这就是色度学的基本原理——三基色原理。 图2-18 RGB模型 在多媒体计算机技术中,因为计算机的彩色监视器的输入需要R、C、B 3个彩色分量,通过3个分量的不同比例,在显示屏幕上合成所需要的任意颜色,所以不管多媒体系统中采用什么
21、形式的色彩模型表示,最后输出一定要转换成RGB彩色表示。 RGB模型产生色彩的方式称为加色法,因为没有光是全黑,各色光加入后才产生色彩,同时越加越高,加到极限时成为白色。现在使用的彩色显示器和电视机都是利用三基色混合原理来显示彩色图像,而把彩色图片输入到计算机的彩色扫描仪则是利用它的逆过程。扫描是把一幅彩色图片分解成R、C、B三种基色,每一种基色的数据代表特定颜色的强度,当这三种基色的数据在计算机中重新混合时又显示出它原来的颜色。 (2)HSL模型 HSL(Hue、Lightness、Saturation)模型是使用H、S和L 3个参数来生成颜色。H为颜色的色调,改变它的数值可生成不同的
22、颜色表示;S为颜色的饱合度,改变它可使颜色变亮或变暗;L为颜色的亮度参量。 用HSL模型描述颜色时更加自然,符合人眼对颜色的感知方式,比较容易为画家所理解,但使用时却不方便,所以显示时要转换成RGB模式。在Windows95中的画笔软件中,在编辑颜色对话框里显示了采用HSL和RGB模型与颜色的对应关系(图2-19)。它们之间是一种线性关系,使得颜色的编辑十分直观方便,有助于人们理解这两种色彩模型。 (3)CMY模型 人们在利用计算机屏幕显示彩色图像时采用的是RGB模型,而在打印时一般需要转换为CMY模型。CMY模型(Cyan、Magenta、Yellow)是采用青、品红、黄三种基本颜色按
23、一定比例合成颜色的方法(图2-20)。CMY模式和RGB模式不同之处在于色彩的产生不是直接来自于光线的色彩,而是来自于照射在颜料上放射回来的光线。颜料会吸收一部分 图2-19 “编辑颜色”对话框 光线,而未吸收的光线会反射出来,成为视觉判定颜色的依据,这种色彩的产生方式称减色法。因为所有的颜料都加入后才能成为纯黑,当颜料减少时才开始出现色彩,颜料全部除去后才成为白色。 图2-20 CMY模型 虽然理论上利用CMY三基色混合可以制作出所需要的各种色彩,但实际上同量的CMY混合后并不能产生完善的黑色或灰色,因此在印刷时必须加上一个黑色(Black),这样又称为CMYK模式
24、 四色印刷便是依据CMYK模式发展而来的(图2-21)。人们以常见的彩色印刷品为例。人们所看到的五颜六色的彩色印刷品,其实在印刷的过程中仅仅只用了四种颜色。在印刷之前先通过计算机或电子分色机将一件艺术品分解成4色,并打印成胶片。一般地,一张真彩色图像的分色胶片是4张透明的灰度图,单独地看一张单色胶片时不会发现什么特别之处,但如果将这几张分色胶片分别着以C(青)、M(品红)、Y(黄)和K(黑)四种颜色叠印到一起时观察时,就产生了一张绚丽多姿的彩色照片。 图2-21 印刷行业中使用的CMYK标准调色板 彩色打印机和彩色印刷都是采用CMYK模型实现彩色输出的。从理论上讲,RGB与CMY模
25、型是互补的模型,可以互相转换,但实际上因为发射光与反射光的性质完全不同,显示器上看到的颜色不可能精确地在打印机上复制出来,因此实际的转换过程会有若干程序的失真,应尽量减少转换的次数。 (4)黑白模式与灰度等级 灰度等级如果用8位来表示一个像素,即将纯黑和纯白间的层次等分为256级,就形成了256等级的灰度模式(图2-22),可以用来模拟黑白照片的图像效果。黑白模式采用1位来表示一个像素,于是只能显示黑色和白色。黑白模式无法表示层次复杂的图像,但可以制作黑白的线条图。 图2-22如果图像量化为8位,共有256种灰度等级 5.色彩深度和位平面 位图图像中像素的颜色(或亮度)信息是用若
26、干二进制数据位来表示的,这些数据位的个数称为图像颜色的深度。 颜色浓度反映了构成图像的颜色总数目(图2-23)。例如,深度为1位的图像只能有两种颜色(一般为黑色和白色),这样的图像称为单色图像。颜色深度为4位,则可以显示24=16种颜色,如果颜色深度为8位,则可以在屏幕上显示28=256种颜色,以上两种图像称为索引彩色图像,因为它的色彩要由像素的值通过一个所谓的颜色查找表(Color Look Up Table)来决定。使用这种方法显示的颜色不是图像本身真正的颜色,因而称为伪彩色。 对于彩色图像,图像中可能出现的不同颜色的最大数目,取决该图像的所有位平面中的颜色深度之和。对于单色灰度图像,
27、只有1个位平面。彩色图像由R、G、B3个平面组成。例如,一个彩色图像的3个位平面中的颜色深度均为8位,此时该图像的颜色深度之和为24位,则该图像的最大颜色数目为224=16 777 216(图2-23)。 颜色深度为8位(256色) 颜色深度为24位(真彩色) 图2-23 颜色深度反映图像颜色的总数目 2. 2图像数字化过程 2. 2.1图像数字化概述 现实中的图像是一种模拟信号。图像数字化的目的是把真实的图像转变成计算机能够接受的显示和存储格式,更有利于计算机进行分析处理。 图像的数字化过程分为采样与量化与编码三个步骤。
28、采样的实质就是要用多少点来描述一张图像,采样的结果就是通常所说的图像分辨率。比如,一幅640X480的图像,就表示这幅图像是由307 200个像素点所组成。采样频率是指一秒钟内采样的次数,它反映了采样点之间的间隔大小。采样频率越高,得到的图像样本就越细腻逼真,图像的质量越高,但要求的存储量也越大。 量化是指要使用多大范围的数值,来表示图像采样之后的每一个点。量化的结果是图像能够容纳的颜色总数,它反映了采样的质量。例如,如果以4bit存储一个点,就表示图像只能有16种颜色。若采用16位存储一个点,则有216=65 536种颜色。所以,量化位数越大,表示图像可以拥有更多的颜色,自然可以产生更为细
29、致的图像效果。但是,也会占用更大的存储空间。两者的基本问题都是视觉效果与存储空间的取舍问题。 假设有一幅黑白照片,可称之为一幅模拟图像,因为它在水平与垂直方向上的灰度变化都是连续的,可认为有无数个像素,而且任一点上灰度的取值都是从黑到白可以有无限个可能值。通过沿水平和垂直方向的等间隔采样可将一幅模拟图像分解为近似的有限个像素,每个像素的取值代表该像素的灰度(亮度),对灰度进行量化,使其取值变为有限个可能值。通常采用28=256级均匀量化(也称8位量化)已能得到优质的图像。 经过这样采样和量化得到的一幅空间上表现为离散分布的有限个像素,灰度取值上表现为有限个离散的可能值的图像称为数字图像。只
30、要水平与垂直方向采样点数N和M足够多,量化位数足够大,则数字图像的质量比原始模拟图像毫不逊色。 在采样与量化处理后,才能产生一张数字化的图像,再运用计算机图像处理软件的各种技巧,对图像进行处理、修饰或转换,达到所需要的图像效果。 2.2.2 图像采样 计算机要感知图像,就要把图像分割成为离散的小区域,即像素。像素是计算机系统生成和再现图像的基本单位,像素的亮度、色彩等特征是通过特定的数值来表示的。数字化图像的形成是计算机使用相应的软硬件技术把许多像素点的特征数据组织成行列,整齐地排列在一个矩形区域内,形成计算机可以识别的图像。 图像采样就是将二维空间上模拟的连续亮度(即灰度)或色彩信息
31、转化为一系列有限的离散数值来表示。由于图像是一种二维分布的信息,所以具体的做法就是对图像在水平方向和垂直方向上等间隔地分割成矩形网状结构,所形成的矩形微小区域,称之为像素点。被分割的图像若水平方向有M个间隔,垂直方向上有N个间隔,则一幅图像画面就被表示成M×N个像素构成的离散像素点的集合(图2-24),M×N表示图像的分辨率。 图2-24 图像采样就是在水平方向和垂直方向上等间隔地将图像分割成网状 在进行采样时,采样点的间隔的选取是一个重要的问题。它决定了采样后的图像是否能真实地反映原图像的程度(图2-25)。一般说来,原图像中的画面越复杂,色彩越丰富,则采样
32、间隔应越小。由于二维图像的采样是一维的推广,根据信号的采样定理,要从采样样本中精确地复原图像,可利用图像采样的奈奎斯特(Nyquist)定理:图像采样的频率必须大于或等于原图像最高频率分量的两倍。 2.2.3 图像量化 采样后得到的亮度值(或色彩值)在取值空间上仍然是连续值。把采样后所得到的这些连续量表示的像素值离散化为整数值的操作叫量化。图像量化实际就是将图像采样后的样本值的范围分为有限多个区域,把落人某区域中的所有样本值用同一值表示,是用有限的离散数值量来代替无限的连续模拟量的一种映射操作。 为此,通常把图像的颜色(对于黑白图像为灰度)的取值范围分成K个子区间,在第i个子区间中选取
33、某一个确定的色彩值q,落在第i个子区间中的任何色彩值都以q代替,这样就有尺个不同的色彩值,即颜色值的取值空间被离散化为有限个数值。 8×16像素 (256色) 16×32像素 (256色) 32×64像素 (65535色) 64×128像素(65535色) 图2-25 不同采样精度所获得的图像分辨率不同 在量化时所确定的离散取值个数称为量化级数,表示量化的色彩值(或亮度值)所需的二进制位数称为量化字长。一般可用8位、16位、24位或更高的
34、量化字长来表示图像的颜色。量化字长越大,则越能真实地反映原有图像的颜色(图2-26)。但得到的数字图像的容量也越大。 32位色 效果 24位色 效果 8位256色 效果 2位4位色 效果 图2-26 不同量化字长的灰度图像效果 2.2.4 图像的编码与压缩 数字化后得到的图像数据量十分巨大,必须采用编码技术来压缩信息。在一定意义上讲,编码压缩技术是实现图像传
35、输与存储的关键。 图像的预测编码是将图像数据的空间变化规律和序列变化规律用一个预测公式表示,如果知道了某一像素的前面各相邻像素值之后,可以用公式预测该像素值。采用预测编码,一般只需传输图像数据的起始值和预测误差。 变换编码方法是将整幅图像分成一个个小的数据块,再将这些数据块经过变换、量化和编码,图像显示时再经过逆变换即可重构原来图像。 除了常见的压缩编码外,目前又出现了新的编码方法,如分形编码、小波变换图像压缩编码等,使图像的压缩率进一步提高。 2.3分辨率 数字化图像在计算机里采用分辨率来描绘其大小等特征。分辨率和图形、图像的质量有着密切关系,一般有显示分辨率、图像分辨率、扫描分辨
36、率、打印分辨率等几种形式。在处理图像时要理解它们之间的区别。 1.显示分辨率 显示分辨率又称屏幕分辨率。数字化图像通过计算机显示系统,如显示卡、显示器描述时,屏幕呈现出横向与纵向像素点的个数,称之为显示分辨率。显示分辨率与显示系统软、硬件的显示模式有关。如标准VGA显示模式,其屏幕分辨率为640×480像素点,即横向640个像素,纵向480个像素。 2.图像分辨率 图像分辨率是指数字化图像的大小,以水平的和垂直的像素点表示。需要注意的是,不要把显示分辨率与图像分辨率相混淆。例如,有一幅分辨率为320X 240像素的彩色图像,在显示器分辨率为640X480像素的屏幕上显示,这时图像在屏幕
37、上的大小只占整个屏幕的1/4。如果显示的分辨率设置成800×600像素,则显示的图像就更小。反之,如果有一幅分辨率为1 024×768的彩色图像,显示器的分辨率为640×480像素,那么在显示屏幕上只能看到整幅图像的1/4,需要卷屏才能看到图像的其余部分。另外,图像分辨率实际上决定了图像的显示质量,也就是说,即使提高了显示分辨率,也无法真正改善图像的质量。 图像分辨率和显示分辨率决定了显示图像的大小,图2-27所示是在相同的屏幕分辨率下,在不同图像分辨率下实际显示图像的大小。 3.扫描分辨率 扫描分辨率是指每英寸扫描所得到的点,单位是dpi(dot per inch)。它表示一台扫描仪输
38、入图像的细微程度,数值越大,表示被扫描的图像转化为数字化图像越逼真,扫描仪质量图也越好。 4.打印分辨率 表示一台打印机输出图像的技术指标,由打印头每英寸输出的点的数目决定,单位也是dpi,高清晰度的打印一般超过600dpi。 2-27 同一幅图像在不同的显示分辨率下的效果 5.像素分辨率 在每一个屏幕上的像素没有必要具有同样的大小或形状。把用长宽比为1:1的像素创建的图像,放到像素长宽比为l:2的屏幕上将出现严重的失真。但这种类型的失真已较少见,因为现代的显示技术已差不多完全把像素的长宽比1:1定成了标准。
39、 2.4图像文件格式 图像在存储媒体(如磁盘、光盘)中储存格式,称为文件格式。图像文件的存储格式有多种,如:BMP、PCX、TIF、GIF、JPEG等。 1.BMP BMP(Bitmap)文件是一种与设备无关的图像文件,它是Windows软件推荐使用的一种格式,例如BMP文件用于作为Windows系统的图标和背景。BMP是一种典型的位映射存储形式,可达24位全彩色模式。为了处理方便,BMP文件都不压缩。 2.PCX PCX是为Zsoft公司研制开发的图像处理软件PC Paintbrush设计的文件格式。PCX图像文件格式与特定图形显示硬件有关。PCX文件在存储时都要经过RLE压缩,读
40、写PCX时需要一段RLE编码和解码程序。 3.TIFF格式 TIFF(Tag Image File Format)称为标记图像文件格式。它是Alaus和Microsoft公司为扫描仪和桌面出版系统研制开发的较为通用的图像文件格式。TIFF的存储格式可以压缩也可不压缩,压缩的方法也不只一种。TIFF不依赖于操作环境,具有可移植性。它不仅作为图像信息交换的有效媒介,更可作为图像编辑程序的基本内部数据格式,具有多用性。由于PC机和苹果MAC机同时支持TIFF格式,所以如果制作的图像同时要在PC机及苹果MAC机系统上应用的话,TIFF格式是个很好的选择。 4.GIF GIF(Graphics
41、Interchange Format)是由CompuServe公司为了制定彩色图像传输协议而开发的图像格式文件。它具有支持64 000像素的图像,256~16M颜色的调色板,单个文件的多重图像,按行扫描迅速解码,有效地压缩以及与硬件无关等特性。 GIF文件在存储时都经LZW压缩,可以将文件的大小压缩至原来的1/2。GIF可用于压缩复杂并极富变化的图像,因此适合于需要高效率的图像处理。目前,在因特网上,GIF格式已成为主页图片的标准格式。 5.JPEG JPEG是按图像专家联合组(Joint Photographic Experts Group)制订的压缩标准DCT来压缩储存的图像文件格式
42、JPEG使用一种有损压缩算法,无损压缩算法能在解压后准确再现压缩前的图像,而有损压缩则牺牲了一部分的图像数据来达到较高的压缩率,但是这种损失很小,以至于人们很难察觉。 6.MACPAINT格式(文件扩展名为.MPT和.MAC) 它是苹果MAC机所使用的灰度图像模式,在PC机上制作图像时可以利用这种格式与苹果MAC机沟通,值得注意的是它的屏幕显示固定在576x 720像素,和其他格式不尽相同,在转换文件时要注意调整以免图像有所损失。 7.PhotoShop格式(文件扩展名为.PSD) 这是Adobe公司开发的图像处理软件PhotoShop中自建的标准文件格式,在该软件所支持的各种格式中
43、其存取速度比其他格式快很多。由于PhotoShop软件越来越广泛地应用,所以这个格式也逐步流行起来。 教师授课教案 / 学年 第 学期 课程 多媒体技术 章节课题 第二章 多媒体信息的表示 授课方法 讲授 所需教具 授课时间 月 日 节 月 日 节 月 日 节 授课班级 目的要求: 掌握图形数字化过程及图形文件格式 旧知复习: 图像数字化过程? 重点:图形数字化过程 难点:图形数字化过程 教学过程:(包括主要教学环节、时间分配
44、 九、 复习提问(5分) 十、 讲授新课 2.1 计算机图形学理论(20分) 2.2 计算机图形学的发展与应用(20分) 2.3 图形与图像的区别与联系(10分) 2.4 真实感图形技术(20分) 2.5 计算机图形格式与处理软件(10分) 十一、 总结(3分) 十二、 布置作业(2分) 课后作业: 教学后记: 任课教师: 教研室主任 新课导入:多媒体信息是如何表示的 第二章 多媒体信息的表示 2.1矢量图形 图形是一种抽象化的图像,是把图像按某个标准进行分析而产生的结果。它不直接描述数据的每一点,而是描述
45、产生这些点的过程和方法。通常,将图形称之为矢量图形。 矢量图形是用一个指令集合来描述的。这些指令用来描述构成一幅图的所包含的直线、矩形、圆、圆弧、曲线等图形元素,每一个图形元素成为一个自成一体的实体。它具有如颜色、形状、轮廓、大小和屏幕位置等属性,整个作品基本由各种各种直线、曲线、面以及填充这些线、面之间的丰富的色彩构成。既然每个对象都是一个独立的试题,就可以在维持它原有的清晰度和弯曲度的同时,多次移动和改变它的属性,而不会影响图形中的其它对象。 矢量图形的特点是精度高、灵活性大,并且设计出来的作品可以任意地放大、缩小而不变形失真。相对于位图来讲,它占用的空间小,但是在屏幕每次显示时,它都
46、需要经过重新计算,故显示速度没有图像快。 产生矢量图形的程序通常称为绘图程序,例如:AutoCAD、FreeHand、CorelDRAW以及3DMAX等,它可以分别产生和操作矢量图形和各个片段,并可任意移动、缩小、放大、旋转和扭曲各个部分,即使相互覆盖或重叠,也依然保持各自的特性。矢量图形主要用于线形的图画、美术字、工程制图等。但是,对于一个复杂的图像,用矢量图形的格式表示,需要花费计算机大量的时间。通常可以用矢量图形方式创建一幅复杂的图形,再在应用程序的使用中将其转化为位图格式的图像。 把矢量图构成的图画变换成位图的方法很简单,只要在保存图画时,把矢量图变换成位图就可以了。但把位图变换成
47、矢量图则比较困难。但是,也有许多实用程序,可以检测位图图像中物体的边界,然后得出描述该物体的多边形对象。这一过程叫做“自动跟踪”,在某些集成了位图和矢量图像的创作系统(如SuperCard)中就提供这种功能。 大多数多媒体著作系统都提供了若干矢量图对象供用户使用,这些矢量图对象有直线、矩形、椭圆、多边形以及正文等。 矢量图有许多用处。比如,计算机辅助设计系统中常用矢量图对象系统来创造一些十分复杂的几何图形和三维动画。 提示: 矢量是用其两个端点位置来描述的一条直线。例如,一个矩形可以简单地定义如下: Rect,0,0,200,200 将画出一个矩形,它先从荧
48、光屏的左上角开始,水平走200个像素,再往下走200个像素,最后画成一个正方形。对于下面这个描述: Rect,0,0,200,200,Red,Blue 将画出一个同样的正方形,只不过其边框线是红色,方框中填以蓝色。 对于下述描述: Circle, x, y, r 表明画一个圆,圆心由x和y指明,圆的大小由r表示。 上述的解释结果,完全由软件设计时所制订的语法规则所确定。 2.2矢量图与位图的比较 1.空间 在上述对一个彩色正方形的矢量图的描述中,所用的数字和字母仅用了不到30个字节。如果经过压缩,所用的字节数还要更少。另一方面,对于同样的一个正方形,
49、若用未经压缩的位图描述,对黑白图像而言(每个像素仅有1位颜色深度),将占用5000个字节(200X200/8),其中,数字8表示一个字节有8位;对256色的图像而言(每个像素有8位颜色深度),则将要求40k字节[ (200×200/8)×8 ]。 2.性能 当在荧光屏上画了许多对象时,由于每个对象的大小、位置和其他特性都需要计算,等待荧光屏的刷新就需要很长的时间,速度变慢。例如,由500个单独的直线和矩形构成的图像就比仅由处理几个对象组成的图像用的时间多很多。这就是说,对于复杂的图像,用位图比用矢量图画对象速度快。 教师授课教案 / 学年
50、 第 学期 课程 多媒体技术 章节课题 第二章 多媒体信息的表示 授课方法 讲授 所需教具 授课时间 月 日 节 月 日 节 月 日 节 授课班级 目的要求: 掌握视频信号数字化过程及视频文件格式 旧知复习: 图形和图像有何区别? 重点:掌握视频信号数字化过程 难点:掌握视频信号数字化过程 教学过程:(包括主要教学环节、时间分配) 十三、 复习提问(5分) 十四、 讲授新课 2.1 视频基础知识(5’) 2.2 电视信号及其标准(15’) 2.3 视频的数字化过程(15’






