多媒体技术基础第3版课后答案.doc

资源描述

资料内容仅供您学习参考，如有不当或者侵权，请联系改正或者删除。《多媒体技术基础》第 3版练习与思考题参考答案林福宗清华大学计算机科学与技术系 -2-15 第1章多媒体技术概要 1.1 多媒体是什么? 多媒体是融合两种或者两种以上媒体的一种人-机交互式信息交流和传播媒体。使用的媒体包括文字、图形、图像、声音、动画和视像(video)。 1.2 超链接是什么? 超链接(hyper link)是两个对象或元素之间的定向逻辑链接, 是一个对象指向另一个对象的指针。建立互相链接的这些对象不受空间位置的限制, 可在同一个文件、在不同的文件或在世界上任何一台连网计算机上。 1.3 超文本是什么? 超文本是包含指向其它文档或文档元素的指针的电子文档。与传统的文本文件相比, 它们之间的主要差别是, 传统文本是以线性方式组织的, 而超文本是以非线性方式组织的。这种文本的组织方式与人们的思维方式和工作方式比较接近。 1.4 无损压缩是什么? 无损压缩是用压缩后的数据进行重构(也称还原或解压缩), 重构后的数据与原来的数据完全相同的数据压缩技术。无损压缩用于要求重构的数据与原始数据完全一致的应用, 如磁盘文件压缩就是一个应用实例。根据当前的技术水平, 无损压缩算法可把普通文件的数据压缩到原来的 1/2～1/4。常见的无损压缩算法包括哈夫曼编码和LZW等算法。 1.5 有损压缩是什么? 有损压缩是用压缩后的数据进行重构, 重构后的数据与原来的数据有所不同, 但不影响人对原始资料表示的信息造成误解的数据压缩技术。有损压缩适用于重构数据不一定非要和原始数据完全相同的应用。例如, 图像、视像和声音数据就可采用有损压缩, 因为它们包含的数据往往多于我们的视觉系统和听觉系统所能感受的信息, 丢掉一些数据而不至于对图像、视像或声音所表示的意思产生误解。 1.6 SGML是什么语言? SGML语言的精华是什么? HTML是什么语言? HTML语言与SGML 语言是什么关系? 1 (1) 1986年国际标准化组织(ISO)采用的信息管理标准。该标准定义独立于平台和应用的文本文档的格式、索引和链接信息, 为用户提供一种类似于语法的机制, 用来定义文档的结构和指示文档结构的标签。 (2) SGML的精华是把文档的内容与样式分开处理。 (3) HTML是用来创立超文本文档的标记语言, 也是创立Web网页用的标记语言。 (4) HTML是SGML的一个子集。 1.7 有人认为”因特网就是万维网”, 这种看法对不对? 为什么? (1) 不对。 (2) 因特网是专指全球范围内最大的、由众多网络相互连接而成的、基于TCP/IP协议的计算机网络; 万维网是指分布在全世界所有HTTP服务器上互相连接的超媒体文档的集合。 1.8 组成万维网的 4个核心部分是什么? (1) 超文本传输协议(HTTP); (2) 文档格式标准, 包括HTML, XML, XHTML; (3) 执行HTTP协议的Web浏览器; (4) 执行HTTP协议的Web服务器。 1.9 H.261~H.264和G.711~G.731是哪个组织制定的标准? 国际电信联盟(ITU)。 1.10 MPEG-1, MPEG-2和MPEG-4是哪个组织制定的标准? ISO/IEC, 即国际标准化组织(ISO)/ 国际电工技术委员会(IEC)。 1.11 因特网标准是哪个组织制定的标准? 因特网标准是ISOC(因特网协会或称互联网协会)协调的 4个组制定的。 ISOC负责协调的 4 个组: (1) 因特网工程特别工作组(IETF); (2) 因特网体系结构研究部(IAB): (3) 因特网工程指导组(IESG); (4) 因特网研究特别工作组(IRTF)。 1.12 HTML和XML语言是哪个组织制定的标准? 万维网协会(World Wide Web Consortium, W3C)。 1.13 阐述你对数据、内容、信息、知识和智慧的理解。 (1) 数据(data)是以数字、字符或图像等可读语言或其它记录方法表示的事实、概念或指令, 适用于人或自动装置进行通信、解释或处理。数据本身没有意义, 一般需要在一定的语义环境中才有意义 (2) 内容(content)是对数据的描述, (3) 信息(information)是对内容的解释, 信息是数据的含义。 (4) 知识(knowledge)是在某个感兴趣领域中的事实、概念和关系。 (5) 智慧(wisdom)是知识累积后产生的洞察力、判断力和创造创造能力。 2 第2章无损数据压缩 2.1假设{a,b,c}是由 3个事件组成的集合, 计算该集合的决策量。(分别用Sh, Nat和Hart 作单位)。 H0 = = = (log23) Sh = = = 1.580 Sh (loge3) Nat (log103) Hart 1.098 Nat 0.477 Hart 2.2 现有一幅用 256级灰度表示的图像, 如果每级灰度出现的概率均为 p(xi) =1/ 256, i = 0,",255, 计算这幅图像数据的熵。 n 1 ×log2 1 ) =8 (位), ∑ H(X ) = − p(xi)log2 p(xi) = −256×( 256 256 i=1 也就是每级灰度的代码就要用 8 比特, 不能再少了。 2.3现有 8个待编码的符号m0,",m7, 它们的概率如练习_表 2-1所示, 计算这些符号的霍夫曼码并填入表中。答案不唯一) 。练习表 2-1 待编码符号 m0 概率 0.4 分配的代码 1 代码长度(比特数) 1 3 3 3 4 5 6 6 m1 m2 m3 m4 m5 m6 m7 0.2 000 0.15 0.10 0.07 0.04 0.03 0.01 001 011 0101 01000 010010 010011 2.4 现有 5个待编码的符号, 它们的概率见练习表 2-2。计算该符号集的: (1) 熵; (2)霍夫曼码; (3) 平均码长。练习表 2-2 a2 a1 a3 a4 a5 符号概率 0.4 0.2 0.2 0.1 0.1 (1) 熵 n ∑ H(ai) = − p(ai)log2 p(ai) =-0.4×log2 (0.4)-2×0.2*log2 (0.2)-2×0.1log i=1 2 (0.1) =0.4×1.3219+0.4×2.3219+0.2×3.3219=0.5288+-0.9288+0.6644=2.1220 (位) (2) 编码树和霍夫曼码 3 a( 2 0.4) 0 1 P4(1.0) a( 1 0.2) 1 a( 3 0.2) 1 P3(0.6) 0 a( 4 0.1) 1 P2(0.4) 0 0 P( 1 0.2) a( 5 0.1) 练习图2-1 编码树编码表符号概率 0.4 0.2 0.2 0.1 0.1 霍夫曼码* 码长所需位数 0.4 a2 0 1 2 3 4 4 a1 a3 a4 a5 11 0.4 101 1001 1000 0.6 0.4 0.4 *代码分配不唯一 (3) 平均码长 L = 0.4+0.4+0.6+0.4+.04=2.2(位/符号) 2.5 使用算术编码生成字符串games的代码。字符g, a, m, e, s的概率见练习表 2-3。练习表 2-3 符号概率 g a m 0.2 e 0.1 s 0.1 0.4 0.2 1.0 0.84 0.792 0.7792 0.77776 1.0 g 0.6 0.4 a a m m 0.2 0.1 0.0 e s e s 0.6 0.76 0.776 0.7776 0.7776 练习图2-2 games的算术码 2.6字符流的输入如练习表 2-4所示, 使用LZW算法计算输出的码字流。如果对本章介绍的 LZW算法不打算改进, 并按表 2-17所示步骤计算, 请核对计算的输出码字流为: (1) (2) (4) (3) (5) (8) (1) (10) (11) …。练习表 2-4 输入位置 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 … 4 输入字符流输出码字 a a b b a - b c c b - a b a b a a - a a - a a a … ab ba bab a aa - aaa 练习表 2-5 步骤位置词典输出码字 (1) (2) a b (3) c 1 2 1 2 (4) ab (1) (2) (4) (3) (5) (8) (1) (10) (11) … (5) ba 3 4 (6) abc cb 4 5 (7) 5 7 (8) bab baba aa 6 10 11 13 16 … (9) 7 (10) (11) (12) … 8 aaa aaa … 9 … 2.7 LZ78算法和LZ77算法的差别在哪里? (1) LZ77 编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串(2.4.2 LZ77 算法)。 (2) LZ78的编码思想是不断地从字符流中提取新的缀-符串(String), 通俗地理解为新”词条”, 然后用”代号”也就是码字(Code word)表示这个”词条”。这样一来, 对字符流的编码就变成了用码字(Code word)去替换字符流(Charstream), 生成码字流(Codestream), 从而达到压缩数据的目的。(2.4.4 LZ78算法) 2.8 LZSS算法和LZ77算法的核心思想是什么? 它们之间有什么差别? (1) LZSS经过输出真实字符解决了在窗口中出现没有匹配串的问题, 但这个解决方案包含有冗余信息。(2.4.3 LZSS算法) (2) LZ77编码算法的核心是查找从前向缓冲存储器开始的最长匹配串(2.4.2 LZ77算法) 2.9 LZW算法和LZ78算法的核心思想是什么? 它们之间有什么差别? (1) LZW算法和LZ78算法的核心思想都是不断地从字符流中提取新的缀-符串(String), 通俗地理解为新”词条”, 然后用”代号”也就是码字(Code word)表示这个”词条”。这样一来, 对字符流的编码就变成了用码字(Code word)去替换字符流(Charstream), 生成码字流(Codestream), 从而达到压缩数据的目的。(2.4.4 LZ78算法) (2) 在编码原理上, LZW与LZ78 相比有如下差别: ① LZW只输出代表词典中的缀-符串(String)的码字(code word)。这就意味在开始时词典不能是空的, 它必须包含可能在字符流中出现的所有单个字符, 即前缀根 (Root)。② 由于所有可能出现的单个字符都事先包含在词典中, 每个编码步骤开始时都使用一字符前缀(one-character prefix), 因此在词典中搜索的第 1个缀-符串有两个字符。③ 新前缀开始的字符是先前缀-符串(C)的最后一个字符, 这样在重构词典时就不需要在码字流中加入额外的字符。(2.4.5 LZW算法) 5 2.10 你是是否同意”某个事件的信息量就是某个事件的熵”的看法。 ”信息量(information content)是具有确定概率事件的信息的定量度量”, 而”熵(entropy) 是事件的信息量的平均值, 也称事件的平均信息量(mean information content)”。第3章数字声音编码 3.1 音频信号的频率范围大约多少? 话音信号频率范围大约多少? (1) Audio: 20~ 0 Hz (2) Speech: 300~3400 Hz 3.2 什么叫做模拟信号? 什么叫做数字信号? (1) 模拟信号是幅度或频率发生连续变化的一种信号。 (2) 数字信号是以二进制代码形式表示有无或高低的一种信号。 3.3 什么叫做采样? 什么叫做量化? 什么叫做线性量化? 什么叫做非线性量化? (1) 采样: 在某些特定的时刻对模拟信号进行测量的过程。 (2) 量化: 幅值连续的模拟信号转化成为幅值离散的数字信号的过程。 (3) 线性量化: 在量化时, 信号幅度的划分是等间隔的量化。 (4) 非线性量化: 在量化时, 信号幅度的划分是非等间隔的量化。 3.4 采样频率根据什么原则来确定? 奈奎斯特理论和声音信号本身的最高频率。采样频率不应低于声音信号最高频率的两倍, 这样就能把以数字表示的声音还原成原来的声音。 3.5 样本精度为 8位的信噪比等于多少分贝? 48 分贝 3.6 声音有哪几种等级? 它们的频率范围分别是什么? 表 3-1 声音质量和数据率采样频率 (kHz) 8 样本精度单道声 / 数据率 (kb/s) 质量频率范围 (bit/s) 立体声单道声单道声立体声立体声立体声 (未压缩 ) 64.0 电话 * AM 8 200～3 400 Hz 20～15 000Hz 50～7 000Hz 11.025 22.050 44.1 8 88.2 FM 16 16 16 705.6 CD 1411.2 1536.0 20～20 000 Hz 20～20 000 Hz DAT 48 3.7 选择采样频率为 22.050 kHz和样本精度为 16位的录音参数。在不采用压缩技术的情况下, 计算录制 2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=1024×1024B) (22050×2×2×2×60)/(1024×1024) ＝ 10.09 MB 3.8 什么叫做均匀量化? 什么叫做非均匀量化? 6 (1) 均匀量化: 采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种说法。 (2) 非均匀量化: 采用非相等的量化间隔对采样得到的信号进行量化。例如, 对大的输入信号采用大的量化间隔, 对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。 3.9 什么叫做μ率压扩? 什么叫做A率压扩? (1) 在脉冲编码调制(PCM)系统中, 一种模拟信号和数字信号之间进行转换的CCITT压 (缩)扩(展)标准。在北美PCM电话网中, 使用μ率压扩算法。 (2) 在脉冲编码调制(PCM)系统中, 一种模拟信号和数字信号之间进行转换的CCITT压 (缩)扩(展)标准。在欧洲电话网, 使用A律压扩算法。对于采样频率为 8 kHz, 样本精度为 13比特、 14比特或 16比特的输入信号, 使用μ律压扩编码或使用A律压扩编码, 经过PCM编码器之后每个样本的精度为 8比特, 输出的数据率为 64 kbps。 3.10 G.711标准定义的输出数据率是多少? T1的数据率是多少? T2的数据率是多少? (1) G.711使用μ率和A率压缩算法, 信号带宽为 3.4 kHz, 压缩后的数据率为 64 kbps。 (2) T1总传输率: 1.544 Mbps。 (2) T2总传输率: 6.312 Mbps。 3.11 自适应脉冲编码调制(APCM)的基本思想是什么? 根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应能够是瞬时自适应, 即量化阶的大小每隔几个样本就改变, 也能够是音节自适应, 即量化阶的大小在较长时间周期里发生变化。 3.12 差分脉冲编码调制(DPCM)的基本思想是什么? 利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。这种技术是根据过去的样本去估算(estimate)下一个样本信号的幅度大小, 这个值称为预测值, 然后对实际信号值与预测值之差进行量化编码, 从而就减少了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是, PCM是直接对采样信号进行量化编码, 而DPCM是对实际信号值与预测值之差进行量化编码, 存储或者传送的是差值而不是幅度绝对值, 这就降低了传送或存储的数据量。另外, 它还能适应大范围变化的输入信号。 3.13 自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么? ADPCM综合了APCM的自适应特性和DPCM系统的差分特性, 是一种性能比较好的波形编码。它的核心想法是: ①利用自适应的思想改变量化阶的大小, 即使用小的量化阶 (step-size)去编码小的差值, 使用大的量化阶去编码大的差值, ②使用过去的样本值估算下一个输入样本的预测值, 使实际样本值和预测值之间的差值总是最小。第4章彩色数字图像基础 4.1 什么叫做真彩色和伪彩色? 在一幅彩色图像中, 每个像素值有 R, G, B三个基色分量, 每个基色分量直接决定显示设备的基色强度, 这样产生的彩色称为真彩色。例如用RGB 5∶5∶5表示的彩色图像, R, 7 G, B各用 5 位, 用R, G, B分量大小的值直接确定三个基色的强度, 这样得到的彩色是真实的原图彩色。现在, 一般把每个像素的颜色值用 24位表示的颜色叫做真彩色。24位表示的颜色总数: 224 ＝ 16 777 216 种颜色。 4.2什么叫做屏幕分辩率和图像分辩率? 查看你使用的计算机的所有屏幕分辩率。 (1) 屏幕分辩率是显示设备再现图像的精细程度的度量方法; 图像分辨率是图像精细程度的度量方法。 (2) 在Windows的主界面下, 单击鼠标器的右键→在弹出的菜单上点击”属性”→在弹出的”显示属性”窗口上点击”设置”按钮→然后点击”高级”按钮→在弹出的”默认监视器和…”窗口上点击”适配器”按钮→再点击”列出所有模式(L)…”按钮, 就可看到你的计算机的所有屏幕分辩率。 4.3一个像素的RGB分量分别用 3, 3, 2位表示的图像, 该幅图像的颜色数目最多是多少? 如果有一幅 256色的图像, 问该图的颜色深度是多少? (1) 256 种; (2) 8 位 4.4 按照JPEG标准的要求, 一幅彩色图像经过JPEG压缩后还原得到的图像与原始图像相比较, 非图像专家难以找出它们之间的区别, 此时的最大压缩比是多少? 24:1 4.5 JPEG压缩编码算法的主要计算步骤是: ① DCT变换, ② 量化, ③ Z字形编码, ④ 使用DPCM对直流系数(DC)进行编码, ⑤ 使用RLE对交流系数(AC)进行编码, ⑥ 熵编码。假设计算机的精度足够高, 在上述计算方法中, 哪些计算对图像的质量是有损的? 哪些计算对图像的质量是无损的? 算法名称 ① DCT变换 ② 量化有损/无损无损算法名称有损/无损无损 ④ 使用DPCM对直流系数(DC)进行编码 ⑤ 使用RLE对交流系数(AC)进行编码 ⑥ 熵编码有损无损 ③ Z字形编码无损无损 4.6 什么叫做γ校正? 在屏幕上显示用离散量表示的色彩时采用的一种色彩调整技术。计算机显示器和电视采用的阴极射线管产生的光亮度与输入的电压不成正比, 而是等于以某个常数为底, 以输入电压为指数的数, 这个常数称为γ, 它的值随显示器的不同而改变, 一般在 2.5左右。 4.7 什么叫做α通道? 它的作用是什么? 在每个像素用 32位表示的图像表示法中的高 8位, 用于表示像素在一个对象中的透明度。例如, 用两幅图A和B混合成一幅新图New, 新图的像素为: New pixel =(alpha)(pixel A color) +(alpha)(pixel B color)。在计算机环境下, α 通道可存储在帧缓冲存储器中的附加位平面上。对于 32 位帧缓冲存储器, 除高 8 位是α 通道外, 其余 24 位是颜色位, 红、绿和蓝各占 8位。 4.8 PNG图像文件格式的主要特点是什么? PNG用来存储灰度图像时, 灰度图像的深度可多到 16位, 存储彩色图像时, 彩色图像的深度可多到 48位, 而且还可存储多到 16位的α通道数据。详见”4.7.4 PNG格式”。 8 4.9 什么叫做图形(graphics)、图像(image)、位图(bitmap )和图形图像(graphical image)? (1) 图形: 按照数学规则用绘图软件(如Adobe Illustrator)或图形输入设备创立的图, 如工程图和结构图。(2) 图像: 用像素值阵列表示的人物或场景的图。(3) 位图: 用像素值阵列表示的图。(4) 图形图像: 表示矢量图的位图。 4.10 经过调查、试验和分析, 把BMP, GIF, JPG和PNG格式的一些特性填入下表。图像文件格式名称有损还是无损压缩支持的最大颜色数 BMP 无损 GIF 无损 256 JPG PNG 有损无损 16 777 216 16 777 216 16 777 216 第5章颜色的度量体系 5.1 在开拓颜色科学方面, Newton, Thomas Young, Maxwell, Munsell, Ostwald和CIE分别做出了哪些重要贡献? (1) Newton: 创造了颜色圆, 用于度量颜色 (2) Thomas : 认为人的眼睛有三种不同类型的颜色感知接收器, 大致上相当于红、绿和蓝三种基色的接收器。 (3) Maxwell: 探索了三种基色的关系, 而且认识到三种基色相加产生的色调不能覆盖整个感知色调的色域, 而使用相减混色产生的色调却能够。她认识到彩色表面的色调和饱和度对眼睛的敏感度比明度低。Maxwell的工作可被认为是现代色度学的基础。 (4) Munsell: 开发了第一个广泛被接受的颜色次序制, 称为Munsell color-order system或者叫Munsell color system, 对颜色作了精确的描述并用在她的教学中。Munsell颜色次序制也是其它颜色体系的基础。 (5) Ostwald: 开发了Ostwald颜色体系, 根据对颜色起决定作用的波长、纯度和亮度来映射色调、饱和度和明度的值。 (6) CIE定义了许多度量颜色的标准 5.2 什么是颜色空间? 对人、显示设备和打印设备, 一般采用什么颜色参数来定义颜色? (1) 颜色空间: 表示颜色的一种数学方法, 人们用它来指定和产生颜色, 使颜色形象化。 (2) 对于人来说, 能够经过色调、饱和度和明度来定义颜色; 对于显示设备来说, 人们使用红、绿和蓝磷光体的发光量来描述颜色; 对于打印或者印刷设备来说, 人们使用青色、品红色、黄色和黑色的反射和吸收来产生指定的颜色。 5.3 什么叫做颜色系统(即颜色体系)? 简要说明组织和表示颜色的两种方法。 (1) 组织和表示颜色的方法。 (2) 两种方法: 颜色模型(color model), 编目系统(cataloging system)。注: (1) 颜色模型: 在台式机排版和图形艺术中, 表示颜色的任何一种方法或约定。在图形艺术和印刷领域, 颜色常见Pantone(公司)颜色匹配系统; 在计算机图形学方面, 以下任何一种不同的色彩系统都能够描述色彩: HSB(色调, 饱和度和亮度 ), CMY(青, 品红, 黄 )和 RGB(红, 绿, 蓝)。 (2) 颜色空间是颜色模型最普通的例子, RGB, HSB, CMY, CIE XYZ, CIELAB, CMYK 和颜色的光谱描述方法都是颜色模型。 9 5.4 使用你能够找到的工具和资料, 探讨本章介绍的CIE度量体系是否有错误, 哪些地方需要修改和补充。CIE度量体系包括: ① CIE 1931 RGB ②CIE 1931 XYZ ③CIE 1931 xyY ④CIE 1960 YUV和CIE YU'V' ⑤CIE 1976 LUV ⑥CIE 1976 LAB ⑦CIELUV LCh和⑧CIELAB LCh (略) 第6章颜色空间变换 6.1 PAL制彩色电视使用什么颜色模型? NTSC制彩色电视使用什么颜色模型? 计算机图像显示使用什么颜色模型? (1) PAL制彩色电视: YUV (2) NTSC制彩色电视: YIQ (3) 计算机图像显示设备: RGB 6.2 用YUV或YIQ模型来表示彩色图像的优点是什么? 为什么黑白电视机可看彩色电视图像? (1) YUV表示法的优点: ① 它的亮度信号(Y)和色度信号(U, V)是相互独立的, 因此可以对这些单色图分别进行编码; ② 能够利用人眼的特性来降低数字彩色图像所需要的存储容量。YIQ同样具有YUV的这两个优点。 (2) 黑白电视能接收彩色电视信号的道理是利用了YUV/YIQ分量之间的独立性。 6.3 在RGB颜色空间中, 当R=G=B, 且为任意数值, 问计算机显示器显示的颜色是什么颜色? 灰色 6.4 在HSL颜色空间中, 当H为任意值, S=L=0时, R, G和B的值是多少? 当H＝0, S=1, L ＝0.5, R, G和B的值是多少? (1) 当H为任意值, S=L=0时, R = G = B = 0 (2) 当H＝0, S=1, L＝0.5时, R＝1, G ＝ B ＝ 0 6.5 打开Windows 操作系统中的”画图”程序, 在”编辑颜色”窗口中的红(R)、绿(G)、蓝 (B)和色调(H)、饱和度(S)、亮度(L)对应显示上, 如果设置R=G=B＝255, 问H, S和L的值分别为多少? 分别改变R, G和B的值, 观察H, S和L的值的变化。当R=G=B＝255时, H＝160, S=0, L=240。 (2) (略) 6.6 用MATLAB编写RGB到HSL和HSL到RGB颜色空间的转换程序: rgb2hsl.m和hsl2rgb.m。 (略) 6.7 用MATLAB编写Y'CbCr和R'G'B'[0,219]颜色空间的转换程序: RGB2YCbCr和 YCbCr2RGB.m。(略) 第7章小波与小波变换 7.1 写出矢量空间 3的哈尔小波并画出它的波形。 W 10 ⎧ 1 0 ≤ x <1/16 ⎧ 1 2/16 ≤ x < 3/16 ⎪ ⎪ 3 0 ψ13(x) = −1 3/16 ≤ x < 4/16 ψ (x) = −1 1/16 ≤ x < 2/16 ⎨ ⎨ ⎪ ⎪ 0 其它 0 其它 ⎩ ⎩ ⎧ 1 4/16 ≤ x < 5/16 ⎧ 1 6/16 ≤ x < 7 /16 ⎪ ⎪ 3 2 3 3 ψ (x) = −1 5/16 ≤ x < 6/16 ψ (x) = −1 7 /16 ≤ x < 8/16 ⎨ ⎨ ⎪ ⎪ 0 其它 0 其它 ⎩ ⎩ ⎧ 1 8/16 ≤ x < 9/16 ⎧ 1 10/16 ≤ x <11/16 ⎪ ⎪ 3 4 3 5 ψ (x) = −1 9/16 ≤ x <10/16 ψ (x) = −1 11/16 ≤ x <12/16 ⎨ ⎨ ⎪ ⎪ 0 其它 0 其它 ⎩ ⎩ ⎧ 1 12/8 ≤ x <13/16 ⎧ 1 14/16 ≤ x <15/16 ⎪ ⎪ 3 6 3 7 ψ (x) = −1 13/8 ≤ x <14/16 ψ (x) = −1 15/16 ≤ x <1 ⎨ ⎨ ⎪ ⎪ 0 ⎩ 0 其它其它 ⎩ 7.2 写出 4×4哈尔小波变换矩阵。先写出: , ⎡1 1 2 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎡1 1 2 0 0⎥⎤ 0 0 ⎢ ⎢ 2 1 2 1 ⎢ ⎢ ⎥ 0 − 1 − 1 ⎢ M = ⎢⎢ 0 0⎥⎥ 0 1 2 ⎥ ⎥ M = ⎢⎢ ⎢ ⎢ 1 0⎥ 2 2 2 2 0 2 1 1 0 0 ⎢ ⎢ ⎢ ⎥ 0 2 1 ⎢ ⎣0 0 0 1⎦⎥ ⎢0 0 − 1⎥ ⎢ ⎣ ⎥ 2 2⎦ (1) 4×4哈尔小波变换矩阵: ⎡1 4 1 1 4 1 1 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ 0 ⎢ ⎢ ⎢ ⎢ 2 − 1 0 1 2 ⎥ ⎥ 4 1 ⎢4 1 ⎣4 4 2 W = M1M 2 = ⎢ − 1 ⎢ 0 4 ⎢ − 1 0 − 1⎥ ⎢ ⎢ ⎥ 4 2⎦ (2) 规范化的 4×4哈尔小波变换矩阵: 11 ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ 1 1 1 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ 0 2 2 2 ( 2) ( 2) 2 1 1 − 1 2 0 1 2 ( 2) ( 2) W = M1M 2 = ⎢⎢ 1 1 ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ − 0 0 2 2 2 2 ⎥ ⎥ ( 2) ( 2) − 1 ⎥⎥ 1 1 − 2 ( 2) ( 2) 2 ⎥ ⎢ ⎥ ⎣ ⎦ 7.3 使用MATLAB中的多级一维小波分解函数例程(function)wavedec, 对例 7.2所示的函数作小波变换。(略) 7.4 使用规范化的小波变换算法, 用MATLAB编写一个M文件, 重新计算 f (x) = [2, 5, 8, 9, 7, 4, −1, −1]的哈尔小波变换。(略) 第8章小波图像编码 8.1 什么叫做零树? ”零树”是指小波变换系数之间的一种数据结构。因为离散小波变换是一种多分辨率的分解方法, 每一级分解都会产生表示图像比较粗糙(低频图像)和比较精细(高频图像)的小波系数, 在同一方向和相同空间位置上的所有小波系数之间的关系可用一棵树的形式表示, 如果树根和它的子孙的小波系数的绝对值小于某个给定的阈值T(threshold), 那么这棵树就叫做零树。 8.2 解释EZW的含义。嵌入零树小波编码(embedded zerotree wavelet, EZW)是Shapiro, J. M在 1993年开发的一种编码算法。"小波"表示该算法以离散小波变换为基础, 以变换后的大系数比小系数更重要以及高频子带中的小系数能够忽略为背景; "零树"表示小波变换系数之间的一种数据结构, 用同一方向和相同空间位置上的所有小波系数构成一棵树, 如果树根及其子孙的小波系数的绝对值小于某个给定域值, 则这棵树就称为零树; "嵌入"表示一幅图像能够分解成一幅低分辨率图像和分辨率由低到高(表示图像细节)的许多子图像, 图像合成过程是经过子图像生成许多分辨率不同的图像。EZW编码就是按照用户对图像分辨率的不同要求, 编码器进行多次编码, 每进行一次编码, 域值降低 1/2, 水平和垂直方向上的图像分辨率各提高 1倍。编码从最低分辨率图像开始扫描, 每当遇到幅度大于域值的正系数就用符号P表示, 幅度小于域值的负系数用符号N表示, 树根节点上的系数幅度小于域值而树枝中有大于域值的非零树用符号Z表示, 零树用符号T表示, 编码的输出是符号集{P, N, T, Z, 0, 1}中的一系列符号。 8.3 如果条件允许, 用MATLAB或者其它语言编写执行EZW算法的编码和解码程序 (略) 8.4 解释SPIHT的含义。 12 层树分集算法(set partitioning in hierarchical trees, SPIHT)的根据是, 图像经过小波变换之后, 大部分能量都集中在低频子带。从这个事实出发, 最先传送幅度大的系数, 这样解码器即使在低速率应用环境下也可得到图像的大部分信息。编码树的结构与 EZW算法的结构类似, 每一个节点要么没有子节点, 要么有 4个子节点。在编码过程中, 使用三个列表变量存储重要系数和不重要系数。该算法适用于图像的渐进传输, 具有比较高的PSNR, 复杂度比较低, 计算量比较少, 位速率容易控制等优点。 8.5 如果条件允许, 用MATLAB或者其它语言编写执行SPIHT算法的编码和解码程序。(略) 8.6 请用因特网搜索工具, 查找并阅读EBCOT的详细说明。(略) 8.7 如果条件允许, 用MATLAB或者其它语言编写执行EBCOT算法的编码和解码程序。(略) 8.8 JPEG 有许多功能, 请用因特网搜索工具调查和描述它的详细功能。(略) 第9章数字电视基础 9.1电视是什么? 电视制是什么? 世界上主要的彩色电视制有哪几种? (1) 电视是捕获、广播和接收活动图像和声音的远程通信系统; (2) 电视制(television system)是传输图像和声音的方法; (3) 当前世界上使用的彩色电视制式主要有PAL, NTSC, SECAM三种, 都是模拟彩色电视制式。 9.2 隔行扫描是什么意思? 非隔行扫描是什么意思? (1) 在隔行扫描中, 一帧画面分两场, 第一场扫描总行数的一半, 第二场扫描总行数的另一半。电子束扫完第 1行后回到第 3行开始的位置接着扫, 如图 10-01(b)所示, 然后在第 5、 7、 ……, 行上扫, 直到最后一行。奇数行扫完后接着扫偶数行, 这样就完成了一帧(frame) 的扫描。隔行扫描要求第一场结束于最后一行的一半, 不

展开阅读全文