资源描述
参考答案
第1章
一. 判断题
1.√ 2.√ 3.× 4.√ 5.× 6.× 7.√
二. 填空题
1. 感知媒体 、表达媒体 、呈现媒体 、 存储媒体 、传输媒体 、交换媒体
2. 文本(Text)、图形(Graph)、图像(Image)、视频(Video)、音频(Audio)、动画(Animation)
3. 家庭信息中心 、视频点播系统 、 高清晰电视与数字电视 、影视娱乐业
4. 多个媒体对象的多种合成方式 、能够为大量数据提供高性能的存储管理 、支持传统的数据库管理系统功能 、支持多媒体信息提取的功能 、能为用户提供丰富而便捷的交互手段
三. 简答题
1.多媒体技术,指能够同时获取、处理、编辑、存储和回放两种或者两种以上不同类型信息媒体的技术,这些信息媒体包括文字、声音、图形、图像、动画、视频等,它一般不是指多种媒体本身,而主要是指处理和应用的一整套技术手段。它有以下五个主要特性(1)多样性 (2)集成性 (3)交互性 (4)实时性 (5)非线性
2.多媒体应用领域主要包括以下方面:(1)娱乐,(2)教育与培训,(3)电子出版物,(4) 咨询、信息服务与广告,(5) 工业控制与科学研究,(6)医疗影像与远程诊断,(7)多媒体办公系统,(8)多媒体技术在通信系统中的应用
3. 多媒体技术的核心问题包括:
(1)多媒体信号数字化与计算机获取技术;
l (2)多媒体数据压缩编码和解码技术;
l (3)多媒体数据的实时处理和特技效果技术;
l (4)多媒体数据的输出与回放技术。
4.略
5.略
6. 多媒体对象是异构型的,是由若干类型不一且具有不同特点的媒体对象复合而成。它们的数据量大,内部又存在着多种复杂的约束关系,其复杂程度远远高于传统的数据对象,特别是与传统应用相比,多媒体应用有着许多新的需求,如对连续媒体对象的实时处理、对数据对象内容的分析等。有鉴于此,传统的数据库已不适用于多媒体信息管理,因此必须研究新的多媒体数据库技术。
多媒体数据库一般可从以下三方面进行:
l (1)对现有的关系数据库模型进行扩充;
l (2)研究面向对象数据库等适应多媒体数据的新型数据库;
l (3)研究超文本/超媒体模型数据库。
第2章
一、 判断题
1.√ 2.× 3.√ 4.√ 5.× 6.× 7.√ 8.√
二、 选择题
1.D 2.B 3.A 4.D 5.C 6.D 7.C 8.A
三、 填空题
1.音调 音强 音色 2.有用信号的平均功率 噪声的平均功率
3.均匀 非均匀 4.采样频率、量化位数、通道(声道)个数
5.均匀量化PCM、非均匀量化PCM 自适应量化PCM
6.主轮廓 低复杂性轮廓 可变采样率轮廓
7.文本分析模块、韵律分析模块、语音生成模块
四、 简答题
1.人耳能识别的声音频率范围大约在20~20kHz,通常称为音频(audio)信号。决定音频信号波形的参数有采样频率、声道数、编码算法。
2.CD-DA数字音乐从10Hz 到22k Hz 、调频(FM)广播从20 Hz到15kHz、调幅(AM)广播从50Hz到7k Hz、电话从200Hz 到3.4k Hz。
3.所谓采样(sampling)就是在某些特定的时刻对模拟信号进行取值。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。若原有声音信号的频率为20kHz,则采样频率应为44kHz。
4. 将每个采样值在幅度上进行离散化处理的过程称为量化。若一个数字化声音的量化位数为16,则能够表示的声音幅度等级为216。
5.数字音频是一个数据序列,它是由模拟声音经采样、量化和编码后得到的。音频压缩编码就是在它的基础上进行的,利用编码技术节约信号存储空间。
6.PCM方法可以按量化方式的不同,分为均匀量化PCM、非均匀量化PCM和自适应量化PCM等几种。如果采用相等的量化间隔对采样得到的信号做量化,那么这种量化称为均匀量化。均匀量化PCM必须使用较多的量化位数。这样所记录和产生的音乐,可以达到最接近原声的效果。当然提高采样频率及分辨率后,将引起数据存储空间的增大。非均匀量化PCM,也称为μ律压扩方法。即让量化级高度随信号幅度而变化。可以在满足精度要求的情况下用较少的位数实现编码。为了进一步提高编码的性能,人们将自适应量化器和自适应预测器结合在一起用于DPCM之中,从而实现了自适应差分脉冲编码,它是一种有损压缩编码,记录的量化值不是每个采样点的幅值,而是该点的幅值与前一个采样点幅值之差,这样,每个采样点的量化位就不需要16bit,由此可以减少信号的容量。
7.从数据通信的角度,音频编码标准主要有三种:一是在电话传输系统中应用的电话质量的音频压缩编码技术标准,如PCM(ITU G.711)、ADPCM(ITU G.721)等,可满足电话级的语音质量要求;二是在窄带综合服务数据网传送中应用的调幅广播质量的音频压缩编码技术标准,如G.722, 可提供调幅广播级的语音质量要求;三是在电视传输系统、视频点播系统中应用的音频编码标准,如MPEG音频标准,可提供立体声声音质量
8.
44.1* 16 = 705.6 kbit/s
705.6 kbit/s*60/8=5292MB
9.数字音频实际上是一种数字式录音/重放的过程,它需要很大的数据量。在多媒体系统中,除了用数字音频的方式之外,还可以用采样合成的方式产生音乐。音乐合成的方式是根据一定的协议标准,采用音乐符号记录方法来记录和解释乐谱,并合成相应的音乐信号,这也就是MIDI(Musical Instrument Digital Interface)方式。
音乐合成器在需要播放这首乐曲时,根据记录的乐谱指令,生成音乐声波,经放大后由扬声器播出。音序器软件来采集MIDI电子乐器发出的一系列指令,这一系列指令可记录到以.MID为扩展名的MIDI文件中,在计算机上音序器可对MIDI文件进行编辑和修改,最后,将MIDI指令送往音乐合成器,由合成器将MIDI指令符号进行解释并产生波形,然后通过声音发生器送往扬声器播放出来。音源的作用是使用正弦波发生器来模拟音色。
10. MPEG-1的层1、2和3编码分别使用了听觉系统的人耳屏蔽特性。
11.当在一定的频率范围内, 同时存在能量相差一定程度的一强一弱两个音频信号时, 弱音将被强音掩蔽,人耳感觉不到。强音称为掩蔽音,弱音称为被掩蔽音,被掩蔽音刚能听到时的强度称为掩蔽阈值。
12.略
第3章
一、 判断题
1.√ 2.√ 3.× 4.√ 5.√ 6.√ 7.√ 8.√ 9.√
二、 选择题
1. A 2. C 3 .A 4. A 5. B 6.B 7. B 8. B
三、 填空题
1. 色调(hue) 饱和度(saturation) 明度(brightness) 2. 亮度信号 色差信号
3. 点 线 面 体 灰度 色彩 线型 线宽 4. RGB RGB HIS CMY
5. 直方图增强 空域滤波法 频率域滤波法 彩色增强法
6.投影重建方法 变换重建方法 级数展开重建方法 综合重建 体素级重建方法 切片级重建方法
7. 分析合成编码 基于知识的编码 模式编码 语义编码
8. BMP图像文件 PG图像文件 PCX图像文件 TIFF图像文件 GIF图像文件
四、简答题
1. 真彩色是指图像中的每个像素值都分成R、G、B 3个基色分量,每个基色分量直接决定其基色的强度,这样产生的颜色称为真彩色。
伪彩色图像的每个像素值实际上是一个索引值或代码,该代码值作为颜色查找表(CLUT,Color Look-Up Table)中某一项的入口地址,根据该地址可查找出包含实际R、G、B的强度值。这种用查找映射的方法产生的颜色称为伪彩色。
2.略
3.略
4.与模拟视频相比,数字视频有许多优点:适合于网络应用;再现性好;便于计算机编辑处理。
5. 略
第4章
一、 判断题
1.√ 2.√ 3.× 4.√ 5.√ 6.√
二、 选择题
1.C 2.A 3.A 4.A 5.C 6.D 7.D 8.C 9.C
三、 填空题
1. 一个编码器 一个解码器 2.定长游程编码 变长游程编码
3.无损预测编码 有损预测编码 4.MPEG JPEG
5.帧内预测编码 帧间预测编码 6.预测误差 编码效率
7.确定判别两个子块匹配的准则 寻找计算量最少的匹配搜索算法
四、简答题
1.影响数据压缩性能的主要因素有空间冗余,时间冗余,结构冗余,知识冗余,视觉冗余,图像区域的相同性冗余,纹理的统计冗余,到底能压缩多少,除了和图像本身存在的冗余度多少有关外,很大程度取决于对图像质量的要求。
2.DPCM为差分脉冲编码调制,ADPCM为自适应差分脉冲编码调制
后者对实际信号与按其前一些信号而得的预测值间的差值信号进行编码。话音信号样值的相关性,使差值信号的动态范围较话音样值本身的动态范围大大缩小,用较低码速也能得到足够精确的编码效果,在ADPCM中所用的量化间隔的大小还可按差值信号的统计结果自动适配,达到最佳量化,从而使因量化造成的失真亦最小。
3. 采用DCT进行变换编码时,通常首先将原始图像分成子块,对每一子块经正交变换得到变换系数,并对变换系数经过量化和取舍,然后采用熵编码等方式进行编码后,再由信道传输到接收端。在接收端,经过解码、反量化、逆变换后,得到重建图像。
4.子带编码技术依据人眼对不同频域段的敏感程度不同,图像信号可以划分为不同的频域段,例如,图像信号的主要能量集中在低频区域,它反映图像的平均亮度,而细节和边缘信息则集中在高频区域。子带编码的基本思想是利用一滤波器组,将采样将输入信号分解为高频分量和低频分量,然后分别对高频和低频分量进行量化和编码。解码时,高频分量和低频分量经过插值和共轭滤波器而合成原信号。是一种高质量、高压缩比的图像编码方法。
5. 定义在概率空间中每—事件的概率不相等时的平均信息量为信息熵,则信息熵H可采用如下公式计算:
对于图像来说,n=2m个灰度级为xi,则p(xi)为各灰度级出现的概率,熵即表示平均信息量为多少比特,换句话说,熵是编码所需比特数的下限,即编码所需要最少的比特。
6.统计编码属无损编码,它是根据消息出现概率的分布特性而进行的压缩编码。这种编码的宗旨在于,在消息和码字之间找到明确的一一对应关系,以便在恢复时能够准确无误地再现出来。统计编码又可分为定长码和变长码。
常用的统计编码有Huffman编码、行程编码和算术编码三种。
7.
信源出现的概率及其编码
元素XI
X1
X2
X3
X4
X5
X6
概率P(xi)
0.25
0.25
0.2
0.15
0.10
0.05
编码wi
00
11
10
001
0101
0100
8.
1) 编码器在开始时将“当前间隔”[ L,H] 设置为[0,1)。
2) 对每一事件,编码器按步骤(a)和(b)进行处理。
3) 编码器将“当前间隔”分为子间隔,每一个事件一个。
4) 一个子间隔的大小与下一个将出现的事件的概率成比例,编码器选择子间隔对应于下一个确切发生的事件相对应,并使它成为新的“当前间隔”。
5) 最后输出的“当前间隔”的下边界就是该给定事件序列的算术编码。
第5章
一、 选择题
1.C 2.D 3.C 4.C 5.D 6.D 7.A 8.B
二、 填空题
1.图像层(P) 块组层(GOB) 宏块层(MB) 块层(B)
2. 基本档次、主要档次 扩展档次
3.视频 音频 系统 4.宏块
5.时间域可分级编码、空间域可分级编码和信噪比可分级编码
6. VOP内宏块 VOP外宏块 边界宏块 7.多媒体内容描述接口
三、 简答题
1.JPEG编码的计算步骤包括图像准备,图像处理,量化和熵编码。
2.图像准备,图像处理,熵编码是无损的,量化是有损的。
3.略
4.MPEG-1是针对码率在1.5Mbit/s左右的数字存储媒体应用所制定的音视频编码标准,它包括系统、视频、音频、一致性和软件。MPEG-2根据应用的不同,MPEG-2的码率范围为1.5-100Mbit/s,一般情况下,只有码率超过4Mbit/s的MPEG-2视频,其视频质量才能明显优于MPEG-1。MPEG-4标准试图制定成为一个支持多种多媒体应用、支持基于内容的访问、支持根据应用要求现场配置解码器的标准。MPEG-7称为多媒体内容描述接口,目的是制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便更快更有效地检索信息。
第6章
一 判断题
1.√ 2.× 3.√ 4.√ 5.√ 6√ 7√ 8.√ 9×
二 选择题
1.A 2.B 3.C 4.A 5.C 6.B 7.B 8.C 9.A
三 填空题
1.多媒体计算机硬件系统 多媒体的软件系统 多媒体应用程序接口 多媒体著作工具及软件 多媒体应用系统
2.预处理部分 识别部分 后处理部分
3.CRT投影技术、LCD投影技术、DLP投影技术
4.视角度 点距和分辨率 亮度与对比度 反应速度 色阶
5.主机系统、音频与视频获取系统、磁盘存储系统 显示系统
6.分辨率、色彩位数 扫描速度
7.多媒体功能和通信支持功能
四 简答题
1.人机交互方式:光学字符识别(OCR)声音数据输入交互). 图像数据输入等
特点:与传统用户界面相比,引入了视频和音频之后的多媒体用户界面,最重要的变化就是界面不再是一个静态界面,而是一个与时间有关的时变媒体界面。
2.OCR技术实际上是计算机认字,也是一种文字输入法,它通过扫描和摄像等光学输 入方式获取纸张上文字方式图像信息,利用各种模式识别算法,分析文字形态特征,判断出文字的标准码,并按通用格式存储在文本文件中。OCR系统可分为3个部分:1.预处理部分;2.识别部分;3.后处理部分
3.常用的接口标准有:RS-232,USB,FIREEIRE(火线)等
4.根据记录方式不同,信息存储装置大致可以分为磁、光两大阵营。磁记录方式历史悠久,应用也很广泛。而采用光学方式的记忆装置,因其容量大、可靠性好、存储成本低廉等特点,越来越受世人注目。
5.媒体处理器与其他多媒体配件的最大不同之处在于,媒体处理器具有灵活的软件驱动程序,能适应多种应用。
6.略
第7章
一、判断题
1.× 2.√ 3.√ 4.√ 5.× 6.× 7.× 8.√ 9.× 10.√
二、选择题
1. B 2. C 3. D 4. A 5. B 6. A 7. C 8. B 9. D
三、填空题
1、 多媒体信息网、络结构形式、交互特征
2、 能创建和实现独立于平台的文档、能与Internet上其他文档相连、能够使WWW页面包括图形和多媒体、能够链接Internet上的其他资源
3、 表现层——用户接口、超文本抽象机层——节点和链、数据库层——存储、共享数据和网络访问
4、 基于卡片或页面的工具、基于图标的事件驱动工具、基于时间线的创作工具
5、 超媒体应用、超媒体工具
6、 浏览器(Viewer)、文献控制系统(DCS)、过滤器(Filter)、过滤器管理系统(FMS)
四、简答题
1、 超文本和超媒体的结构由节点、链、网络、宏节点和热标五个基本元素组成。
节点是表达信息的基本单位,可以是文本、图像、视频、音频、动画或一段计算机程序等各种媒体信息以及它们的组合,其内容还包括对媒体数据属性的描述和表现方法。
链,又称超链(Hyper Link),是超媒体的组成部分。它将节点链接在一起,描述节点之间的关系。超媒体中的链是超媒体系统的本质,它是模拟人脑思维的自由联想功能。所谓自由联想是指人思考问题时经常自然而然地由一个概念转移到另一相关概念地思维方式。超媒体中的链是用户由一个节点转移到下一个相关节点的有效手段,达到实现非线性检索信息的目的。链是具有方向性的,由三个部分组成:链源、链宿以及链的属性。
超文本信息网络是由节点和链构成的一个有向信息网络,这种信息网络类似于人工智能中的语义网络,语义网是一种知识表示方法,其中节点表示概念,而节点之间的弧表示两个概念之间的关系。网络结构中信息块的排列没有单一、固定的顺序,每一节点都包含多个不同的选择,可由用户自由选择。超媒体中的网络结构不仅仅提供了知识、信息,同时还包含对知识信息的分析和推理。
宏节点是指链接在一起的节点群。准确地说,一个宏节点就是超文本网络的一部分,即子网(Web)。通过一个层次的超文本网络管理会很复杂,因此分层是简化网络拓扑结构最有效的方法。计算机网络中,很多超媒体的Web网分散在多台计算机中,这些Web网称为宏节点或者文献,它们之间通过跨越计算机网络的链进行链接。
热标是超媒体中特有的元素,它确定相关信息的链源,通过它可以引起相关内容的转移。热标可分为热字、热区、热元、热点和热属性五类。
2.宏文本和微文本表示不同层次的超文本。微文本也称小型文本,支持对节点信息的浏览;宏文本也称大型超文本,支持对文献(宏节点)的查找与索引,它强调存在于许多文献之间的链,可以跨越文献进行查询和检索。
组文本及专家文本(省略)
3.链,又称超链(Hyper Link),是超媒体的组成部分。由三个部分组成:链源、链宿以及链的属性。
根据超链的特点及功能,链可以分为基本结构链、组织链和推理链三大类型。基本结构链:是一种由超媒体系统作者事先说明的,具有固定明确特点的实链。基本链用来建立节点之间基本顺序的链,它使信息在总体上呈现出层次结构。组织链和推理链可以分为索引链、蕴含链和执行链。在智能超文本系统中,推理链是由谓词定义的。因此,可以通过逻辑编程来增强超媒体嵌入谓词的能力,并在逻辑运算过程中建立相应的链。推理链是一种虚链或称之为动态链。
4.超文本抽象机层介于数据库层和用户接口层之间,决定了超文本系统节点和链的基本特点,记录了该节点之间链的关系,并保存了有关节点和链的结构信息。是实现超文本输入/输出格式标准化转换的最佳层次,因为数据库层在存储格式上依赖于不同的机器,用户接口层各超文本系统之间差别甚大,难以统一。
Dexter模型也分为三层:内部成员层、存储层和运行层,各层之间通过定义好的接口相互连接。内部成员层描述超文本中成员的内容和结构,对应于各个媒体单个应用成员。存储层和内部成员层之间的接口即为锚接口,锚接口的标识即能被链引用的标识符。
存储层是描述成员和链的网络。成员是由存储层提供的基本对象,它包括内容、属性、描述规范和一个锚接口集合等。原子成员是最小成员单位,也就是超文本中的节点,其内容可为不同媒体的信息。复合成员是具有嵌套层次的成员。链成员的内容为一个连接表,各个表中都含有相关成员的描述规范、成员标识和锚接口标识。
运行层描述支持用户和超文本交互作用的机制,负责在运行时处理链、锚接口和成员。运行层的对象包括管理支持特殊超文本交互作用的会话以及管理与特殊成员交互作用的实例。运行层具有独立的用户接口工具,介于存储层和运行层之间的接口提供确定各个成员在运行时表现的描述规范等内容。
5. XML是一种可扩展的标记语言(Extensible Markup Language),虽然也是用标记表示数据,但是它的标记说明了数据的含义,而不是如何显示。XML是一种可扩展的标记语言(Extensible Markup Language),虽然也是用标记表示数据,但是它的标记说明了数据的含义,而不是如何显示。
XML的主要组成部分是XML包含三个要素:文档类型声明DTD(Document Type Definition)或者XML Schema,可扩展样式语言XSL(eXtensible Stylesheet Language),以及可扩展链接语言Xlink(eXtensible Link Language)。
6.超文本可以简单地定义为收集、存储和浏览离散信息,以及建立和表示信息之间关系的技术。它采用一种非线性的网状结构组织块状信息,没有固定的顺序,也不要求读者必须按某个顺序来阅读。以缩微胶卷的形式存储书籍、照片、记录和信件,而且在页边加上注释和说明;人们按照联想存储的方式就可以快速、方便地得到各种存储的信息。
超文本概念早于计算机的诞生。在超文本发展的过程中,最新的多媒体技术与人工智能相结合,产生了一些有较大影响的大型产品。
作者子系统通过向用户提供生成超媒体的手段,包括编辑器、超媒体语言,媒体编辑工具等,将零散的多媒体数据组成具有丰富表现的超媒体应用网络。
读者子系统向用户提供使用超媒体应用的手段,主要包括浏览器以及其他的一些读者工具,用于协助用户使用超媒体的文献和数据。浏览器的主要作用是,一方面使用户在超媒体信息网络中能够快速定位、查询,收集有关的信息和数据;另一方面防止用户在复杂的超媒体信息网络中迷失航向。这里只介绍几种常用的导航工具:导航图、查询系统、线索、遍历和书签。
在超媒体信息网络中查找信息,通常的方法是首先查询控制节点或索引节点,由它提供给用户完整的信息网络轮廓或更细致的局部轮廓,再逐步跟踪相关节点缩小搜索范围,直到找到所需信息。
用户在使用超媒体文献时就可以沿着某个线索浏览,阅读线索建立者对各种故事、插图或新词等的评注,就像看评论员文章一样。建立线索这种导航方式,对于超媒体信息网络而言是一个非常有用的工具,因为一旦读者掌握了线索,就能对问题定位并可重新调整网络结构。
现代的超媒体应用更趋向于自动地通过内容寻找源地和目的地,也就是锚地,而不管它们是如何表现、在什么位置上。
超媒体语言能以一种程序设计的方法来描述超媒体信息网的构造、节点和各种属性。虽然交互式的操作非常易于使用,但对大批量的数据创作整理和更新来说,用程序语言的方式更能体现创作者的意图。
7.略
第8章
一、判断题
1.× 2. √ 3. × 4. √ 5. √ 6. ×
二、选择题
1.ABC 2.ABCD 3. ABC 4.ABCD 5.A
三、填空题
1.光盘存储系统 高速磁盘存储
2.扩展字段长度 扩展为对象采用面向对象的方案
3.数据对象类型的集合 操作的集合 通用完整性规则的集合
4.图像像素级的物理表示或称物理层表示
5.基于传统的数据库检索方法 基于信号处理理论
四、简答题
1.相同点:他们都属于数据库系统,都满足数据库的特点。
不同点:传统数据库模型主要针对的是整数、实数、定长字符等规范数据。数据库的设计者必须把真实世界抽象为规范数据。传统数据模型只是对数据本身的信息内容进行建模,以表达语义。
多媒体数据库主要针对的是在引入图像,声音、动态视频等多媒体信息后,由于多媒体数据不规则,没有一致的取值范围,没有相同的数据量级,也没有相似的属性集等产生的。建模过程中对多媒体数据时空关系的建模是多媒体数据模型的一个重要组成部分。
2. 能够表示各种不同媒体数据的构造及其属性特征;能够指出不同媒体数据之间的相互关系,包括相互之间的信息语义关系,以及媒体特性之间的关系,主要是时空特性关系。
3. 对多媒体数据时空关系的建模是多媒体数据模型的一个重要组成部分,是传统数据模型所不具有的。传统数据模型只是对数据本身的信息内容进行建模,以表达语义。而在多媒体信息系统中,还存在另外一个重要方面——表现。可以说表现(Presentation)是多媒体信息系统所特有的,它不同于一般系统的显示,它是多种媒体的合成再现,加工再现,有交互性参与的创作再现。所以关于表现的模型是多媒体数据模型的一个重要组成方面。
4. 如何使系统直接从各种媒体中获取信息线索,并将这些线索用于数据库中的检索操作,帮助用户从数据库中检索出合适的多媒体信息对象,这就是基于内容检索的主要研究内容。要实现对媒体基于内容的检索,多媒体系统必须能够从媒体数据中分析、提取出可供检索的内容特征,并将这些内容特征进行结构化的表示。相对于媒体数据层次的处理过程,将对媒体语义层次的处理称为媒体的内容处理。
5.基于内容检索技术一般用于多媒体数据库系统之中,也可以单独建立应用系统,例如指纹系统、头像系统或其他的应用系统。他主要包括基于内容的图像检索和基于内容的视频检索。
6.略
7.目前,应用较多、较成熟的多媒体数据库都是通过对关系模型数据库的扩展来实现对多媒体数据的存储与管理的。在未来的多媒体数据库技术的发展中,面向对象的多媒体数据库将以对象媒体数据模型来建构多媒体数据库,从而真正实现多媒体数据库。
基于内容的检索技术面临许多挑战,例如:如何建立语义层次的描述,使用户自然的与检索系统交互,又如如何挖掘更多的实际应用场合,使检索技术真正的使用起来。
8. 由于多媒体数据的特殊性,传统的数据管理技术难以胜任,需要建立多媒体数据库和多媒体数据库管理系统。且具有以下功能。
1)必须能表示和处理各种媒体的数据,特别是非格式化数据,如图形、图像、音频和视频等。
(2)必须能反映和管理各种媒体数据的特性以及各种媒体数据之间的空间、时间的关联性。
(3)必须能满足媒体数据独立性的要求。媒体数据独立性是指在MDBMS的设计和实现时,要求系统能保持各种媒体的独立性和透明性,即用户的操作可最大限度地忽略各种媒体的差别,而不受具体媒体的影响和约束;同时要求它不受媒体变换的影响,实现复杂数据的统一管理。
(4)必须能提供媒体数据的操作功能,如基于内容的检索、媒体浏览操作等。
(5)应具有网络功能,目前多媒体应用一般以网络(尤其是宽带局域网)为中心,应解决分布在网络上的多媒体数据库中数据的定义、存储、操作问题,并对数据一致性、安全性、并发性进行管理。
(6)应具有开放功能,提供多媒体数据库的应用程序开发接口API,并提供独立于外设和格式的接口。同时,还应提供事务和版本管理的功能
第9章
一、填空题
1.人与环境融合技术、物体对象的仿真技术、VR图像生成技术及高效快速生成体系图技术、 实时处理及并发处理的多维信息表示技术、 高性能的计算机图形处理硬件研究、分布式虚拟环境和基于网络环境的虚拟现实研究
2.几何仿真 物理仿真 行为仿真
3.虚拟世界 虚拟现实软件 计算机 输入设备 输出设备
4.沉浸 交互 构想
5.简易型虚拟现实系统 沉浸型虚拟现实系统 共享型虚拟现实系统
6.科学研究和科学计算可视化 工程应用 商业应用 军事应用 医学应用 教育培训、娱乐应用 虚拟实验室
7. .wrl
二、简答题
1.虚拟现实系统按其功能不同,可分成三种类型。
(1) 简易型虚拟现实系统
(2) 沉浸型虚拟现实系统
(3) 共享型虚拟现实系统
无论是哪—种虚拟现实系统,都有沉浸、交互和构想这三个基本特征。
2.虚拟现实系统主要的建模技术有:
(1)人与环境融合技术
(2) 物体对象的仿真技术
(3) VR图像生成技术及高效快速生成体系图技术
(4) 实时处理及并发处理的多维信息表示技术
(5) 高性能的计算机图形处理硬件研究
(6) 分布式虚拟环境和基于网络环境的虚拟现实研究
3. 略
4.略
5.略
6.略
第10章
一、 判断题
1.× 2. √ 3. √ 4. × 5. √
二、 选择题
1. A 2.A 3.ABCD 4.B 5.C 6.C 7.A、C、B 8.B
三、 填空题
1. 下载 流式传输
2. 网络通信 多媒体数据采集 多媒体数据压缩 多媒体数据存储 多媒体数据传输 流式传输
3. 实时流式传输 渐进流式传输
4. HTTP/TCP RTP/UDP
5. 媒体内容制作 媒体内容管理 用户管理 视频服务器 客户端播放系统
6. AVICAP.DLL MSVIDEO.DLL MCIAVI.DRV AVIFILE.DLL ICM ACM
7.创建“捕获窗” 关联捕获窗和驱动程序 打开预览
8.QuickTime Streaming Server RealServer Windows Media Server RTSP MMS(Microsoft Media Server)。
9.登记 授权 计费 认证
四、简答题
1.在网络上传输音/视频(A/V)等多媒体信息,目前主要有下载和流式传输两种方式。如果采用下载方式下载一个音/视频文件,常常要花数分钟甚至数小时。这主要是由于音/视频文件一般都较大,所需的存储容量也较大;再加上网络带宽的限制,所以这种方法延迟很大。流式传输则把声音、影像或动画等时基媒体通过音/视频服务器向用户终端连续、实时地传送。采用这种方式时,用户不必等到整个文件全部下载完毕,而只需经过几秒或几十秒的启动延时即可进行播放和观看。当声音等时基媒体在客户机上播放时,文件的剩余部分将在后台从服务器上继续下载。流式传输不仅使启动延时成十倍、百倍地缩短,而且不需要太大的缓存容量。流式传输避免了用户必须等待整个文件全部从Internet上下载完毕后才能观看的缺陷。信号在发送端应做压缩处理。
2.略
3.在流式传输的实现方案中,一般采用HTTP/TCP来传输控制信息,而用RTP/UDP来传输实时音/视频数据。
4.略
第11章
一、 判断题
1.× 2. × 3. √ 4. × 5. ×
二、 选择题
1. ABCD 2.ABCD 3.AB 4.AC 5.D
三、 填空题
1. 消息内容分析 通信量分析
2. 不可见性 鲁棒性 安全性
3. 水印生成 水印嵌入 水印检测
4. JPEG压缩攻击、图像增强处理攻击、噪声攻击、几何变形攻击、打印扫描攻击、共谋攻击、嵌入多重水印攻击、Oracle攻击
5. 原始视频水印算法 编码域视频水印算法 压缩域视频水印算法
四、 简答题
1.多媒体信息安全的要素包括:机密性、完整性、可用性、可控性和不可抵赖性。
完整性是指信息在存储或传输过程中保持不被修改、不被破坏、不被插入、不延迟、不乱序和不丢失的特性。破坏信息的完整性是对信息安全发动攻击的目的之一。
可用性是指信息可被合法用户访问并按要求顺当使用的特性,即指当需要时可以取用所需信息。对可用性的攻击就是阻断信息的可用性,例如破坏网络和有关系统的正常运行就属于这种类型的攻击。
保密性是指信息不泄漏给非授权的个人和实体,或供其利用的特性。
不可抵赖性是防止发送方或接收方抵赖所传输的消息。因此,当发送一个消息时,接收方能够证实该消息的确是由所宣称的发送方发送的。类似地,当接收到一个消息时,发送方能够证实该消息的确是由所宣称的接收方接收的。
可控性是指授权机构可以随时控制信息的机密性。
2.常用的多媒体攻击可根据被动攻击和主动攻击来进行分类:
被动攻击本质上是在传输过程中的偷听或监视,其目的是从传输中获得信息。两类被动攻击分别是消息内容分析和通信量分析
第二种主要攻击类型是主动攻击,这些攻击涉及对某些数据流的篡改或一个虚假流的产生。这些攻击还能进一步划分为四类:伪装、重放、篡改消息和拒绝服务。
3.多媒体信息保护策略主要有数据置乱、数字信息隐藏、数字信息分存、数据加密、认证及防病毒等。
4.按信息隐藏技术包含的内容进行分类:
分为隐藏术(Steganography)、数字水印(Digital Watermarking)、数据隐藏和数据嵌入(Data hiding and data embedding)、指纹和标签(Fingerprinting and Labeling)等。
息隐藏有广泛的应用领域。如隐蔽通信中,可以隐藏通信的收发双方,以及通信过程的存在。版权保护,可以用于确认数据的作者和数据的合法使用者。此外,还可以用于确认数据的真实性、完整性,提示被篡改情况等。
5.略
6.
(1)水印嵌入量受限于采样频率。
(2)由于传播途径不同,音频信号的幅度、量化方式和时域采样率在传输过程中都有可能发生改变,从而可能破坏水印信息。
(3)音频水印算法要兼顾人耳听觉特性,满足不可感知性。其次,人耳对音频信号的绝对相位不敏感,而只对其相对相位敏感。最后,人耳对不同频率段声音的敏感度不同。
(4)音频信号具有特定的攻击,如回声、时间缩放。
展开阅读全文