1、资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。 数字电视技术结构 数字电视技术由两大部分组成, 即系统技术和应用技术。 系统技术主要包括条件接收技术( CAS) 、 复用/解复用技术、 用户管理技术( SMS) 、 节目管理技术( PMS) 四大部, 其中, CAS、 SMS、 PMS是构成可管理、 可控制数字电视播出系统的技术核心。 应用技术是支持VOD、 EPG、 数据广播、 交互游戏和交互证券等业务的软件技术。应用软件在系统前端和用户端设备中运行时, 需要建立一个开放的运用环境, 需要与系统软件进行接口, 这个运用环境和程序接口的建立由中间件系统来完成, 因此,
2、中间件系统在结构层次上位于系统技术和应用技术之间, 是系统平台对综合业务( 综合性和交互性) 开放的支撑技术。 复用/解复用技术由GB/T17957.1、 ISO/ICE13818描述, 它所规定的TS流是运载由CAS、 SMS、 SMS关联生成的控制信息、 PSI/SI信息、 图像/伴音信息的载体, 处于系统技术的最低层, 是整个系统平台的物理支撑。 条件接收技术( CAS) 是提供对数字电视用户业务进行授权和认证的一种技术手段, 通俗地讲, 是对视频、 音频和数据等信息实施加密、 解密、 接收的控制技术。CAS是实现容许被授权的用户使用某一业务; 未经授权的用户不能使用某一业务的系统技
3、术, 能够对数字电视业务按时间、 频道和节目进行有效的控制和管理。数字电视一般采用机顶盒( STB) +智能卡的方式实现用户端对数字电视节目的条件接收。 第一讲数字电视概述 电视技术, 经历着从黑白电视到彩色电视的发展过程, 有的国家已开始试播高清晰度电视和立体电视。中国决定从1999年10月1日起开始试播高清晰度电视(HDTV)。电视的使用范围早已超越了广播娱乐界, 并深深地扩展到文化教育、 科研管理、 工矿企业、 医疗卫生、 公安交通、 军事宇航等各个重要部门。现在的彩色电视虽已发展到色彩鲜艳, 形象逼真的高超地步, 可是, 它们依然是”模拟电视”。在图像信号的制作处理、 控制调节、
4、记录重放、 调制解调、 传输转播、 接收显示等过程中, 图像信号和伴音信号都是在时间轴上和振幅轴上连续变化的模拟信号。模拟电视最明显的缺点是接力传输方式产生噪声, 长距离传输的信噪比恶化, 使图像清晰度越来越受到损伤; 发送传输设备中, 放大器的非线性积累使图像对比度产生越来越大的畸变; 相位失真的积累产生色彩失真, 使”鬼影”现象愈来愈严重。同时, 模拟电视还具有稳定度差、 可靠性低、 调整繁杂、 不便集成、 自动控制困难、 以及成本高昂等缺点。近十多年来, 由于微电子技术、 超大规模集成电路技术、 数字信号处理技术、 计算机技术的突飞猛进, 使数字电视的发展已取得了令人鼓舞的成果。特别是数
5、字图像获取、 数字存储、 位图打印和图形显示的数字设备的出现,带来了许多数字图像方面的应用。技术先进国家的电视演播室设备数字化已完成, 数字电视接收机已上市出售, 各种数字图像编码压缩设备随多媒体技术的发展已投人使用。国际上也相应地制定了统一的数字电视信号的编码标准, 为数字电视的发展奠定了坚实的基础。 所谓数字电视, 是将传统的模拟电视信号经过抽样、 量化和编码转换成用二进制数代表的数字式信号, 然后进行各种功能的处理、 传输、 存储和记录, 也能够用电子计算机进行处理、 监测和控制。采用数字技术不但使各种电视设备获得比原有模拟式设备更高的技术性能, 而且还具有模拟技术不能达到的新功能,
6、使电视技术进入崭新时代。 数字电视技术与原有的模拟电视技术相比, 有如下优点: (l)信号杂波比和连续处理的次数无关。电视信号经过数字化后是用若干位二进制的两个电平来表示, 因而在连续处理过程中或在传输过程中引入杂波后, 其杂波幅度只要不超过某一额定电平, 经过数字信号再生, 都可能把它清除掉, 即使某一杂波电平超过额定值, 造成误码, 也能够利用纠错编、 解码技术把它们纠正过来。因此, 在数字信号传输过程中, 不会降低信杂比。而模拟信号在处理和传输中, 每次都可能引入新的杂波, 为了保证最终输出有足够的信杂比, 就必须对各种处理设备提出较高信杂比的要求。模拟信号要求S/N>40dB,
7、而数字信号只要求S/N>20dB。模拟信号在传输过程中噪声逐步积累, 而数字信号在传输过程中, 基本上不产生新的噪声, 也即信杂比基本不变。 (2)可避免系统的非线性失真的影响。而在模拟系统中, 非线性失真会造成图像的明显损伤。 (3)数字设备输出信号稳定可靠。因数字信号只有”0”、 ”l”两个电平, ”l”电平的幅度大小只要满足处理电路中可能识别出是”l”电平就可, 大一点、 小一点无关紧要。 (4)易于实现信号的存储, 而且存储时间与信号的特性无关。近年来, 大规模集成电路(半导体存储器)的发展, 能够存储多帧的电视信号, 从而完成用模拟技术不可能达到的处理功能。例如, 帧存储器可用
8、来实现帧同步和制式转换等处理,获得各种新的电视图像特技效果。 (5)由于采用数字技术, 与计算机配合能够实现设备的自动控制和调整。 (6)数字技术可实现时分多路, 充分利用信道容量, 利用数字电视信号中行、 场消隐时间, 可实现文字多工广播(Teletext) (7)压缩后的数字电视信号经数字调制后, 可进行开路广播, 在设计的服务区内(地面广播), 观众将以极大的概率实现”无差错接收”(发”0”收”0”, 发”l”收”l”), 收看到的电视图像及声音质量非常接近演播室质量。 (8)能够合理地利用各种类型的频谱资源。以地面广播而言, 数字电视能够启用模拟电视的”禁用频道”(tabooc
9、hannel), 而且在今后能够采用”单频率网络”(singlefrequencynetwork)技术, 例如l套电视节目仅占用同1个数字电视频道而覆盖全国。另外, 现有的6MHz模拟电视频道, 可用于传输l套数字高清晰度电视节目或者4-6套质量较高的数字常规电视节目, 或者16-24套与家用VHS录像机质量相当的数字电视节目。 (9)在同步转移模式(STM)的通信网络中, 可实现多种业务的”动态组合”(dynamiccombination)。例如, 在数字高清晰度电视节目中, 经常会出现图像细节较少的时刻。这时由于压缩后的图像数据量较少, 便可插入其它业务(如电视节目指南、 传真、 电子游
10、戏软件等), 而不必插入大量没有意义的”填充比特”。 (10)很容易实现加密/解密和加扰/解扰技术, 便于专业应用(包括军用)以及广播应用(特别是开展各类收费业务)。 (ll)具有可扩展性、 可分级性和互操作性, 便于在各类通信信道特别是异步转移模式(ATM)的网络中传输, 也便于与计算机网络联通。 (12)能够与计算机”融合”而构成一类多媒体计算机系统, 成为未来”国家信息基础设施”(NII)的重要组成部分。数字电视不进行数据压缩时, 数码率太高。例如, 亮度信号抽样频率一般选为13.5MHz(3倍彩色副载波频率), 每样品值经8比特量化后, 码率为13.5×8=108Mbit/s。两
11、个色差信号R-Y、 B-Y抽样频率, 分别为6.75MHz(3/2倍彩色副载波频率), 每样品值经8比特量化后为54Mbit/s。因此在不采用任何压缩措施时, 总的数码率为108十54十54=216(Mbit/s)。这相当于3000多路数字电话话路。从理论上讲, PCM二进制传输信道每lHz带宽能传输的最高码率是2bit/s。因此, 这相当于要求信道提供108MHz的带宽, 是现有视频信号带宽的10倍以上。因此说, 不压缩时的数字电视信号的数码率太高, 频带太宽, 从通信系统的观点来看, PCM传输方式是以带宽为代价换取高的传输质量。为了提高图像通信的有效性, 一般不采用直接PCM方式传输,
12、而是对数字化后的信源信号先进行数据压缩, 然后再传输。现正已提出、 并正在探索各种数据压缩措施, 可望数码率大大降低。例如: 美国所提出的全数字高清晰度电视方案, 数据压缩后的信号带宽, 可做到与普通NTSC彩色电视信号的带宽相同(6MHz), 但图像质量实现了跃。按当前的国际水平, 已实现的把一路普通彩色数字电视216Mb/s的数码率压缩到8.448Mb/s, 它是未压缩前数据量的3.7%, 相当于模拟信号带宽为4MHz,但与模拟彩色电视相比, 其主观图像质量没有任何降低。另外, 彩色数字会议电视系统, 其数码率的国际标准为2.048Mb/S, 数据量仅为未压缩前的1%, 图像质量也能够达到
13、满意的程度。可见, 数据压缩的前景可观。数字调制技术更是方兴未艾。而且, 8.448Mb/s的数字电视信号, 经数字调制以后的模拟带宽可降到1.2MHz, 则在6MHz带宽中, 可传5路8.448Mb/s经调制以后的数字电视信号。 当前已被采用的数字电视设备有: 数字特技、 数字时基校正器、 数字帧同步机、 数字录像机、 数字电视接收机等。数字化设备可大大扩展特技功能, 加强艺术效果。从整个电视系统来说, 发展数字电视能够分两步走: (l)局部设备数字化。即摄像机输出为模拟信号, 经模拟、 数字转换(A/D)变成数字信号, 在演播室的数字设备中进行处理, 如数字特技处理等, 处理完后, 又转
14、换成(D/A)模拟信号, 再用电视发射机发射。接收机收到信号以后, 检波成视频信号, 再经A/D变换成数字信号, 在接收机中进行数字处理(如数字降噪、 数字轮廓校正、 数字去重影、 画中画等), 再由D/A变换在显像管上显示出高度清晰、 噪声很小的鲜艳图像。(2)全系统实现数字化, 即把要发送图像直接变换成数字信号, 经编码压缩再变换成适合于传输的码型, 在数字微波、 数字光纤信道上传输, 在接收端再将所收到的数据恢复成电视图像, 在通道的所有环节上电视信号都是以数字形式传送的。图l-l为演播室数字处理框图。信号源为彩色摄像机送出R、 G、 B信号后, 均经A/D变换成数字视频信号送至节目制作
15、单元, 同时还有数字录像机、 数字特技以及数字制式转换器送来的信号均送入节目制作单元中, 经节目制作以后的信号, 再送至D/A变换器中, 变成模拟信号, 然后送往电视发射机。图l-2为数字电视传输系统框图。发端由摄像机产生彩色电视图像, 经A/D变换后, 变为数字视频信号送入信源编码中。信源编码承担着图像数据压缩功能, 它去掉信号中的冗余部分, 使传输码率降低。经信源编码后的图像信号送入多路复用器中与数字音频信号进行多路复用, 然后送入信道编码器, 信道编码即为纠错编码, 提高信号在传输中的抗干扰能力。这是因为数据码流经长距离传输后不可避免地会引入噪声而发生误码。因此, 加入纠错码以提高其抗干
16、扰能力。经纠错编码后的信号送入输出接口电路。输出接口电路起码型变换作用, 即把单极性码变成有利于传输的双极性码。远距离传输时, 能够采用数字微波线路, 也能够采用数字光纤线路, 以接力传输方式, 站与站的距离可达50公里。收端的过程与发端相反, 接收端收下信号后, 输入接口电路把双极性信号变为单极性信号, 再送入信道解码中, 在信道解码中可纠正由传输所造成的误码, 然后信号送入解多路复用, 再分别送入视频、 音频处理电路中, 还原成模拟的视频、 音频信号。 图l-l演播室数字处理框图 图l-2数字电视传输系统框图 数字电视接收机框图如图l-3所示, 电视接收天线接收下来的信号经高
17、频通道、 中频放大, 然后, 送至视频检波得到模拟信号。再经A/D变换, 变为数字信号, 送入数字处理器中, 进行数字降噪、 数字轮廓校正、 数字去重影、 行频加倍、 去闪烁处理、 画中画处理等, 最后送入D/A变换器中, 变成模拟信号供显象管显示。电视发射高频部分和电视接收高频通道部分均为模拟系统, 这是因为在接近1000MHz频率要实现数字化,就当前的技术水平不可能完成。 图l-3数字电视接收机框图 对数字电视信号进行编码,可分为全信号编码和分量编码, 如图l-4所示。其中图(a)为全信号编码, 图(b)为分量信号编码。从图(a)能够看出, 模拟全电视信号经A/D变换, 变为数字信
18、号, 经数字处理后, 再送入D/A变换, 还原成模拟全信号。全信号编码, 从框图上看似乎很简单, 但这种方法易造成亮、 色干扰。特别对SECA制(东欧国家彩色电视制式)来说, 由于色差信号对副载频的调制方式是调频的, 难于采用全信号编码, 只能采用分量编码。图(b)是分量信号编码框图, 模拟全信号经A/D变换后, 再经数字亮、 色分离, 分成数字亮度信号和数字色差信号, 送入数字信号处理器中, 经处理后的信号再经数字式全信号编码, 然后经D/A变成模拟全信号。该图虽增加数字亮、 色分离和数字式全信号编码, 但数字处理是对分量信号进行的, 消除了亮、 色干扰现象。这种处理方式可使图像质量提高,
19、因此应用较为广泛, 国际标准也建议采用分量信号编码方式。从数宇电视发展的趋势来看, 可有如下进程:第一步实现普通电视的数字化, 利用MPEG-l的国际标准, 将数据率压缩到2.048Mb/s速率, 其图像质量可优于家用录像机VHS的质量。第二步按MPEG-2标准中的主级标准, 将数据率压缩到8.448Mb/s, 其图像质量可达现有电视演播室的质量。第三步按MPEG-2的高级标准, 将数据率压缩到20Mb/s左右, 其图像质量可达HDTV的质量。将来, 人们不会只满足于HDTV, 还会有更高级的电视。例如, 可能出现垂直和水平清晰度分别为现有电视的4倍和8倍的特高清晰度电视(UDTV)和超高清晰
20、度电视(SDTV), 扫描行数可达2248行, 其图像质量可达70mm电影的水平。 图l-4全信号编码和分量编码 第二讲数字电视的国际标准 自1948年提出视频数字化概念后,经过将近40年的探索,于1982年提出了电视演播室数字编码的国际标准(CCIR601号建议);又于1984年提出了第一个实用化的、 适应于会议电视和可视电话要求的H.261标准;1993年公布了活动图像的编码压缩标准MPEG-1;1994年发表了MPEG-2标准,该标准向下兼容MPEG-1,向上兼容HDTV的图像质量;1999年公布了MPEG-4标准;今后还计划发表MPEG-7标准。下面将上述国际标准逐一介绍。
21、 2.1.CCIR601号建议 为了便于国际间的节目交换, 为消除数字设备之间的制式差别,和为625行电视系统与525行电视系统之间兼容, 在1982年2月国际无线电咨询委员会(CCIR)第15次全会上, 经过了601号建议, 确定以分量编码为基础,即以亮度分量Y、 和两个色差分量R-Y、 B-Y为基础进行编码,作为电视演播室数字编码的国际标准。 该标准规定:(1).不论是PAL制, 还是NTSC制电视,Y、 R-Y、 B-Y三分量的抽样频率分别为13.5MHz、 6.75MHz、 6.75MHz。(2).抽样后采用线性量化, 每个样点的量化比特数用于演播室为10bit,用于传输为8bit
22、3).Y、 R-Y、 B-Y三分量样点之间比例为4:2:2。 在1983年9月召开的国际无线电咨询委员会(CCIR)中期会议上, 又作了三点补充: (l)明确规定编码信号是经过γ预校正的Y、 (R-Y)、 B-Y)信号; (2)相应于量化级0和255的码字专用于同步, l到254的量化级用于视频信号;(3)进一步明确了模拟与数字行的对应关系, 并规定从数字有效行末尾至基准时间样点的间隔, 对525行、 60场/秒制式来说为16个样点, 对625行、 50场/秒制式则为12个样点。不论625行/50场或525行/60场, 其数字有效行的亮度样点数都是720, 色差信号的样点数均是360,
23、这是为了便于制式转换。若亮度样点数被2除, 就得到色差信号的数据。 2.2.H·261标准 1984年国际电报电话咨询委员会的第15研究组成立了一个专家组,专门研究电视电话的编码问题, 所用的电话网络为综合业务数据网络ISDN, 当时的目标是推荐一个图像编码标准, 其传输速率为m×384kb/s(千位/秒), m=l,2,3,4,5。这里384kb/s在ISDN中称为Ho通道。另有基本通道B的速率为64kb/s,6×B=384kb/s。5×Ho=30×B=1920kb/s为窄带ISDN的最高速率。后来因为384kb/s速率作为起始点偏高, 广泛性受限制, 另外跨度也太大, 灵活性受影响,
24、因此改为p×64kb/s,p=l, 2,3,..30。最后又把p扩展到32, 因为32×64kb/s=2084kb/s,其中2084=211, 基本上等于2Mb/s,实际上已超过了窄带ISDN的最高速率1920kb/s, 最高速率也称通道容量。经过5年以上的精心研究和努力, 终于在1990年12月完成和批准了CCITT推荐书H.261, 即”采用p×64kb/s的声像业务的图像编解码”, H.261简称p×64。 由于H.261标准是用于电视电话和电视会议, 因此推荐的图像编码算法必须是实时处理的, 而且要求最小的延迟时间, 因为图像必须和语音密切配合, 否则必须延迟语音时间。当p取l或2时
25、 速率只能达到128kb/s,由于速率较低只能传清晰度不太高的图像, 因此适合于面对面的电视电话。当p>6时, 速率>384kb/s则速率较高, 能够传输清晰度尚好的图像, 因此适用于电视会议。 2.3.JPEG标准 静像数据压缩标准JPEG(JointPhoto一graphicExpertsGroup), 直译为联合摄影术专家组, 其中联合是指几个国际组织的联合。它是从1986年正式开始制订的。当时由两个国际组织联合支持, 其一,是国际标准组织ISO;其二,是国际电报电话咨询委员会CCITT。到1987年l1月, 国际电工委员会IEC也参加合作, 因此说JPEG是三个国际组织合作的成果
26、虽然从1986开始, 经过许多次国际会议讨论和修改后, 于1992年7月2日表决经过标准的第一部分, 可是可能对有关测试标准草案(即标准的第二部分)作进一步修改。JPEG是ISO的标准,同时也CCITT的推荐标准。 JPEG是数字图像压缩的国际标准。它用于连续变化的静止图像, 这里包括灰度等级和颜色两方面的连续变化。JPEG包含两种基本压缩方法, 各有不同的操作模式。第一种是有损压缩, 它是以DCT(DiscreteCosineTransform)为基础的压缩方法。第二种为无损压缩, 又称预测压缩方法。但最常使用的是第一种,即DCT压缩方法, 也称为基线顺序编解码(BaselineSequ
27、entialCodec)方法, 因为这种方法的优点是先进、 有效、 简单、 易于交流, 因此应用广泛,是以DCT为基础的最基本、 最重要的方法。 2.4.MPEG-l标准 MPEG是活动图像专家组(MovingPictureExpertGroup)的英文缩写。实际上, 它是标准化组织(ISO)和国际电工委员会(IEC)联合技术委员会l(JTCl)的第29分委员会(SC29)的第ll工作组(WGll), 其全称是WGllofSC29ofISO/IECJTCl。MPEG的任务是开发运动图像及其声音的数字编码标准, 成立于1988年。 专家组最初的任务有三个: 实现1.5Mb/s、 10Mb/
28、s、 40Mb/s的压缩编码标准, 即MPEG-l、 MPEG-2、 MPEG-3。但因为MPEG-2的功能已使MPEG-3为多余, 因此MPEG-3于1992月撤消。MPEG-4项目是1991年5月建议并于1993年7月确认, 其目标是甚低数码率的音频压缩编码(码率低于28.8Kb/s)。下面分别介绍各个标准。 随着数字音频和数字视频技术的广泛应用, ISO的活动图像专家组(MPEG)在1991年11月提出了ISOll172标准的建议草案, 通称MPEG-1标准。该标准于1992年11月经过, 1993年8月公布。MPEG-1标准适用于数码率在1.5Mbps左右的应用环境, 也就是为CD-
29、ROM光盘的视频存储和放像所制定的。 MPEG-l标准能够处理各种类型的活动图像, 其基本算法对于压缩水平方向360个像素竖直方向288个象素的空间分辨力, 每秒24至30幅画面的运动图像有很好的效果, 在MPEG-1标准中的一帧图像的概念不同于电视中帧的概念, 前者一定是成逐行扫描的图像, 如果待处理信号是隔行扫描的图像, 则编码前必须将其转换成逐行扫描的格式。 MPEG-l标准提供了一些录像机的功能: 正放, 图像冻结、 快进、 快倒和慢放。另外, 还提供了随机存储的功能, 当然, 解码器这些功能的实现在一定程度上同图像数据存储介质相关。 MPEG-l标准采用了一系列技术以获得高压缩
30、比, 第一, 对色差信号进行亚采样, 减少数据量;第二, 采用运动补偿技术减少帧间冗余度; 第三, 做二维DCT变换去除空间相关性;第四, 对DCT分量进行量化, 舍去不重要的信息, 将量化后DCT分量按照频率重新排序;第五, 将DCT分量进行变字长编码;第六, 对每数据块的直流分量(DC)进行预测差分编码MPEG-l中的图像类型共分四种:I图像,或称Intra图像, 采用帧内编码, 不参照其它图像;P图像,或称Predicted图像,它们参照前一幅I或P图像做运动补偿编码;B图像, 或称双向预测图像, 它们参照前一幅和后一幅I或P图像做双向运动补偿编码;D图像, 或称直流(DC)图像, 这类
31、图像中只含直流分量, 是为快放功能而设计的。 2.5.MPEG-2标准 MPEG-2是由MPEG开发的第2个标准。按计划于1994年l1月正式确定为国际标准, MPEG-2是”活动图像及有关声音信息的通用编码”(GenericCodingofMovingPicturesAssociatedAudioInformation)标准。MPEG-2标准制定始于1990年7月。在此之间, 国际电信盟电信标准化部门(ITU-T)成立了一个有关ATM的图像编码专家组。从此开始了JTC1ITU-T的合作。从1991年5月开始征集有关图像编码算法(VideoCodingAlgorithms)的文件,有32个
32、公司和组织提供了非常详细的研究结果和D1格式的编解码图像录像带。1991年ll月,在日本的JVC研究所进行了对比测试, 确定带有运动补偿预测和内插的DCT最成熟和性能最好。在1992年1月的会上又定下了MPEG-2是”通用”(generic)标准。 MPEG-2的声音和系统部分的工作始于1992年7月。MPEG为制定MPEG-2经常与有关国际组织, 如ISO、 IEC、 ITU-T、 ITU-R等开会协调, 并注意到了与MPEG-1的兼容一致。国际电联的无线电通信部门(ITU-R)从广播电视方面提出的不同需求构成了MPEG-2的档次/等级(Profile/Level)概念的基础。ITU-R在
33、MPEG-2的质量检验、 测试方面做了大量工作。MPEG-2的委员会草案ISO/IECCD13818是1993年l1月产生的。按计划在1994年1l月7日至l1日的新加坡会议上, 批准为国际标准ISO/IECIS13818。此后还要对MPEG-2进行扩展。 2.6.MPEG-4标准 MPEG-4标准将支持7个新的功能。可粗略划分为3类: 基于内容的交互性、 高压缩率和灵活多样的存取模式。现分别介绍如下: 1.基于内容的交互性(Content-basedinteractivity) (1)基于内容的操作与比特流编辑支持无须编码就可进行基于内容的操作与比特流编辑。例如: 使用者可在图像或
34、比特流中选择一具体的对象(Object)(例如图像中的某个人, 某个建筑等等), 随后改变它的某些特性。 (2)自然与合成数据混合编码提供将自然视频图像同合成数据(文本、 图形)有效结合的方式, 同时支持交互性操作。 (3)增强的时间域随机存取MPEG-4将提供有效的随机存取方式: 在有限的时间间隔内,可按帧或任意形状的对象,对一音、 视频序列进行随机存取。例如以一序列中的某个音、 视频对象为目标进行”快进”搜索。 2.高压缩率(Compression) (l)提高编码效率在与现有的或正在形成的标准的可比拟速率上,MPEG-4标准将提供更好的主观视觉质量的图像。这一功能可望在迅速发展中
35、的移动通信网中获得应用, 但值得注意的是: 提高编码效率不是MPEG-4的唯一的主要目际。 (2)对多个并发数据流的编码MPEG-4将提供对一景物的有效多视角编码,加上多伴音声道编码及有效的视听同步。在立体视频应用方面,MPEG-4将利用对同一景物的多视点观察所造成的信息冗余, MPEG-4的这一功能在足够的观察视点条件下将有效地描述三维自然景物。 3.灵活多样的存取(Universalaccess) (l)错误易发环境中的抗错性(Robustness)”灵活多样”是指允许采用各种有线、 线网和各种存储媒体, MPEG-4将提高抗错误能力(Errorrobustnesscapabilit
36、y), 特别是在易发生严重错误的环境下的低比特应用中(移动通信链路)。注意, MPEG-4是第一个在其音、 视频表示规范中考虑信道特性的标准。目的不是取代已由通信网提供的错误控制技术, 而是提供一种对抗残留错误的坚韧性。例如: 选择性前向纠错(Selectiveforwarderrorcorrection), 错误遏制(Errorcontainment),或错误掩盖(Errorconcealment)。 (2)基于内容的尺度可变性(Content-basedscalability)内容尺度可变性意味着给图像中的各个对象分配优先级。其中, 比较重要的对象用较高的空间和或时间分辨率表示。基于内容
37、的尺度可变性是MPEG-4的核心, 因为一旦图像中所含对象的目录及相应的优先级确定后, 其它的基于内容的功能就比较容易实现了。对甚低比特率应用来说, 尺度可变性是一个关键的因素,因为它提供了自适应可用资源的能力。例如,这个功能允许使用者规定: 对具有最高优先级的对象以可接受的质量显示,第二优先级的对象则以较低的质量显示, 而其余内容(对象)则不予显示, 可见,这种方式可最有效地利用有限的资源。 2.7.MPEG-7标准 MPEG家族的新成员叫作”多媒体内容描述接口”(简称MPEG-7,它的由来是1+2+4=7,因为没有MPEG-3、 MPEG-5、 MPEG-6), 它将扩展现有内容识别专
38、用解决方案的有限的能力, 特别是它还包括了更多的数据类型。换言之, MPEG-7将规定一个用于描述各种不同类型多媒体信息的描述符的标准集合。MPEG-7还将对定义其它描述符及其结构(描述方案), 和她们之间的关系的方法进行标准化。这种描述(也就是描述符和描述方案的组合)将与内容本身关联起来, 以便对用户感兴趣的素材进行快速高效的搜索。MPEG-7将标准化一种用来定义描述方案的语言, 即描述定义语言(DDL)。带有与之相关的MPEG-7数据的AV素材, 就能够被加上索引, 并可进行检索。这些素材可能包括, 静止图像、 图形、 3D模型、 音频、 语言、 视频、 以及关于这些成份如何组成一个多媒体
39、表述(即所谓”环境”, 组合信息)的信息。在这些通用数据类型中的特殊情况可能已包括面部表情和个人特征。 MPEG-7象MPEG家族中的其它成员一样, 是针对满足特定需要的音、 视频信息的标准化表述。由于MPEG-7是在其它标准表述诸如模拟、 PCM、 MPEG-l、 MPEG-2和MPEG-4等基础上建立起来的, 而标准化的功能之一就是对其中相应部分提供参考。举例来说, 可能一个用于MPEG-4的形状描述符,在MPEG-7的环境里可能会有帮助, 同样的, 用于MFEG-l、 MPEG-2的运动矢量区也可能有这样的情况。 可是, MPEG-7的描述符并不依赖于它所描述的内容是编码的或存储的方
40、式, 能够把MPEG-7的描述说明,附加到模拟制的电影里或是用纸张打印出来的图片上。然而, 尽管MPEG-7的描述不依赖于所处理素材的(编码)表示方式, 但由于在一定程度上它是在MPEG-4的基础上发展起来的, 而MPEG-4采用了按照具有一定时间关系(同步)和空间关系(对于视频而言是在屏幕上, 对于音频而言是在房间内)的对象,来进行音、 视频编码的处理方式, 因此用MPEG-4编码有可能把描述说明附加到场景中的成员(对象), 比如说音、 视频对象身上。因此, MPEG-7在描述中要提供不同的程度, 才可能实现不同等级的识别。 因为描述性特征必须在应用环境中才有意义, 因此她们会因用户范围的
41、不同和应用领域的不同而有所区别。这就意昧着, 同样的素材, 因为要和应用范围相匹配, 可能会使用不同类型的特征来描述。我们来看一些例子, 对于可视素材, 较低的抽象级别可能会用一些象形状、 尺寸、 纹理、 颜色、 运动(抛射)、 位置(”对象会在场景中的哪个位置被发现呢?”)等属性来描述; 对音频内容而言, 可能会采用调式、 情绪、 节奏、 节奏变化、 在声场中的位置等属性。而最高的抽象等级可能会给出关于语意的信息: ”在这个场景中, 左侧有一只正在吠叫的棕狗, 右侧有一只落下来的蓝色圆球, 背景中还有汽车经过的声音。”当然, 所有这些描述都会以高效方式进行编码, 也即能提高搜索的效率。同时,
42、 中间也可能存在过渡的抽象等级。抽象等级与提取特征的方式有关, 许多低等级的特征能够用全自动的方式提取出来, 而高等级的特征就需要更多的人工交互。 第三讲 数字视频广播(DVB) 数字电视是在还没有察觉的情况下就已经进入了我们的生活。而我们能够开始感觉到数字技术的冲击只是一个时间问题, 今天数字技术已经在我们生活的方方面面有所体现, 从电话、 传真机到微型电脑, 再到当前风靡世界的因特网。 今天, 尽管我们在家里依然收看的还是模拟电视节目, 可是节目制作棚里的设备已经是数字化了, 从节目制作棚到发射塔的信号传输也已是数字化了, 没有这些节目制作与传输的数字技术, 我们的节目质量是无法满足
43、的。当你经过卫星电视网、 有线电视网或开路电视网观看电视节目时, 你已经是位于数字电视传输的最后一个环节, 这一个环节正在经历一场数字化革命,以达到电视节目的全数字化传输。在电视数字化的进程中,国际DVB组织(DigitalVideoBroadcasting)提出了全套的解决方案, 这-方案涉及我们常见的传输媒介: 数字卫星电视(DVB-S)、 数字有线电视(DVB-C)、 数字开路电视(DVB-T)。 电视数字化的时代已经到来! 在欧洲, 从1991年开始, 电视台、 家电产品生产厂家和标准制订者坐到了一起, 商谈组成-个工作组, 共同制订数字电视的发展规划, 工作组的成员发展很快, 这
44、一个由欧洲人发起的组织很快就吸引美国及日本的许多成员, 变成了-个世界性组织。1993年9月工作组起草了一个备忘录, 将工作组更名为DVB组织, 即国际数字视频广播组织。数字电视的发展进入了新的时代。 根据过去痛苦的教训, 工业界决定要以市场的商业需求作为标准制订的指导, DVB组织决定新的技术必须是建立在MPEG-2压缩算法上的数字技术, 必须是市场导向的。 由于相对较低的基础设施费用投入和各国相对简单的标准协调问题,数字卫星电视(DVB-S)网、 数字有线电视(DVB-C)网和数字开路电视(DVB-T)网先走一步, 发展更快。1995年DVB组织确立了数字卫星电视的标准DVB-S, 1
45、996年数字有线电视DVB-C数字共用天线电视、 数字微波电视等标准随之确立, 数字开路电视DVB-T的采用紧随其后, 将给整个社会带来更深刻的变化。I997年以DVB标准为基础的数字电视已经在全世界普及, 拥有了几百万用户。1998年末, 微型计算机用户能够经过在她们使用的微机内插入数字卫星接收卡, 用来享受因特网服务。当前, 数字地面电视(DVB-T)标准正在逐渐被世界各国所采用, 为今后的高清晰度电视开辟了广泛的前景。 DVB标准提供了-套完整的, 适用于不同媒介的数字电视广播系统规范, 其周全的计划及广范的共识是其成功的关键。从一开始, 大家就选定ISO/IECMPEG-2标准作为音
46、频及视频的编码压缩方式, 对信源编码进行了统一, 随后对MPEG-2码流进行打包形成传输流(TS), 进行多个传输流复用, 最后经过卫星、 有线电视及开路电视等不同媒介传输方式进行传输。 1.DVB标准的核心 ●系统采用MPEG压缩的音频, 视频及数据格式作为数据源 ●系统采用公共MPEG-2传输流(TS)复用方式 ●系统采用公共的用于描述广播节目的系统服务信息(SI) ●系统的第一级信道编码采用R-S前向纠错编码保护 ●调制与其它附属的信道编码方式, 由不同的传输媒介来确定 ●使用通用的加扰方式以及条件接收界面 2.DVB音频特点 DVB系统的音频编码使用MPEG-ILay
47、erII笫二层音频编码, 也称做MUSICAM。音频的MPEG-ILayerII编码压缩系统利用了声音的低声音频谱掩蔽效应, 这一人体生理学效应允许我们对于人耳不太敏感的频率进行低码率编码, 这一技术的采用能够大大地降低音频编码速率。MPEG-ILayerII音频编码可用于单音, 立体声, 环绕声和多路多语言声音的编码。 3.DVB视频特点 对于视频,国际上采用标准的MPEG-2压缩编码, MPEG-2视频编码系统由一个大家族构成, 每一个系统之间都有兼容性和共同性, 根据图像清晰度的不同, 它分成四种信源格式或称”等级”(LEVEL), 从录像带(VCR)的低图像清晰度, 到高清晰度电视
48、除了根据图像清晰度定义的”等级”以外, DVB视频标准还定义了”档次”(PROFILE)的概念, 每一个不同的”档次”(PROFILE)能够提供构成编码系统的压缩工具和压缩算法。 a)”档次”(PROFILE) 当前在MPEG-2系统中存在5个”档次”(PROFILE), 每一个”档次”(PROFILE)都会比它的前一个”档次”更加复杂, 更加完善, 提供更多的工具,同时其相对应的设备的价格也更高。 ”档次”的最初级叫做简单档次(SIMPLEPROFILE), 随后是主档次(MAINPROFILE), 它比简单档次(SIMPLEPROPILE)增加了编码双向预测的功能, 即: B-FR
49、AMES, 在使用同样的码流的情况下, 它的质量会更好, 但算法更加复杂, 使用的芯片更多。主档次(MAINPROFILE)的解码芯片,能够兼容解码简单档次(SIMPLEPROFILE)的编码, 这种向下兼容性贯穿整个系列的”档次”。 在主档次(MAINPROFILE)之后,是信噪比可分级档次(SNRSCALABLE)及空间频谱可分级档次(SPACILLYSCALABLEPROFILE), 这两种”档次”能够调整信噪比与码流率关系,以及图像清晰度与码流率之间的关系, 出于其编码的复杂性以及接收设备价格昂贵问题, DVB标准当前不支持这两种”档次”。最高级的”档次”是HIGHPROFILE,
50、它不但兼容前面的低极”档次”, 兼备所有的功能, 而且能够进行多行, 同时编码, 而前面的”档次”则是逐行编码。 在”档次”中存在两种图像采样方式, 即: 4:2:2和4:2:0格式。我们知道电视复合信号能够分成亮度信号分量(Y)和色度信号分量(R-Y,B-Y), 4:2:2格式是对亮度信号进行4个采样, 对色度信号(R-Y, B-Y)进行2个采样, 见图3.1; 4:2:0格式的色度信号(R-Y,B-Y)只做隔行采样, 如果使用8比特采样,我们能够算出对标准PAL制电视信号进行采样后的4:2:2格式图像码流率如下: 亮度信号码流率为: 720×576×25帧/秒×8bit=82.944






