收藏 分销(赏)

VoIP关键技术连载专业资料.doc

上传人:天**** 文档编号:2948064 上传时间:2024-06-11 格式:DOC 页数:31 大小:225.04KB
下载 相关 举报
VoIP关键技术连载专业资料.doc_第1页
第1页 / 共31页
VoIP关键技术连载专业资料.doc_第2页
第2页 / 共31页
VoIP关键技术连载专业资料.doc_第3页
第3页 / 共31页
VoIP关键技术连载专业资料.doc_第4页
第4页 / 共31页
VoIP关键技术连载专业资料.doc_第5页
第5页 / 共31页
点击查看更多>>
资源描述

1、VoIP技术连载之一:IP电话发展历史IP电话是一种数字电话,是技术创新一种通信服务业务。在全球范畴内得到了迅速发展,可以说是当仿世界上发展最快、普及最快一门应用服务技术之一。/VoIP技术连载之一:IP电话发展历史/ IP电话作为下一代电话而倍受瞩目因素,是与通信业务经营者所传播语音量和IP信息量比率关于。以因特网为代表IP通信信息量,当前以指数函数方式增长。由于在所有信息传播量中,IP信息量占极高比例,因而整个网络应适应于IP信息量,少量语言信息量也应搭载在IP网上,这比起分别建立IP网和语音网要经济得多。正由于如此,IP电话技术将成为将来电话技术。 IP(Internet Protoco

2、l)电话是一种数字电话,是技术创新一种通信服务业务。它把语音、压缩编码、打包分组、分派路由、存储互换、解包解压等互换解决在IP网或互联网上实现语音通信。它增进了网络资源运用,减少语音业务成本。因而在全球范畴内得到了迅速发展,可以说是当仿世界上发展最快、普及最快一门应用服务技术之一,也是计算机网络界关注热点之 一。 1. IP电话产生背景 (1)IP电话产生Internet商业化后来,在全世界,特别是发达国家迅速发展起来。在某些国家(如美国)本地电话Internet接入采用包月 制,不限时限量,因而Internet是近乎免费(Free),人们都但愿能通过这近乎免费网络进行老式电话和传真服务。19

3、95年2月以色列 VocalTec公司研制出可以通过Internet网打长途电话软件产品Internet Phone。 顾客只要在多媒体PC机上安装该软件,就可以通过Internet网和任何地方安装同样软件联机顾客进行通话。这项技术上突破引起全世界瞩目,其背后无限商机也 使许多公司进行此项技术研究,从而使IP电话技术得到迅速发展,人们把这种在Internet上实现电话业务称为Internet电话,应当说是IP电 话雏形。 通过五年发展,IP电话成为信息技术进步带来一项新型电话业务在全世界开展,并对老式电话业务形成越来越大威胁。IP电话从当时PC到PC发展到 今天PC到PC、PC电话、电话到电话

4、等各种业务形式,但无论是当前还是将来,电话到电话应用将拥有最大市场,IP电话承载网络可以是 Internet ,更多是遵循TCP/IP合同专用网或Internet 。因而对咱们来说,IP电话/传真就是通过IP网络传送电话/传真业务。IP网泛指基本TCP/IP合同网络,涉及因特网Internet和公司网 Internet。 (2)IP电话迅速发展背景,从最初Internet联应用到可以利普通电话实现通话,IP电话在短短几年间得到了非常迅速发展。IP电话为什么 会在这样短时间里引起全球电信界关注,并且正在或将要对老式通信方式产生巨大冲击?这除了IP电话采用语音压缩和记录复用技术节约宽带从而导致运

5、营成本减少外,尚有如下两个因素: 第一, 电话业务从来都是各国管制最为严格业务,但对于IP电话各国大多采用宽容甚至是扶植态度,如美国将IP电话归类为增值业务,从而不必承担长途电话公司 所受管制规定,这样IP电话提供长途电话业务时,不必向本地电话公司交纳占长途电话费40%左右接入费。这样庞大通信市场潜力,必然吸引众多老式和 新型电信公司加入到IP电话研究、开发和经营队伍中。 第二, 各国国际长途电话费存在着严重不平衡性,且国际长途电话业务在诸多国家都是垄断经营。这样,国际话费低国家电信 运营者可以运用各国对IP电话政策优惠,通过IP电话向国际话费高国家渗入,直接或间接进入电信市场中尚未开放国家国

6、际长途业务经营领域;而资费高 国家可以减少IP电话同国际回叫业务争夺顾客,同步开拓新顾客群;在国际电信业务垄断经营国家,新电信或ISP运营者迫切但愿进入这一高利润 垄断经营领域,IP电话应运而生好正好为其提供了一条有效途径。 2. IP电话发展阶段 IP电话在技术上大体经历这样几种阶段: (1) 技术突破期(1995-1996)IP电话最早是作为Internet上联机应用浮现,那时只要通放双方拥有同样客户端应用软件就可以在 Internet上进行实时通话了,固然语音质量存在诸多问题。最早推出这种客户端软件是以色列VocalTec公司,她们在1995年2月宣布推出 Internet Phone,

7、可以说是当代IP电话雏形。 自从VocalTec推出了软件Internet Phone后,不少软件公司,涉及诸多在公司,都相继推出了类似软件,例如微软NetMeeting、IDT Net2Phone、NetSpeakWebPhone、英特尔Internet Video Phone等,顾客只需在PC机上安装客户端软件,并配合麦克风、声卡、音响等设备, 就可以在IP网上与同样安装了这些软硬件顾客通话了。由于当时这种应用只限于在Internet上使用,因而那时人们普通将这种应用称为 Internet电话。 这一时期,使用者大多数是Internet上网迷,语音质量基本没有保证,技术还不完全成熟,人们对

8、它结识也比较稚嫩,咱们也可以把这一时期IP电话 发展萌芽期。 (2) 发展期(1996-1999)逐渐地,电信公司开始结识到运用Internet实现语音业务巨大潜在市场,她们开始考虑如何将Internet和已有 PSTN结合起来,从而更加广泛普通电话顾客提供业务。于是,用以连接Internet和PSTN网关设备浮现了,由于运用Internet代替老式 长途电话线路可以大大减少成本,许多产品制造商和业务商纷纷看好这一市场并开始制造设备和提供业务。可以说,这时IP电话进入迅速发展阶段。 由于运用公司Internet传播实时语音存在诸多局限性,难以保证顾客接受语音质量,这对一项业务来说显然是不行。因

9、而诸多业务商建立了专用 IP网或在Internet上构建VPN来提供语音业务,从而实现较好语音质量,这时IP电话也可以真正地称为IP电话了。 (3) 成熟期()也许再过几年,IP电话将步入成熟期,届时IP电话将具备如下特点: 1) 技术成熟。 2) 统一原则。 3) 全球网络实现互通。 4) 语音质量良好。 5) 大部份老式电信运营公司开始提供IP电话业务。 6) 向IP传播多媒体业务过渡。当前,IP电话正处在发展期,各个设备制造商纷纷推出IP电话网关产品,众多电信运营公司开始经营IP电话业务,IP电话正以 强大吸引力吸引着老式和新型电信公司。VoIP技术连载之二:VoIP原理及技术通过因特网

10、进行语音通信最主线技术是VoIP,因而有必要一方面分析VoIP基本原理,以及VoIP中有关技术问题。 通过因特网进行语音通信是一种非常复杂系统工程,其应用面很广,因而涉及技术也特别多,其中最主线技术是VoIP (Voice over IP)技术,可以说,因特网语音通信是VoIP技术一种最典型、也是最有前景应用领域。因而在讨论用因特网进行语音通信之前,有必要一方面分析 VoIP基本原理,以及VoIP中有关技术问题。 一、VoIP基本传播过程 老式电话网是以电路互换方式传播语音,所规定传播宽带为64kbit/s。而所谓VoIP是以IP分组互换网络为传播平台,对模仿语音信号进行压缩、打包等一系列特殊

11、解决,使之可以采用无连接UDP合同进行传播。 为了在一种IP网络上传播语音信号,规定几种元素和功能。最简朴形式网络由两个或各种具备VoIP功能设备构成,这一设备通过一种IP网络连接。 VoIP模型基本构造图如下图所示。从图中可以发现VoIP设备是如何把语音信号转换为IP数据流,并把这些数据流转发到IP目地,IP目地又把它 们转换回到语音信号。两者之音网络必要支持IP传播,且可以是IP路由器和网络链路任意组合。因而可以简朴地将VoIP传播过程分为下列几种阶段。 1、语音-数据转换 语音信号是模仿波形,通过IP方式来传播语音,不论是实时应用业务还是非实时应用业务,道貌岸一方面要对语音信号进行模仿数

12、据转换,也就是对模仿语音信号 进行8位或6位量化,然后送入到缓冲存储区中,缓冲器大小可以依照延迟和编码规定选取。许多低比特率编码器是采用以帧为单位进行编码。典型帧长为 1030ms。考虑传播过程中代价,语间包普通由60、120或240ms语音数据构成。数字化可以使用各种语音编码方案来实现,当前采用语音编 码原则重要有ITU-T G.711。源和目地语音编码器必要实现相似算法,这样目地语音设备帮可以还原模仿语音信号。 2、原数据到IP转换 一旦语音信号进行数字编码,下一步就是对语音包以特定帧长进行压缩编码。大部份编码器均有特定帧长,若一种编码器使用15ms帧,则把从第一来 60ms包提成4帧,并

13、按顺序进行编码。每个帧合120个语音样点(抽样率为8kHz)。编码后,将4个压缩帧合成一种压缩语音包送入网络解决 器。网络解决器为语音添加包头、时标和其他信息后通过网络传送到另一端点。语音网络简朴地建立通信端点之间物理连接(一条线路),并在端点之间传播编码 信号。IP网络不像电路互换网络,它不形成连接,它规定把数据放在可变长数据报或分组中,然后给每个数据报附带寻址和控制信息,并通过网络发送,一站 一站地转发到目地。 3、传送 在这个通道中,所有网络被当作一种从输入端接受语音包,然后在一定期间 (t)内将其传送到网络输出端。t可以在某全范畴内变化,反映了网络传播中抖动。网络中同间节点检查每个IP

14、数据附带寻址信息,并使用这个信息把该 数据报转发到目地途径上下一站。网络链路可以是支持IP数据流任何拓构造或访问办法。 4、IP包-数据转换 目地VoIP设备接受这个IP数据并开始解决。网络级提供一种可变长度缓冲器,用来调节网络产生抖动。该缓冲器可容纳许多语音包,顾客可以选取缓 冲器大小。小缓冲器产生延迟较小,但不能调节大抖动。另一方面,解码器将经编码语音包解压缩后产生新语音包,这个模块也可以按帧进行操作,完全和解 码器长度相似。若帧长度为15ms,是60ms语音包被提成4帧,然后它们被解码还原成60ms语音数据流送入解码缓冲器。在数据报解决过程 中,去掉寻址和控制信息,保存原始原数据,然后把

15、这个原数据提供应解码器。 5、数字语音转换为模仿语音 播放驱动器将缓冲器中语音样点(480个)取出送入声卡,通过扬声器按预定频率(例如8kHz)播出。 简而言之,语音信号在IP网络上传送要通过从模仿信号到数字信号转换、数字语音封装成IP分组、IP分组通过网络传送、IP分组解包和数字语音还 原到模仿信号等过程。VoIP技术连载之三:国际原则化组织研究IP电话国际原则化组织重要涉及国际电信联盟电信原则部 (International Telecommunications Union- Telecommunications Standardization section,1TU-T)、欧洲电信技术原

16、则所(European Telecommunications Standards Institue,ETSI)、因特网工程任务组(Internet Engineering Task Force,IETF)、国际多媒体电视会议联合会(IMTC)和INOW。1. ITU-T 国际电联是世界是制定通信原则最具备权威性和影响力组织,ITU-T第16研究组制定H.323合同已经提到计算机业和老式电信业广泛支持,当前, H.323 v2已经完毕,并已经开始H.323 v2研究制定工作。第16组于1999年5月在智利会议上提出H.gcp草案,并开始研究MGCP与H.gcp进一步融合。2. ETSI ETSI

17、 TIPHON项目研究组在业务互操作、网络构造、编号和寻址、服务质量等方面研究得比较进一步,其目是结合电信和Internet技术,提出IP网上传播语音原则,TIPHON将研究过程分为四个阶段:第一阶段重点是由IP网到电路互换网络,即IP网中一种顾客向PST/ISDN、GSM中发起呼喊,其目是使IP网顾客可以接入PST/ISDN、GSM,并使用电路互换网络所能提供业务,如补充业务和基本IP业务。其示意图如图所示。第二阶段重点是电路互换网到IP网,即PSTN/ISDN、GSM中顾客向IP网中一种顾客发起呼喊,其核心是如何将E-164地址转换成IP地址,示意图如图所示。第三阶段重点是电路互换网通过I

18、P网至电路互换网,即实现以Internet作为传送手段进行通信目,其示意图如图所示。第四阶段重点是IP网电路互换网至IP网,其示意图如图所示。3. IMTC和IETF 国际多媒体电视会议联合会(IMTC)是一种非赚钱性组织,由大概140个成员构成。IMTC当前与ETSI TIPHON合伙重点研究互通问题,以保证设备互操作性;IETF中IPTEL、PINT、MEGACO等研究组正在进行IP电话方面厂家,重要研究IP电话新合同(如MGCP、SIP等)、IP电话网与PSTN和IN互通等。4. INOW INOW是由ITXC发起。ITXC是一种IP电话业务批发商,它拥有一种覆盖全球IP电话网,当前已经

19、建立127个网关接入点。ITXC网络中采用了朗讯和VocalTec两定公司产品。1986年6月,ITXC、朗讯和VocalTec宣布开发可以在ITXC网络上互通产品,并于1998年11月向人们公开了产品规范,当前已经发布第二版规范书,这一举动引起了许多厂家,原则化组织电信公司关注。VoIP技术连载之四:IP电话五项基本原则IP电话系统建设应遵循五项基本原则,它们是:延时400毫秒基本原则,99.9999%可靠电信原则,网络开发原则,后方管理保障原则。1、延迟400毫秒基本原则 能否将语音业务集成到数据网络中,核心就是如何保证QoS。对于IP电话而言,保证其QoS就如何保证语音传播最低延迟及如何

20、减少丢包率。据专家简介, 只有端到端延迟减少到400毫秒如下,将丢包率减少到5%-8%,才干使IP电话与老式电话相媲美,实现收费质量语音业务,并且必要自始至终保证这 两项指标。IP电话虽然有了原则,但实现起来并不容易。当前,从电信厂商到网络厂商,都已依照自己强项技术产品,提出解决QoS办法。从网络核心到 网络边沿,QoS解决方案各具特色,但其能否满足IP电话这个基本原则,能否保证IP电话语音质量,还必要通过实践检查。通过较长时间讨论与发展。 许多厂家都推出了产品。2、99.9999%可靠电信原则 IP网络已成发展潮流,已成为网络应用热点。在IP有一点非常清晰:IP网络必要发展与PSTN同样功能

21、甚至超过PSTN,PSTN发展1, IP网络要走路决不是坦途,电信服务质量、通用业务、全球互通,6个9(99.9999%)可靠性、内容丰富服务及收费质量等,这些规定在PSTN 中实现起来也许很容易,但在以包互换为基本IP电话网络中能实现吗?专家建议是,实现IP电话网络电信质量,在建设电信级IP电话业务及承载网络 之外,还需采用负载分担,路由备份等技术来保障网络可靠性、可用性及服务质量,同步还必要保证IP网络可管理性、可综合性、可扩展性。看来,唯有通过 漫长、艰难变革,VOIP才干成为下一代电信基本设施构造核心。3、多媒体应用发展原则 IP电话影响深远、引人注目,由于三网合一正式开始,顾客翘首期

22、盼也是IP电话更高境界-多媒体应用。IP电话应用领域应当说是十分辽阔,它还可提供多媒体功能和呼喊管理功能,如交互式WEB商务、呼喊中心、LAN PBX、协商计算、公司传真等。最后,基于IP业务功能将超来PSNT,可提供一体化信息解决,在高速线上提供多条虚拟线路,并提供多媒体会议、智能代 理(Intelligent Agent)及信息业务等。节约费用只是IP电话众多长处中一小部份,但在当前IP网络基本设施阶段,设备成本才基本电话功能可用性促成了IP电话替 代老式电话最初应用。IP电话从便宜呼起叫步,逐渐与视频及数据通信技术紧紧结合,向多媒体应用发展,才会带动网络融合。4、网络开放原则 老式卢信网

23、络作为专用网络设计,它具备封闭式构造合同,而IP电话网络则不同,它会在一种开放环境中逐渐成熟。开放环境引来众多厂商大显身手,寻 求商机。当前,各厂商IP电话还不能完全互能,如不能解决这个问题,IP电话发展必将大打折扣。有鉴于此,国际电信组织下增进各厂商使用原则合同,不 仅要使IP电话产品互通,还要使IP电话能与既有老式电话较好地合伙。此外,使用原则合同尚有助于各厂商开发设计出开放应用程序,服务IP电话 系统。由于IP电话网络开放性,顾客此后可以随时买到最先进程序或者自己编写需要程序,而不是必要依赖于某些厂商,增大了顾客应用自由度。固然, 开放、灵活同步会给IP网络管理、集成测试、验证等带来非常

24、严峻挑战,作为开放环境必然会带来开放竞争推动技术创新和技术改造。可以说,在网络 开放原则下,IP电话技术发展会有一种相称快步伐,为广大顾客提供一种较好环境。5、后台管理保存障原则 在LAN、WAN和Internet 数据领域中,后方管理不用过多考虑,计费是按统一费率进行。网络管理在公司网内进行。随着数据和语音综合,从数据领域遗留下来这一问题便会成为不利 包袱,并且成为运营商环境中长期障碍。大规模语音业务需要后方管理工具和办法以支撑其商业运作,其服务,内容涉及顾客管理、认证授权,异地漫游、精 确到秒或字节可靠计费系统、网络管理和大规模业务管理、管理安全性、大规模网络配备和监控等,都是运商必要具备

25、条件,才干提高网络运营效率。实现这些管理难点在于,骨干网技术基于分组而不是电路。在网络管理与安全面矛盾将日益突出,成为此后需要重点研究课题之一。 VoIP技术连载之五:H.323合同简介在老式电话系统中,一次通话从建立系统连接到拆除连接都需要一定信令来配合完毕。同样,在IP电话中,如何寻找被叫方、如何建立应答、如何按照彼此数据解决能力发送数据,也需要相应信令系统,普通称为合同。当前在国际上,比较有景响IP电话方面合同涉及ITU-T提出H.323合同和IETE提出SIP合同,本节重要简介当前用得最广泛H.323合同。 一、H.323体系构造 为了能在不保证QoS分组互换网络上展开多媒体会议,由I

26、TU第15研究组SG-15于1996年通过H.323建议第一版,并在1998年提出了H.323第二版。H.323制定了无QoS(服务质量)保证分组网络PBN(packet Based Networks)上多媒体通信系统原则,这些分组网络主宰了当今桌面网络系统,涉及基于TCP/IP、IPX分组互换以太网、迅速以太网、令牌网、FDDI技术。因而,H.323原则为LAN、WAN、Internet、因特网上多媒体通信应用提供了技术基本和保障。 H.323是ITU多媒体通信系列原则H.32x一部份,该系列原则使得在既有通信网络上进行视频会议成为也许,其中,H.320是在N-ISDN上进行多媒体通信原则:

27、H.321是在B-ISDN上 进行多媒体通信原则:H.322是在有服务质量保证LAN上进行多媒体通信原则:H.324是在GSTN和无线网络上进行多媒体通信原则。 H.323为既有分组网络PBN(如IP网络)提供多媒体通信原则。若和其他IP技术如IETF资源预留合同RSVP相结合,就可以实现IP网络 多媒体通信。基于IPLAN正变得越来越强大,如IP over SDH/SONET、IP over ATM技术正在迅速发展以及LAN 宽带正 在不断提高。由于能提供设备与设备、应用与应用、供应商与供应商之间互操作能力,因而,H.323可以保证所有H.323兼容设备互操作性。更高速 率解决器、日益增强图

28、形器件和强大多媒体加速芯片使提PC成为一种越来越强大多媒体平台。H.323可提供PBN与别网络之间进行多媒体通信 互连互通原则。许多计算机、网络通信公司,如Inter、Microsoft和Netscape都支持H.323原则。H.323原则涉及在无QoS保证分组网络中进行多媒体通信 所需技术规定。这些分组网络涉及LAN、WAN、Internet/因特网以及使用PPP等分组合同通过GSTN或ISDN拨号连接或点对点连接。 从整体上来说,H.323是一种框架性建设,它涉及到终端设备、视频、音频和数据传播、通信控制、网络接口方面内容,还涉及了构成多点会议多点控制单元(MCU)、多点控制器(MC)、多

29、点解决器(MP)、网关以 及关守等设备。它基本构成单元是域,在H.323系统中,所谓域是指一种由关守管理网关、多点控制单元(MCU)、多点控制器(MC)、多点解决 器(MP)和所有终端构成集合。一种域至少包括一种终端,并且必要有且只有一种关守。H.323系统中各个逻辑构成部份称为H.323实体,其种类 有:终端、网关、多点控制单元(MCU)、多点控制器(MC)、多点解决器(MP)。其中终端、网关、多点控制单元(MCU)是H.323中终端设备, 是网络中逻辑单元。终端设备是可呼喊和被呼喊,而有些实体是不通被呼喊,如关守。H.323涉及了H.323终端与其他终端之间、通过不同网络 、端到端连接。V

30、oIP技术连载之六:语音编码器本章综述在IP语音技术(VOIP)中惯用编码解码器(codess)。它们常被称为编码解器、语音编码器或者简称为编码器。关于这方面知识诸多。 本章一方面简要简介编码器重要功能、编码器分类,然后阐述以及用于VOIP三种编码器:IUT-T G.723语音编者按码器、ITU-T G.729语音编码器。 一、语音编码器功能 语音编码器重要功能就是把顾客语音PCM(脉冲编码调制)样值编码成少量比特(帧)。这种办法使得语音在连路产生误码、网络抖动和突发传播时具备健壮性(Robustness)。在接受端,语音帧先被误码为PCM语音样值,然后再转换成语音波形。 二、语音编器分类 语

31、音编码器分为三种类形:(a)波形编器;(b)声码器;(c)混合编码器。波形编码器会尽量构出涉及背景噪单在内模仿波形。由于波形编码器作用于所 有输入信号,因而会产生高质量样值。然而,波形编码器工作在高比特率。例如:ITU-G.711规范(PCM)用比特率为64Kbps。 声码器(vocoder)不会再生原始波形。这组编码器会提取一组参数,这组参数被送到接受端,用来导出语音产生模形。线性预测编码(LPC) 用来获取一时变数字滤波器参数。这个滤波器用来模仿说话人声道输出WEST96。在电话系统中使用声码器,语音质量不够好。 合成分析操作低比特率编码器MOS得分-比特率关系曲线(WEST96)在VOI

32、P中惯用语音编码器是混合编码器,它融入了波形编码器和声器长处,它另一特点是它工作在非常低比特率(4-6Kbps)。混合编码器采用合成分析(AbS)。 为了阐明问题,考虑人声道产生一种语音模式:当人说话产生语音信号时就会发出浊音(如音素pa、da等)和清音 (如音素sh、th)。勉励信号就是由输入语音信号导出,其办法是使合成语音与输入语音差别非常小。LPC用法、勉励产生以及对合成分析 (AbS)系统误差检查均如图4-1所示。 长话质量编码器在比特率高于8Kbps时容易实现,如图4-2所示。长话质量语音平均意见得分(MOS)必要在分或许分以上。老式PCN语音在比特率 不大于32 Kbps,语音质量

33、会严重恶化,在这里就不讨论PCN了。混合编码和声码器在比特率相称低MOS上得分是可接受。在现阶段,大多数基于VOIP编 码器工作范畴在5.28kbps。研究表白,原则编码器在比特率为4 Kbps时能提供可接受NOS得分,某些分用系统在4.8 KbpsMOS上得分为3.8。 矢量量化和码勉励线性预测 一种较好办法就是用预测存储 最优参数(码元矢量)码本对输入语音信号表达矢量进行编码,这种技术称为矢量量化(VQ,vector quantization)。 将VQ和AbS技术结合在一起会进一步提高编码性能。AbS VQ是技术构成CELP基本。VQ和AbS VQ重要区别在于进行矢量量化码簿搜索时采用量

34、化失真测量定义不同WONG96。 三、线性预测合成分析编码器 最惯用比特率在4.8kbps16 kbps之间语音编码器是基于模型编码器,这些编码器都是线性预测合成分析(LPAS)办法。为了随着时间变化模仿语音信号,线性预测语音产生模型 必要用恰当信号来勉励。每隔一段固定期间(如每隔20ms),语音模型参数和勉励参数都必要做一次预计和更新,并用来控制语音模型。下面将简介两种 LPAS编码器:前向至应LPAS编码器和后向自适应LPAS编码器。 3.1 前向自适应LPAS编码器:8kbps G.729编码器和6.3kbps 与5.3kbps G.723.1编码器 在前向自适应AbS编码器中,预测滤波

35、器系数和增益是显示传送。为了提供长话质量语音性能,这两种编码器都依赖于信源模型。勉励信号(以语音基调 周期信息形式表达)也要传送。这种编码器所提供模型对语音信号来说是比较好,但对于某些噪音或者多数器来说并不适当。因而,在背景噪音和音乐环境 下,LPAS编码器质量比7.726和7.727编码器质量要差某些。 G.723.1 ITU-T G.723.1编码器在6.4kbps提供长话质量语音。同步 G.723.1还涉及一种工作在5.3kbps低质量语音编码器。G.723.1是为低比特率可视电话而设计。在这种适应中,由于视频编码时延普通不不大于语音编码时延,因而对时延规定不是很严格。G.723.1编码

36、器帧长为30ms,尚有7.5ms前视。再加上编码器解决时延,编码器单向总时延为67.5ms。其他时延是由系统缓冲区和网络导致。 G.723.1编码器一方面对语音信号进行老式电话带宽波滤(基于G.712),再对语音信号用老式8000Hz速率进行抽样(基于 G.711),并变换成位线性PCM码作作为该编码器输入。在编码器中对输出进行逆操作来重构语音信号。 G.723.1系统用LPAS编码办法将语音信号编码成帧。编码器可以产生两种速率语音流量:(a)用于高速率6.3kbps;(b)用于低速率5.3kbps。主速率编码器使用多脉冲最大自然量化(MP-MLQ),低速率编码器使用代数码勉励线性预测(ACE

37、LP, Algebraic-Code-Excited Linear-Prediction)办法。编码器和解码器都必要支持两种速率,并通可以在帧间对两种速度进行转换,此系统同样可以对音乐和其他音频信号 进行压缩和解压缩,但它对语音信号来说是最优。 编码器对帧进行操作,每帧涉及240个样点,采用速率为8000Hz。在进一步解决(高通滤波器去直流分量)后把每帧提成4个子帧,每个子帧 涉及60个样点,其他各种操作涉及LPC滤波器以及LSP滤波器非量化系数计算等,将会导致30ms分组时延。对每个子帧,用未经解决输入信号计 算LPC滤波器。最后一种子帧滤波器系数用来预测分裂矢量量化器(PSVQ,Predi

38、ctive split Vector quantizer)进行量化。正如前面所简介,前视占有7.5ms,因此整个编码时延为37.5ms。这个时延在评介编码器,特别是通过数据网络传播 语音时是个很重要因素,由于如果编码及解码时延比较小话,就意味着解决互联网中时延及其抖动时具备更大自由度。 解码器解决也是基于帧,解码过程如下(G.723.1算法摘要): 对LPC量化索引号进行解码。 对构造LPC合成滤波器。 对每个子帧,先对自适应码本勉励和固定码本勉励解码,然后再输入合成滤波器。 勉励信号经基音后置滤波器解决后,再送入合成滤波器。 合成信号被输入到共振峰后置滤波器,该滤波器采用增益标度单元以使其输

39、出能量维持在糨输入水平。 静音压缩已运用近年,它运用了在总会话时间中静音时间占大概50%这一事实。其基本思路是在静音期间减少传送比特数,从而节约了所需传播总 比特数。 在电话网中,近年来对模仿语音信号都是用时间分派语音插值(TASI,Time-Assigned Speech Interpolation)主法进行解决。这一技术也就是将其他语音信号或者数据信号放置在谈话静音期间内,从而为多信道链路提供附加容量。现今, TASI已运用数字信号中并被赋予新名称-其中一种例子就是时分多址(TDMA,Time Division Multiple Access)。简要地讲,DTMA是将普通信号划提成很小、数

40、字化片段(slots即时隙)。这些时隙和其他时隙一起在一种信道中进行时分复用。 G.723.1采用了执行不持续传播静音压缩,这就意味着在静音期间比特流中加入了人为噪声。除了预留带宽之外,这种技术使发信机调制解调器保持边续工作,并且避免了载波信号时通时断。 G.729 G.729编码器是为低时延应用设计,它帧长只有10ms,解决时延也是10ms,再加上5ms前视,这就使得G.729产生点到点时延为 25ms,比特率为8 kbps。这些时延性能在互联网中很重要,由于咱们懂得任何能减少时延因素都是非常重要。 G.729有两个版本:G.729和G.729A。G.729比G.723.1简朴。这两个版本互

41、相兼容但它们性能有些不同,复杂性低版本 (G.729A)性能较差。两种编码器都提供了对帧丢失和分组丢失隐藏解决机制,因而在因特网上传播语音时,这两种编码器都是较好选取。Cox等 COX98以为G.729在解决随机比特错误方面性能不好。建议在有随机比特错误信道上不使用此编码器,除非运用信道编码(前向纠错码和卷积码,将 在无线部份讨论)保护最敏感比特。 3.2 后向自适应LPAS编码:16 kbps G.728低时延码勉励线性预测 G.728是低比特线性预测合成分析编码器(G.729和G.723.1)和后向ADPCM编码器混合体。G.728是LD-CELP编码器,它一次只解决5个样点。 CELP是

42、上种语音编码技术,它勉励信号是从一种也许勉励信号集合中通过全搜索办法选出。低速率语音编码吕器对样值预测滤波器采用前向自 适应方案。而LD-CELP采用后向自适应滤波器并每隔2.5ms做一次更新。CELP中共有1024个也许勉励矢量。这些矢量可进一步分析为4种也许 增益,两种符号(+和-)与128种形状矢量。 对于低速率(56128 kbps)综合业务数字网(ISDN)可视电话,G.728是一种建议采用语音编码器。由于其后向自适应特性,因而G.728是一种低时延编码器,但 它比其他编码器都复杂,这是由于在编码器中必要重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。 四、参

43、数语音编码器:2.4 kbps混合勉励线性预测编码 参数编码器采用简化勉励信号语音模型,因而能工作在最低比特率。前而讨论所有语音编码器都可描述为波形跟踪,它们输出信号波形和相位与输入信号很相似。 参数语音编码器却不同,它不呈现为波形跟踪。此类编码器是基于分析合成模型,可用相称少参数表达语音信号。这些参数普通是每隔 20ms40ms就会从语音信号中提取和量化。在接受端,这些参数用来生成合成语音信号。在抱负条件下,合成语音听起来和原始语音相似。在背景噪音较大 状况下,由于输入语音信号不能依照其内在语音模型较好建模,因此任何参数编码器都将失败。美国政府选取了2.4 kbps MELP用于保密电话。

44、对于我媒体应用,COX98研究指出:当需要低比特率时,参数编码器是一种好选取。例如,简朴顾客游戏中经惯用参数编码器。这会减少所需存储空 间。出于同样因素,参数编码器对某些多媒体消息型业务也是一种好选取。对所有类型语音环境来说,参数编码器绝对语音质量都较低,特别是在噪声环境 下。如果事先能对语音文献做仔细编辑,那么这个缺陷是能克服。当前,多媒体应用中大多数参数编码器都不是原则。而是合用于此类专用编码器。 用于无线通信G.723.1可变速率编码 G.723.1附件C规定了一种信道编码规范,此规范可以和三倍速率语音编码器一起使用。这个信道编码器比特率可变,它作为整个H.324原则系列一部份,是为移动

45、多媒体应用设计。 这个信道编码器支持比特率范畴从0.7 kbps到4.3 kbps。它也支持G.723.1三个操作模式编解码器,即高速率模式、低速率模式和不持续传送模式。 这个信道编码器采用截短卷积码,依照每一类型信息比特主观重要性不同,信道编码器比特率可对不同比特类型分进行优化。这种分派算法对编码器和解码器 都是已知。每次系统控制信号无论是变化G.723.1速率还是变化信道编码器比特率,这个算法都会使信道编码器适应于新语音业务配备。 如果信道编码器可用速率较低,那么一方面要保护主观上最敏感比特位。当信道编码器比特率增长时,多余信道比特一方面用来保护更多信息比特 位,然后再对已保护过比特类型增

46、强保护。 在运用信道编码之前,语音参数要在信道适配层作部份变化以提高对传播错误健壮性。五、编码器评价 评估编码器性能时要考虑几种重要因素。这些因素如下提示: 帧大小:帧大小表达语音流量时间长度,也称为帧时延。 帧是语音信号分立部件,且每帧是依照语音样点更新。本 简介编码器都是一次解决一帧。每帧信息各放在各语音分组 中,并传送给接受端。 解决时延:它表达在编码器中对一帧语音做编码算法解决所 需时间。它普通简朴计入帧时延。解决时延好称为算法时延。 前视时延:编码器为了对当前帧编码提供协助而检查下一 帧一定长度,此长度就称为前视时延。前视想法是为了利 用相邻语音帧之间密切有关性。 帧长度:这个值表达

47、经编码解决后字节数(不涉及帧头)。 语音比特率:当编解码器输入是原则脉冲编码调制语音 码流(比特率为64 kbit/s)时,编解码器输出速率。 DSP MIPS:此值是指支持特定编码器DSP解决器最低 速度。值提注意是DSP MISP与其他解决器MISP速率无 关。与用在工作站和个人计算机上通用解决器不同,这些DSP 是为特定任务而专门设计。因而,为实现上述编解码器处 理所需求MISP,通用解决器要比专用DSP解决器大。 RAM需求:它描述了支持特定编码过程所需要RAM大 小。 评价编码器性能核心因素是编码器工作所需时间。这个时间是指编码器缓存及解决时间,称为单向系统时延。其值等于:帧大小+解

48、决时延+前视时延。显然,解码时延也非常重要。事实上,解码时延大概是编码时延一半。六、语音编码器比较 为了原则编码器讨论作个总结,表4-1RUDK97对几种编码器比特率、MOS、复杂性(以G .711为基准)和时延(帧大小及前视时间)作为比较。 原则编码类型比特率(kbps)MOS复杂性时延(ms)G.711PCM644.310.125G.726ADPCM324.0100.125G.728LD-CELP164.0500.625GSMRAE_LPT133.7520G.729CSA-CELP84.03015G.729A15G.723.1ACELP6.33.82537.5MP-MLQ6.3US DodLPC-102.4合成语音1022.5FS1

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服