收藏 分销(赏)

多媒体播放系统论文.doc

上传人:仙人****88 文档编号:9354716 上传时间:2025-03-23 格式:DOC 页数:33 大小:233.50KB 下载积分:10 金币
下载 相关 举报
多媒体播放系统论文.doc_第1页
第1页 / 共33页
多媒体播放系统论文.doc_第2页
第2页 / 共33页


点击查看更多>>
资源描述
毕业论文(设计) 目录 目录 目录 1 摘要 2 Abtract 3 第1章 绪论 4 1.1 选题背景 4 1.2 本文研究的内容 4 第2章 VB.NET多媒体编程技术 5 2.1 多媒体技术 5 2.1.1 多媒体的基本概念 5 2.1.2 多媒体关键技术 6 2.2 多媒体信息系统 8 2.2.1 媒体系统组织结构 8 2.2.2 媒体系统程序功能 8 2.2.3 媒体系统发展趋势 9 2.3 用VB.NET进行多媒体编程 9 2.3.1 VB.NET新特性 9 2.3.2 VB.NET集成开发环境 11 2.3.3 VB.NET在多媒体应用软件开发上的优势 12 第3章 常见音视频格式 14 3.1 几个相关概念 14 3.2 视频格式简介 17 3.2.1 Windows视频原理 17 3.2.2 Windows视频系统组成 17 3.3 常见视频格式 17 第4章 媒体播放器功能分析 19 4.1 VB.NET中对媒体文件的处理方法 19 4.1.1 MCI设备类型 19 4.1.2 Windows API在多媒体中的应用 22 4.2 整体功能分析 23 4.2.1 需求及功能分析 23 4.2.2主要界面的设计 25 4.2.3 主要方法及技巧 26 第5章 系统不足之处及发展前景 30 致谢 31 参考文献 32 33 毕业论文(设计) 摘要 摘要 该媒体播放器是一款基于高性能PC的多媒体应用软件,可以令用户方便的播放目前存在的多种常用音频视频格式,实现录音播放及在线视听的功能。该软件利用Visual Basic.Net进行开发,此语言被计算机界称为“最富有创新精神的编程工具之一”,可以处理文本、图像、动画、声音等多媒体数据,从根本上改变了传统程序设计模式。经过测试,此系统能播放MP3、CD、VCD、MID、AVI、WAV、MPG等媒体文件类型,实现暂停、快进、快退、左右声道立体声转换,新建、打开、录制、保存WAV文件,音量、播放速度的控制及M3U文件列表的创建、实现连续播放等基本功能。 关键字: VB.NET,音频,MCI,API函数 Abtract The Multi-media Player was the application software that was baseded on high performance PC,Much kinds of popular audio frequency and video frequency standards can be played by it. Moreover, it had the service and capacity about recording announcement and online seeing and hearing 。The software was developed by Visual Basic.Net.This language was called by IT circle as“The most wealthy one of innovation essence programming means”,The version may be handle 、Image 、Stir by painting 、Multi-medium data such as voice and so on ,Revise traditional programming pattern through simply on 。Course was tested ,This system can be able to play MP3 、CD、VCD、MID、AVI、WAV、The multi-media files type such as MPG and so on were achieved suspend 、Move forward quickly 、Retreat quickly 、The left and right sides voice road stereo transforms ,Build 、Unfold 、Record 、Conserve WAV's files ,Loudness 、Playback velocity control and M3U's papers list creating 、Achieve the basics function such as successive playback and so on 。 Keywords: VB.NET,Audio-Frequency,MCI,API Function 毕业论文(设计) 第1章 第1章 绪论 1.1 选题背景 随着多媒体技术的发展和PC性能的大幅度提高,在PC机上运行的应用程序越来越多地采用了多媒体技术。如果编写的程序能够发出美妙的声音,播放有趣的动画,无疑将会给人留下深刻的印象。多媒体以其形象直观的特点和丰富的信息含量受到广大用户的欢迎。多媒体编程技术已成为现在编程技术的一个热点。同时,多媒体技术的发展改变了计算机的使用领域,由办公室、实验室的专用品变成了信息社会的普通工具,广泛应用与工业生产管理、学校教育、公共信息咨询、商业广告、军事指挥与训练,甚至家庭生活与娱乐等领域。多媒体是计算机技术应用的重要领域,有着极其良好的发展前景。选择多媒体播放器这一课题,是为了在原有的语言知识基础上,通过制作一个常用的多媒体播放器,加深对多媒体技术的理解,提高自己的编程能力和对所学知识的综合运用能力。 1.2 本文研究的内容 本文介绍的主要内容是VB.NET在多媒体方面的编程应用,主要是对音频文件的处理。在第二章VB.NET多媒体编程技术中,介绍了多媒体技术的内容,应用方面的关键技术,以及VB.NET的特点和在多媒体应用编程方面的优势。在第三章中介绍了常见音视频格式。第四章是本文研究的重点,包括主要的编程技术,及整个播放器的系统功能分析。第五章,总结分析系统的不足之处,和发展前景。 毕业论文(设计) 第2章 第2章 VB.NET多媒体编程技术 2.1 多媒体技术 2.1.1 多媒体的基本概念 多媒体(Multimedia,由media和multi两部分组成)一般理解为包括多种媒体元素。所谓多媒体元素,指媒体中可显示给用户的媒体组成,主要包括文本、图形、图像、声音、动画和视频影像等。 下面主要对音频元素进行介绍。 声音是人们用来传递信息、交流感情最方便、最熟悉的方式之一。在多媒体课件中,按其表达形式,可将声音分为讲解、音乐、效果三类。我们听到的声音都是模拟信号,在电脑里要处理这些声音数据,就需要把模拟音频转成数字音频。这在电脑音乐里就称作采样,其过程所用的主要硬件设备便是模拟/数字转换器(Analog to Digital Conberter,即ADC)。采样的过程实际上是把通常的模拟音频信号的电信号转换成许多称作“比特(Bit)”的二进制码0和1,这些0和1码便构成了数字音频文件。生成音频文件后,就可以对其进行处理了。对多媒体而言,我们通常需要编辑和存储声音以及对各种音频格式进行转化。压缩技术使得音频文件更易于存储和传播。一个50MB的WAV文件被压缩成MP3,WMA或Mjuice(*.MJF)文件时可能只有5MB。声音文件有多种格式,目前常用的有:波形音频文件、MP3文件、RA文件、CD-Audio以及数字音频文件等。下面分别介绍。 1.波形音频文件 扩展名为WAV。高格式记录声音的波形,故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件能够和原声基本一致,质量非常高。但因该声音文件没有经过压缩,每分钟的音频约占用10MB的存储空间,这样做的代价就是文件太大。 2.MP3文件 这是现在流行的声音文件格式,MP3格式压缩音乐的典型比例有10:1、17:1,甚至70:1。所以我们可以用64Kbps或更低的采样频率节省空间,也可以用320Kbps的标准达到极高的音质。在网络可视电话通信方面应用广泛,缺点是和CD唱片相比,音质不能令人满意。 3.RA文件 全名是Real Audio,扩展名为RA,这种格式可谓是网络的灵魂,强大的压缩量和极小的失真使其在众多格式中脱颖而出。和MP3相同,它也是为了解决网络传输带宽资源而设计的,因此主要目标是压缩比和容错性,其次才是音质。 4.CD Audio音乐CD 即光盘数字音频文件,其采用的采样频率是44.1Hz,每个采样数据使用16位存储信息。这是唱片采用的格式,又叫“红皮书”格式,记录的是波形流,绝对的纯正。但缺点是无法编辑,文件长度太大。 5. 数字音频文件 即MIDI,其扩展名是MID。MIDI是指乐器数字的接口,它是数字音乐的国际标准,这是目前最成熟的音乐格式。 MIDI文件实际上是一系列指令(即音乐行为的记录,其中包括音长、音量、音高等音乐的主要信息),而不是音乐波形,所以其文件不大。MIDI能指挥多个音乐设备的运转,而且具有统一的标准格式,能够模仿原始乐器的各种演奏技巧甚至无法演奏的效果,而且文件的长度非常小。MIDI文件记录的是“音乐在什么时刻,使用什么乐器,以什么音符开始,以什么音调结束,加以什么伴奏”等信息,所以MIDI文件本身并不是音乐,而是一些发音命令,不包含任何声音信息。所以MIDI文件所占用的磁盘空间显然要比WAV或MP3文件小得多。这样的文件,最适合在互联网上传播,MIDI音乐也因此成为与Internet联系最密切的音乐。一般来说,MIDI文件只适合于记录乐曲,而不适合对歌曲进行处理。除正常的MIDI文件之外,这种格式还有很多变种,如*.RMI、*.CMI、*.CMF等。 2.1.2 多媒体关键技术 由于多媒体技术最终要处理的无非是文、图、声和像等信息,而多媒体系统需要将不同的媒体数据表示成统一的结构码流,然后对其进行变换、重组和分析处理,以便进行进一步的存储、传送、输出和交互控制。所以,多媒体的关键技术重要集中能在以下四类中:数据压缩技术、多媒体专用芯片、多媒体同步技术和多媒体实时多任务操作系统技术。正是因为这些技术取得了突破性的进展,多媒体技术才会迅速的发展,成为像今天这样具有强大的处理声音、文字、图像等媒体信息的能力的高科技技术。 1. 多媒体数据压缩及编码技术 研制多媒体计算机需要解决的关键技术之一是能够实时的综合处理声音、文字和图形等信息。这就要求这些信息的数据量的大小能够承受。现代存储设备对于存储文字信息来讲容易实现,但是由于数字化的图像、声音等多媒体数据量非常大,而且,视频、音频信号还要求快速的传输处理,这致使一般计算机产品特别是个人计算机系列上开展多媒体应真正把多媒体技术投入应用,首先应该解决的问题就是对多媒体信息的压缩编码及解码。 2. 多媒体专用芯片 多媒体专用芯片的发展来源于的规模集成电路(VLSI)技术,它是多媒体硬件系统体系结构的关键技术之一。因为要实现音频、视频信号的快速压缩、解压缩和播放处理,需要进行大量的快速计算。另外,要实现图像的许多特殊效果、图像生成、绘制,以及音频信号处理等,也需要较快的运算处理速度,因此,只有采用专用芯片,才能取得满意效果。 3.多媒体同步技术 在多媒体系统中,通常利用多种媒体从不同侧面来表达同一个主题。例如在计算某处旅游景点时,屏幕的窗口中出现该点的录像,同时有声音在解说,屏幕的其他部位则显示有关的文字说明、图表等。此时图像、语音等就存在着相互依存的关系。这种关系不只是显示时才有,在捕获、存储、传输和处理过程中也是存在的。 从广义上讲,同步通常是指三类不同媒体对象之间的相互依存关系,即内容关系,空间关系和时间关系。 在集成了多种多媒体的多媒体系统中,同步是一个关键性问题。系统的各个组成部分,例如,操作系统、数据库、文件系统、传输数据的通信系统,以至于应用程序等,都需要在不同层次上支持媒体的同步。与同步相关的国际标准有MHEG,Hytime等。 4.多媒体实时多任务操作系统 多媒体的各种软件要运行于多媒体操作系统平台(如Windows)上,故操作系统平台是软件的核心。多媒体操作系统具有实时任务调度、多媒体数据转换和同步控制等对多媒体设备的驱动和控制,以及图形用户界面管理等。这样的操作系统能够方便的处理动态音频和视频,具有良好的交互能力,并且该操作系统对数据存取的方法和数据格式无关,易于扩充。 另外,对于网络中的多媒体,其对于上述技术的要求更严格,并且,为了实现多种媒体的同步传输,需要有大量的更为复杂的工作要做。 2.2 多媒体信息系统 多媒体信息系统是多种媒体存储、处理、显示等技术与有线和无线通信网、广播和闭路电视网、计算机网相结合,把计算机的交互性、通信的分布广域性、电视的真实性结合为一体的高品质的信息网络系统。 多媒体信息系统具体的应用系统已层出不穷,如远程教育、远程医疗、电子贸易、多媒体会议系统等。多媒体信息系统的应用将在提高国力,发展经济和改善人民生活等方面起到巨大的作用,多媒体技术的开发对人类世界产生变革性的影响。 2.2.1 媒体系统组织结构 多媒体信息系统结构包括三个领域:设备域、系统域和应用域。还有一条贯穿三个域的纽带,那便是同步化技术。正如前面介绍的,同步化是由计算机控制的独立媒体数据可以被集成并完成特定的功能,为了此目的,时间上的,空间上的和语义上的同步必须一并考虑。 2.2.2 媒体系统程序功能 多媒体信息系统程序的主要功能包括以下几个方面: n 彩色图形图像显示 n WAVE声音文件播放(多种语言) n MIDI数字音乐文件播放 n MPEG或AVI视频信息播放 n 文本文件显示(多种文字) n 数据库及网络数据的传输与共享 n 二维、三维动画表现 n 全程自动播放 下面以媒体播放器在Web中的应用为例,来看看多媒体信息系统程序的主要功能。由于声音点播和影视点播应用还没有完全直接集成到现在的Web浏览器中,这就需要一贯单独的应用程序来帮助,通常我们用媒体播放器(Media Player)来播放声音和影视。典型的媒体播放器要执行好几个功能,包括解压缩、消除抖动、错误纠正和用户播放等。现在可以使用插件技术把媒体播放器的用户接口放在Web客户机的用户界面上,浏览器在当前Web页面上保留屏幕空间,并且由媒体播放器来管理。 2.2.3 媒体系统发展趋势 由于新一代高速互联网的飞速发展,网络带宽和CPU计算能力成倍的增长,以及多媒体技术的日益成熟,使得计算机、通信及多媒体技术逐步趋向融合,构成以互联网为基础的信息基础设施,成为人与人之间交互(即人际交互)或人与信息源、外部世界交互的媒介。在这种形势下,新一代分布式多媒体信息系统概念的提出是技术发展的趋势和需要。 用户是以自我服务的形式获得信息;另一种是特定风味的饭店形式的信息传送类型(用户以按需服务的形式获得信息),这是一种效率更高的信息服务形式,更能适应信息大量涌现的情况。显然,后者将对人机交互提出更高的要求,如需要基于内容的检索等。另外,要进行远距离之间的人际交互首先要进行人机交互,这就对分布式人机交互提出了更高的要求。这时的人机交互是以多模态(语音和视觉)的方式和能支持多人之间成组形式的实时、协作式的交互。总之,人机交互技术是新一代分布式多媒体信息系统的关键技术。 正是在这种环境下,有关专家提出了基于高速互联网的新一代分布式多媒体信息系统的概念。这种系统的基本特点是:以人为中心的计算,即以符合人的习惯方式进行信息交互。因此需要基于多功能感知的智能接口,甚至提供一贯沉浸的环境;它支持多用户以多种媒体进行的实时交互;它是一个集成的系统,能完成任务的全过程;在信息检索方面,由于传统检索方法中所用的关键字检索不能代表多媒体信息中的丰富信息,因此新一代分布式信息系统的检索是基于内容的信息检索。 2.3 用VB.NET进行多媒体编程 2.3.1 VB.NET新特性 VB.NET(Visual Basic7.0)是微软针对其.NET框架在Visual Basic6.0基础上进行重塑后的结果,其“可视性”和“面向事件”的特征是简化Windows程序开发的关键。它全面继承了Visual Basic原有的优秀特性,尤其是作为世界流行的开发软件之一,VB.NET仍然保持了容易上手的特色,主要体现在网络窗体、网络服务以及面向对象几个方面,尤其是增加了对象的继承性。 在过去的几年中,面向对象的程序设计OOP(Object-Oriented Programming)思想已经深入人心。OOP程序设计方法能够使大规模的系统程序可读性和纠错能力大为增强,升级过程大大加快。由于VB.NET相对以前的Visual Basic已发生了一系列根本性的转变,从VB6到VB.NET的进阶,即使是经验丰富的程序员,不花一定的时间也是无法完成的。 从Visual Basic6.0升级到VB.NET所带来的变化绝对可以称得上是革命性的。VB.NET完全是一种基于.NET框架的开发工具,.NET框架位于操作系统的上层,处理从内存管理到用户界面的绘制等所有事情,而VB.NET与.NET框架集成得非常紧密。Microsoft在VB.NET中添加了许多全新的功能,使之成为完全面向对象的编程语言,并成为功能有很大改进的Web设计工具。 VB.NET主要在网络窗体、网络服务和面对象这三个方面进行了改善和加强。不仅如此,VB.NET还具有强大的错误处理以及同VC++、C#更紧密的集成。同时,VB.NET也下决心放弃了一些Visual Basic原来一直保持的特性。 1. 网络窗体(Web Forms) 网络窗体是VB.NET为网络开发人员引进的一个新概念,主要用于提高Visual Basic的RAD能力,满足网络应用的广泛需求。网络窗体为组件化网络解决方案提供了一种全新的方法。VB.NET中有两种窗体包,Windows窗体和网络窗体。相对于VB6的窗体,Windows窗体使用了不同的对象模块,不过绝大部分是与前者兼容的。当项目升级时,VB窗体将自动升级到Windows窗体。网络窗体是.NET架构中非常重要的一个组成部分。一个网络窗体页面包含两个部分:一个是HTML文件,代表页面的可视内容,主要用于描述页面;另一个是响应和控制该页面事件的源代码文件。 2. 网络服务(Web Service) 网络服务是Visual Studio.NET开发系统中第二个主要的改进之处。网络服务包含在ASP.NET中,是一个封装的、基于XML方式的中间商务模块,作为DCOM的有效延伸,它允许用户通过互联网、内部网,或在同一台机器上调用方法和函数,并返回相应的结果。通过一个SOAP(Simple Object Access Protocol,简单对象访问协议)接口,网络服务能使你在网络触及的任何地方配置程序模块。 3. 面向对象语言的增强 VB.NET中将包括与C++、JAVA语言一样的面向对象的开发技术(此前的VB都未具备)。通过一些关键的面向对象语言的增强,VB.NET能够支持继承(Inheritance)、多态(Polymorphism)和重载(Overload)等重要特性,例如GoSub/Return语句以及DefInt已经从新的VB.NET程序中消失了。VB.NET的OOP特性必将改变我们过去习惯的一些编程方法,VB.NET程序的编写将会变得和C++一样灵活、方便。VB.NET中专门引入了几个新的语句和关键字来满足支持继承的需要。见表一 表一 VB.NET引入及关键字 语句/关键字 Inherits 说明 指定当前类所继承类(即基类)。Inherits关键字只允许用在类和接口中 NotInherits 防止程序员使用某个类作为基类 MustInherit 指定不能创建所给定的类的实例。使用这个类的唯一方法是继承 Overridable 允许在继承类中重载某个属性或方法。默认的公共方法是NotOverridable Overrides 允许重载基类中定义的某个属性或方法 NotOverridable (默认)防止某个属性或方法在继承类中被重载 MustOverride 需要继承类覆盖这个属性或方法。当使用这个关键字时,方法定义只包括Sub、Function或Property语句。没有End Sub、End Function或End Property语句。拥有MustOverride方法的类必须被声明为MusInherit。默认方法是NotOverridable Shadows 允许重用继承类成员的名称。屏蔽某个名称并不是删除使用该名称的继承的类型成员;只是使所有继承的类型成员,包括重载和覆盖的成员不能在派生类中使用。屏蔽在派生类中声明类成员 2.3.2 VB.NET集成开发环境 VB在其集成开发环境(IDE,Integrated Development Environment)里集成了许多不同的功能,例如,设计、编辑、编译和调试。Visual Basic一直保持了友好的用户界面,而VB.NET的界面又作了些修改 1.环境要求 如果要安装VB.NET,计算机必须运行了Windows 98/2000/XP操作系统,并且需要确认在安装VB.NET前安装了IIS软件。 2. 启动VB.NET IDE 要了解VB.NET的集成开发环境,首先启动并进入VB.NET IDE。在第一次启动Visual Studio.NET时,将首先进入一个配置文件页面,你需要在其中对IDE的有关选项进行设置,该页面又称为“Profile”页面。以后Visual Studio.NET的每次启动都按此次设置进入。 2.3.3 VB.NET在多媒体应用软件开发上的优势 从原理上说,进行多媒体应用程序设计可以采用从C++到多媒体专用开发系统,如Authorware,Director等多种层次的工具。然而,由于多媒体软件涉及的媒体复杂多样、开发周期短并且需要多种专业人员参与,因此,为了能进行实用高效的开发,必须选用简单易用、开发效率高的软件。 Visual Basic是Microsoft公司开发的Windows编程工具软件。由于它具有先进的设计思想、快速易掌握的使用方法及控制媒体对象手段灵活多样等特点,受到了多媒体软件开发人员的关注和青睐,也因此成为多媒体应用程序开发的重要工具之一。 Visual Basic可以处理文本、图像、动画、声音等多媒体数据。这是由于VB是一种面向对象、编程灵活多媒体开法工具,它能够调用各种多媒体素材并利用多种方法、事件、属性等来控制对象及其链接关系,通过程序实现对各个对象的精确控制;通过Windows动态链接库或定制控件的形式可以与任何多媒体系统相关联。 另外,在Visual Basic专业版中,为了便于开发多媒体应用程序,系统为我们提供了MCI(媒体控制接口)进行多媒体编程。通过MCI接口,我们可以用指令控制各种多媒体外设并读取各种多媒体系统所需的文件格式。正是由于Visual Basic为我们进行多媒体开发带来了极大的方便和灵活性,所以Visual Basic是我们进行多媒体开发的工具之一。 VB.NET在多媒体应用软件开发方面有着良好的前景。目前多媒体制作工具基本上可以分为两类,一类是专为开发多媒体节目和电子出版物而设计的所谓多媒体编著工具(authoring tools);另一类是通用的软件开发工具,如Windows下的Visual Basic、Visual C++等。采用通用的软件开发工具的优点是灵活性高,软件运行效率高。在需要大数据量处理及查询时常常采用VB程序设计语言,如百科全书类的节目大多是用Visual Basic开发制作的。之所以选用VB开发多媒体系统,主要是可用专业版中所提供的MCI.VBX(Media Control Interface:媒体控制接口)的控制对象。通过MCI.VBX就可以用指令控制各种多媒体外部设备并读取各种多媒体系统所需的文件格式。 毕业论文(设计) 第3章 第3章 常见音视频格式 3.1 几个相关概念 音频文件的很多因素都会影响到人们对文件的选择。例如,音频文件的比特率(Kbps),它表明了音乐文件每秒的数据量,比特率越高,音质也就越好,文件相应地就越大。一首MP3歌曲,根据比特率的不同可能会有三个版本:96Kbps、128Kbps和192Kbps.普遍认为,128Kbps的MP3文件最为接近CD音质。录制WAV文件时将遇到不同的音质表示法:采样频率(Sample Rates)、采样精度(Bit Depth)、声道数(Channels),等等采样频率指的是原始的声音每秒钟被记录多少次,以Hz或KHz表示,采样频率越高表示音质越好,文件也就越大;声道数表示WAV是单声道(Mono)、双声道(Stereo)还是其他情况。采样精度有8位、16位或更多,它告诉你电脑在对原始声音的每一次采样时记录了多少信息。44.1KHz,双声道,16位采样精度就是平时说的CD音质。 七种目前比较流行的音频文件格式: 1.WAV:最为常见的音频格式之一,是微软公司专门为Windows开发的一种标准数字音频文件(WaveForm,波形文件)。这种文件记录的是声音信号的波形数据,所以只要采样频率高、采样字节长,利用这种格式记录的声音能够和原声基本保持一致,质量非常高。但WAV文件的一个致命的缺点就是他所占用的磁盘空间太大(每分钟的音乐大约需要12MB的磁盘空间)。 (1) 文件结构 Windows环境下的大部分多媒体文件都按照“资源互换文件格式”(Resources Interchang File Format,简称RIFF)来存放信息。WAV文件和AVI文件等都是由这种结构衍生出来的。RIFF格式类似一种树状结构,其基本构成单位是块(chunk),犹如树状结构中的节点,每个块(chunk)由“辨别码”、“数据大小”及“数据”三部分组成。WAV文件包含若干不同类型的块。其中格式块“fmt”是必须的,它包含着描述波形的重要参数,例如波形的采样率。数据块“data”包含着实际的波形数据,也是WAV文件所必须的。其他类型的数据块则是可选的。 (2) 采样数据的存储 对于波形音频进行量化时,由于表示采样数据所用的位数不同,存储数据的方式也有所不同。一般有以下三种情况:如果量化的数据大于8个比特率,例如16比特,那么这个数字波形的每一个采样点将占用两个字节,其取值范围从-32768~32767。如果量化的数据小于或者等于8个比特,则每个采样点以一个字节存储,它是一个无符号数,其取值范围从0~255。如果量化的数据不足8的整数倍,例如12比特,则仍然以两个字节(即16位)的方式存储。 (3) 采样率 采样帧1# 采样帧0# 0通道 1通道 0通道 1通道 图A 立体声的采样帧示意图 立体声有两个声道。对立体声进行采样和量化之后会形成两个声道的数据。在存储立体声的波形数据时,具体方式是:先存左声道和右声道的第一个采样点,再存第二个采样点,……只有这样存储各个声道的采样数据,才能保证他们能够同时播放。立体声数字波形,每两个采样点(左声道和右声道的采样点)构成一个采样帧,如图A所示。对于单声道的数字波形,一个采样帧只有一个采样点。对于多声道的数字波形,一个采样帧则包含多个采样点。在一个采样帧中安排各个采样点数据的顺序时,其规则如图B所示: 立体声: 1左 2右 三通道: 1左 2右 3中 四方音效: 1左前 2右前 3左后 4右后 四通道: 1左 2中 3右 4环绕 六通道: 1左中 2左 3中 4右中 5右 6环绕 图B 采样帧中各个声道采样点的安排 (4) 波形声音的采集、处理与输出 波形声音的获取是通过声音数字化接口进行的,输入的声音经过数字化后存入计算机中,在需要时,再将其恢复成原始波形输出。这是一般的过程。对于声音的处理主要集中在压缩、编辑和效果处理上。压缩常在硬件或低层软件中完成,以求降低数据量。声音的编辑常常是进行分段、组合、首尾处理等,以求单一的声音片段能以干净、准确的形式出现。 2. CD Audio: CD的历史不长,但由此产生的CD规范和标准很多。国际标准化组织ISO指定和采纳了多种标准,规范中定义了光盘的尺寸、转速、数据传送速率、数据格式等重要参数。CD Audio即音乐CD,文件的扩展名CDA。唱片一般采用这种格式,又称为“红皮书”格式,它所记录的是波形流。CD音乐在CD盘上是按磁轨存放的,一个曲目占一个磁轨。 3.MP3:这是目前最为流行的声音文件格式,这种音频文件虽然达不到CD音质,但是却具有压缩率大的特点。 MP3是以MPG-Layer3标准压缩编码的一种音频文件格式。MP3全称MPEG-1 Layer3,是MPEG-1 Audio的组成部分。MPEG-1 Audio是VCD影像压缩标准的一个组成,即音频部分的压缩标准。该标准主要有三层:Layer1、Layer2和Layer3。经Layer1编码的文件后缀为MP1,依次为MP2(MPA)、MP3。 MPEG编码具有很高的压缩率,通过简单的计算可以知道,一分钟CD音质(44.1KHZ,16Bitc,2Stereo,60Second)的WAV文件如果未经压缩需要10MB左右的存储空间。而MPEG Layer1和Layer2的压缩率可分别达到1:4和1:6,MPEG Layer3的压缩率更是高达1:12。以前,繁多的音乐文件格式和庞大的体积一直阻碍着音乐在互联网上的传播,有了MP3情况就大不相同了。MP3作为传播音乐的重要形式,正形成风靡全球之势。 4. MIDI:Musical Instrument Digital Interface(乐器数字接口)的缩写,扩展名MID。国际MIDI协会开发的乐器数字接口文件,它采用数字方式对乐器所奏出来的声音进行记录(每个音符记录为一个数字),然后在播放时再对这些记录进行合成,因而占用的磁盘空间非常小,但其效果相对来说要差一些。一般来说,MID文件只适合于记录乐曲,而不适合对歌曲进行处理。MIDI文件主要依靠硬件生成。除正常的MID文件之外,它还有很多变种,如*.RMI、*.CMI、*.CMF等。 MIDI消息,实际上就是乐谱的数字描述。当一组MIDI消息通过音乐合成器芯片演奏时,合成器就会解释这些符号并产生音乐。关键是作为媒体应能记录这些音乐的符号,相应的设备能够产生和解释这些符号。 5. Real Audio:文件的扩展名RA,这种音频格式以其强大的压缩比和极小的失真在众多格式中脱颖而出。和MP3相同,它也是为了解决网络传输带宽资源有限的问题而设计的,因此考虑的主要问题是压缩比和容错性,其次才是音质。 3.2 视频格式简介 3.2.1 Windows视频原理 Windows视频的文件格式是AVI(Audio Video Interleave,即声音与视频交织文件),AVI文件包含一系列的位图和音频数据段,其中的数据都是压缩的。实际上,也正是压缩技术才使得视频成为可能。如果没有压缩,存储一分钟的视频为30帧/秒(平滑拨反速率)、160*120分辨率,并且不包括声音的视频信息将占用103,680,000字节的空间,这就要求数据传输速率为98.8Mb/s,没有一种硬盘能达到这样的传输率,也没有人愿意用一张CD-ROM来装几分钟的视频信息。 AVI文件采用的压缩算法是有损压缩,这会降低图像的质量,但是如果不采用压缩技术,就不会有Windows视频。Windows视频的系统的任务是识别一个视频剪辑的压缩/解压缩算法,然后采用适当的编码/解码器来重新组织数据,把它分成视频和音频元素,输入系统和声卡,从而播放出动画和声音。 3.2.2 Windows视频系统组成 Windows视频系统由四个主要模块组成: (1)AVICAP.DLL包含视频捕捉函数,并给AVI文件的输入/输出以及视频/音频驱动程序接口。 (2)MSVIDEO.DLL使用一套函数处理屏幕上的视频操作。 (3)MCIAVI.DRV包含Windows视频的MCI命令解释器。 (4)AVIFILE.DLL包含管理AVI文件的函数,这些函数根据视频帧和数据流来管理AVI文件。 3.3 常见视频格式 1.AVI AVI是微软由Win3.1时代就发表的旧视频格式,其好处是兼容好、调用方便、图象质量好。但缺点也是有目共睹的:尺寸大!就因此才可以看到由MPEG-1到现在的MPEG-4的出台。AVI文件是由“资源互换文件格式”(Resources Interchange File Format,简称RIFF)这种结构衍生出来的。RIFF格式类似一种树状结构,RIFF格式类似一种树状结构,其基本构成单位是块(chunk),犹如树状结构中的节点,每个块(chunk)由“辨别码”、“数据大小”及“数据”三部分组成。 2.MPEG MPEG(Motion Picture Experts Group)包括了MPEG-1,MPEG-2和MPEG-4(没有MPEG-3,大家熟悉的MP3只是MPEG Layeur 3)。MPEG-1被广泛应用在VCD制作和一些视频片段下载的网络应用上面,可以说99%的VCD都是用MPEG-1格式压缩的,(VCD2.0并不说明VCD是用MPEG-2压缩的)使用MPEG-1压缩算法可以把一部120分钟长的电影(未视频文件)压缩到1.2Gb左右大小。MPEG-2则应用在DVD制作(压缩)方面,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当的应用面。使用MPEG-2压缩算法一部120分钟长的电影压缩到300M左右的视频流,可供在网上观看。其它的DIVX格式也可以压缩到600M左右,但其图像质量比ASF要好很多。 毕业论文(设计) 第4章 第4章 媒体播放器功能分析 4.1 VB.NET中对媒体文件的处理方法 VB.NET为用户提供了一个多媒体控制接口MCI,通过MCI这个公用接口,用户无需介入实际的设备就可操纵所有的多媒体设备。为了增强VB的能力,VB提供访问Windows应用程序接口(API)的方法。通过调用API就可深入到Windows内部,实行许多高级功能,例如,访问操作系统、多媒体的应用等。API函数是一组C语言编写的系统函数,是Windows本身用来提供图形用户界面和操作Windows环境的所有的过程。Visual Basic可以直接调用所有Win32 API函数。 4.1.1 MCI设备类型 多媒体控制接口(Multim
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 学术论文 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服