1、书全国计算机等级考试二级MSOffice基础知识概要资料仅供参考第一章 计算机基础知识计算机是能按照人的要求接受和存储信息,自动进行数据处理和计算,并输出结果信息的机器系统。计算机是一门科学,也是一种自动、高速、精确地对信息进行存储、传达与加工处理的电子工具。掌握以计算机为核心的信息技术的基本知识和应用能力,是信息社会中必备的基本素质。1.1概述1.1.1计算机的发展1943年,莫克利和埃克特开始研制电子数字积分计算机(ENIAC),并于1946年研制成功。ENIAC被广泛认为是世界上第一台现实意义上的计算机。【习题2】1946年诞生了世界上第一台电子计算机,她的英文名字是( )AUNIVAC
2、-1 BEDVAC CENIAC DMARK-II几乎与此同时,ENIAC项目组的一个研究成员冯诺依曼(现代电子计算机之父)来到了普林斯顿高等研究院,并开始研制她自己的EDVAC(当时最快的计算机)。美籍匈牙利数学家归纳了EDVAC的原理要点。(1)计算机的程序和程序运行所需要的数据以二进制形式存放在计算机的存储器中。(2)程序和数据存放在存储器中,即存储程序的概念。计算机执行程序时,无需人工干预,能自动、连续地执行程序,并得到预期的结果。 (3 ) 计算机的硬件系统由控制器、适配器(也称运算器)、存储器、输入设备、输出设备五大部分组成。【习题1】在冯诺依曼型体系结构的计算机中引进两个重要的概
3、念,它们是( )A引入CPU和内存储器的概念 B采用二进制和存储程序的概念C机器语言和十六进制 DASCII编码和指令系统计算机发展经历的四个阶段:阶段 部件 第一阶段 (1946-1959)第二阶段 (1959-1964) 第三阶段 (1964-1972) 第四阶段 (1972年至今)主机电子器件 电子管 晶体管中小规模集成电路 大规模,超大规模集成电路内存 汞延迟线磁芯存储器 半导体存储器 半导体存储器 外存储器 穿孔卡片,纸袋 磁带磁带,磁盘磁带,磁盘,挂盘等大容量存储器处理速度 几千条几万至几十万条 几十万至几百万 上千万至万亿条代表UNIVAC-I通用自动计算机IBM-7000系列机
4、IBM-360系列机IBM-4300、3080、3090、9000系列1.1.2计算机的特点、用途和分类计算机能够按照程序引导确定步骤,对输入的数据进行加工处理、存储或传送,以获得期望的输出信息,从而利用这些信息来提高工作效率和社会生产率以及改进人们的生活质量。特点:1)高速、精确的运算能力 2)精确地逻辑判断能力3)强大的存储能力 4)自动功能5)网络与通信功能【习题3】计算机最早的应用领域是( )A辅助工程 B过程控制 C数据处理 D数值计算用途:计算机问世之初,主要用于数值计算,“计算机”也因此得名。1)科学计算主要是使用计算机进行数学方法的实现和应用 2)数据/信息处理也称为非数值计算
5、。是当前计算机应用最多的一个领域。3)过程控制是指利用计算机对生产过程、制造过程或运行过程进行监测与控制,即经过实时监控目标物体的状态,及时调整被控对象,使被控对象能够正确地完成目标物体的生产、制造或运行。 4)计算机辅助计算机辅助是计算机应用的一个非常广泛的领域。几乎所有过去由人进行的具有设计性质的过程都能够让计算机帮助实现部分或全部工作。计算机辅助(或称为计算机辅助工程)主要有:计算机辅助设计(CAD)、计算机辅助制造(CAM)、计算机辅助教育(CAI)、计算机辅助技术(CAT)、计算机仿真模拟(Simulation)等。【习题4】英文缩写CAD的中文意思是( )A计算机辅助设计 B计算机
6、辅助制造 C计算机辅助教学 D计算机辅助管理计算机模拟和仿真是计算机辅助的重要方面。在计算机中起着重要作用的是集成电路。5)网络通信计算机技术和数字通信技术发展并相融合产生了计算机网络。6)人工智能(AI) 是用计算机模拟人类的某些智能活动。7)多媒体应用 是包括文本、图形、图像、音频、视频、动画等多种信息类型的综合。8)嵌入式系统并不是所有计算机都通用的。分类:1按计算机处理数据的类型能够分为:模拟计算机、数字计算机、数字和模拟计算机。模拟计算机的主要特点:参与运算的数值由不间断的连续量表示,其运算过程是连续的,模拟计算机由于受元器件质量影响,其计算精度较低,应用范围较窄,当前已很少生产。数
7、字计算机的主要特点:参与运算的数值用离散的数字量表示,其运算过程按数字位进行计算,数字计算机由于具有逻辑判断等功能,是以近似人类大脑的“思维”方式进行工作,因此又被称为“电脑”。2按计算机的用途可分为:通用计算机和专用计算机。通用计算机能解决多种类型的问题,通用性强,如PC专用计算机则配备有解决特定问题的软件和硬件,但能够高速、可靠地解决特定问题,如在导弹和火箭上使用的计算机大部分都是专用计算机。3按计算机的性能、规模和处理能力,可分为:巨型机、大型通用机、微型计算机、工作站及服务器1)巨型机巨型机是指当前速度最快、处理最强的计算机,称为高性能计算机。2)大型通用机大型通用机是对一类计算机的习
8、惯称呼,其特点是通用性强,具有较高的运算速度、极强的综合处理能力和极大的性能覆盖,运算速度为每秒100万次至每秒几千万次。一般人们称大型机为“企业级”计算机。通用性强,但价格比较贵。大型机系统能够是单处理机、多处理机或多个子系统的复合体。3)微型机微型机是微电子技术飞速发展的产物。根据微型机是否由最终用户使用,微型机又可分为独立式微机(即日常使用的微机)和嵌入式微机(或称嵌入式系统)。嵌入式微机作为一个信息处理部件安装在应用设备里,最终用户不直接使用计算机,使用的是该应用设备。单片机是将中央处理器、存储器和输入/输出接口采用超大规模集成电路技术集成到一块硅芯片上。单片机本身的集成度相当高,因此
9、ROM、RAM容量有限,接口电路也不多,适用于小系统中。单板机就是在一块电路板上把CPU,一定容量的ROM、RAM,以及I/O接口电路等大规模集成电路芯片组装在一起而成的微机,并配有简单外设如键盘和显示器,一般电路板上固化有ROM或者EPROM的小规模监控程序。微型计算机的结构有:单片机、单板机、多芯片和多板机。4)工作站工作站是一种高档的微型计算机,它比微型机有更大的存储容量和更快的运算速度。一般配有高分辨率的大屏幕显示器及容量很大的内部存储器和外部存储器,而且具有较强的信息处理功能和高性能的图形、图像处理功能以及联网功能。工作站主要用于图像处理和计算机辅助设计等领域,具有很强的图形交互与处
10、理能力。因此在工程领域,特别是在计算机辅助设计(CAD)领域得到广泛应用。无怪乎人们称工作站是专为工程师设计的计算机。工作站一般采用开放是系统结构,即将机器的软、硬件接口公开,并尽量遵守国际工业界流行标准,以鼓励其它厂商和用户围绕工作站开发软件、硬件产品。当前,多媒体等各种新技术已普遍集成到工作站中,使其更具特色。而它的应用领域已经也已从最初的计算机辅助设计扩展到商业、金融、办公领域,并频频充当网络服务器的角色。5)服务器“服务器”一词很恰当地描述了计算机在应用中的角色,而不是描述机器的档次。服务器作为网络的节点,存储、处理网络上80%的数据、信息,因此也被称为网络的灵魂。主要特点:(1)只有
11、在客户机的请求下才为其提供服务。(2)服务器对客户透明。一个与服务器通信的用户面正确是具体的服务,而能够完全不知道服务器采用的是什么机型及运行的是什么操作系统。(3)服务器严格地说是一种软件的概念。一台作为服务器使用的计算机经过安装不同的服务器软件,能够同时扮演几种服务器的角色。1.1.3计算机科学研究与应用1人工智能人工智能的主要内容是研究如何让让计算机来完成过去只有人才能做的智能的工作,核心目标是赋予计算机人脑一样的智能。2网络计算随着计算机的普及,个人计算机进入家庭,而由此产生计算机的利用率问题。越来越多的计算机处于闲置状态。互联网的出现使得链接调用所有这些拥有优先计算资源的计算机系统成
12、为现实。网络计算是专门针对复杂科学计算的新型计算模式。这种计算模式是利用互联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计算机”,其中每一台参与计算的计算机就是一个“节点”,而整个计算是由成千上万个“节点”组成的“一张网络”,因此这种计算方式称为网络计算。这样组织起来的“虚拟的超级计算机”有两个优势:一是数据处理能力超强;二是能充分利用网上的闲置处理能力。网络计算包括任务管理、任务调度和资源管理,它们是网络计算的三要素。用户经过任务管理向网络提交任务,为任务制定所需的资源,删除任务并检测任务的运行;任务调度室对用户提交的任务根据任务的类型、所需的资源、可用资源等情况安排运行日程和策略;资
13、源管理则负责检测网络中资源的状况。网络计算技术的特点是:(1)能够提供资源共享,实现应用程序的互联互通。网格与计算机网络不同,计算机网络实现的是一种硬件的连通,而网格能实现应用层面的联通。(2)协同工作。很多网格节点能够共同处理一个项目。(3)基于国际的开放技术标准。(4)网格能够提供动态的服务,能够适应变化。网格计算是一场计算革命,它将全世界的计算机联合起来协同工作,它被人们视为21世纪的新型网络基本架构。3中间件技术顾名思义,中间件是介于应用软件和操作系统之间的系统软件。中间件技术已经发展成为企业应用的主流技术,并形成各种不同类别,如交易中间件、消息中间件、专有中间件、面向对象中间件、数据
14、存取中间件、远程调用中间件等。4云计算云计算是分布式计算、网络计算、并行计算、网络存储及虚拟化计算机和网络技术发展融合的产物,或者说是它们的商业实现。构成包括硬件、软件和服务。云计算将传统的以桌面为核心的任务处理转变为以网络为核心的任务处理,利用互联网实现一切处理任务,使网络成为传递服务、计算和信息的综合媒介,真正实现按需计算、网络协作。特点:超大规模分布式、虚拟化、高可靠性、通用性、高可扩展性、按需服务、价廉。1.1.4未来计算机的发展趋势1电子计算机的发展方向从类型上看,电子计算机技术正在向巨型化、微型化、网络化和智能化方向发展。1)巨型化巨型化是指计算速度更快、存储容量更大、功能更完整、
15、可靠性更高的计算机。2)微型化微型计算机从过去的台式机迅速向便携机、掌上机、膝上机发展,其低廉的价格、方便的使用、丰富的软件而受到人们的青睐。同时也作为工业控制过程的心脏,使仪器设备实现“智能化”。3)网络化网络化指利用现代通信技术和计算机技术,把分布在不同地点的计算机相互连接起来,按照网络协议互相通信,以共享软件、硬件和数据资源。4)智能化智能化指计算机模拟人的感觉和思维过程的能力。智能化是计算机发展的一个重要方向。智能计算机具有解决问题和逻辑推理的功能,以及知识处理和知识库管理的功能等。2未来新一代的计算机计算机中最重要的核心部件是芯片,芯片制造技术的不断进步是推动计算机技术发展的最根本的
16、动力。当前的芯片主要采用光蚀刻技术制造,即让光线透过刻有线路图的掩膜照射在硅片表面已进行线路蚀刻技术。当前主要是用紫外光进行光刻操作,随着紫外光波长的缩短,芯片上的线宽将会继续大幅度缩小,同样大小的芯片上能够容纳更多的晶体管,从而推动半导体工业继续前进。然而,以硅为基础的芯片制造技术的发展不是无限的。专家预言,随着晶体管的尺寸接近纳米级,不但芯片发热等副作用逐渐显现,电子的运行也难以控制,晶体管将不再可靠。当前可能的技术至少有4种:纳米技术、光技术、生物技术和量子技术。利用这些技术研究新一代计算机就成为世界各国研究的焦点。1)模糊计算机1956年,英国人查德创立了模糊信息理论。模糊计算机是建立
17、在模糊数学基础上的计算机。模糊计算机还能用于地震灾情判断、疾病医疗诊断、发酵工程控制、海空导航巡视等多个方面。2)生物计算机微电子技术和生物工程这两项高科技术的互相渗透,为研制生物计算机提供了可能。3)光子计算机光子计算机是一种用光信号进行数字运算、信息存储和处理的新型计算机。运用集成光路技术,把光开关、光存储器等集成一块芯片上,再用光导纤维连接成计算机。4)超导计算机超导计算机具有超导逻辑电路和超导存储器,其消耗小,运算速度是传统计算机无法比拟的。因此,世界各国科学家都在研究超导计算机,但还是有许多技术难关有待突破。5)量子计算机量子计算机的目的是为了解决计算机中的能耗问题,其概念源于对可逆
18、计算机的研究。【习题5】办公自动化(OA)是计算机的一项应用,按计算机应用的分类,它属于( )A科学计算 B辅助设计 C实时控制 D数据处理1.1.5电子商务伴随着计算机网络技术发展起来的电子商务是一种崭新的商务手段,它从根本上改变传统经济活动中的交易方式和流通方式。电子商务充分利用了信息网络技术等高科技手段。打破了时空局限,向所有交易主体提供先进的交易模式和平等交易机会,大大减少了交易的中间环节,缩短了交易时间,节省了交易费用,从而提高了商务效率和经济利益,同时也将改变人们传统的生活方式和思想观念。电子商务以前所未有的速度创造着新的商务环境,作为一种全新的商业管理方法,电子商务也将会引发生产
19、、管理、政府职能和法律制度等产生一系列的巨大变革。这无论对政府、企业、还是个人,都将是新的机遇和挑战。电子商务是应用现代信息技术在互联网络上进行的商务活动。从本质上讲,电子商务是一组电子工具在商务过程中的应用,这些工具主要包括:电子数据交换(EDI)、电子邮件(E-Mail)、电子公告系统(BBS)、博客(Blog)、条码(Barcode)、图像处理、智能卡等。而应用的前提和基础是完善的现在通信网络和人们的思想意识的提高以及管理体制的转变。IBM认为电子商务=Web+IT+Business。它所强调的是在网络计算环境下的商业化应用,是把买方、卖方、厂商以及其合作伙伴在因特网(Internet)
20、、企业内部网(Intranet)和企业外部网(Extranet)结合起来的应用。HP认为,电子商务是指从售前服务到售后支持的各个环节实现电子化、自动化,它能够以电子手段完成物品和服务等价值交换。【习题6】电子商务的本质是( )A计算机技术 B电子技术 C商务活动 D网络技术电子商务是现代信息技术和现代商业技术的结合体。对它可分为狭义和广义两种看法:1狭义的电子商务狭义电子商务(E-Commerce)是指利用互联网进行交易的一种方式。主要指信息服务、交易和支付。主要内容包括:电子商情广告;电子选购和交易、电子交易凭证的交换;电子支付与结算等。2广义电子商务广义电子商务(E-Business)是利
21、用Internet能够进行全部的贸易活动。从计算机与商业结合的角度,电子商务就是经过电子信息技术、网络互联技术和现代通信技术使得交易涉及的各方当事人借助电子方式联系,而无需依靠纸面文件完成单据的传输,实现整个交易过程的电子化。简单地说,电子商务就是在网上将信息流、商流、资金流和部分的物流完整地实现。广义电子商务不但包含电子交易,而且包含在Internet基础上构造的Intranet、Extranet、企业资源计划(ERP)、供应链管理(SCM)、客户关系管理(CRM)等。按照不同的标准,电子商务可划分为不同的类型。当前比较流行的标准时按照参加主体将电子商务分为如下几类:l 企业间的电子商务(B
22、usiness-to-Business,B2B)l 企业与消费者间的电子商务(Business-to-Consumer,B2C)l 消费者与消费者间的电子商务(Consumer-to-Consumer,C2C)l 非商务的电子商务(No-business EC)l 企业内的电子商务(Intrabusiness EC)1.1.6信息技术1信息技术的定义随着信息技术的发展,其内涵也在不断变化,因此至今仍没有统一的定义。一般来说,信息采集、加工、存储、传输和利用过程中的每一种技术都是信息技术,这是一种狭义的定义。在现代信息社会中,技术发展能够导致虚拟现实的产生,信息本质也被改写,一切能够利用二进制进
23、行编码的东西都被称为信息。因此,联合国教科文组织对信息技术的定义是:应用在信息加工和处理中的科学、技术与工程的训练方法和管理技巧;上述方面的技巧和应用;计算机及其与人、机的相互作用;与之相应的社会、经济和文化等诸种事物。在这个当前世界范围内较为统一的定义中,信息技术一般是指一系列与计算机等相关的技术。该定义侧重于信息技术的应用,对信息技术可能对社会、科技、人们的日常生活产生影响及其相互作用进行了广泛的研究。信息技术不但包括现代信息技术,还包括在现代文明之前的原始时代和古代社会中与那个时代相对应的信息技术。不能把信息技术等同为现代信息技术。2现代信息技术的内容一般来说,信息技术包含三个层次的内容
24、:信息基础技术、信息系统技术和信息应用技术。1)信息基础技术信息基础技术是信息技术的基础,包括新材料、新能源、新器件的开发和制造技术。近几十年来,发展最快、应用最广泛、对信息技术以及整个高科技领域的发展影响最大的是微电子技术和光电子技术。、微电子技术是随着集成电库,特别是超大型规模集成电路而发展起来的一门新的技术。微电子技术包括系统电路设计、器件物理、工艺技术、材料制备、自动测试以及封装、组装等一系列专门的技术,微电子技术是微电子学中的各项工艺技术的总和。光电子技术是有光电子技术和电子技术结合而成的新技术,涉及光显示、光存储、激光等领域。是未来信息产业的核心技术。2)信息系统技术信息系统技术是
25、指有关信息的获取、传输、处理、控制的设备和系统的技术。感测技术、通信技术、计算机与智能技术和控制技术是它的核心和支撑技术。感测技术就是获取信息的技术,主要是对信息进行提取、识别或检测并能经过一定的计算方式显示计量结果。现代通信技术,一般是指电信,国际上称为远程通信。计算机与智能技术是以人工智能理论和方法为核心的,研究如何用计算机去模拟、延伸和扩展人的智能;如何设计和建造具有高智能水平的计算机应用系统;如何设计和制造跟聪明的计算机。一个完整的智能行为周期为:从机器感知到知识表示;从机器学习到知识发展;从搜索推理到规划决策;从智能交互到机器行为,到人工生命等,构成了智能科学与技术科学特有的认识对象
26、。控制技术是指对组织行为进行控制的技术。控制技术是多种多样的,常见的控制技术有信息控制技术和网络控制技术两种。3)信息应用技术信息应用技术是针对种种实用目的,如信息管理、信息控制、信息决策而发展起来的具体的技术群类。如工厂的自动化、办公自动化、家庭自动化、人工智能和互联通信技术等。它们是信息技术开发的根本目的所在。信息技术在社会的各个领域得到广泛的应用,显示出强大的生命力。纵观人类科技发展历程,还没有一项技术像信息技术一样对人类社会产生如此巨大的影响。3现代信息技术的发展趋势展望未来,在社会生产力发展、人类认识和实践活动的推动下,信息技术将得到更深、更广、更快的发展,其发展趋势能够概括为数字化
27、、多媒体化、高速度、网络化、宽频带、智能化等。1)数字化当信息被数字化并经由数字网络流通时,一个拥有无数可能性的全新世界便由此揭开序幕。大量信息能够压缩,并以光速进行传输,数字传输的品质又比模拟传输的品质要好得多。许多种信息形态能够被结合、被制造,例如多媒体文件。2)多媒体化随着未来信息技术的发展,多媒体技术将文字、声音、图形、图像、视频等信息媒体与计算机集成在一起,使计算机的应用由单纯的文字处理进入到文、图、声、影集成处理。3)高速度、网络化、宽频带当前,几乎所有的国家都在进行最新一代的信息基础建设,即建设宽频高速公路。尽管今日的Internet已经能够传输多媒体信息,但依然被认为是一条低容
28、量频宽的网络路径,被形象地成为一条花园小径。下一代的Internet技术(Internet2)的传输速率将能够达到2.4GB/s。实现宽频的多媒体网络是未来信息技术的发展趋势之一。4)智能化直到今日,不但是信息处理装置本身几乎没有智慧,作为传输信息的网络也几乎没有智能。1.2信息的表示与存储计算机科学的研究主要包括信息采集、存储、处理和传输,而这些都与信息的量化和表示密切相关。1.2.1数据与信息数据是对客观事物的符号表示。数值、文字、语言、图形、图像等都是不同形式的数据。信息是现代生活和计算机科学中一个非常流行的词汇。一般来说,信息是对各种事物变化和特征的反映,是经过加工处理并对人类客观行为
29、产生影响的数据表现形式。人经过接受信息来认识事物,从这个意义上来说,信息是一种知识,是接受者原来不了解的知识。数据是信息的载体,信息是对人有用的数据。计算机科学中的信息一般被认为是能够用计算机处理的有意义的内容或消息,它们以数据的形式出现。数据与信息的区别:数据处理之后产生的结果为信息,信息具有针对性、时效性。尽管人们在许多场合把这两个词互换使用。信息是有意义的,而数据没有。信息同物质、能源一样重要,是人类生存和社会发展的三大基本资源之一。能够说信息不但维系着社会的生存和发展,而且在不断地推动着社会和经济的发展。1.2.2计算机中的数据ENIAC是一台十进制的计算机,它采用十个真空管来表示一位
30、十进制。冯诺依曼在研制IAS时,发觉这种十进制的表示和实现方式十分麻烦,故提出了二进制的表示方法,从此改变了整个计算机的发展历史。二进制只有“0”和“1”两个数,相对十进制而言,采用二进制表示不但运算简单、易于物理实现、通用性强,更重要的优点是所占用的空间和所消耗的能量小得多,机器可靠性高。1.2.3计算机中数据的单位计算机中数据的最小单位是位。存储容量的基本单位是字节。8个二进制位称为1个字节,另外还有KB、MB、GB、TB等,1位位是度量数据的最小单位,在数字电路和计算机技术中采用二进制表示数据,代码只有0和1,采用多个数码(0和1的组合)来表示一个数,其中的每一个数码称为1位(bit)2
31、字节一个字节由8位二进制数字组成(1Byte=8bit)。【习题12】存储24*24点阵的一个汉字信息,需要的字节数是( )A48 B72 C144 D192字节是信息组织和存储的基本单位,也是计算机体系机构的基本单位。为了便于衡量存储器的大小,统一以字节(Byte,B)为单位。千字节 1KB=1024B=210B兆字节 1MB=1024KB=220B吉字节 1GB=1024MB=230B太字节 1TB=1024GB=240B【习题8】在计算机中,20GB的硬盘能够存放的汉子个数是()A10*1000*1000 B B20*1024 MB C10*1024*1024 KB D20*1000*1
32、000 KB3字长在计算机诞生初期,受各种因素限制,计算机一次能够同时(并行)处理8个二进制数。人们将计算机一次能够并行处理的二进制数成为该机器的字长,也成为计算机的一个“字”。字长是计算机的一个重要指标,直接反映一台计算机的计算能力和精度。字长越长,计算机的数据处理速度越快。1.2.4字符的编码字符包括西文字符(字母、数字、各种符号)和中文字符。由于计算机室以二进制形式存储和处理数据的,因此字符也必须按特定的规则进行二进制编码才能进入计算机。【习题9】计算机中所有信息的存储都采用(D)A十进制 B十六进制 CASCII码 D二进制字符编码的方法很简单,首先确定需要编码的字符总数,然后将每一个
33、字符按顺序确定顺序编号,编号值的大小无意义,仅作为识别与使用这些字符的依据。字符形式的多少涉及编码的位数。对西文与中文字符,由于形式的不同,使用不同的编码。1西文字符的编码计算机中的数据都是用二进制编码表示的,用以表示字符的二进制编码称为字符编码。计算机中最常见的字符编码是美国信息交换标准交换代码(ASCII),被国际标准化组织指定为国际标准。ASCII码有7位码和8位码两种版本。国际通用的是7位ASCII码,用7位二进制数表示一个字符的编码,共有27=128个不同的编码值,相应能够表示128个不同字符的编码。【习题7】国际通用的ASCII码的码长是(A)A7 B8 C12 D16对大小写英文
34、字母、阿拉伯数字、标点符号及控制符等特殊符号规定了编码,表中每个字符都对应一个数值,称为该字符的ASSCII码值。其排列次序为b6 b5 b4 b3 b2 b1 b0,b6为最高位,b0为最低位。从ASCII码表中看出:有34个非图形字符(又称为控制字符)。例如:SP(Space)编码是0100000 空格CR(Carriage Return)编码是0001101 回车DEL(Delete)编码是1111111 删除BS(Back Space)编码是0001000 退格其余94个可打印字符,也成为图形字符。在这些字符中,从小到大的排列:09、AZ、az都是顺序排的,且小写比大写字母的码值大32
35、,即位值b5为0或1,这有利于大、小写字母之间的编码转换。有些特殊的字符编码是容易记忆的。如:“a”字符的编码为1100001,对应的十进制数是97,则“b”的编码值是98。“A”字符的编码为1000001,对应的十进制数是65,则“B”的编码值是66。“0”数字字符的编码为0110000,对应的十进制数是48,则“1”的编码值是49。【习题10】大写字母B的ASCII码值是(B)A65 B66 C41H D97计算机的内部用用一个字节(8个二进制位)存放7为ASCII码,最高位置为0。2汉字的编码ASCII码只对英文字母,数字和标点符号进行了编码。为了使计算机能够处理、显示、打印、交换汉字字
36、符等,同样也需要对汉子进行编码。中国于1980年发布了国家汉字编码标准GB23181980,全称是信息交换用汉子编码及字符集基本集(简称GB码或国际码)。根据统计,把最常见的6763个汉字分成两级:一级汉字有3755个,按汉语拼音字母的次序排列;二级汉字3008个,按偏旁部首排列。由于一个字节只能表示256种编码,是不足以表示6763个汉字的,因此一个国际码用两个字节来表示一个汉字,每个字节的最高位为0。为避开ASCII表中的控制码,区位码将GB23121980中的6763个汉字分为94行、94列,代码表分94个区(行)和94个位(列)。由区号(行号)和位号(列号)构成了区位码。区位码最多能够
37、表示94*94=8836个汉字。区位码由4位十进制数字组成,前2位为区号,后2位为位号。在区位码中,0109区为特殊字符,1055区为一级汉字,5687区为二级汉字。例如汉字“中”的区位码为54 48,即它位于第54行、第48列。区位码是一个4位十进制数,国际码是一个4位十六进制数。为了与ASCII码兼容,汉字输入区位码与国际码之间有一个简单的转换关系。具体方法是:将一个汉字的十进制区号和十进制位号分别转换成十六进制;然后再分别加上20H(十进制就是32,因是非图形字符码值),就成为汉字的国际码。例如:汉字“中”字十进制 十六进制区位码 5448D (3630)H国际码 8680D (3630
38、H+2020H)=5650H二进制表示:(00110110 00110000)B+(00100000 00100000)B =(01010110 01010000)B1992,年经过的国际标准ISO 10646,定义了一个用于世界范围各种文字及各种语言的书面形式的图形字符集,基本上收全了上面国家和地区使用的汉字。Unicode编码标准,对汉字集的处理与ISO 10646相似。GB2312-1980中因有许多汉子没有包括在内,为此有了GBK编码(扩展汉字编码),它是对GB2312-1980的扩展,共收录了21003个汉字,支持国际标准ISO 10646中的全部中日韩汉字,也包含了BIG5(台港澳
39、)编码中的所有汉字。GBK编码于1995年12月发布。当前Windows以上的版本都支持GBK编码,只要计算机安装了多语言支持功能,几乎不需要任何操作就能够在不同的汉字系统之间自由变换。“微软拼音”、“全拼”、“紫光”等几种输入法都支持GBK字符集。 中国发布了GB 18030编码标准,它是GBK的升级,GB 18030编码空间约为160万码位,且当前纳入了编码的汉子约为2.6万个。3,汉字的处理过程计算机内部只能识别二进制,任何信息(包括字符、汉字、声音、图像等)在计算机中都是以二进制形式存放的。而汉字能够输入到计算机中,在计算机中存储,经过转换,在屏幕上显示或在打印机上打印。下面介绍汉字的
40、处理过程。这些编码主要包括:汉字输入码、汉字内码、汉字地址吗、汉字字形码等。这一系列的汉字编码及转换、汉字信息处理中的各编码及流程如图1.5所示。输入法国际码机内码地址码字形码 图1.5 汉字信息处理系统的模拟汉字输入 汉字输出从图1.5中能够看到:经过键盘对每个汉字输入规定的代码,即汉字的输入码(例如拼音输入码)。不论哪一种汉字输入方法,计算机都将每个汉字的汉字输入码转换为相应的国际码,然后再转换为机内码,就能够在计算机内存储和处理了。【习题11】汉字在计算机内部的传输、处理和存储都使用汉字的(C)A字形码 B输入码 C机内码 D国际码输出汉字时,先将汉字的内机码经过简单地对应关系转换为相应
41、的汉字地址码;然后经过汉字地址码对汉字库进行访问,从字库中提取汉字的字形码,最后根据自行数据显示和打印出汉字。 1)汉字输入码为将汉字输入计算机而编制的代码称为汉字输入码,也叫外码。汉字输入码是利用计算机标准键盘上按键的不同排列组合来对汉字的输入进行编码。当前汉字输入码法的开发研究种类繁多,已多达数百种。一个好的输入编码应是:编码短,能够减少击键的次数;重码少,能够实现盲打;好学好记,便于学习和掌握。但当前还没有一种符合上述全部要求的汉字输入编码方法。当前常见的输入法类别有音码、形码、语音输入、手写输入或扫描输入等。实际上,区位码也是一种输入法,其最大优点是一字一码的无重码输入法,最大的缺点是
42、代码难以记忆。能够想象,对于同一个汉字,不同的输入法有不同的输入码。例如:“中”字的全拼输入吗是“zhong”,其双拼输入吗是“vs”,而五笔形的输入码是“kh”。这种不同的输入码经过输入字典转换统一到标准的国际码之下。2)汉字内码是为计算机内部对汉字进行存储、处理的汉字代码,它应满足存储、处理和传输的要求。当一个汉字输入计算机后转换为内码,才能在机器传输、处理。汉字内码的形式也是多种多样。当前,对应于国际码,一个汉字的内码用2个字节存储,并把每个字节的最高二进制位置“1”作为汉字内码的标识,以免与单字节的ASCII码产生歧义。如果用十六进制来表述,就是把汉字国际码的每个字节上加一个80H(即
43、二进制数10000000)。因此,汉字的国际码与其内码存在下列关系:汉字的内码=汉字的国际码+8080H例如,已知“中”字的国际码为5650H,则根据上述公式得:“中”字的内码=“中”字的国际码5650H+8080H=D6D0H二进制表示:(01010110 01010000)B+(10000000 10000000)B =(11010110 11010000)B由此可见:西文字符的内码是7位ASCII码,一个字节的最高位为0。每个西文字符的ASCII码值均小于128。为了与ASCII码兼容,汉字用两个字节来存储,区位码再分别加上20H,就成为汉字的国际码。在计算机内部为了能够区分是汉字还是A
44、SCII码,将国际码每个字节的最高位由0变为1(也就是说汉字内码的每个字节都大于128),变换后的国际码称为汉字内码。4汉字字形码经过计算机处理的汉字信息,如果要显示或打印出来提供阅读,则必须将汉字内码转换成人们可读的方块汉字。汉字字形码又称汉字字模,用于汉字的显示屏或打印机输出。汉字字形码一般有两种表示方式:点阵和矢量表示方式。用点阵表示字形时,汉字字形码指的就是这个汉字字形点阵的代码。根据输出汉字的要求不同,点阵的多少也不同。容易型汉字为16*16点阵,普通型汉字为24*24点阵,提高型汉字为32*32点阵,48*48点阵,等等。图1.6显示了“次”字的16*16字形点阵和代码。【习题12
45、】存储24*24点阵的一个汉字信息,需要的字节数是(B)A48 B72 C144 D192在一个16*16的网格中用点描出一个汉字,如“次”字,整个网格分为16行16列,每个小格用1位二进制编码表示,有点的用“1”表示,没有点的用“0”表示,这样,从上到下,每一行需要16个二进制位,占两个字节。如第一行的点阵编码是0080H,描述整个汉字的字形需要32B的存储空间。汉字的点阵字形编码仅用于构造汉字的字库,一般对应不同的字体(如宋体、楷体、黑体)有不同的字库,字库中存储了每个汉字的点阵代码。字模点阵只能用来构成“字库”,而不能用于机内存储。输出汉字时,先根据汉字内码的对应关系转换成汉字地址吗,再
46、经过汉字地址码提取汉字的字形码,根据字形数据显示和打印出文字。点阵规模越大,字形愈清晰美观,所占存储空间也愈大。两级汉字大约占用256KB。点阵表示方式的缺点是字形放大后产生的效果差。矢量表示方式存储的是描述汉字字形的轮廓特征,当要输出汉字时,经过计算机的计算,由汉字字形描述生成所需大小和形状的汉字点阵。矢量化字形描述与最终文字显示的大小、分辨率无关,因此可产生高质量的汉字输出。Windows中使用的TrueType技术就是汉字矢量表示方式,它解决了汉字点阵字形放大后出现锯齿现象的问题。5汉字地址码汉字地址码是指汉字库(这里主要指整字形的点阵式字模库)中存储汉字字形信息的逻辑地址码。需要向输出设备输出汉字时,必须经过地址码对汉字库进行访问。汉字库中,字形信息都是按一定顺序(大多数按标准汉字