收藏 分销(赏)

计算机中数据的表示与信息编码.doc

上传人:精*** 文档编号:4132577 上传时间:2024-07-31 格式:DOC 页数:8 大小:128.04KB
下载 相关 举报
计算机中数据的表示与信息编码.doc_第1页
第1页 / 共8页
计算机中数据的表示与信息编码.doc_第2页
第2页 / 共8页
计算机中数据的表示与信息编码.doc_第3页
第3页 / 共8页
计算机中数据的表示与信息编码.doc_第4页
第4页 / 共8页
计算机中数据的表示与信息编码.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、计算机中数据的表示与信息编码计算机最主要的功能是处理信息,如处理文字、声音、图形和图像等信息.在计算机内部,各种信息都必须经过数字化编码后才能被传送、存储和处理.因此要了解计算机工作的原理,还必须了解计算机中信息的表现形式。1.2。1 计算机使用的数制 1计算机内部是一个二进制数字世界计算机内部采用二进制来保存数据和信息。无论是指令还是数据,若想存入计算机中,都必须采用二进制数编码形式,即使是图形、图像、声音等信息,也必须转换成二进制,才能存入计算机中。为什么在计算机中必须使用二进制数,而不使用人们习惯的十进制数?原因在于: 易于物理实现:因为具有两种稳定状态的物理器件很多,例如,电路的导通与

2、截止、电压的高与低、磁性材料的正向极化与反向极化等。它们恰好对应表示1和0两个符号。 机器可靠性高:由于电压的高低、电流的有无等都是一种跃变,两种状态分明,所以0和1两个数的传输和处理抗干扰性强,不易出错,鉴别信息的可靠性好。 运算规则简单:二进制数的运算法则比较简单,例如,二进制数的四则运算法则分别只有三条。由于二进制数运算法则少,使计算机运算器的硬件结构大大简化,控制也就简单多了. 虽然在计算机内部都使用二进制数来表示各种信息,但计算机仍采用人们熟悉和便于阅读的形式与外部联系,如十进制、八进制、十六进制数据,文字和图形信息等,由计算机系统将各种形式的信息转化为二进制的形式并储存在计算机的内

3、部。 2进位计数制数制,也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。数制可分为非进位计数制和进位计数制两种。非进位计数制的数码表示的数值大小与它在数中的位置无关;而进位计数制的数码所表示的数值大小则与它在数中所处的位置有关。而我们在这里讨论的数制指的都是进位计数制。进制是进位计数制的简称,是目前世界上使用最广泛的一种计数方法,它有基数和位权两个要素. 基数:在采用进位计数制的系统中,如果只用r个基本符号(例如0,1,2,r1)表示数值,则称其为r数制(Radixr Number System),r称为该数制的基数(Radix).如日常生活中常用的十进制,就是r=10,即基本符

4、号为0,1,2,9。如取r=2,即基本符号为0和1,则为二进制数。 位权:每个数字符号在固定位置上的计数单位称为位权。位权实际就是处在某一位上的1所表示的数值大小。如在十位制中,个位的位权是100,十位的位权是101,;向右依次是101,102,。而二进制整数右数第2位的位权为2,第3位的位权为4,第4位的位权为8。一般情况下,对于r进制数,整数部分右数第i位的位权为ri1,而小数部分左数第i位的位权为r-i。各种进制的共同点是: 每一种数制都有固定的符号集。如十进制数制,其符号有十个:0,1,2,9,二进制数制,其符号只有两个:0和1.需要指出的是,16进制数基数为16,所以有16个基本符号

5、,分别为,1,2, ,8,9,A,B,C,D,E,F.表 13列出了计算机中常用的几种进制. 采用位置表示法,用位权来计数。即处于不同位置的数符所代表的值不同,与它所在位置的权值有关.例如:十进制的1358.74可表示为: 1358。74=1103+3102+5101+8100+7101+410-2可以看出,各种进位制中的位权的值恰好是基数的某次幂。因此,对于任何一个进位计数制表示的数都可以写出按其权值展开的各项式之和,称为“按权展开式”。任意一个n位整数和m位小数的r进制数D可表示为:n位整数m位数 Dn-1 Dn2D2 D1 D0。 Dm Dm1 Dm2D2 D1 按基数来进位和借位(逢r

6、进一,借一当r)。现列举二进制的算术运算如下:从这里我们能够体会到二进制的运算的确能够起到简化硬件的作用 加法: 减法: (借位) (进位)乘法: 除法:0 表 13 计算机中常用的几种进位数制进位制二进制八进制十进制十六进制规则逢二进一逢八进一逢十进一逢十六进一基数r=2r=8r=10r=16数符0,10,1,2,70,1,2,90,1,2,9,A,B,C,D,E,F权2i8i10i16i表示符号BODH1。2.2 数制间的相互转换 1非十进制数转换十进制数r进制转换为十进制数,采用r进制数的位权展开法,即将r进制数按“位权”展开形成多项式并求和,得到的结果就是转换结果。【例1.1】 【例1

7、.1】 把 (11011。101)2转换成十进制数 解:(11011。101)2 = 1524 + 1523 + 0522 + 1521 + 1520 + 152-1 + 0522 + 152-3 = 16 + 8 + 0 + 2 + 1 + 0。5 + 0 +0。125 = (27。625)10 2十进制数转换非十进制数 转换规则:整数部分采用“逐次除以基数取余”法,直到商为0; 小数部分采用“逐次乘以基数取整”法,直到小数部分为0或取到有效数位。 十进制数转换成二进制数:整数部分采用“除2取余”法; 小数部分采用“乘2取整”法 【例1.2】把 (157.6875)10转换成二进制数余数 十

8、进制整数部分 余 余 余 余 2余 余 余 余 (157)10=( 10011101)210011101第一个余数是最低位 最高位0.6875 21.3750整数1 20.7500整数0 21.5000整数1 21.0000整数1十进制小数部分10111 0 1 111 1最低位注:十进制小数不一定能转换成完全等值的二进制小数,有时要取近似值。 (0。6875)10 = (1011) 2 结果:(157。6875)10 = (10011101.1011)2 用同样的方法,可将十进制数转换成八进制数和十六进制数,分别采用“除8取余,乘8取整和“除16取余,乘16取整”法。3。 非十进制数之间的转

9、换通常两个非十进制数之间的转换方法是采用上述两种方法的组合,即先将被转换数转换为相应的十进制数,然后再将十进制数转换为其他进制数。由于二进制、八进制和十六进制之间存在着特殊关系,即81=23,161=24,因此转换方法就比较容易,如表14所示. 二进制、八进制数之间的转换.由于1位八进制数相当于3位二进制数,因此,二进制数转换成八进制数,只需以小数点为界,整数部分按照由右至左(由低位向高位)、小数部分按照从左至右(由高位向低位)的顺序每三位划分为一组,最后不足3位二进制数时用零补足.按表14,每三位二进制数分别用与其对应的八进制数码来取代,即可完成转换。而将八进制转换成二进制的过程正好相反。【

10、例1.3】 将 (11001110.01010111)2 转换成八进制数。 ( ) ( 5 ) 【例1.4】将 (574。623)8 转换成二进制数. ( ) ( ) 二进制、十六进制数之间的转换由于十六进制的1位数相当于二进制的4位数,因此二进制同十六进制之间的转换就如同二进制同八进制之间的转换一样,只是4位一组 ,不足补零。【例1.5】将 (11011 1110 0011 。 1001 011)2 转换成十六进制数。 ( )2 ( )16表 14 二进制、八进制和十六进制之间的关系二进制八进制二进制十六进制二进制十六进制00000000010008001100011100190102001

11、021010A0113001131011B1004010041100C1015010151101D1106011061110E1117011171111F总之,数在机器中是用二进制表示的,但是,二进制数书写起来太冗长,容易出错,而且目前大部分微型机的字长是4位、8位、16位、32位和64位的,都是4的整数倍,故在书写时可用十六进制表示。一个字节(8位)可用两位十六位进制数表示,两个字节(16位)可用4位十六进制表示等,书写方便且不容易出错。1。2.3 二进制数在计算机内的表示计算机中的数据包括数值型和非数值型两大类。数值型数据指可以参加算术运算的数据,例如 (123)10、(1001。101)

12、2等。非数值型数据不参与算术运算。例如字符串“电话号码:2519603”、“4的3倍等于12等都是非数值数据。注意这两个例子中均含有数字,如2519603、4、3、12 ,但它们不能也不需要参加算术运算,故仍属非数值数据。下面讨论数值型的二进制数的表示形式:1。 机器数 在计算机中,因为只有“0和“1两种形式,所以数的正负,也必须以“0”和“1”表示.通常把一个数的最高位定义为符号位,用0表示正,1表示负,称为数符,其余位仍表示数值。把在机器内存放的正、负号数码化的作为一个整体来处理的二进数串称为机器数(或机器字),而把机器外部由正、负表示的数称为真值数.例:真值为 (+1010011) B的

13、机器数为 01010011,存放在机器中,等效于+83.需注意的是,机器数表示的范围受到字长和数据的类型的限制。字长和数据类型定了,机器数能表示的数值范围也就定了。例如,若表示一个整数,字长为8位,则最大的正数为01111111,最高位为符号位,即最大值为127.若数值超出127,就要“溢出”。2。 数的定点表示和浮点表示 当计算机所需处理的数含有小数部分时,又出现了如何表示小数点的问题。计算机中并不单独利用某一个二进制位来表示小数点,而是隐含规定小数点的位置。根据小数点位置是否固定,计算机中的数可分为定点数和浮点数两种。 定点表示法:所谓定点表示法就是小数点在数中的位置固定不变,它总是隐含在

14、预定位置上。通常,对于整型数,小数点固定在数值部分的右端,即在数的最低位之后,其格式如图1-2所示;对于小数,小数点固定在数值部分左端,即在数的符号位之后、最高数位之前,其格式如图1-3所示。sdn-1dn-2d0图1-2 定点整数的存储格式sdn-1dn-2d0图1-3 定点小数的存储格式数值部分符号位小数点位置数值部分符号位小数点位置 例如:定点整数120用8位二进制数可表示为01111000,其中最高位0表示符号为正。根据计算机字长不同,如果用n个二进制位存放一个定点整数,那么它的表示范围为:2n-12n1-1.说明:上面表示的整数的范围是以补码形式表示的,有关补码的知识在后面介绍。定点

15、小数-0.125用8位二进制数可表示为10010000,其中最高位1表示号为负。根据计算机字长不同,如果用n个二进制位存放一个定点小数(纯小数),其表示范围为:-1(2 (n1))。 数的浮点表示定点数用来表示整数或纯小数。如果,一个数既有整数部分,又有小数部分,采用定点格式就会引起一些麻烦和困难。因此,计算机中使用浮点表示方法.浮点表示法对应于科学(指数)计数法,如数110。011可表示为N=110.011=1.100112+10 =11001。1210 =0.1100112+11浮点表示法中的小数点在数中的位置不是固定不变的,是浮动的。任何浮点数都由阶码和尾数两部分组成,阶码是指数,尾数是

16、纯小数。其存储格式如图14所示。其中,数符和阶符都各占一位,数符是尾数(纯小数)部分的符号位;而阶符为阶码(指数部分)的符号位。阶码的位数随数值的表示的范围而定,尾数的位数则依数的精度而定。当一个数的阶码大于机器所能表示的最大阶码或小于机器所能表示的最小阶码时会产生“溢出。阶符Em-1Em-2E0数符d n-1d n-2d 0图1-4 浮点数存储格式阶码尾数尾数小数点位置阶码小数点位置 例如,设尾数为4位,阶码为2位,则二进制数N=10111011的浮点数表示形式为 01101011 阶符 阶码 数符 尾数应当注意的是:浮点数的正负是由尾数的数符确定的,而阶码的正、负只决定小数点的位置,即决定

17、浮点数的绝对值的大小。当浮点数的尾数为零或阶码为最小值时,机器通常规定,把该数看作零,称为机器零。3。 带符号数的表示在计算机中,带符号数可以用不同方法表示,常用的有原码、反码和补码。 原码 X 0 X2n-1-1 2n-1 +X -(2n-1-1)X0X原=数X的原码记作 X原,如果机器字长为n ,由则原码的定义如下: X 0 X2n-1 2n -X -(2n-1-1)X原= 例: X1 ,X2的真值为 X1=+1010110 X2=-1001010 , 原码表示为 X1原=+1010110原=01010110 X2原=1001010原=11001010由此可以看出,原码的最高位为符号位,正

18、数为0,负数为1,其余n1位表示数的真值的绝对值。其中,0的原码表示有两种,+0原=00000000 -0原=10000000 采用原码的优点是简单易懂,与真值转换方便,用于乘除法运算十分方便。但是对于加减法运算就麻烦了,因为当两个同号数相减或两个异号数相加时,必须判断两个数的绝对值哪个大,用绝对值大的数减去绝对值小的数,而运算结果的符号则应取与绝对值大的数相同符号。要完成这些操作相当麻烦,还会增加运算器的复杂性。为了克服原码的缺点,引进了数的补码表示方法。 补码数X的补码记作 X补,如果机器字长为n ,则补码的定义如下: X 0 XMn1111SIUS/?O_oDEL2. 2. 汉字编码:

19、汉字在计算机内也采用二进制的数字化信息编码。由于汉字的数量大,常用的也有几千个之多,显然汉字编码比ASCII码表要复杂得多,用一个字节(8 bit)是不够的。目前的汉字编码方案有二字节、三字节甚至四字节的.在一个汉字处理系统中,输入、内部处理、输出对汉字的要求不同,所用代码也不尽相同.汉字信息处理系统在处理汉字词语时,要进行输入码、国标码、内码、字型码等一系列的汉字代码转换。 国标码1981年我国制定了中华人民共和国国家标准信息交换汉字编码(GB2312-80标准),这种编码称为国标码。在国标码字符集中共收录了汉字和图形符号7445个,其中一级汉字3755个,二级汉字3008个,西文和图形符号

20、682个。国标GB231280规定,所有的国标汉字与符号组成一个94594的矩阵。在此方阵中,每一行称为一个区(区号分别为0194)、每个区内有94个位(位号分别为01-94)的汉字字符集。汉字与符号在方阵中的分布情况如下:115区为图形符号区:1655区为一级常用二级汉字区5687区为不常用的二级汉字区8894区为自定义汉字区。 汉字输入码与机内码计算机处理时,由于汉字具有特殊性,因此汉字输入、存储、处理及输出过程所使用的代码均不相同。其中包含用于汉字输入的输入码、机内存储和处理的机内码、用于显示及打印的字模点阵码(字形码)。 输入码(外码)汉字由各种输入设备以不同方式输入计算机所用到的编码

21、。每一种输入码都与相应的输入方案有关。根据不同的输入编码方案不同,一般可分类为:数字编码(如区位码)、音码(如拼音编码)、字形码(如五笔字型编码)及音形混合码等。 机内码汉字系统中对汉字的存储和处理使用了统一的编码,即汉字机内码(机内码、内码)。机内码与国标码稍有区别,如果直接用国标码作内码,就会与ASCII码冲突。在汉字输入时,根据输入码通过计算或查找输入码表完成输入码到机内码的转换。如汉字国标码(H)8080(H)汉字机内码(H)。 汉字库与汉字字形码。 图1-5 16516汉字点阵“中”汉字在显示和打印输出时,是以汉字字形信息表示的,即以点阵的方式形成汉字图形。汉字字形码是指确定一个汉字字形点阵的代码(汉字字模)。一般采用点阵表示字形.如图1-5所示是一个1616点阵的汉字“中”,用“1表示黑点、“0”表示白点,则黑白信息就可以用二进制数来表示。每一个点用一位二进制数来表示,则一个1616的汉字字模要用32个字节来存储。国标码中的6763个汉字及符号码要用261696字节存储。以这种形式存储所有汉字字形信息的集合称为汉字字库。可以看出,随着点阵的增大,所需存储容量也很快变大,其字形质量也越好,但成本也越高。目前汉字信息处理系统中,屏幕显示一般用1616点阵,打印输出时采用3232点阵,在质量要较高时可以采用更高的点阵。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服