资源描述
,单击此处编辑母版标题样式,*,.,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,.,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,.,*,汉字编码,第一章 项目三,重点:汉字编码类型及编码方式,难点:,ASCII,码,1.2.5 字符的编码,1.2.5 字符的编码,字符,西文字符,中文字符,字母、数字、各种符号,1.2.5 字符的编码,1.,西文字符的编码,计算机中的数据都是用二进制编码表示的,用以表示字符的二进制编码称为,字符编码,。,而,计算机最常用的就是,ASCII,。,美国信息交换,标准码,ASCII,,,7,位码(,128,个字符),扩展码,ASCII,,,8,位码(,256,个字符),7,位,国际通用,1.2.5 字符的编码,1.,西文字符的编码,ASCII,码对,128,个字符进行了编码,这其中包括大小写,英文字母,、,阿拉伯数字,、,标点符号,以及,控制字符等特殊字符,。,ASCII,码中共有,34,个非图形字符(控制字符),,94,个可打印字符(图形字符)。,读表,1-6,可知,每个符号的,ASCII,编码为:高,3,位,+,低,4,位。,1.2.5 字符的编码,1.,西文字符的编码,“a”,字符编码为,1100001,(,97,),,,bcde,依次增加,“,A,”字符编码为,1000001,(,65,),,,BCDE,依次增加,“,0,”数字字符编码为,0110000,(,48,),,,1234,依次增加,计算机内部用一个字节(,8,个二进制位)存放一个,7,位,ASCII,码,最高位置为,0,。,重点掌握字符的推算!,1.2.5 字符的编码,ASCII,码中存在以下两个规律:,(,1,)大小写英文字母和阿拉伯数字都是,按其固有,顺序排列在表中的。,(,2,)在表中,,阿拉伯数字,排在,大写英文字母,前,而大写英文字母排在,小写英文字母,前,。,1.,西文字符的编码,1.2.5 字符的编码,1.,西文字符的编码(非图形字符/控制字符),SP,(空格)的编码是,CR,(回车)的编码是,DEL,(删除)的编码是,BS,(退格)的编码是,0100000,0001101,1111111,0001000,1.2.5 字符的编码,汉字分成两级:,一级汉字,3755,个,按汉语拼音字母的次序排列;,二级汉字,3008,个,按偏旁部首排列。,由于一个字节不足以表示,6763,个汉字,所以,一个国标码用两个字节来表示一个汉字,,,每个字节最高位为,0,。,2.,汉字的编码,国标码,0,0,1,位,7,位,1,位,7,位,1.2.5 字符的编码,GB2312-80,将汉字分为,94,行、,94,列,代码表分为,94,个,区,(,行,)、,94,个,位,(,列,)。,区位码,是一个,4,位,十,进制数,国标码,是一个,4,位,十六,进制数。,2.,汉字的编码,区位码,1.2.5 字符的编码,2.,汉字的编码,区位码、国标码转换,汉字国标码,=,区位码,+,(,2020,),H,区号和位号,:,转换为,16,进制数,,分别,加上,(,20,),H,1.2.5 字符的编码,3.,汉字的处理过程,输入,输入码,国标码,机内码,地址码,字形码,输出,由于汉字的特殊性(象形文字),汉字的处理过程必须同时需要多种编码才能完成。,1.2.5 字符的编码,3.,汉字的处理过程,汉字输入码(外码),:,为将汉字,输入,计算机而编制的代码。,一个好的输入编码:,编码短,重码少,好学好记,1.2.5 字符的编码,3.,汉字的处理过程,汉字内码,:是为在计算机内部对汉字进行,存储、处理,的汉字编码。,不同汉字系统使用的机内码可能不同。汉字内码的形式有多种。,对应国标码,一个汉字的内码用,2,个字节,存储,每个汉字的,最高位置“,1”,作为汉字内码的标识,。,1.2.5 字符的编码,3.,汉字的处理过程,0,0,1,位,7,位,1,位,7,位,1,1,1,位,7,位,1,位,7,位,国标码,汉字内码,汉字内码,=,汉字国标码,+,(,8080,),H,1.2.5 字符的编码,3.,汉字的处理过程,西文字符,7,位,ASCII,码,区位码分别加,20H,国标码,最高位由,0,变,1,,即加,8080H,汉字内码,1.2.5 字符的编码,4.,汉字字形码,又称,汉字字模,,用于汉字在显示屏或打印机输出。,两种表示方式:,点阵,和,矢量,。,点阵,规模越大,字形越清晰美观,所占存储空间也愈大。,矢量,表示方式存储的是描述汉字字形的轮廓特征。,1.2.5 字符的编码,4.,汉字字形码,点阵:,有点的用“,1,”表示,没点的用“,0,”表示。,一位(,1,bit,)可以存储一个点,的信息。,显示一个汉字需要多少个点,就需要有多少位(,bit,)的存储空间来存储它。,例:存储一个,1616,点阵的汉字字形码,需要的存储空间为:,1616 bit=256 bit,,即,2568=32B,(字节),1.2.5 字符的编码,4.,汉字字形码,汉字的点阵字形编码,仅用于构造汉字的字库,字模点阵只能用来构成“字库”,而不能用于机内存储。,输出汉字时,先根据汉字内码从字库中提取汉字的字形数据,然后很据字形数据显示和打印出汉字。,1.2.5 字符的编码,4.,汉字字形码,点阵式:,1.2.5 字符的编码,4.,汉字字形码,矢量式:,1.2.5 字符的编码,5.,汉字地址码,是指汉字库中存储汉字字形信息的逻辑地址码。需要向输出设备输出汉字时,必须通过地址码对汉字库进行访问。,1.2.5 字符的编码,6.,其他汉字内码,1,),GBK,码(扩充汉字内码规范):,多达,2,万多简、繁汉字。,2,),UCS,码:,包含字母、音节文字,中日韩的表意文字。,3,),Unicode,编码:,65536,个字符编码,主要用来解决多语言的计算问题。,4,),BIG5,码:,香港、台湾地区使用的一种繁体汉字编码。,1.2.5 字符的编码,作业,
展开阅读全文