汉字的机内码是指在计算机中表示一个汉字的编码.doc

资源描述

汉字的机内码是指在计算机中表示一个汉字的编码。机内码与区位码稍有区别。汉字区位码的区码和位码的取值均在1~94之间，如直接用区位码作为机内码，就会与基本ASCII码混淆。为了避免机内码与基本ASCII码的冲突，需要避开基本ASCII码中的控制码(00H~1FH)，还需与基本ASCII码中的字符相区别。为了实现这两点，可以先在区码和位码分别加上20H，在此基础上再加80H(此处“H”表示前两位数字为十六进制数)。经过这些处理，用机内码表示一个汉字需要占两个字节，分别称为高位字节和低位字节，这两位字节的机内码按如下规则表示: 高位字节＝区码+20H+80H(或区码+A0H) 低位字节=位码+20H+80H(或位码+AOH) 由于汉字的区码与位码的取值范围的十六进制数均为01H~5EH(即十进制的01~94)，所以汉字的高位字节与低位字节的取值范围则为A1H~FEH(即十进制的161~254)。例如，汉字“啊”的区位码为1601，区码和位码分别用十六进制表示即为1001H，它的机内码的高位字节为B0H，低位字节为A1H，机内码就是B0A1H。 2603 = 1A03H 区位码 + A0A0H = BAA3H 机内码 [ 本帖最后由 rossini23 于 2006-10-11 13:28 编辑 ] 计算机处理汉字信息的前提条件是对每个汉字进行编码，这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。汉字交换码：汉字信息处理系统之间或通信系统之间传输信息时，对每一个汉字所规定的统一编码，我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”，代号为GB 2312—80，又称为“国标码”。国标码：所有汉字编码都应该遵循这一标准，汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等，都以此标准为基础。GB 2312—80就是国标码。该码规定：一个汉字用两个字节表示，每个字节只有7位，与ASCII码相似。区位码：将GB 2312—80的全部字符集组成一个94×94的方阵，每一行称为一个“区”，编号为0l～94；每一列称为一个“位”，编号为0l～94，这样得到GB 2312—80的区位图，用区位图的位置来表示的汉字编码，称为区位码。机内码：为了避免ASCII码和国标码同时使用时产生二义性问题，大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性，又使汉字机内码与国标码具有极简单的对应关系。汉字机内码、国标码和区位码三者之间的关系为：区位码（十进制）的两个字节分别转换为十六进制后加20H得到对应的国标码；机内码是汉字交换码（国标码）两个字节的最高位分别加1，即汉字交换码（国标码）的两个字节分别加80H得到对应的机内码；区位码（十进制）的两个字节分别转换为十六进制后加A0H得到对应的机内码。 1、区位码和国标码 (1)国标：1981年，我国制订了“中华人们共和国国家标准信息交换汉字编码”，代号为“GB2312-80”。 (2)区位码：按国标规定，汉字编码表有94行94列，其行号01~94称为区号，列号01~94称为位号。一个汉字所在的区号和位号简单地组合在一起就构成了这个汉字的区位码。 GB2312-80 区位码=区号+位号(采用十进制) 符：2391 例1：汉字“啊”处于16区的01位，则其区位码为1601。 (3)国标码：又称为“交换码”，它是在不同汉字处理系统间进行汉字交换时所使用的编码。国标码采用两个字节表示，它与区位码的关系是：国标码高位字节=(区号)16+(20)16 国标码低位字节=(位号)16+(20)16 例2：汉字“啊”的区位码为1601，则其国标码为(3021)16。 2、汉字内码(机内码) (1)概念：在计算机内部表示汉字的代码。 (2)特点：汉字内码采用两个字节，一个汉字占两个ASCII字符；汉字内码最高位为1，ASCII码最高位为0 (3)汉字内码与区位码的关系：汉字内码高位字 ... GB2312-1980 信息交换用汉字编码字符集基本集 GB11383-1989 信息处理信息交换用八位代码结构和编码规则 GB2311-1990 信息处理七位和八位编码字符集代码扩充技术 GB12345-1990 信息交换用汉字编码字符集辅助集 GB13000.1-1993 信息技术通用多八位编码字符集（UCS）第一部分 GBK-1995 技术规范指导性文件《汉字内码扩展规范（GBK）1.0版 GB18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充上面是我国颁布并实施的有关编码方案 -后面为发布年份和名称 GB2312共收录6763个简体汉字，是一般输入法的默认编码 GBK共收录21004个汉字（包括简体和繁体），是字库庞大的输入法的首选编码 BIG5 即通常说的大五码，是港台地区使用的繁体中文编码规格。 GB18030 分别以单字节、双字节和四字节进行编码。兼容了GBK和GB2312。当然也支持繁体中文 RAM 是随机存取存储器，它的特点是易挥发性，即掉电失忆。 ROM 通常指固化存储器(一次写入，反复读取)，它的特点与RAM 相反。ROM又分一次性固化、光擦除和电擦除重写两种类型你提的问题应该是计算机中的术语（根据问题分类）。因此，简单地说，在计算机中，RAM 、ROM都是数据存储器。RAM 是随机存取存储器，它的特点是易挥发性，即掉电失忆。ROM 通常指固化存储器(一次写入，反复读取)，它的特点与RAM 相反。ROM又分一次性固化、光擦除和电擦除重写两种类型。参考资料：计算机原理类书籍 ram -random access memory rom -read only memory ram 随机存储器 rom 只读存储器 RAM：随机存储器。 ROM：只读存储器。通俗的讲：内存就是一种RAM，内存的数据无法长期保存，断电后数据就会丢失。但你可以将内存的数据保存到硬盘、光盘还有U盘中。硬盘、光盘还有U盘就是所谓的ROM。存储器分为随机存储器（RAM）和只读存储器（ROM）两种。其中ＲＯＭ通常用来固化存储一些生产厂家写入的程序或数据，用于启动电脑和控制电脑的工作方式。而ＲＡＭ则用来存取各种动态的输入输出数据、中间计算结果以及与外部存储器交换的数据和暂存数据。设备断电后，ＲＡＭ中存储的数据就会丢失。运行游戏、程序速度快慢看的是ＲＡＭ，也就是动态内存，不是看ＲＯＭ。ＲＯＭ是静态空间，用来存储东西的，相当于手机的Ｚ盘。ＲＡＭ和ＲＯＭ就好比是电脑的内存和硬盘。Ｃ盘准确的来讲也不应该叫ＲＯＭ只读存储器。Ｃ盘应该叫ＦＬＡＳＨ，因为Ｃ盘是可擦写的，而ＦＬＡＳＨ的大小并不影响运行速度。RAM（RandomAccessMemory）的全名为随机存取记忆体，它相当于PC机上的移动存储，用来存储和保存数据的。它在任何时候都可以读写，RAM通常是作为操作系统或其他正在运行程序的临时存储介质（可称作系统内存）。不过，当电源关闭时RAM不能保留数据，如果需要保存数据，就必须把它们写入到一个长期的存储器中（例如硬盘）。正因为如此，有时也将RAM称作“可变存储器”。RAM内存可以进一步分为静态RAM（SRAM）和动态内存（DRAM）两大类。DRAM由于具有较低的单位容量价格，所以被大量的采用作为系统的主记忆。RAM和ROM相比，两者的最大区别是RAM在断电以后保存在上面的数据会自动消失，而ROM就不会。4～8M的RAM对于一般应用程序的运行已经足够，如果追求多媒体功能，64M的RAM容量也只能够算是基本要求。相关术语：1、内存ROM容量ROM（ReadOnlyMemory）的全名为唯读记忆体，它相当于PC机上的硬盘，用来存储和保存数据。ROM数据不能随意更新，但是在任何时候都可以读取。即使是断电，ROM也能够保留数据。但是资料一但写入后只能用特殊方法或根本无法更改，因此ROM常在嵌入式系统中担任存放作业系统的用途。现在市面上主流的PDA的ROM大小是64MB以及128MB。RAM和ROM相比，两者的最大区别是RAM在断电以后保存在上面的数据会自动消失，而ROM就不会。2、FlashROM由于ROM不易更改的特性让更新资料变得相当麻烦，因此就有了FlashMemory的发展，FlashMemory具有ROM不需电力维持资料的好处，又可以在需要的时候任意更改资料，不过单价也比普通的ROM要高。幻灯片母版为除“标题幻灯片”外的一组或全部幻灯片提供下列样式： “自动版式标题”的默认样式； “自动版式文本对象”的默认样式； “页脚”的默认样式，包括：“日期时间区”、“页脚文字区”和“页码数字区”等；统一的背景颜色或图案讲义母版提供在一张打印纸上同时打印1、2、3、4、6、9张幻灯片的讲义版面布局选择设置和“页眉与页脚”的默认样式备注母版向各幻灯片添加“备注”文本的默认样式也就是说，你需要什么统一格式，只需编辑母版，该文件中的所有幻灯片都会统一应用其格式，当然你还可以每一张幻灯片再进一步修改成你所需要的效果 C/S模式概述　　C/S （Client/Server，客户机/服务器）模式又称C/S结构，是20世纪80年代末逐步成长起来的一种模式，是软件系统体系结构的一种。C/S结构的关键在于功能的分布，一些功能放在前端机（即客户机）上执行，另一些功能放在后端机（即服务器）上执行。功能的分布在于减少计算机系统的各种瓶颈问题。C/S模式简单地讲就是基于企业内部网络的应用系统。与B/S（Browser/Server，浏览器/服务器）模式相比，C/S模式的应用系统最大的好处是不依赖企业外网环境，即无论企业是否能够上网，都不影响应用。　　服务器通常采用高性能的PC、工作站或小型机，并采用大型数据库系统，如ORACLE、SYBASE、InfORMix或 SQL Server。客户端需要安装专用的客户端软件。　　传统的C／S体系结构虽然采用的是开放模式，但这只是系统开发一级的开放性，在特定的应用中无论是Client端还是Server端都还需要特定的软件支持。由于没能提供用户真正期望的开放环境，C/S结构的软件需要针对不同的操作系统系统开发不同版本的软件，加之产品的更新换代十分快，已经很难适应百台电脑以上局域网用户同时使用。而且代价高，效率低。如我院使用的上海超兰公司“案件统计”管理软件就是典型的C／S体系结构管理软件。 [编辑本段] C/S结构的优点　　C/S结构的优点是能充分发挥客户端ＰＣ的处理能力，很多工作可以在客户端处理后再提交给服务器。对应的优点就是客户端响应速度快。 [编辑本段] C/S结构的缺点　　缺点主要有以下几个：只适用于局域网。　　而随着互联网的飞速发展，移动办公和分布式办公越来越普及，这需要我们的系统具有扩展性。这种方式远程访问需要专门的技术，同时要对系统进行专门的设计来处理分布式的数据。客户端需要安装专用的客户端软件。　　首先涉及到安装的工作量，其次任何一台电脑出问题，如病毒、硬件损坏，都需要进行安装或维护。特别是有很多分部或专卖店的情况，不是工作量的问题，而是路程的问题。还有，系统软件升级时，每一台客户机需要重新安装，其维护和升级成本非常高。对客户端的操作系统一般也会有限制。可能适应于Win98, 但不能用于win2000或Windows XP。或者不适用于微软新的操作系统等等，更不用说Linux、Ｕnix等。通配符百科名片鼠标手势器StrokeIt就支持标通配符通配符是一种特殊语句，主要有星号(*)和问号(?)，用来模糊搜索文件。当查找文件夹时,可以使用它来代替一个或多个真正字符；当不知道真正字符或者懒得输入完整名字时，常常使用通配符代替一个或多个真正的字符。实际上用“*Not?paOd”可以对应Notpad\MyNotpad【*可以代表任何文字】;Notpad\Notepad【?仅代表单个文字】;Notepad\Notepod【ao代表a与o里二选一】，其余以此类推。目录[隐藏] 一、基本概念 1. 星号（*）： 2. 问号（？）： 3. 通配符包括星号“*”和问号“？”：二、使用模式 1. 通配符优先级 2. 通配符优先级的示例 3. 路由配置中的通配符一、基本概念 1. 星号（*）： 2. 问号（？）： 3. 通配符包括星号“*”和问号“？”：二、使用模式 1. 通配符优先级 2. 通配符优先级的示例 3. 路由配置中的通配符　　 [编辑本段] 一、基本概念　　通配符是一类键盘字符,有星号(*)和问号(?). 　　当查找文件夹时,可以使用它来代替一个或多个真正字符；当不知道真正字符或者不想建入完整名字时，常常使用通配符代替一个或多个真正字符。星号（*）：　　可以使用星号代替0个或多个字符。如果正在查找以AEW开头的一个文件，但不记得文件名其余部分，可以输入AEW*，查找以AEW开头的所有文件类型的文件，如AEWT.txt、AEWU.EXE、AEWI.dll等。要缩小范围可以输入AEW*.txt，查找以AEW开头的所有文件类型并.txt为扩展名的文件如AEWIP.txt、AEWDF.txt。问号（？）：　　可以使用问号代替一个字符。如果输入love?,查找以love开头的一个字符结尾文件类型的文件，如lovey、lovei等。要缩小范围可以输入love?.doc，查找以love开头的一个字符结尾文件类型并.doc为扩展名的文件如lovey.doc、loveh.doc。通配符包括星号“*”和问号“？”：　　星号表示匹配的数量不受限制，而后者的匹配字符数则受到限制。这个技巧主要用于英文搜索中，如输入““computer*”，就可以找到“computer、computers、computerised、computerized”等单词，而输入“comp?ter”，则只能找到“computer、compater、competer”等单词。 [编辑本段] 二、使用模式通配符优先级　　对于使用通配符模式的各种资源，Tivoli Access Manager for Operating Systems 必须确定将应用何种通配符模式。例如，假设有两种模式：　　/usr/local/*.log 　　和　　/usr/local/user1/*.log 　　字符串 /usr/local/user1/x.log 与这两种模式都匹配。　　为了解决这种模棱两可的情况，应用了优先级规则。模式越具体，其优先级也越高。根据这种原则，/usr/local/user1/x.log 在与 /usr/local/*.log 模式相匹配之前先与 /usr/local/user1/*.log 模式相匹配。由于找到一个匹配项，任何可应用于匹配此模式的对象的策略都将适用。　　下表显示了通配符元素的优先级。表中较高位置的元素优先于表中较低位置的元素。　　表：通配符元素优先级规则　　优先级元素示例　　1 精确字符 a, \*, \\ 　　2 字符范围 [Aa], [[:digit:]] 　　3 任意字符 ? 　　4 重复的精确字符 a+ 　　5 重复的字符范围 [Aa]+, [[:digit:]]+ 　　6 重复的任意字符 ?+ 　　7 任意字符串 * 　　根据资源的种类，将通过从开始到结束（或者相反方向）逐个元素比较模式来确定优先级。匹配文件名称的模式是从开始比较到结束。匹配主机名称的模式是从结束比较到开始。　　除了认为相同的两种模式之外，将认为较长的模式比较短的模式更具体，除非较长的字符串是由于星号（*）而较长。通配符优先级的示例　　表 4 显示了按优先级从最高到最低排列的文件名和主机名通配符模式。　　表 4. 通配符模式优先级示例　　优先级文件名称模式主机名称模式　　1 log/0[0-9]/error www.[a-z] 　　2 log/0?/error www.? 　　3 log/0*/error www.* 　　4 log/[0-9]+/error.1 www-help.[a-z]+ 　　5 log/*/error.1 www-help.* 　　6 log*/error.1 www-help.*.com 　　7 log*/error www.*.com 　　8 log*/error* *www.*.com 　　9 log* *.com 　　10 * * 　　当两个模式之间的唯一差别是字符集合中指定的字符时，将通过逐字比较包含模式的两个字符串来确定优先级。仅在要匹配的字符集包含一些相同字符时才必须考虑这一点。如果在两个集合中没有公共字符，则任一给定的字符串最多只能匹配这两个模式中的一个。路由配置中的通配符　　在路由器的配置中，经常出现通配符。和子网掩码一样，都是以“0”或“1”表示，不过与子网掩码所表示的意思却不一样。　　子网掩码所表示的是IP的网络位和主机位，而通配符则表示与IP是否匹配。　　通配符同样是32位，和IP地址一一对应，“0”位代表精确匹配，而“1“位代表不许匹配。例如路由器EIGRP的配置中：　　RouterA(config)#router eigrp 100 　　RouterA(config-router)#network 10.0.0.0 0.0.0.255 　　RouterA(config-router)#network 192.168.1.0 0.0.0.255 　　10.0.0.0 0.0.0.255说明只要接口的IP地址是以“10”开头就参与EIGRP进程。同理的，192.168.1.0 0.0.0.255说明只要IP是以192.168.1开头的IP就符合。

展开阅读全文