资源描述
第3章 常用汉字输入法
我国从20世纪60年代开始研究汉字输入法,目前已取得了重大的成果。汉字输入的方法有多种,好的输入方法能适用于各种不同的操作环境,但不管哪种输入方法,在输入汉字时都有自己的优点和不足。目前常用的汉字输入法主要是五笔字型输入法、全拼输入法和智能拼音输入法等。
本章主要内容:
= 汉字的表示与汉字编码
= 常用的中文输入法
= 简码的输入
= 词汇的输入
= 重码和容错码
= 帮助键“Z”的使用
3.1 汉字的表示与汉字编码
汉字的输入对于使用汉字的人来说,是一项必不可少的工作。我国的计算机研究人员已成功地开发了多种汉字输入法,将汉字以一定的规则进行编码,在输入汉字时,只要输入该汉字的编码字符,就能输入对应的汉字。
3.1.1 汉字字形的表示
计算机在处理汉字时,先根据汉字的机内码,取出对应的汉字字形码,得到该汉字的点阵字形,再由点阵字形来输出该汉字。
点阵字形就是以点阵方式来表示的汉字字形,是一种以网格来描画字形的方法。由于汉字是方形的,所以点阵都是正方形的。
目前计算机使用的汉字字形大多采用16×16点阵,也就是将一个正方形分为横向的16格与纵向16格,从而在相应的网格上描画汉字。16×16点阵的每列用两个字节存储,每个汉字字型占用32个字节。
点阵的大小影响着汉字字形的质量,点阵越大,即点阵越密,汉字的笔画表示得就越清晰,因而汉字的质量就越高,但它所占用的存储空间也就越大。所以,汉字信息处理系统在确定汉字点阵的同时,也要考虑存储容量及设备的成本等因素。
3.1.2 汉字代码
汉字代码包括汉字输入码、汉字交换码、汉字机内码、汉字地址码、汉字字形码和汉字控制功能码六种。
1. 汉字输入码
汉字输入码主要有流水码、音码、形码和音形码等。
· 流水码:将被编码的汉字按一定的顺序排列,依次编排一个号码,这个号码便是这个汉字的编码,这样形成的汉字编码就称为流水码。它整洁、简单,但编码与汉字的属性(即字音、字形、字义)没有直接的关系,因此这种编码较难记忆和掌握,国标码和区位码就属于流水码。
· 音码:其编码规则与音素有关,它是根据汉字的读音属性来对汉字进行编码,因此只需具有汉语拼音的基础即可掌握。但音码只能对那些能读出音的汉字进行编码,否则无法编码。如:智能ABC、双拼、全拼等。
· 形码:这种编码较易掌握,它是根据汉字的字形来确定的。此种编码缺乏像汉语拼音输入法那样一个法定的科学规范作为基础,而且笔画或字根在通用键盘上的表示和布局也较为困难,因此这些问题还有待解决。如五笔字型和郑码等属于形码。
· 音形码:它是根据汉字的字音和字形属性来确定汉字的编码的,其编码规则不但与字音有关,还与字形有关,常见的音形码有首尾码。
无论哪种编码方案都提供了重码字、辅助选择、词组输入、联想输入等方法,以提高输入速度,达到易学好用的目的。
2. 汉字交换码
使用汉字交换码可以达到系统设备之间或记录媒体之间信息交换的目的。它是汉字信息处理系统之间,或者汉字信息处理系统与通信系统之间信息交换时的统一编码。
目前,我国计算机所使用的交换码的标准主要有两个:
· GB1988《信息交换用的七位编码字符集》。它与ASCII代码集基本相同,只是把2列4行中的货币符号$变成人民币标识符¥。
· GB2312《信息交换常用汉字编码字符集——基本集》。它规定了进行一般汉字信息交换用的6763个汉字和682个非汉字(包括图形字符)的编码。在GB2312代码表中,任何一个图形字符的位置可有两种表示方法:一种是国际交换码;一种是国标区位码,它们之间存在着一一对应的关系。
3. 汉字机内码
汉字机内码是汉字在汉字信息处理系统内部最基本的表示形式,它是计算机内部对汉字进行存储、运算、传输时所使用的代码,它通常是对汉字交换码作出某种标识之后得到的内部码,所以它与交换码之间有明显的对应关系。
4. 汉字地址码
在输出汉字前,由汉字地址码先找到该汉字在汉字库中的存储地址,才能取得字形码。所以它是用来指出汉字字形信息在汉字库存中存放位置的编码。
5. 汉字字形码
汉字字形码是一种表示汉字字形信息的编码。汉字的字形码一般用汉字字形点阵的数字表示或数学公式表示。
6. 汉字控制功能码
汉字控制功能码只对汉字的处理过程产生影响,而不表示汉字本身。它可以对汉字数据格式处理、传送控制和解释执行起控制作用。
3.2 常用的中文输入法
随着计算机的发展,汉字输入法也越来越多,掌握汉字输入法已成为我们日常使用计算机的基本要求。根据汉字编码的不同,汉字输入法可分为三种:字音编码法、字形编码法和音形结合编码法。目前,使用最多的字音编码有全拼输入法、双拼输入法和智能ABC输入法等。
3.2.1 全拼输入法
在众多输入法中,全拼输入法是最简单的汉字输入法,它是使用汉字的拼音字母作为编码,只要知道汉字的拼音就可以输入汉字。因此它的编码较长,击键较多,而且由于汉字同音字多,所以重码很多,输入汉字时要选字,不方便盲打。
1. 输入单个汉字
在全拼输入状态下,直接输入汉字的汉语拼音编码就可以输入单个汉字。
『举例』 使用全拼输入法输入“中”字,其操作步骤如下:
(1)先切换至全拼输入法状态。
(2)输入“中”的汉语拼音“zhong”,注意要输入小写字母,此时即会出现一个提示板,如图3-1所示。
图3-1 输入拼音后出现一个提示板
(3)在提示板内可以看到“中”字对应的数字键为1,可按数字键1或直接按空格键即可输入“中”字。
如果在当前提示板中的10个汉字中都没有需要的汉字,可以通过单击提示板左上方的向右或向左黑三角,或者按Page Down键来进行重码区的翻页,直到提示板中显示需要的汉字,再按相应的数字键即可。
2. 输入词组
输入词组不仅可以减少编码,也可以减少输入时的重码数,从而使输入的准确性提高、输入速度加快。使用全拼输入法,可输入的词组有双字词组、三字词组、四字词组和多字词组,除了多字词组外,在输入时都要求全码输入。
3.2.2 双拼输入法
双拼输入法的编码原则是:将汉语拼音的声母和韵母分别用一个单字母或符号来编码,因而每个汉字都是由两个编码组成。它是利用字音的单音节声韵双拼的特点,如果一个汉字没有声母,则声码编码用零声母来代替。
与全拼输入法相比,双拼输入法的最大优点在于编码短,击键次数少,输入速度相对较快。
『举例』 使用双拼输入法输入二字词汇“计算”,其输入顺序如下:
(1)先切换至双拼输入法的状态。
(2)输入双字词汇中每个字的声、韵母,即“计”字的声、韵母为“ji”,“算”的声、韵母为“sr”。
(3)双字词汇中两个字的声、韵母输入完成后,屏幕上会出一个提示板,如图3-2所示。
图3-2 声、韵母输入完成后的提示板
(4)在提示板中可以看到词汇“计算”对应的数字号为1,此时即可键入结束码(即空格键),或按数字键1即可。
在输入词汇时,完成了声、韵母的输入后,如果键入空格键后只输入了第一个汉字,要想输入第二个汉字,则再次按下空格键即可。
3.2.3 智能ABC输入法
智能ABC输入法在全拼输入法的基础上进行了改善,它是目前使用较普遍的一种拼音输入法,仅次于五笔字型输入法。它将汉字拼音进行简化,把一些常用的拼音字母组合起来,用单个拼音字母来代替,从而减少了编码的长度,大大提高了输入汉字的速度。
在使用智能ABC输入法输入汉字时,其特点主要体现在词组和语句的输入。
『举例』 使用智能ABC输入法输入多字词组“中国人民解放军”,其输入过程如下:
(1)先切换输入法至智能ABC输入法的状态。
(2)输入多字词组“中国人民解放军”中每个汉字的第一个拼音字母,即“zgrmjfj”(输入的字母必须为小写字母)。
(3)输入完成后,按空格键或回车键(如果确定输入的多个汉字是词组,按空格键即可显示出整个词组)屏幕上即会显示一个提示板,如图3-3所示。
按下回车键后出现的提示面板 按下空格键后出现的提示面板
图3-3 使用智能ABC输入多字词组
(4)需要的词组汉字都出现后,键入空格键或回车键即可输入该词组。
当输入完该语句中每个汉字的第一个字母时,按下空格键或回车键后,只有一个或几个汉字显示(如有重码,可键入需要汉字前的数字序号),再次按空格键或回车键,并在出现的提示板中进行选择,直到整个语句出现后,按空格键或回车键即可输入一个语句。
用智能ABC输入法录入过的句子,计算机系统会记住该句子,下次再录入该句子时,输入该句子编码后,按回车键提示行中即可出现该句子。
『举例』 使用智能ABC输入法输入句子“今天天气很好”,其输入过程如下:
(1)先切换至智能ABC输入法状态。
(2)输入句子“今天天气很好”中每个汉字的第一个拼音字母,即“jttqhh”(输入的字母必须为小写字母)。
(3)编码输入完成后,按下空格键,此时整个句子都显示在提示行中(即提示行显示 ),表示以前用智能ABC输入法录入过该句子。
(4)再次按空格键即可。
3.3 认识五笔字型输入法
前面我们已介绍了三种比较常用的输入法,在日常应用中,非专业汉字录入人员大多使用这三种输入法,因为它们具有学习容易、操作简便的特点,但是它们编码较长,输入速度也相对较慢,而且由于重码较多,经常要进行选择,所以不便实现盲打。因此,对于专业录入和想提高输入速度的人来说,就有点不太合适。目前大多数专业录入人员使用的汉字输入法是五笔字型输入法。
五笔字型输入法的优点有:
· 码长短,重码率低。
· 输入一个汉字或词组最多只要击键四下,并且还有大量的各级简码汉字。
· 输入每一个汉字都有规则可循、输入简便。
因此,五笔字型输入法是目前输入汉字最快、应用最广泛的一种汉字输入法,广大专业输入汉字的工作人员大多使用该输入法。
3.3.1 五种基本笔画
在书写汉字时,不间断地一次连续写成的一个线条叫做汉字的一个笔画,在五笔字型输入法中,将汉字的笔画归结为横、竖、撇、捺、折五种。
在五笔字型输入法中,笔画是组成字根的基本单位,其基本字根有130个,加上一些基本字根的变形,共有200个左右。这些字根按照其运笔方式又分为5个区(即字母走向),即横起笔画类、竖起笔画类、撇起笔画类、捺起笔画类和折起笔画类,其中每个区都分为5组,共25组。
五种笔画的代号、走向、各种变形及字母的走向,如表3-1所示。
表3-1 汉字的五种基本笔画
代号
笔画名称
笔画走向
笔画
字母走向
1
横
从左到右
一和
G—A
2
竖
从上到下
| 和亅
H—M
3
撇
从右上到左下
丿
T—Q
4
捺
从左上到右下
丶和
Y—P
5
折
各方向转折
乙
N—X
从表3-1中可以看到,分别用1、2、3、4、5来代表五种不同的笔画:在横笔画中,除了一般的横线外,提笔画也归于横笔画一类;在竖笔画栏中,除了竖笔画外,带左钩的竖线也属于竖笔画类;捺笔画还包括了点笔画在内;带有转折的所有笔画都属于折笔画内。
为了在录入文字时方便好记,可阅读以下“助记歌”,相信一定会为你带来事半功倍的效果。
横竖撇捺折,
一二三四五,
横是G来竖H,
撇是T来捺为Y,
还有折笔是N。
1. 横起笔画类
横起笔画是以从左至右的方向来运笔的,并包括以从左下到右上的方向运笔的提笔画在内。
如:“功”字的左边部分最后一画“”,它是以从左下至右下的方向运笔的,所以可以意为横笔画“一”,即该部分看成“工”字根来录入;再如“刁”字,它的最后一笔也是“”,如果这里不把它看横笔画“一”的话,是没法打出来的。
因此在使用五笔字型输入法时,凡运笔方向从左到右和从左下到右上的笔画都为横起笔画类,如表3-2所示为横起笔画类的区域,为了帮助记忆,每组都有相应的助记词,我们可根据记忆词来快速记忆。
表3-2 横起笔画区
区位
编码
字 根
字根助记词
11
G
王五一戋
王旁青头兼(戋)五一
12
F
土士干二十雨寸
土士二干十寸雨
13
D
大犬古石丆三厂
大犬三羊古石厂
14
S
木丁西
木西丁
15
A
工匸艹廿七戈弋
工戈草头右框七
2. 竖起笔画类
竖起笔画是以从上到下的方向来运笔的,并包括以同样方向运笔的竖钩在内。
如:“利”字左边部分的末笔是竖勾“亅”,以其运笔方向来看,应把“亅”笔画看作竖笔画“丨”,即该字在竖笔画区。
因此在使用五笔字型输入法录入文字时,凡是以从上到下运笔的笔画都包括在“竖”的管辖内。如表5-3所示为竖笔画的区域。
表3-3 竖笔画区
区位
编码
字 根
字根助记词
21
H
目丨卜 上止
目具上止卜虎皮
22
J
日 曰 早 刂
日早两竖虫利刀
23
K
口 川
口与川,字根稀
24
L
田 甲 口 四 皿车 力
田甲方框四车力
25
M
山 由 贝 冂 几
山由贝,下框几骨头
3. 撇起笔画类
撇起笔画是以从右上到左下的方向运笔的,不管撇是长是短、是大是小,只要是以从右上到左下的方向运笔,都属于撇类,如表3-4所示为撇笔画的管辖区,我们同样可根据助记忆词来快速记。
表3-4 撇笔画区
区位
编码
字 根
字根助记词
31
T
禾竹丿攵夂彳
禾竹一撇双人立,
反文条头共三一
32
R
白手扌斤
白手看头提手斤
33
E
月用彡爫乃豕
月彡(衫)乃用家衣底
34
W
亻八癶
人和八,三四里
35
Q
钅儿勹犭乂ク夕
金勺缺点无尾鱼,
犬旁留乂儿一点夕,
氏无七(妻)
4. 捺起笔画区
捺笔起画是以从左上到右下的方向运笔的,并包括以相同方向运笔的点在内。另外,像“冖”笔画的运笔方向也是以从左上到右下的方向运笔的,如:军、写等,所以也归为捺笔画区。
如:“买”字下面部分“”,在单独成字(也就是说“大”字)使用时,最后一笔是捺,作为偏旁部首使用时,最后一笔就成了点,点也是从左上至右下的方向运笔的。
因此,起笔时凡以从左上到右下的方向运笔的笔画都属于“捺”的管辖区,如表3-5所示。为了使读者记忆起来更方便,同样可以根据提供的助记词来达到快速记忆的目的。
表3-5 捺笔画区
区位
编码
字 根
字根助记词
41
Y
言 讠 文 方 八 亠 广
言文方广在四一,
高头一捺主多一
42
U
六 立 辛 冫 丬 丷 疒 门
立辛两点六门疒
43
I
氵 水 小
水旁兴头小倒立
44
O
火 灬 米
火业头,四点米
45
P
之 廴 冖 宀
之字军盖建到底,
摘礻(示)衤(衣)
5.折起笔画区
折起笔画区是将各种不同的折都归为同一类,它运笔方向不定,在众多笔画中折的形状变化是最多的一种,如表3-6所示为折笔画的管辖区。通过助记词来快速掌握折笔画各组中所包含的字根。
表3-6 折笔画区
区位
编码
字 根
字根助记词
51
N
巳 已 尸 心 忄 羽
已半巳满不出己,
左框折尸心和羽
52
B
孑 子 ㄍ 也 耳卩 阝 凵
子耳了也框向上
53
V
女 刀 九 巛 彐 臼
女刀九臼山朝西
54
C
又 ス マ ㄙ 巴 马
又巴马,丢失矣
55
X
纟 幺 弓 匕
慈母无心弓和匕,
幼无力
像前面左竖勾“亅”也带了折,但它并不属于折笔画内。
3.3.2 字根结构
在五笔字型输入法中,字根是汉字的组成部分,在使用五笔字型输入法录入汉字时,就是由130多个基本字根(如图3-4所示为五笔字型输入法字根表),通过一定连接方式来组成所有汉字的。字根的连接方式包括四种,即单、散、连、交。
1. 单
一个字根不需要与其他字根发生关系,而本身就是一个汉字的字根称为“成字字根”,这种情况不只包括成字字根,也包括键名汉字,如五、又、一、以等。
2. 散
在众多汉字中,大多数汉字都不是由一个单独的字根构成,而是由多个字根发生联系才能组成的。所谓“散”,就是指在构成汉字时,各字根之间不相连也不相交,保持一定的距离,如:好、他、江、邑等。
3. 连
组成汉字的各个字根有着相连的关系,这里的相连与平时相互连接的意思不同,这种相连关系有两种情况:
图3-2 字根的区和位
· 一种是点结构和其他字根相连,如:叉、太、主、关、术、玉等。这些汉字中的点与其他基本字根并不一定相连在一起,它们之间可连可不连,可稍远可稍进。
·一种是单笔画与其他字根相连,如:自(撇与字根“目”相连)、下(横与字根“卜”相连)、不(横与字根“小”相连)。
4. 交
由两个或多个字根相交组成的汉字,其各字根之间部分笔画重叠。如来(由横与字根“米”交叉组成)、丰(由字根“三”与一竖交组成)。
3.3.3 形近和相似字根的区分
在众多的字根中有很多形近和相似字根,但它们并不在同一字母键位上,拆分此类汉字时极易出错,因此必须能够正确分析这类字根。
1. 相似字根
像字根“七”和“匕”极为相似,但它们并不在同一字母键位上,是易混淆字根。在区分时,应按字根起笔笔画区位来区分:若字根是以横起笔,则位于第一区(横起笔画区),因此该字根为“七”,即在字母键A上;若以折起笔,则位于第五区(折起笔画区),因此该字根为“匕”,即在字母键X上。
如:“龙”字,如果不明白其末笔字根是取“七”还是“匕”,就可按该字根的起笔笔画来区分。“龙”字的末笔字根起笔笔画为拆,故应取“匕”为该字字根,即其编码为DX。
再如“看”字,如果不明确是取字根“”还是字根“”,同样可以根据其首笔来判断,即该字根的首笔画为撇,因此“看”字的第一字根应取“”,在第三区的字母键R上,此时即得出“看”字的编码为RHF。
2. 形式字根
像字根“戋”、“”、“”和“戈”在形状上很相似,虽然它们都属于第一区,但所处的字母键有所不同的,所以也容易混淆字根。分辨这些字根在哪一字母键时,可按斜勾部分起笔画和次笔画的不同来判断。
『举例』 按斜勾部分起笔画和次笔画的不同来判断字根。
划:该字的斜勾部分起笔画和次笔画分别由横、斜勾、撇和点组成。首笔为横在1区,次笔笔画为折在第5位上,所以该字的斜勾部分“戈”在1区5位上(即字母键A上),即该字的编码为(AJH)戈、刂。
钱:该字的斜勾部分第一笔和第二笔分别为横、横,首笔画为横在1区,次笔画为横在1位上,所以该字的斜勾部分“戋”在1区1位上(即字母键G上),即该字的编码为(QG)钅、戋。
尧:此字斜勾部分“”与字根“戈”相似,但该斜勾部分少了一点,按字根的拆分原则,它不是一个单独的字根。按能连不交、取大优选的原则,该部分可分为“”与“丿”两个单独字根,即字根“”与字根“七”相似,并且首次笔均为横、拆,所以它们同处一个字母键上(即A),即该字的编码为(ATGQ)丿一儿。
曳:该字斜勾部分的首笔画和次笔画分别为斜勾(折)、撇,首笔折在5区,次笔撇在第3位,所以该字的斜勾部分在5区3位(即字母键X上),该字的斜勾部分与字根“匕”相似,可将其看作“匕”来划分,即该字的编码为(JXE)日匕丿。
“且字头”和“具字头”,这样的字根也为相似易混淆的字根,这里的“且字头”是变形字根“月”的变体,在字母键E上(即“且”字的编码为‘EG’);而“具字头”是在字母键H上(即“具”字的编码为‘HW’)。
以上只是对一少部分易混淆字根的分析,在文字录入时,像这些形状相似的字根大有存在,如果遇到此类情况,可参照以上的拆分方法来判断。
3.3.4 汉字的字型结构
由于很多汉字都由同样的字根组成,为了使这些含有同样字根的汉字不重码,五笔字型输入法,根据各汉字中字根之间的位置关系,将其分为三种汉字结构,即上下结构、左右结构和杂合结构,并分别用数字来表示,即代号1、2、3。
1. 上下结构
如果一个汉字由上、下不同的两个部分组成(其中任一部分可以是由多个字根组成,这一部分可以是左、右结构,或左、中、右结构),或由上、中、下三部分组成,这种结构的汉字就称为上下结构,即代号为1。
例如:竖、全、笔、邑、曼、罚等。
2. 左右结构
一个汉字由左、右两个部分组成,(其中左、右任一部分可以是由多个字根组成,这一部分的字根结构可以是上、下结构,或上、中、下结构),或是由左、中、右三部分组成的汉字,统称为左右结构,即代号为2。
例如:好、组、结、部、街、谢等。
3. 杂合结构
如果某一个汉字没有简单而明确的上下或左右结构之分,那么此类汉字就属于杂合结构,即代号为3。
例如:屏、成、发、回、可等。
在分辨汉字是否属杂合结构时,可根据以下方法来判断:
·凡属字根相连(即单笔画字根与其他多笔画字根,或点笔画字根与其他基本字根之间的相连关系)的汉字,都视为杂合结构。
·内外结构的汉字都属于杂合结构,如:围、国、同、因等。
·含两个字根,并且字根之间为相交关系的汉字都属于杂合结构,如:叉、必。
3.3.5 拆分汉字
前面已经提到,在使用五笔字型输入法进行汉字录入时,各字根的组成是有一定规则的,不同结构的汉字,它们的拆分规则也不相同,以下为不同结构汉字的拆分规则:
· 成字字根是不必拆分的,只要按一定的编码规则就可以形成汉字;
· “散”方式形成的汉字,在拆分时只要将每个字根分离出来即可;
· “连”方式形成的汉字,拆分时先找出单笔画,再拆分出其相连的字根;
· “交”方式形成的汉字,仔细分清它是由哪些字根相交而成,然后再拆分。
在拆分汉字的时候,通常一个汉字有多种拆分方法,然而在使用五笔字型输入法录入汉字时,一个汉字只有一种编码是正确的,因此,要想准确地录入汉字,就必须掌握正确地拆分方法。正确地拆分汉字可遵循以下原则:
1. 取大优先
如果一个汉字有多种拆分方法,就取拆分后字根最少的那一种,并保证在书写顺序下拆分成尽可能大的基本字根,使字根数目最少,即“能大则不小”。
『举例』:
“横”字可拆分为:
第一种拆法:十、八、艹、一、由、八
第二种拆法:一、小、艹、一、由、八
第三种拆法:木、艹、一、由、八、
第四种拆法:木、、由、八
按其取大优先的原则,第四种是拆分后字根最少的,并且其拆分顺序也正确,所以第四种拆法才是“横”字的正确拆分。
“颗”字可以拆分为:
第一种拆法:日、十、八、厂、冂、人
第二种拆法:日、一、小、厂、冂、人
第三种拆法:日、木、厂、冂、人
第四种拆法:日、木、厂、贝
按其取大优先的原则,第四种是拆分后字根最少的,并且其拆分顺序也正确,所以第四种拆分是正确的。
2. 能交不连
字根与字根之间的位置有“连”、“交”的关系,如果一个汉字可以拆分为相连或相交的两种方式,并保证在书写顺序下拆分成尽可能大的字根,那么应取相连的关系进行拆分。
『举例』:
“于”字可拆分为:
第一种拆分法:二、丨
第二种拆分法:一、十
按其能交不连的原则,第二种最符合,并且其拆分的顺序也正确,所以“于”字的第二种拆法是正确的。
“天”也有两种拆分方法:
第一种拆法:二、人
第二种拆法:一、大
按其能交不连的原则,“天”字的正确的拆分应是第二种。
3. 能散不连
如果一个汉字的字根之间有一定的距离,在拆分时就不要将该字拆成“连”的形式,并保证在书写顺序下拆分成尽可能大的字根。
『举例』:“百”字可拆分为
第一种拆分法:一、白
第二种拆分法;厂、日
按其能散不连的原则,第二种最符合,并且其拆分的顺序也正确,所以“百”字的第二种方拆法是正确的。
“自”字的拆分方法有:
第一种拆分方法:白、一
第二种折分方法:丿、目
按其能散不连的原则,在这里应该选择第二种拆分方法。
以上三种汉字的拆分原则,是进行五笔字型输入的先决条件。以下汉字便是按拆分原则来拆分的示例:
汉字 字根组成 汉字 字根组成
原 厂、白、小 凌 冫、土、八、夂
拆 扌、斤、丶 体 亻、木、一
度 广、廿、又 秆 禾、干
余 人、禾 位 亻、立
内 冂、人 输 车、人、一、月、刂
则 贝、刂 播 扌、丿、米、田
3.3.6 单个汉字的编码规则
在使用五笔字型输入法输入单个汉字前,应首先了解键名汉字、成字字根、五种笔画及一般汉字的编码规则。读者可通过背诵以下的口决,来记忆单个汉字的编码规则:
五笔字型看直观,依照笔顺来编码;
键名汉字击四下,基本字根须照搬;
一二三末共四码,顺序拆分大优先;
不足四码要注意,交叉识别后边补。
以上的口决总结了编码规则的五项原则:
· 按汉字的书写(从左至右、从上至下、从外至内)顺序进行编码。
· 以汉字拆分后的基本字根进行编码。
· 每个汉字最多只取四码,即第一、二、三和最后字根。
· 汉字拆分遵循取大优先的原则。
· 不够四码的汉字,最后一笔画取交叉识别码。
1. 键名汉字的编码规则
五笔字型的字根分布在键盘的25个字母键上,每个字母键都有一个键名汉字,即字根表中每个字母键所对应排在第一位的那个字根,如图3-5所示。
图3-5 键名汉字对应的字母键
在输入这些键名汉字时,只需将所在键位连击4下即可,例如:“金”的编码为“QQQQ”;“目”的编码为“HHHH”。
当然有些键名汉字不必击4次,例如“人”是一级简码,只需击一次键名码(即W),再键入一个空格键即可;“水”是二级简码,只需击两次“I”键位,再键入一个空格键即可。
2. 成字字根的编码规则
在五笔字型字根键盘的每个字母键上,除了键名汉字外,还有一些字根本身就是一个汉字,这此字根被称为成字字根(除键名汉字外)。
当一个成字字根超过2个笔画时,其编码规则用公式来表示为:
编码 = 键名码 + 首笔码 + 次笔码 + 末笔码
其中首笔码、次笔码、末笔三都是指五种基本笔画:横、竖、撇、捺、折,它们对应的字母键为G、H、T、Y、N,如表3-7所示为一些两个笔划以上的成字字根的编码法。
表3-7 成字字根击键法
成字字根
键名码
编码
成字字根
键名码
编码法
文
Y
YYGY
辛
U
UYGH
虫
J
JHNY
石
D
DGTG
续表
成字字根
键名码
击键法
成字字根
键名码
击键法
西
S
SGHG
戋
G
GGGT
干
F
FGGH
川
K
KTHH
如果成字字根只有2个笔画时,即三个编码,则第四码以空格键结束。输入方法为:
编码 = 键名码 + 首笔代码 + 次笔代码 + 空格键
例如:“丁”字,先按键名码S,再按首笔代码G,然后是次笔H,最后再加上一个空格键,“丁”字就出现在屏幕上。再如“二”字就是FGG,再加上一个空格,则“二”字就出现在屏幕上。
3. 五种笔画的编码
在五笔字型输入法中,五种基本笔画横、竖、撇、捺、折,分别用笔画一、丨、丿、丶、乙来表示。它们同样有自己的编码规则,其击键法是击两下键名码,再击两下L键。这五种笔画的编码分别为:
一:GGLL
丨;HHLL
丿:TTLL
丶:YYLL
乙:NNLL
4. 一般汉字的编码规则
在五笔字型输入法中,键名汉字和成字字根只占汉字极小的一部分,绝大部分的汉字是一般汉字。因此,掌握一般汉字的编码规则,对熟练地使用五笔字型输入法起着至关重要的作用。
在学习一般汉字的编码规则之前,必须先清楚两个概念:字根码和识别码。
· 字根码:字根所在的英文字母键就是它的字根码。不同的字根可以拥有相同的字根码,例如:“方”的字根码为“Y”,“文”的字根码也为“Y”;“目”的字码为“H”,“止”的字根码也为“H”。
· 识别码:与汉字最后一笔的笔画号和字型结构的编号组成交叉代码,交叉代码所对应的英文字母键就是识别码。前面我们已经提到过横、竖、撇、捺、折代号分别为1、2、3、4、5。在字型结构中,左右结构、上下结构、杂合结构的编号分别为1、2、3。把这两种编号组成起来就形成了交叉码,不同的编号对应不同的字母键,如表3-8所示。
表3-8 不同笔画、结构的识别码
左右(1)
识别码
上下型(2)
识别码
杂合型(3)
识别码
横(1)
11
G
12
F
13
D
竖(2)
21
H
22
J
23
K
撇(3)
31
T
32
R
33
E
续表
左右(1)
识别码
上下型(2)
识别码
杂合型(3)
识别码
捺(4)
41
Y
42
U
43
I
折(5)
51
N
52
B
53
V
『举例』:
汉字 最后一笔及代码 字型结构及代码 交叉代码 识别码
反 捺—4 杂合结构—3 43 I
严 撇—3 上下结构—2 32 R
刚 竖—2 左右结构—1 21 H
忆 折—5 左右结构—1 51 N
找 撇—3 左右结构—1 31 T
识 捺—4 左右结构—1 41 Y
吾 横—1 上下结构—1 12 F
旦 横—1 上下结构—2 12 F
气 折—5 上下结构—2 52 B
利 竖—2 左右结构—1 21 H
叉 捺—4 杂合结构—3 43 I
下面列出了一部分在使用五笔字型输入法录入时,需要加识别码的汉字:
劫 戒 诫 巾 今 筋 仅 京 惊 井 酒 巨 句 苗 庙 闽 牡 亩 捂 尿 茗 涅 牛 农
蚂 吗 麦 忙 卯 冒 枚 眉 美 闷 孟 贾 钾 笺 肩 聿 茧 贱 见 涧 溅 秸 疟 弄
判 刨 匹 票 迫 粕 扑 朴 栖 奇 气 乞 泣 讫 扦 千 忍 仟 浅 巧 怯 青 琼 丘
羌 抉 钧 君 刊 看 抗 亢 栗 利 隶 柰 连 凉 晾 疗 吝 漏 竞 芦 庐 掠 仑 玛
扎 札 轧 盏 章 仗 兆 召 砧 正 汗 置 痔 钟 仲 舟 诌 肘 住 爪 庄 壮 状 谆
粪 拂 伏 弗 付 父 讣 改 甘 杆 竿 赶 秆 枉 皋 告 恭 汞 勾 苟 咕 蛊 故 固
刮 挂 圭 旱 夯 豪 亨 弘 户 幻 皇 惶 煌 回 卉 昏 霍 击 伎 剂 忌 仓 草 厕
岔 誊 码 呕 卓 孜 仔 自 走 足 皑 艾 岸 叭 扒 笆 疤 把 坝 柏 败 拌 剥 卑
钡 狈 叉 备 铂 扯 彻 尘 程 驰 尺 斥 愁 丑 臭 床 闯 辞 歹 待 悼 等 奋 狄
翟 惊 刁 钓 叮 冬 抖 杜 肚 妒 竞 讹 厄 尔 洱 饵 伐 乏 钒 犯 坊 肪 仿 访
飞 吠 奋 忿 封 酋 去 雀 冉 壬 刃 戎 茸 冗 汝 晒 杉 汕 扇 尚 舌 申 声 升
圣 什 矢 屎 仁 市 谁 私 宋 诵 岁 她 坍 叹 讨 套 贴 汀 头 秃 徒 吐 推 驮
洼 尺 万 亡 旺 忘 妄 唯 位 蚊 问 沃 吾 毋 午 伍 勿 悟 昔 硒 汐 悉 匣 闲
香 湘 乡 翔 享 泄 芯 锌 否 刑 兄 朽 穴 血 驯 丫 岩 阎 厌 汁 唁 彦 羊 仰
耶 曳 沂 艺 邑 亦 异 翌 音 尹 应 拥 佣 痈 蛹 尤 铀 油 幼 余 鱼 渔 予 元
钥 云 孕 宰 皂
一般汉字的编码规则是:
· 含有四个或四个以上字根的汉字编码为:
编码 = 字根码1 + 字根码2 + 字根码3 + 字根码4
其中字根码1、2、3,分别代表一个汉字的第1、2、3个字根的字根码,字根码4表示该汉字的最后一个字根的字根码。
『举例』:
汉字 字根编码 汉字编码
增 FULJ FULJ
繁 TXGUTXI TXGI
题 JGHDM JGHM
编 XYNMA XYNA
键 QVFHP QVFP
缬 XFKDM XFKM
· 含有三个字根的汉字编码为:
编码=字根码1 + 字根码2 + 字根码3 + 识别码
『举例』:
汉字 字根编码 识别码 汉字编码
简 TUJ F TUJF
识 YKW Y YKWY
根 SVE Y SVEY
往 TYG G TYGG
框 SAG G SAGG
· 含有两个字根的汉字编码为:
编码=字根码1 + 字根码2 + 识别码 + 空格
『举例』:
汉字 字根编码 识别码 汉字编码
入 TY I TYI
汉 IC Y ICY
码 DC G DCG
字 PB F PBF
下 GH I GHI
好 VB G VBG
忆 NN N NNN
元 FQ B FQB
3.4 简码的输入
按照五笔字型输入法的规则,一个汉字的编码由四个字母构成,为了简化输入,省略掉编码中后面的若干个字母,从而使编码简化,就形成了简码。在五笔字型输入法中包含了一、二、三级简码,正由于这些简码的存在,使得五笔字型输入法的速度大大加快。如果要想达到快速度地输入汉字,就得熟练各级简码。
3.4.1 一级简码
一级简码又称高频字,在五笔字型输入法中,把最常用的25个汉字用单个字母键来编码,只要单击它们对应的字母键,然后再按一个空格键(如“我”字,单击字母键“Q”后,再键入一个空格键即可),就能把它们输入到屏幕上。如图3-6所示为一级简码汉字在键盘上的分布。
图3-6 一级简码汉字在键盘上的分布
这些一级简码汉字除了要牢记外,有时还要用到全码。例如:在输入词组时需要输入前面的一个或两个编码,所以在熟记其一级简码编码的同时,也要熟记其全码。它们全码的编码规则与一般汉字是相同的。
3.4.2 二级简码
二级简码汉字都是平时常见的汉字,此类汉字只需输入其前两个字根,然后再按一个空格键即可。二级简码的汉字最多可以达到25×25=625个,如表3-9所示为五笔字型输入法下的二级简码。
表中间有些地方有空隙,那是特意留出来的,原因就是空隙处对应的两个字母键组合时,不能组成二级简码汉字。
表3-9 二级简码
横笔区
竖笔区
撇笔区
捺笔区
折笔区
11—15
21—25
31—35
41—45
51—55
G F D S A
H J K L M
T R E W Q
Y U I O P
N B V C X
G
F
D
S
A
五 于 天 末 天
二 寺 城 霜 载
三 夺 大 厅 左
本 村 枯 林 械
七 革 基 苛 式
下 理 事 画 现
直 进 吉 协 南
丰 百 右 历 面
相 查 可 楞 机
牙 划 或 功 贡
玫 珠 表 珍 列
才 垢 圾 夫 无
帮 原 胡 春 克
格 折 极 检 构
攻 匠 菜 共 区
玉 平 不 来
坟 增 示 赤 过
太 磁 砂 灰 达
术 样 档 杰 棕
芳 燕 东 芝
与 屯 妻 到 互
志 地 雪 支
成 顾 肆 友 龙
杨 李 要 权 楷
世 节 切 芭 药
H
J
K
L
M
睛 睦 眼 盯 虎
量 时 晨 果 虹
呈 叶 顺 呆 呀
车 轩 因 困 轼
同 财 央 朵 曲
止 旧 占 卤 贞
早 昌 蝇 曙 遇
中 虽 百 另 员
四 辊 加 男 轴
由 则 崭 册
睡 肯 具 餐
昨 蝗 明 蛤 晚
呼 听 吸 只 史
力 斩 胃 办 罗
几 贩 骨 内 风
眩 瞳 步 眯 瞎
景 暗 晃 显 晕
嘛 啼 吵 噗 喧
罚 较 辚 边
凡 赠 峭 迪
卢 眼 皮 此
电 最 归 紧 昆
叫 啊 哪 吧 哟
思 囝 轨 轻 累
岂 邮 凤 嶷
T
R
E
W
Q
生 行 知 条 长
后 持 拓 打
且 肝 采 肛
全 会 估 休 代
钱 针 然 钉
展开阅读全文