收藏 分销(赏)

计算机汉字键盘设计_三原理_.doc

上传人:s4****5z 文档编号:8735352 上传时间:2025-02-28 格式:DOC 页数:34 大小:2.12MB 下载积分:10 金币
下载 相关 举报
计算机汉字键盘设计_三原理_.doc_第1页
第1页 / 共34页
计算机汉字键盘设计_三原理_.doc_第2页
第2页 / 共34页


点击查看更多>>
资源描述
如果喜欢可以尽情下载 这个是我费不少力气搜集的 计算机汉字键盘设计“三原理” ——论计算机中文键盘的设计 王 永 民 摘 要 为突破汉字输入计算机的“瓶颈”,30年来国内外发表过数以千计的汉字输入键盘。作者认为一个有生命力的汉字输入键盘,应当是一个涉及多种学科的多目标统一。本文根据作者20多年来研究计算机汉字输入键盘的过程中所建立的理论和实践,阐明了作为“五笔字型”键盘设计理论支柱的“相容性、规律性、协调性三原理”,提出了据此评价各类汉字输入键盘的量化方法。作者建议我国有必要记取“英美字母键盘设计走了弯路”的教训,应该“一步到位”,以“三原理”为理论框架,设计出中国人自己的计算机汉字输入键盘。 Abstracts The article has a historical analysis of all kinds of computer Chinese character inputting methods of the world in the past 30 years, It takes the knowledge of multi-subjects as the background, and summarizes technological characteristics of all kinds of font code and their optimizing course. This article main illustrates “the three principles of font code design” which as the theory prop of “WUBI”.The author suggests that we should charge up the historical mistakes of the design of British and American letter keyboard which “go winding road and devil to pay”,we should “go to right place with one step” in the theory frame of “the three principles”,and design Chinese character keyboard of ourselves, the author hopes that this article is helpful to academic theory field and information engineering technician to have an general idea and evaluate all kinds of inputting method. 目 录 一、汉字输入键盘设计的相容性原理…………………………………2 二、相容性原理的数学描述……………………………………………5 三、汉字输入键盘设计的规律性原理…………………………………9 四、规律性原理的数学描述 …………………………………………11 五、汉字输入键盘设计的协调性原理 ………………………………15 六、协调性原理的数学描述 …………………………………………16 七、“三原理”对输入键盘设计和优化的指导意义…………………28 形码键盘设计“三原理” 汉字输入,特别是形码输入,并不是简单地把字根部件分成“堆儿”,往键盘上一摆就完事的举手之劳。实践证明,单靠任何一个单一学科的知识,是无法设计出科学实用的汉字输入键盘的。汉字输入键盘的设计是涉及到电脑科学、文字学、心理学和人机工程学等多种学科的边缘学科,是一个系统工程,属于多目标规划的范畴。 关于字根归并和键位设计的理论和方法,构成了汉字输入键盘设计的理论支柱——形码键盘设计三原理。这三项原理,不仅仅指导了五笔字型漫长的研究过程,而且作者相信,对于同行们从事的汉字输入键盘的设计,也可作为参考。 一、汉字输入键盘设计的相容性原理 计算机汉字输入键盘上字根布局的相容性将决定编码的唯一性。相容性(C): 指各个键位上多个编码元素共处一键时,其相互之间的相关性。不相关时的相容性好,反之不好。相容性的量化指标,可以用重码的多少来表示。 将拼形组字的一字根一键的中键盘升级为字母小键盘的唯一方法,是将几个字根归并到同一个键上。归并时,有些字根“乐意”与别人合作,而有些字根,则“个性”极强,跟谁都合不来。所以,压缩键位,也即“归并”并不是一件容易的事。 同一个键上若干字根“不经换档”或其它任何附加操作,便可以让字根各起各的作用,任何时候都不扯皮地“一致对外”,使该汉字输入键盘产生的重码最少。也就是说,每个键上的字根要能很好地“相容”,同一键位上若干个字根“相容”的要求和实现方法,叫做相容性原理。 实现相容性的整个过程要用电脑加人工干预的办法,经千百万次实验,才能逐步逼近实现一个相对理想的组合。 例如:“五笔字型”键盘中,F键上的字根计有“土士二干十寸雨”等,但是,检验证明,纯粹因为它们共处一个F键,享用同一个代码,在6763个汉字中造成的重码却只有2对,这就是说,它们具有很好的“相容性”。 然而,仅仅用26个键,要容纳200个字根,当这些字根处在同一个键位上时,其间必得有很好的配合。使它们的这种组合在拼组字时,只要按键而不必区分字根,引起的重码却最少,此谓之字根的“相容性”。 例如,输入“摸”字: 由上图可知,为了在键盘上打出这个“摸”字,必得按RAJD这4个键各一次,而这4个键上共有字根38个。各按一次后,38个字根“排列”的可能性共计有7776个!就是说,如果任何一种排列都是一个汉字的话,按这4次键,共可以“造”出来7776个不同的“字”!人们要问,为什么其余的7775种“排列”都不能“组合”出真正的汉字,唯独这一种“排列”起了作用,且刚好就“组合”出来一个你要的“摸”字呢? 再如,输入“科学院计算所”: 科学院 计算所: 8 × 10 × 10 × 9 = 7200 由上图可知,为输入“科学院计算所”这条词汇,需要依次按TIBR这4个键各一次,4个键上涉及的字根共有37个,其排列的可能性有7200种!可是,只有“禾阝⺁”四个字根的这一种“排列”,对应了所要的词汇,其它的7199种“排列”,既没“排列”出一个汉字,也没“排列”出一条“词汇”,这又是为什么呢? 这都是因为,25个键上字根布局设计,是符合“相容性”的! 影响某一键盘相容性的因素不但很多,而且互相制约。例如,键位越多,越容易相容;如果允许有300个键位,一个字根一个键,几乎就不存在“相容”的问题。键位越少,相容越困难,而要实现相容,必得在同一个键上容纳安置许多个字根,必然会造成更多的重码而降低编码的唯一性。 实际上,相容性是键位多少(编码基数K)以及字根组合情况的函数;在编码基数K已知的情况下,相容性C只和字根的组合有关。我们不妨以重码数的倒数作为相容性C的数学期望;在K已知时,理论上C有一个最小值,也有一个最大值;而C的最大值所对应的“字根-键位”映射,本应该就是一个“最佳”的字根布局,也就是一个重码最少的字根分布。 然而,问题并不这么简单。因为,一味地追求重码少,特别是C值最大的那个布局,一定是一个字根分布毫无规律、不便记忆、不便学习的布局,更有可能是一个键位负荷很不合理、打起来费劲、效率低、手指头别扭的布局! 所以,一个科学的键位布局,不仅仅要追求重码少,C值大的相容性,还必须符合C值大的若干种(或千百种)最佳、较佳字根布局组合中,优先筛选出字根排列,不但有某种便于学习记忆的规律,而且又保证键位负荷大小与手指能力相匹配的那种布局,才有可能成为真正实用的字根键盘布局。 二、相容性原理数学描述 1、定义:相容性是指同一个键位上若干个字根的相关性,我们可以用“由于若干字根共处在同一个键位”才引发的重码数来定量地评价。 例如:字根“木”和“氵”的相容性就很差,因为若将“木”和“氵”放在同一键上,那么,不管别的字根在其余的键上如何组合摆放,总有“杠江、相泪、权汉、椎淮、林沐、柯河……”这些字成为重码字;相反的情况如:若把“王”与“五”摆在一个键上(即让“王”和“五”用同一个代码),就不会出现重码字。 静态重码率,是指重码的字数在字集总字数中所占的比例。在总字数为N时,一个汉字输入键盘的重码总字数的计算公式是: N:重码的总字数; :重码字的级别,如=3,为3重码,……=10,为10重码等; :级别为的重码的组数(如:3重码有5组时,=5 )。 其静态重码率: 2、计算重码率的函数定义: 对于一个已知的编码序列,可用以下程序生成编码体系的静态重码率: 假设含有n个汉字的序列HZ为:{HZ1,HZ2,...,HZn} 其相应的编码的序列BM为:{BM1,BM2,...,BMn} 另外有一个用于存放“不重的编码”的序列UM,目前为空。 从编码序列BM中,依次取出其中的一个编码BMi,如果该编码BMi在UM序列中尚未存在,就将BMi添加到UM中,直至取完所有的编码,即可得到一个新的、没有重码的序列UM: {UM1,UM2,...,UMk } 此时,UM序列的长度k,即为汉字序列HZ中不重码的汉字的个数,n – k就是该汉字序列中重码汉字的个数,该汉字编码序列的静态重码率则为: = (n – k) / n * 100% 3、计算静态重码率的运算流程如下: 取出第i个编码BMi 计数器i = 0 计数器i加1 将BMi添加到UM中 开始 是 否 BMi在UM中已存在? 返回 是 否 已到最后一个编码? 4、静态重码率在 二维坐标系中,把y轴作为相容性C,x轴代表字集的字数,每1000个字一个单位,可以画出“静态相容性”与字集字数的关系曲线如下: 从以上曲线可知,随着字数的增加,相容性直线下跌!当字数从10,000增加一倍时,相容性C的值从95%减少到84%。这就是说,当字集是10,000字时,重码的字数是1-95%=5%,即1,000╳5%=500字,而当字数增加到20,000字时,重码的字数是1-85%=15%,即有20,000╳15%=3000个字重码;这就是说字数从10,000到20,000,只增加一倍,而重码字数却增加到3,000/500=6倍! 由此看来,当汉字的字集扩大时,会对重码的字数产生严重影响!试想,2,0000字中有3,000个字重码,这个键盘设计的实用价值是不是有问题呢? 进一步的研究将会发现,尽管静态相容性随字集扩大而大幅度下降,可是对于一个设计合理的编码体系来说,其动态相容性常常少受影响! 在中文键盘设计中,因为要考虑各个键位的手指负荷,动态重码率往往比静态重码率更为重要。动态重码率是指每一组重码的字中,除频度最高的一个外(这个字被视为“优先享受”了与其它字重码的那个编码!),其余全部重码汉字的实用频度的总和:   式中,为每组重码字中,除第一个以外的汉字总数; 为第个汉字的实用频度。 显然,编码体系的相容性C与应成正比, <1;越大,重码字的实用频度越高,反之越低。 5、动态重码率及其在中文键盘设计中的指导价值 为了描述和绘图直观而方便,我们可以把动态重码率的“倒数”定义为相容性C的值,C的最大值为100,最小值为0。 当然,还可以将“不重码汉字的实用频度”的总和,直接作为动态相容性C的值,这时的C也叫“动态相容性”,其最大值为100,最小值为0。 为了方便,以下如不特别声明,我们说到相容性时,一律是指动态相容性C。 在二维坐标系中,我们可以定义轴为相容性C,X轴为汉字的字集大小,1,000代表按实用频度排列的前1,000个字,2,000代表前2,000个字,10,000代表前10,000个字;这样,我们可以画出相容性与字数的相关曲线。经验告诉我们,这是一条与电容器放电曲线类似的降指数曲线。 从这条曲线可知,5000字之后,相容性就趋于平衡,由此可得出一个非常重要的结论: 在形码设计中,在字集达到5000字之后,无论字数怎样增加,对相容性都很少影响;即使把字集扩大到2万字、3万字、7万字,编码体系的相容性都几乎不变! 而这一点,正是形码可以处理很大的字集,却不太影响整个中文键盘的实用性技术指标的理论证明。 这一理论证明,在中文键盘设计中的指导意义在于: (1)要优先按字根的实用频度,而不是按字根的组字频度优选字根; (2)只要动态相容性有较满意的值,可以不去计较实际上的重码字数; (3)当一组重码字被输入且显示时,应该将频度最高的字显示在第一位,且默认是所要输入的字。 (4)在字集达到10,000字之后,扩大字集对于相容性的影响,几乎可以忽略不计!因而可以用同一个键盘字根布局、同一规则,处理扩大的字集,比如3万、5万甚至10万字的字集。 以上各项,在五笔字型的设计过程中均加以采用。   在三维坐标系中,我们用轴代表 相容性C的值,其取值范围将依键盘设计的动态重码情况在0到100之间。 当C=0时,说明该键盘设计中汉字的编码全部相同,即所有的字显示在一个提示行中等待挑选!这一情况相当于在使用五笔字型软件时,一个编码也不知道,输入4个“未知码”ZZZZ的情况; 当C=100时,说明该汉字输入键盘全部的字没有一个重码的情况,相容性达到了最高值!一字一键的“整字大键盘”和一字一码的“电报码”,就是这种情况。 然而,C值的两个极值都是不可取的。对于其它各类汉字输入编码方案,包括各种形码、音码、音形码、形音码,其编码方案相容性C的值,应0~100之间。 通常情况下,相容性还必须兼顾规律性和协调性,才能成为一个实用的键盘设计。一旦考虑规律性和协调性,相容性就不可能是100了! 三、汉字输入键盘设计的规律性原理 计算机汉字输入键盘的规律性,将决定汉字输入键盘的易学性。规律性(R):指各个键位以及整个键盘上,编码元素排列分布的规律性。其具体量化指标,可以用某一布局和“理想布局”的差来表示,也可以用学员学习的易接受性加以测量。 在字根“相容”的前提下,同一个键位上的,以及各个键位之间、各排键上的字根,其最佳键盘设计是要符合一定的规律。显然,这是更加难以做到的设计。因为,在字根“相容”的情况下,杂乱无章的排列显然不如有规律可循的排列更便于学习使用。 当然,“规律性”是设计者事先提出的一种要求,比如使字根遵从一个什么样的规律,可以根据经验先定性地事先给出;然后,再在实现“相容性”的过程中,或者,在许多种字根相容(重码少)的若干种组合中,筛选最具规律性要求的设计。 一般来说,拼形组字键盘的“规律性”有三层含义。 1、就某一个键位来说,在其上边“共容”的字根,要有某种共同的特征。例如,使首笔相同,并力争使次笔也相同。如上述“五笔字型”的F键上,“土士十寸雨”等,都是“首二笔”笔画相同的字根,“二、干”则是首笔相同的字根。这样,就使同一个键位上的字根有规律可寻,便于学习,便于记忆。 当然,也可以以字根的读音为特征,将同一声母开头的字根安置在一个键上,关键是,这种组合是否会引发特别多的重码使相容性下降,或者仅是个别的键符合这一要求,实际上,大部分是例外,反而不利于学习记忆。 2、就整个键盘来说,键位之间最好也有规律性。例如:在“五笔字型”中,GFDSA这五个键上的字根,其首笔都是横(一),YUIOP这五个键上的字根,其首笔都是捺(丶)。如此,只须根据字根的首笔特征,便可大体确定字根在键盘上的位置。 3、字根的代码、键位的编号以及手指的序号,三者最好能够保持一致。如在“五笔字型”中,字根“儿”的编码为“35”,它处在第3区第5个键位上,它用左手(第3区)的第5个手指(小指)来按键;字根“文”的编码是“41”,它处在第4区第1个键上,用右手(4区)第1个手指(食指)按键。 以上三种规律性,使得记忆字根、寻找键位变得容易。 然而,懂行的人们都知道,要想在保证“相容性”的前提下,实现这样的“规律性”,那是无疑一个难上加难的目标。 实现“规律性”的方法,也是在人工干预的情况下,用电脑不断地修改数据,逐步逼近,经过大量的运算,以求达到最佳值。 与相容性一样,理论上规律性也是一个可以量化的指标,也有两个极值。最小值是毫无规律,可以认为规律性的值G=0;最大值是每一个字根的安排都符合规律,使学习者按同一指示便可信手找到而没有例外,这时可以认为G=100。当然,实际上,对于汉字来说,任何字形中文键盘的键位字根排列,都不可能完全符合规律,所以,0<G<100。 四、规律性原理的数学描述 在各个键位以及整个键盘上,编码元素排列分布的规律性,直接关乎到汉字键盘的易学性,所以规律性是某个键盘设计是否具备实用性的重要指标。这个指标可以用某一键盘上字根的布局(以下简称“布局”或“局”)与“理想布局”的差别来量化,也可以在技术培训实践过程中,用学员们的学习曲线加以测量。 规律性的文字表述可以是:告诉学习者一条或几条简单的规则,学习者便 可以在键盘上迅速找到任何字根所在的键位,并完成打键运作,学习的时间越最短,规律性越强,指标超高; 例如,在人们已经或普遍熟悉英文字母的键位排列,又熟悉汉语拼音的情况下,某一个中文键盘的码元摆放,使其码元读音(拼音)与英文字母有相对应的关系,如“王”放在W键上,“口”放在K键上,“水”和“石”放在S键上等,如果能按这一要求摆放全部或大多数字根时,便被认为码元的排列具有规律性。 规律性不但可以定性地描述,也可以设法定量地加以描述。 现以五笔字型86版的字根布局来量化规律性指标R。 五笔字型的字根键盘的200个字根,是按照5种基本笔画划分为5个区的,每个区的区号与单笔画的代号一致,每区又有5个位,共计25个键位。在每个按键上,字根与易学规则的“规则符合程度”,用G来表示,可表述如下: 1、G1:字根的第一个笔画的代号与区号一致,第二个代号与位号一致,如“王大石文门山纟又女”等都符合此项,此项规则称为 G1; 2、G2:字根的第一笔画的代号与字根所在的区号一致,如王土大木工,首笔为横,横的代号为1,为此它们都被放在第1区,此项规则称为G2; 3、G3:五种单笔画的笔画个数与对应区的位号一致,如一丨丿丶乙都在对应区的第1位,而“三彡巛”都在第三位等。此项规则称为G3; 4、G4:字源相同的字根或形似的字根放在同一个键上,如“扌”与“手”放在一个键上,,此项规则称为G4。 字根“规则符合度”G的量化方法是: 1、先计算出每一个字根的实用频度表:{PH1、PH2、PH3……PHn} 2、人工逐一设定字根的“规则符合度”G值; 3、凡是键位安排符合G1的字根,设定系数为4,其规则符合度G=4HPi; 4、凡是键位安排符合G2的字根,设定系数为2,其规则符合度G=2HPi; 5、凡是键位安排符合G3的字根,设定系数为3,其规则符合度G=3HPi; 6、凡是符合G4的字根,即有同源关系或相似可以联想的,其“规则符合度”较弱,设定系数为同源相似字根的系数n减1,即:R=(n-1) HPi;如“手”的系数为2,则“扌”的系数为n=2-1=1; 7、凡是不符合以上各项的字根,其规律性系数为0,规则符合度G=0; 8、理想规律符合度Gmax理想值也就是最大值,相当于每一字根规则符合度都是4,在五笔字型的设计中,Rmax相当于:任何一个字根都可以根据其前2个笔画找到的键位,也就是说,前2个笔画的代码便是其区位码,像“王、土、大、白、也”等,前2个笔画代号“11、12、13、32、52、”,便是它在键盘上的区位码,对应着G、F、D、R、B等键位(实际上,这是做不到的,如要照此排列,相容性就不堪设想了!)。 9、规律性指数R:指某一个区的“全部字根的规则符合度之和”与Gmax的比例。至此,一个字根键盘布局的规律性指数为: 其中,n为字根总数,q为字根的规律性系数。 对于86版五笔字型来说,为方便计算,其字根键位设计的“规则符合度”可以分别对5个区进行计算: 五笔字型86版各区“规则符合度”及规律性R    区 各区字根的规则符合度 各区的Gmax 各区规律性R值(%) 1区 100.68 69.70 2区 78.058 57.34 3区 77.380 76.22 4区 89.136 45.88 5区 54.743 75.27 由上表可以看出,各个区的规律性R值是不平均的,这是由于还必须兼顾相容性的缘故。 由此还可以计算出,86版五笔字型键位布局的各个区规律性平均值: 这样的规律性指数R值,在中文键盘设计中是一个很难达到的、相当高的值!以下的几个实验将会证明这一点。 区 各区的规律性 各区的Gmax 平均规律性R值(%) 1区 100.68 55.48 2区 78.057 57.21 3区 77.379 64.38 4区 89.136 53.10 5区 54.742 57.99 实验1:将5个区内的字根都在本区内随机分布,其各区的规律性指数R值统计如下表所示(实验1)   由以上实验1得到的各区的规律性平均值为:   实验2:将全部字根带数值和新的规律性系数在25个键位的5个区内随机分布,其各个区的规律性指数R的值如下表示: 全部字根随机分布时各区的规律性指数(实验2) 区 各区字根的规则符合度G 各区的Gmax 各区规律性R值(%) 1区 80.040 10.31 2区 67.300 5.80 3区 73.918 5.46 4区 56.391 10.30 5区 47.422 16.27   显然,实验2是一个更大的倒退,一个更糟糕的“设计”,请看: 实际上,因为实验1是“第一个笔画符合了区号”,所以规律性还是很明显的,R均可达57.63%;实验2因为200个字根在25个键上随机摆放,规律性只能是“碰运气”了,下降到9.6%,实际上是一个没有任何实用价值的键盘(且不说按照这个键盘字根的“布局”,重码会多得惊人,相容性指标会很低!) 为了验证全部字根在键盘上随机分布时形成的“布局”的规律性的均值  R均一定会很低,甚至有一个平均底线,我们按照实验2的方法,再做多次实验,现随机将其中的三个结果列出: 实验3: 实验4: 实验5: 可以想见,即使把实验再做下去,结果也只是大同小异: 9.00%<R均<13 .00% 这个R均的值在中文键盘设计中,是非常重要的!实际上,一个键盘的设计过程,都可以从“任一个随机布局”开始,是一个逐步优化、不断改善规律性和相容性的过程。比如86版五笔字型,等于是把R均从随机值10%左右,一直拉升到64.88%,净增50%左右,这显然是一个巨大的进步! 规律性指数的提高,意味着中文键盘的易学性大大提高! 当然,我们没有忘记,单纯追求提高规律性,也还是不可取的,还必须兼顾到相容性和协调性! 相容性、规律性和协调性,三足鼎立,缺少或弱化任何一个,都不会成为一个优秀、实用的汉字输入键盘。 而设计一个好的汉字输入键盘的难点,也正于同时使这三者优化。 需要说明的是:规律性的指数R的数值,只有相对意义!它只是某一个键盘字根的“布局”R均与“理想布局”的比较! 五、汉字输入键盘设计的协调性原理 计算机汉字输入键盘设计的协调性,将决定操作键盘的高效性。“协调性”,是在“相容性”、“规律性”之基础上,必须达到的一个更高、更新的境界。它是指仅仅符合“相容性”、“规律性”的字根键盘,未必打起来顺手,未必符合人机工程学原理。作者多年来反复研究测试了人手击键的“协调系数”,包括一次协调系数和二次协调系数,在字根键位设计时,使字根键位的排列尽量获得一个最佳的组合——处理汉字时,平均“协调系数”最大(即打起来顺手)。 这里,我们以标准键盘中排键为例,用国内748工程提供的《汉字综合频度表》提供的频度数据,将汉语拼音及“五笔字型”的输入码加权,做出了两条击键概率曲线。从曲线上不难看出,“五笔字型”的曲线中间高、两端低,比较符合手指的生理功能特点。而汉语拼音的曲线,则根本与人手指的生理功能特点毫不相关。 “协调性”是汉字输入键盘实现高效率的关键。   毫无疑问,一个高水平的“形码”汉字输入键盘,必须同时具备以上相容、规律、协调这三个特性。否则,便绝乎不能成为一个真正经得起实践检验的科学设计。  六、协调性原理的数学描述 文字工具的变革,其经济是意义和社会意义都是极为重大的!在美国人哈特写的一本《影响人类历史的100人》这本书中,发明造纸术的东汉中国人蔡伦和发明印刷机德国人古登堡,分别名列在第7和第8的高位之上!文字工具和工作方式的落后,是一个民族永远也偿还不清的债务。 我们的目的,是要为中国人设计一个自己的输入汉字的键盘!而不是让中国人练习输入英文!这个键盘一定要让中国人打汉字顺手、高效,而不是将汉字依附在英文之上,跟着外国人不合理的设计输入汉字!哪怕是最终我们也使用了同样的一个设备、同样的一个键盘,那也只能是凑巧!中国人也必须将输入汉字之便,作为最高追求,重新加以设计使用!这正如外国人发明的钢琴,在西方国家弹西方音乐,在中国,最动听的当然还是民族乐曲!所以,当我们为汉字设计输入法时,即使“洋为中用”,也必须考虑中文特色而大胆创新! 1、关于输入速度的回顾 向电脑输入汉字,即打字的过程,是一种“人—机”联系方式。关于手指和键盘之间的配合问题,在汉字输入键盘设计,特别是键盘的字根布局中,是一个直接关乎提高汉字输入效率,即能否打得快的重要问题。 对于汉字输入键盘来说,不同的键数,会有不同的“指法”要求: ① 整字大键盘 这是1980年左右国内流行的一种输入法。数千个“字键”摆在面前,差不多任何人都只能是“一指禅”按键,至多两只手各用一个指尖按键。这种被外国人嘲笑为“逮跳蚤”的打字操作,是谈不上“指法”和效率的。 ② “主—辅”键盘 这是比“大键盘”进步的输入设备,当时甚至有人认为,这种方式是汉字输入的最理想方式。输入时,右手按主键(主键有200多个),每个键上9—16个整字,然后左手按9—16个辅键,交替按主键和辅键,等于“选字”。这种输入法,也只能有一种“指法”——左右各一指交替按键,也是无法用键位设计来提高的。 ③ 北京大学256键中键盘方案 下图是1978年北京大学汉字信息研究组,在王选教授领导下,研制出来的一个256键“中键盘”组字方案。大约用了1,000个组字单位,两到三键即可“拼合”出一个字。这在当时是国内最高水平的汉字输入设备了(其制造成本尚不清楚)。 ④ 英文字母小键盘 小键盘的击键效率,即“每分钟的击键次数”,与人的年龄、技能、训练程度 都有关系。但在同一技能水平情况下,效率主要是与键盘键数的多少有关系。据日本“实务用字研究会”(S.T.B)在1962年做的试验统计,当时日本打字员平均每分钟的按键速度如下: (1)26键英文字母打字机     每分钟  450击 (2)50键日文假名打字机     每分钟  250击 (3)2000键汉字假名混合打字机  每分钟  50击 到了1970-1980年间,研究汉字输入的问题成了大热门,人们开始注意英文标准键盘的设计及其效能: 26个字母分为上、中、下三排键,中排为“导键”,左右手各用4个手指分工负责,平时各个手指放在“导键”的位置上,直接敲击键或移行敲键,大拇指放在空格键(spacebar)上。打字动作类似弹钢琴——只看谱不看键。 使用这种“触打法”打英文字母,每秒钟可打8—10击,最多可打14击。只要经过正规的指法训练,打字效率可以很高。其所以如此,道理很简单,是因为这种方式创造了一种“左右手”10指并用、交互打键的方法。 100多年来,看到外国人轻松快捷地打字,的确曾经使中国人望洋兴叹——何时中国的汉字也可以像英文那样,只用一个小小的键盘,10指并用,每分钟也能打上几百下键,打出100多个字呢? 这个梦想,随着五笔字型的发明和应用实现了!1986年秋在作者举办的“首届全国汉字输入大赛”中,外交部的杨君,在严格的评判规则之下(错、漏、多1个罚2个),以每分钟输入生稿169个汉字的世界纪录夺得了冠军(注:此后不久,我国外交部派杨君到联合国总部,为联合国中文处的100位打字员培训五笔字型,后又留在联合国中国代表团长期工作)! 每分钟输入169个汉字,意味着什么呢?如按每个汉字平均2.5击的话(这是五笔字型字词的平均编码长度)杨君的击键速度是: 2.5×169=422(击/分) 显然,每分钟422击,对于国际平均水平每分钟600击甚至每分钟840击(每秒钟14击)来说,还不算最高。 结果,后来的实践证实了这一点,在作者1998年举办的第三届《全国汉字输入大赛》中,解放军女战士李勤在“每错、多、漏1个都罚5个”的严厉规则之下,居然用生稿每分钟输入正确汉字293个字!她是中国冠军,当然也是世界冠军!她创造了至今没人能打破的世界纪录! 每分钟293字,按当时参赛文本的字词平均码长2.4击/字,可以计算出她的每分钟击键次数为: 293×2.4=702击/分 在五笔字型的键盘上,她的击键频率已相当接近极限每分钟840击了,这足以说明她打字很“顺手”(注意:她是在打汉字啊)! 使用五笔字型,何以能创造这样的纪录呢?即便不是比赛,现在全国各地每分钟能输入超过百字的“高手”,少说也有五六十万人!五笔字型其所以能打这么快,其所以能使我国文字处理的效率超过英文,就汉字输入键盘设计而论,主要是因为五笔字型: (1)、重码率很低:输入日常文章,平均每输入1,000个字,才有必要手工选字2—4次; (2)、字词兼容:作者首创了“不用换档”的“字词兼容”编码输入法,在2万条词汇时,平均码长短:L=2.4—2.5; (3)、键盘设计合理:打字按鍵的过程,符合人机工程学原理,即协调性好,打字顺手、快捷、轻松,左右手指负担分配合理,左右交替打键,不易疲劳。 2、英文键盘键位的“不合理性”研究 其实,在标准键盘上,英文字母的排列从一开始(1829年)就是“想当然”排列的!后来的实践证明,这种设计是不合理的。例如,当时为字母安排键位的美国人肖尔斯认为,在英文单词中,E与R,Q与W常连在一起出现,所以在键盘上,就把它们两两紧挨着排列,以至于英文键盘的上排左端的6个键是“QWERTY”,按照其读音,叫“夸蒂”键盘。 以现在的目光看,肖尔斯排列的键盘,问题很多!它的字母排列缺点很明显。例如,英文中10个最常用的字母中,就有ETOAIRS等8个字母,远离了规定的手指起始(导键)位置!很不利于提高打字速度。 此外,键位与手指的对应,没有考虑各个手指的“本事”有大有小,以至于用最无能的左手小指来打A 键!而A键的使用频率却高达7.5%!键盘上需要用左手按键的字母摆放过多,因为一般人都是“右撇子”,英语里也只有3000来个单词能用左手打,所以打字过程十分别扭。 有人曾作过统计,使用QWERTY键盘,一个熟练的打字员8小时内手指移动的距离长达25.7公里,一天下来疲惫不堪。遗憾的是,数以亿计的键盘工作者的习惯已成自然,今天,QWERTY键盘仍牢牢地占据着计算机的输入舞台。 英文键盘上字母的安排,完全不符合人机工程学原理,请看26个字母在英文单词中,按照在日常文本中出现的实用频度统计出的概率: 英文词中各字母的使用概率(%) Q W E R T Y U I O P 0.09 2.60 12.87 5.57 9.75 2.01 2.72 6.27 8.07 1.58 A S D F G H J K L 7.50 6.01 4.36 2.56 1.79 7.40 0.10 0.71 3.73 Z X C V B N M 0.02 0.13 2.16 0.92 1.54 6.96 2.54 1930—1960年间,有许多设计者提出,将英文字母的出现概率与手指“能力”相匹配,并考虑到击键的“二次概率”(保证前后两次打键较多地两只手交替完成),设计出“高效英文键盘”,据说效率可以一下子比现行键盘提高25—30%以上。 然而,英文键盘近200年来,其字母安排早已成为世界通用的“布局”,几乎成了一种“文化”。全世界数以十亿计的各种与文字有关的输入设备,都是QWERTY,约定俗成,木已成舟!谁改得了?谁有这个号召力和财力,来改动全世界风行的现行的英文键盘? 例如,谁敢为了便于操作,把键盘上的A换到现在J的位置?如果换了,全世界立刻有10亿用惯了英文键盘的人 “找不到北”! 所以,慢则慢矣!差则差矣!英文键盘的字母安排不合理,就算按损失25%的工作效率来计算的话,那就等于西方国家不知不觉之间,每日每时地,要付出一种沉重的“代价”! 任何经济学家,都能计算得出来,这个损失一定是个惊人的天文数字! 3、为中国人设计汉字键盘——在“一张白纸”上画最美的画图 前车之覆,后车之鉴!中国人不应当跟着外国人走弯路!中国人在现代化的过程中,一定要避免因为键盘设计不合理而导致永久性的效率低下,一定要避免造成天文数字的经济损失! 英文键盘设计的不合理性,在我国汉字遇到生死劫难,幸而曙光初露之后,当中国人设计自己的输入法和输入键盘的时候,至少有以下四点是越来越清楚了: (1)“废除汉字”是不能容忍的最下策; (2)专门为汉字制造昂贵、笨重、效率低下的“大键盘”、“中键盘”、“主—辅键盘”是下策; (3)不用另外设计或制造键盘,直接采用标准键盘上可能使用的键位,如“字母键+数字键+符号键”输入汉字,是中策; (4)洋为中用,把英文字母键盘设计成中国人自己的汉字输入键盘,是最上策! 当然,“最上策”的实现,是以可能性与可行性为前提的。 理论研究和科学试验已经证明,仅仅使用26个键位,按照科学的编码设计,设计出键位少、码长短、规则简单、符合人机工程学原理,因
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服