第3章常用汉字输入法剖析.doc
文本预览下载声明
第3章 常用漢字輸入法
我国从20世纪60年代开始研究汉字输入法,目前已取得了重大的成果。汉字输入的方法有多种,好的输入方法能适用于各种不同的操作环境,但不管哪种输入方法,在输入汉字时都有自己的优点和不足。目前常用的汉字输入法主要是五笔字型输入法、全拼输入法和智能拼音输入法等。
本章主要内容:
( 汉字的表示与汉字编码
( 常用的中文输入法
( 简码的输入
( 词汇的输入
( 重码和容错码
( 帮助键“Z”的使用
3.1 汉字的表示与汉字编码
汉字的输入对于使用汉字的人来说,是一项必不可少的工作。我国的计算机研究人员已成功地开发了多种汉字输入法,将汉字以一定的规则进行编码,在输入汉字时,只要输入该汉字的编码字符,就能输入对应的汉字。
3.1.1 汉字字形的表示
计算机在处理汉字时,先根据汉字的机内码,取出对应的汉字字形码,得到该汉字的点阵字形,再由点阵字形来输出该汉字。
点阵字形就是以点阵方式来表示的汉字字形,是一种以网格来描画字形的方法。由于汉字是方形的,所以点阵都是正方形的。
目前计算机使用的汉字字形大多采用16×16点阵,也就是将一个正方形分为横向的16格与纵向16格,从而在相应的网格上描画汉字。16×16点阵的每列用两个字节存储,每个汉字字型占用32个字节。
点阵的大小影响着汉字字形的质量,点阵越大,即点阵越密,汉字的笔画表示得就越清晰,因而汉字的质量就越高,但它所占用的存储空间也就越大。所以,汉字信息处理系统在确定汉字点阵的同时,也要考虑存储容量及设备的成本等因素。
3.1.2 汉字代码
汉字代码包括汉字输入码、汉字交换码、汉字机内码、汉字地址码、汉字字形码和汉字控制功能码六种。
1. 汉字输入码
汉字输入码主要有流水码、音码、形码和音形码等。
· 流水码:将被编码的汉字按一定的顺序排列,依次编排一个号码,这个号码便是这个汉字的编码,这样形成的汉字编码就称为流水码。它整洁、简单,但编码与汉字的属性(即字音、字形、字义)没有直接的关系,因此这种编码较难记忆和掌握,国标码和区位码就属于流水码。
· 音码:其编码规则与音素有关,它是根据汉字的读音属性来对汉字进行编码,因此只需具有汉语拼音的基础即可掌握。但音码只能对那些能读出音的汉字进行编码,否则无法编码。如:智能ABC、双拼、全拼等。
· 形码:这种编码较易掌握,它是根据汉字的字形来确定的。此种编码缺乏像汉语拼音输入法那样一个法定的科学规范作为基础,而且笔画或字根在通用键盘上的表示和布局也较为困难,因此这些问题还有待解决。如五笔字型和郑码等属于形码。
· 音形码:它是根据汉字的字音和字形属性来确定汉字的编码的,其编码规则不但与字音有关,还与字形有关,常见的音形码有首尾码。
无论哪种编码方案都提供了重码字、辅助选择、词组输入、联想输入等方法,以提高输入速度,达到易学好用的目的。
2. 汉字交换码
使用汉字交换码可以达到系统设备之间或记录媒体之间信息交换的目的。它是汉字信息处理系统之间,或者汉字信息处理系统与通信系统之间信息交换时的统一编码。
目前,我国计算机所使用的交换码的标准主要有两个:
· GB1988《信息交换用的七位编码字符集》。它与ASCII代码集基本相同,只是把2列4行中的货币符号$变成人民币标识符¥。
· GB2312《信息交换常用汉字编码字符集——基本集》。它规定了进行一般汉字信息交换用的6763个汉字和682个非汉字(包括图形字符)的编码。在GB2312代码表中,任何一个图形字符的位置可有两种表示方法:一种是国际交换码;一种是国标区位码,它们之间存在着一一对应的关系。
3. 汉字机内码
汉字机内码是汉字在汉字信息处理系统内部最基本的表示形式,它是计算机内部对汉字进行存储、运算、传输时所使用的代码,它通常是对汉字交换码作出某种标识之后得到的内部码,所以它与交换码之间有明显的对应关系。
4. 汉字地址码
在输出汉字前,由汉字地址码先找到该汉字在汉字库中的存储地址,才能取得字形码。所以它是用来指出汉字字形信息在汉字库存中存放位置的编码。
5. 汉字字形码
汉字字形码是一种表示汉字字形信息的编码。汉字的字形码一般用汉字字形点阵的数字表示或数学公式表示。
6. 汉字控制功能码
汉字控制功能码只对汉字的处理过程产生影响,而不表示汉字本身。它可以对汉字数据格式处理、传送控制和解释执行起控制作用。
3.2 常用的中文输入法
随着计算机的发展,汉字输入法也越来越多,掌握汉字输入法已成为我们日常使用计算机的基本要求。根据汉字编码的不同,汉字输入法可分为三种:字音编码法、字形编码法和音形结合编码法。目前,使用最多的字音编码有全拼输入法、双拼输入法和智能ABC输入法等。
3.2.1 全拼输入法
在众多输入法中,全拼输入法是最简单的汉字输入法,它是使用汉字的拼音字母作为
显示全部