文档详情

笔字型汉字编码基础.doc

发布:2017-03-29约4.9千字共5页下载文档
文本预览下载声明
五笔字型汉字编码基础 在我国,要普及和推广计算机的应用,就必须解决汉字信息的处理问题。近年来,随着汉字电脑输入技术的进步,许多汉字输入方法已日趋完善,其中,五笔字型汉字输入法是比较常用的汉字输入方法,应熟练掌握,运用自如。 1、汉字的三个层次 五笔字型编码方案设计者认为,汉字是一种意形结合的象形文字,形体复杂,笔画繁多,它最基本的成分是笔画,由基本笔画构成汉字的偏旁部首,再由基本笔画及偏旁部首就可组成全部有形有意的汉字。 但是,一个完整的汉字,既不是一系列不同笔画的线性排列,也不是一组组各种笔画的任意堆积。由若干笔画复合连接交叉所形成的相对不变的结构,绝大多数都是由古汉字中的基本图形演变而来的,现在可以叫做“字根”。一般来说,字根是有形有意,再多数情形下还有称谓的构字基本单位,这些基本单位通过拼形组合,新产生出众多的汉字。 每个汉字都是由横、竖、撇、捺、折五种笔画组合而成的,但是我们在书写汉字的时候,例如“李”字,并不是说“李”这个汉字是由“一横一竖,一撇一捺,一折一竖钩加一横”组成,而是说“李”字是由“木”与“子”构成,这里所说的“木”和“子”就是字根,它是构成汉字最重要的、最基本的单位,将字根按一定的位置组合起来就组成了汉字。虽然字根原是由笔画结合而成的,但构成汉字的基本单位是字根而不是笔画。 可见,汉字可以分为三个层次:笔画、字根、单字。 汉字的拼形编码既不考虑读音,也不把汉字肢解为单一笔画,而是遵循人们的习惯书写顺序,以字根为基本单位来组字编码、拼形输入汉字。 2、汉字的五种笔画 在书写汉字时,不间断地一次连续写成的一个线条叫做笔画。 五笔字型中的笔画只考虑运笔方向,而不计其轻重长短,这样将汉字的诸多笔画归结为基本的五种笔画,即横、竖、撇、捺、折;我们也就将这五个基本的笔画按照顺序、汉字使用频率的高低进行排列,分为五个单元区,并用1,2,3,4,5五个代号代表五种基本笔画,见表。 汉字的五种基本笔画 代号 笔画名称 笔画走向 笔画及变形 1 横 左→右 一 2 竖 上→下 丨 亅 3 撇 右上→左下 丿 4 捺 左上→右下 丶 乀 5 折 带转折 乙  上述五种笔画的变形体不拘一格。有时竖笔画可能拉得很长,撇笔画并不明显倾斜,折笔画则几乎包括了一切有折笔走向的笔画。在判断笔画属于哪种类型时,要特别注意按运笔方向去判断。 3、汉字的三种字型 根据构成汉字的各字根之间的位置关系,可以把成千上万的方块汉字分为三种类型:左右型、上下型和杂合型。我们同样也按照它们拥有汉字字数的多少从1到3命以代号,见下表。 汉字的三种字型 字型代号 字型 字例 1 左右 汉 湘 结 封 2 上下 字 莫 花 华 3 杂合 困 凶 这 司 乘 本 天 表中最后一种又叫独体字,前两种又统称合体字。 两部分合并在一起的汉字叫做双合字,三部分合并在一起的又叫三合字。合体字的分型一般只分到三合字这一级。 三种字型的划分是基于对汉字整体轮廓的认识,指的是整个汉字中有着明显界线,彼此可间隔开一定的距离的几部分之间的相互位置关系。 4、汉字的基本字根 字根不像汉字那样,有公认的标准和数量,不同的目的,会有不同的标准。在五笔字型中我们把那些组字能力很强(组字频率高),而且在日常汉语文字中出现次数很多(实用频率很高)的字根,称为基本字根。而把所有非基本字根一律按“单体结构拆分原则”,拆分成彼此交连叠套的几个基本字根。这样,我们就可以说,一切汉字都是由“基本字根”组成的了。 我们优选出130种基本字根,按照其起笔代号,并考虑键位设计的需要,分为五个大区,每区又分为五个区,命名以区号位号,以11~55共25个代码表示之。 以后,凡提到字根,一律指这130种基本字根,它按照五笔字型其组字频率和实用频率,在形、音、意方面进行归类,同时兼顾计算机标准键盘上26个英文字母的排列规则,将其合理地分布在键位A~Y共计26个英文字母键上,这就构成了五笔字型的字根键盘。、 (1)五个区的分类 书写字根时,我们将其开始的笔画与五个区的笔画相对应的归入一类。每一区占键位是5个,也就是一共有25个字根键位。其中,M键是竖起笔类的字根,即第二区字根键位,I键上的“水、小”起笔本为竖,但为了离散重码,故放在第四区内。 (2)字根键位的安排 我们将同一开始笔画的字根中其直观形态相似的字根安排在同一个键位上,有个别字根尽管直观形态相去甚远,但为了离散重码,仍安排在同一键位上。 (3)键位的命名 键名是这个键位的键面上所有字根中最具代表性的字根,
显示全部
相似文档