文档详情

国标码区位码等的区别.docx

发布:2017-06-07约7.86千字共9页下载文档
文本预览下载声明
即GB国标码:中文内码之一,代表中文简化字,在中国大陆广泛使用,影响所及,使用量渐见普及。 “国家标准信息交换用汉字编码”(GB2312-80标准),简称国标码。国标码是指1980年中国制定的用于不同的具有汉字处理功能的计算机系统间交换汉字信息时使用的编码。国际码是二字节码, 用两个七位二进制数编码表示一个汉字。目前国标码收入6763个汉字, 其中一级汉字(最常用)3755个, 二级汉字3008个, 另外还包括682个西文字符、图符。例如“巧”字的代码是39H 41H, 在机内形式如下: 0 1 1 1 0 0 1 1 第一字节  0 0 0 0 0 1     第二字节  在计算机内部,汉字编码和西文编码是共存的,如何区分它们是个很重要的问题,因为对不同的信息有不同的处理方式。  方法之一是对于二字节的国标码,将二个字节的最高位都置成“1”, 而ASCII码所用字节最高位保持“0”,然后由软件(或硬件)根据字节最高位来作出判断。  字符代码化是指用户从键盘上输入代表某个汉字的编码。我们把采用不同的编码系统以代表汉字进行输入的方案(如数字码、拼音码和字形码),称为汉字的输入法,区位码、五笔字型码、拼音码、智能ABC、微软拼音输入法等都是其中的具体代表。  汉字通过编码输入计算机后,在其后的处理过程中,不同阶段使用不同的代码,首先通过键盘管理程序将接收到的输入编码转换为0和1构成的机内码,实现计算机的存储、加工和传输处理。  同样,存储在计算机内部的机内码也必须经转换后才能恢复汉字的“本来面目”。这种转换通常是由计算机的输入/输出设备来实现的, 有时还需要软件来参与这种转换过程。这个阶段的汉字代码称为字形码,用以显示和打印输出。区位码:1980年,为了使每一个汉字有一个全国统一的代码,我国颁布了第一个汉字编码的国家标准: GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。  国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码。汉字库分布情况如下:一级汉字 16-55区二级汉字 56-87区三级汉字 1-9区空闲未用 10-15区  通常,在DOS下的各汉字系统中,同时按Alt键和F1键即可调用区位码输入方法。而在Windows中常用Ctrl+空格键和Ctrl+Shift键调出区位码。如“2901”代表“健”字,“4582”代表“万”字,“8150”代表“楮”字,这些都是汉字,用区位码还可以很轻松地输入特殊符号,比如,“0189”代表“※”(符号),“0528”代表“ゼ”(日本语),“0711”代表“Й”(俄文),“0949”代表“┭”(制表符)。  在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列),在区位码汉字输入方法中,汉字编码无重码,在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住全部区位码是相当困难的,常使用于录入特殊符号,如制表符、希腊字母等,这里简单介绍几个区。  部分国际区位编码  区号:01 【各类符号】    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19  0100  、。 · ˉ ˇ ¨ 〃々 - ~ ‖ … 〔〕  0120 〈〉《》「」『』〖〗【】 ± × ÷ ∶∧∨ ∑ ∏   0140 ∪ ∩ ∈∷ √ ⊥∥∠⌒⊙ ∫ ∮ ≡ ≌ ≈ ∽∝ ≠ ≮≯  0160 ≤ ≥ ∞ ∵∴ ♂ ♀ ° ′ ″ ℃$ ¤ ¢£ ‰ § № ☆★  0180 ○ ● ◎◇◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓  区号:02 【各类数字】    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19  0200 ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ           ⒈⒉⒊  0220 ⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛⑴⑵⑶  0240 ⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇①②③  0260 ④⑤⑥⑦⑧⑨⑩一二三四五六七八九十  0280 ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ  区号:03 【符号、字母】    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19   0300 !"#¥%&'()*+,-./0123  0320 456789:;<=>?@ABCDEFG  0340 HIJKLMNOPQRSTUVWXYZ[  0360 \]^
显示全部
相似文档