计算机首先是西方人发明和使用的,他们理所当然地解决了拼音文字在计算机上的处理问题。汉字是世界上惟一正在使用的表意文字,如何在计算机上处理好汉字是对这一古老文化的挑战。计算机汉字处理技术,对推广我国计算机应用及加强国际交流有着十分重要的现实意义。

在计算机上处理汉字要比处理西文字符复杂得多,处理汉字首先要确定汉字集合的大小,要解决汉字的输入、传输、存储、输出等一系列问题。在处理过程中每一个环节需要各自不同的编码,因此产生了汉字编码系统和汉字处理技术。

一、汉字字符集

汉字字符集确定了计算机处理汉字的数量,目前,常用的汉字字符集有如下几种。

1、GB 2312-1980汉字编码

GB是中华人民共和国国家标准汉字信息交换用编码,全称《信息交换用汉字编码字符集--基本集》,标准号为GB 2312-80。字符集收录了6763个汉字和682个非汉字图形字符。

2、GBK编码(Chinese Internal Code Specification)

是又一个汉字编码标准(GB即“国标”,K是“扩展”的汉语拼音第一个字母),全称《汉字内码扩展规范》。它共收录了21003个汉字和883个符号,并提供1894个造字码位,简、繁体字融于一库。

3、UCS编码(Universal Multiple-Octet Coded Character Set)

是国际标准化组织ISO公布的一个编码标准,即Universal Multiple-Octet Coded Character Set(简称UCS ),可译为“通用多8位编码字符集”。在该字符集中,总共收录了20902个汉字。

4、BIG-5码

BIG-5码是通行于中国台湾、香港地区的一个繁体字编码方案,俗称“大五码”。它广泛地应用于计算机业和因特网(Internet)中。它是一个双字节编码方案,收录了13461个符号和汉字。其中包括408个符号,13053个汉字。汉字分常用字5401个和次常用字7652个,各部分中的汉字按笔画或部首排列。

二、汉字编码系统

在计算机上处理汉字要经过输入、存储、输出等过程,汉字在处理过程节中要用到不同的编码形式。汉字编码中涉及的编码如下。

1、区位码

人们将GB 2132编码方案所确定的7445个字符放置在一个94行×94列的表格中。表格的每一行称为一个汉字的“区”,用区号表示。每一列称为一个汉字的“位”,用位号表示。

人们把这种表格叫“区位码表”。显然,在区位码表中区号范围是1~94,位号范围也是1~94。这样,一个汉字在区位码表中的位置可用它所在的区号与位号来确定。一个汉字的区号与位号的组合就是该汉字的“区位码”。

2、机内码

汉字在计算机内部进行存储和处理时,要表示为机内码,即一个汉字输入计算机后首先要转换为机内码,然后才能在机器内流动、处理。汉字机内码也是一种二进制编码。

3、输入码

为将汉字输入到计算机内部,一般的方法是将键盘上的字符或数字组合起来,采用“多键一字”输入方法。这种多键组合编码就是汉字键盘输入编码,简称输入码。

4、字形码

汉字字形大多是以数字化方式产生的。字形码就是指确定一个汉字字形点阵的代码,也叫字模或汉字输出码。

5、汉字地址码

在汉字系统中,字形码存放在外存储器里,每一个字模都有自己的存放地址,以便计算机提取字模之用。确定字形码地址的二进制编码就是汉字地址码。

6、内码和外码

计算机在处理汉字的过程中涉及多种编码形式,实际上汉字的编码形式可分为两大类,即汉字的内码和外码。

汉字的内码为计算机系统内处理和存储的汉字形式,它类似于西文的ASCII码,是以进制编码的形式存储。上面所说的机内码、字形码、汉字地址码都属于内码。

汉字的外码是指人向计算机输入汉字,或计算机与其他设备进行汉字信息交换时用的编码形式。常用的外码有汉字输入码、传输码、显示码和打印码等。

计算机系统汉字编码分为,计算机中的汉字编码相关推荐

  1. 是用来将汉字输入到计算机中的一组,计算机中常见的汉字编码有哪些?

    2017-08-06 计算机中的编码是什么样的? (1)二进制.十进制和十六进制等常用数制及其相互转换: 由于计算机的存储器和寄存器是两态部件,所以各种信息在计算机中是以二进制的方式存储和计算的.数制 ...

  2. 计算机系统组成及工作原理PPT,第二章 计算机基础知识 2.1 计算机系统的组成与工作原理 2.2 数制转换及运算 2.3 数据在计算机中的表示....

    Presentation on theme: "第二章 计算机基础知识 2.1 计算机系统的组成与工作原理 2.2 数制转换及运算 2.3 数据在计算机中的表示."- Presen ...

  3. JSP/Servlet中的汉字编码问题

    JSP/Servlet中的汉字编码问题 问题的起源 每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的扩展 ASCII码, 中国的 GB2312-80,日本的 JIS 等,作为该国家/区 ...

  4. 【计算机系统】 信息在计算机中的表示和内存地址与空间的简单理解

    1. 信息在计算机系统中的表示 我们知道,信息在计算机系统中是以二进制的方式进行传送,存储的.那么信息在计算机系统中是如何表示的呢?在这里可分为数值信息和非数值信息两个方面进行讨论. 数据信息分类示意 ...

  5. 微型计算机从外观上看可以分为,冯.诺依曼计算机 1.3 计算机系统的组成 计算机系统概述 EDVAC的3个特点:...

    Presentation on theme: "冯.诺依曼计算机 1.3 计算机系统的组成 计算机系统概述 EDVAC的3个特点:"- Presentation transcrip ...

  6. 在计算机系统中 接口是什么意思,计算机中操作系统是什么的接口

    计算机操作系统是用户与计算机的接口,同时也是计算机硬件和其他软件的接口.在计算机中,操作系统是其最基本也是最为重要的基础性系统软件. 操作系统(Operating System,简称OS)是管理和控制 ...

  7. 利用计算机系统对机床等生产设备进行管理,计算机系统在制造企业中实现品质管理中的应用...

    计算机系统在制造企业中实现品质管理中的应用 (4页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 9.9 积分 计算机系统在制造企业中实现品质管理中的应用 ...

  8. 计算机系统中常用的进制,计算机中常用 二进制 八进制 十进制 十六进制的特点...

    计算机中常用的计数制 用若干数位(由数码表示)的组合去表示一个数,各个数位之间是什么关系,即逢"几"进位,这就是进 位计数制的问题.也就是数制问题.数制,即进位计数制,是人们利用数 ...

  9. 计算机在药店管理系统中的应用,计算机系统在药店管理系统中的应用(国外英语资料).doc...

    计算机系统在药店管理系统中的应用(国外英语资料) 计算机系统在药店管理系统中的应用(国外英语资料) Information technology China high technology enter ...

  10. 计算机中imb二进制数,计算机基础知识总述.doc

    文档介绍: 计算机基础知识汇总 1.在微型计算机中,应用最普遍的字符编码是 A) ASCII 码 B)BCD 码 C)汉字编码 D) 补码 2 .与十进制数 100 等值的二进制数是 A)001001 ...

最新文章

  1. 自定义控件-侧边菜单SlidingMenu(滑动菜单)
  2. asterisk channel driver dev ref
  3. 印度版的“大众点评”如何将 Food Feed 业务从 Redis 迁移到 Cassandra
  4. SVN登录时不断弹出用户名密码输入
  5. DWA泊车算法的实现
  6. php抽奖概率算法(刮刮卡,大转盘)
  7. Linux中断(interrupt)子系统之四:驱动程序接口层 中断通用逻辑层
  8. Axure企业官网通用模板web端+公司官网通用模板web端高保真原型+服务企业门户官网+加入我们+在线招聘+企业宣传+新闻动态+企业理念+产品与服务+公司通用版官方电脑端门户网站
  9. mysql双活存储容量 TB_Mysql双活方案 - osc_fted3syf的个人空间 - OSCHINA - 中文开源技术交流社区...
  10. IDEA 插件 Material Theme UI收费后 免费的办法
  11. html代码向下移动,在html表格中向下移动Jquery
  12. python情感词提取_Python 文本挖掘:使用情感词典进行情感分析(算法及程序设计)...
  13. 160个常用黑客命令速查手册
  14. 借助栈将一个带头节点的单链表倒置
  15. C# 处理PPT水印(一)——添加水印效果(文字水印、图片水印)
  16. 【ELM回归预测】基于非洲秃鹫算法优化极限学习机预测附matlab代码
  17. javaWeb核心技术第六篇之BootStrap
  18. 【网络编程】Linux tcpdump命令详解---编辑中
  19. 2018年上半年阅读书单
  20. 敏涵控股集团贵族私人定制:时尚最C位 懂精致 更懂生活

热门文章

  1. pycharm切换python环境_在PyCharm的 Terminal(终端)切换Python版本的方法
  2. java 有多少种锁_java有哪些锁?java锁种类盘点
  3. Airbnb房源信息爬取(二)——获取房源信息
  4. java星座出生日期_求一个会java fx的大神 编写一个输入日期输出星座的代码 急急急...
  5. mysql 中的升序和降序
  6. cisco路由器进入rommon模式
  7. error C2048 :int main()无法重载/已存在主体
  8. 南天PR2打印机自动退纸解决办法
  9. 这种方式打开会ctrl的流量明星cxk,简直就是魔鬼
  10. 概率论(三)-多维随机变量及其分布:n维随机变量、概率分布函数F(x1,x2,..xn)、联合分布律、联合概率密度、边缘分布律、边缘概率密度、条件分布律、条件概率密度、β函数、Γ函数、max{X,Y}