查询任意汉字的Unicode编码,UTF8编码,GB2312编码,GBK编码
在所有IT项目中,汉字字符编码带来的问题是一个不小的工作量,经常导致乱码的发生。快速查询任意汉字的编码能够更快的定位错误。糖果云库新增了汉字字符集库,可查询任意汉字的Unicode编码,UTF8编码,GB2312编码,GBK编码,库的链接为:
http://www.tgyun.cc/lib/bigtang_汉字字符集
GB2312编码是第一个汉字编码国家标准,由中国国家标准总局1980年发布,1981年5月1日开始使用。GB2312编码共收录汉字6763个,其中一级汉字3755个,二级汉字3008个。同时,GB2312编码收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。
GBK编码范围:8140-FEFE,汉字编码范围见第二节:码位分配及顺序。
GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE,剔除xx7F码位,共23940个码位。共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布,这一版的GBK规范为1.0版。
Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。Unicode的学名是”Universal Multiple-Octet Coded Character Set”,简称为UCS。UCS可以看作是”Unicode Character Set”的缩写。
UCS有两种格式:UCS-2和UCS-4。顾名思义,UCS-2就是用两个字节编码,UCS-4就是用4个字节(实际上只用了31位,最高位必须为0)编码。
UCS-2有2^16=65536个码位,常说的Unicode编码指的是UCS-2的编码,它又有两种表示方法:
UTF-8就是以8位为单元对UCS进行编码。UTF-16以16位为单元对UCS进行编码。
查询任意汉字的Unicode编码,UTF8编码,GB2312编码,GBK编码相关推荐
- ASCII,Unicode,UTF-8,GB2312一些关于编码的理解
2019独角兽企业重金招聘Python工程师标准>>> 字符编码:ASCII,Unicode,UTF-8,GB2312 从文件编码的方式来看,文件可分为ASCII码文件和二进制码文件 ...
- unicode、utf-8、ansi、gbk、gb2312编码详解
前言 作为一个开发人员或是测试人员,免不了要与各种各样的编码打交道,而且这些各种编码总是让人头大,现在我们就来揭开他们的庐山真面目 移动还是联通? 在开始本文前,我需要大家思考一个问题:你知道联通为什 ...
- 单片机中UTF-8如何转换得到GBK编码
概述 我们在单片机开发中常会遇到需要将UTF-8转换为GBK编码的需求. 在我们了解各种编码格式的情况下可知, UFT-8不能直接转成GBK,需中转成unicode再转换为gbk.而unicode和g ...
- java sql编码_java+sql 编码 UTF-8、ISO-8859-1、GBK
java 编码 UTF-8.ISO-8859-1.GBK Java支持UTF-8.ISO-8859-1.GBK等各种字体编码,可笔者发现Java中字体编码的问题仍难倒了不少程序员,网上虽然也有不少关于 ...
- Sublime Text 3技巧:支持GB2312和GBK编码
Sublime Text 3与Sublime Text 2的不同 其实有不少人写过如何让Sublime Text 2支持GB2312和GBK编码,例如这篇.基本原理就是先装好Package Contr ...
- 字符编码、常见字符集解析(ASCII、Unicode、UTF-8、GB2312等)
文章目录 字符编码 ASCII Unicode UTF-8 GB2312 C++中的字符类型 python中的字符编码 小结 各种字符编码的转换是个非常容易混淆的问题,这篇文章旨在梳理字符编码.常见字 ...
- 字符编码简介:ASCII,Unicode,UTF-8,GB2312及Unicode和UTF-8如何转化
转载请标明出处:http://blog.csdn.net/xx326664162/article/details/51453797 文章出自:薛瑄的博客 你也可以查看我的其他同类文章,也会让你有一定的 ...
- [转]各种编码ANSI、GB2312、GBK、GB18030、UNICODE以及UTF-8傻傻分不清!
计算机编程中的编码一直是让新手非常头疼的问题,特别是 GBK.GB2312.UTF-8 这三个比较常见的网页编码的区别,更是让许多新手晕头转向,怎么解释也解释不清楚,看一遍貌似懂了,但实际使用的时候又 ...
- Java编码ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式详解
1 ASCII American Standard Code for Information Interchange.最早最通用的单字节编码系统,因为发明时间早,所以ASCII编码表的设计较为简单. ...
- ASCII、ISO8859-1、GB2312、GBK、GB18030、BIG5、UNICODE、UTF-8、ANSI等字符集编码的讲解与特点
世界是不断进步的,有了新需求就会产生新的事物.首先我们要知道在程序中经常遇到一些关于乱码的问题,而产生乱码的原因就是因为计算机直接存储字符时要把字符转为二进制,这其中不同的转换规则就对应不同的编码方式 ...
最新文章
- python学精通要多久-零基础零经验自学Python,到精通Python要多久啊?
- SAP中VLPOD什么意思
- 对于并列的TextField实现同步控制
- linux c 调用python_C程序调用Python脚本
- 从业务到技术weibo link card快速接入思考-2014.09.20
- redirect重定向中可以带参数吗_关于Laravel重定向的七种方法详解
- 今天居然中了MSN病毒。
- Android 第三方SDK特征的收集
- smith圆图重要性_(完整版)smith史密斯圆图(个人总结),推荐文档
- Spring 常用的注解
- 计算机格式化后数据恢复的基础,格式化计算机硬盘后如何恢复原始数据_计算机的基本知识_IT /计算机_信息...
- ACR122U Android端应用开发入道指南
- ie java 无法复制粘贴_电脑不能复制粘贴的多种实用解决方法
- 飞鱼星流控王VF12路由器使用体验
- 智源社区周刊:LeCun等撰文回应Marcus;朱松纯团队价值对齐工作登Science官网头条;马毅沈向洋等公开AI智能综述论文...
- Unity开发--进入游戏大厅时游戏中常用的弹窗管理
- Shopee通知:未通过实名认证将导致订单无法正常出运
- 消除switch/case语句,不破坏代码的封闭性,使程序结构更符合面向对象思想(二)
- input元素及属性
- MySQL学习笔记——第2章 SQL的基本概念和MySQL简介
热门文章
- ArcGIS和Fragstats的脚本化调用 ------以ArcPy和命令行的方式
- [转]仿百度文库或豆丁网在线浏览doc.pdf.xls.txt源码
- arcgis图像和坐标系统一致但不重合_学习ArcGIS,这62个Arcmap常用操作技巧可能帮到您...
- 通讯录管理系统JAVA版本
- Maven的下载及安装
- 计算机的屏幕为什么成黑色,电脑液晶显示器老是黑屏怎么回事
- 超像素分割算法SLIC的matlab实现
- SiteSucker Pro 4.0.1 扒站神器
- centos安装网易云音乐~
- 什么是防病毒网关 防病毒网关的功能特点