再谈编码(很多都是拾人牙慧不要见笑)
字符集,也叫code page,最先来源于IBM。每个公司都有自己的字符集,并且相同的字符集在不同公司之间的名字也不一样,就算是ISO组织定义的一些标准字符集在不同的公司实现也有差别。
比如说微软和IBM的code page,参见。
微软:
http://msdn.microsoft.com/en-us/library/dd317756%28VS.85%29.aspx
http://msdn.microsoft.com/en-us/goglobal/bb964653.aspx(详细字符集)
IBM:
http://www-03.ibm.com/systems/i/software/globalization/codepages.html
http://demo.icu-project.org/icu-bin/convexp(详细字符集和别名)
再看看IANA的,就知道字符集和他们的别名有多少了。
http://www.iana.org/assignments/character-sets
下面是一些主要的字符集。
ASCII: http://en.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange
EBCDIC: http://en.wikipedia.org/wiki/Extended_Binary_Coded_Decimal_Interchange_Code
ISO 8859: http://www.unicodecharacter.com/charsets/iso8859.html
Unicode是一种用16位bit来表示字符的字符集,UTF-8,UTF-16等都是Unicode的编码方式;
有关什么是UCS-2,UCS-4,UTF-8,字节序,BOM等概念,请参见:
http://www.fmddlmyy.cn/mytext.html 中的谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词,这个作者是我在网上搜到的国内牛人 了
http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html
UTF-7是用来进行mail传输的编码方式,因为SMTP不支持非acsii字符,同时不能保证底层的传输设备是8-bit clean(就是它只认识7-bit的acsii字符http://en.wikipedia.org/wiki/8-bit_clean),
所以在传输非ascii字符时要先进行编码(UTF-7),传输二进制文件时进行base64编码。可参见:
http://en.wikipedia.org/wiki/UTF-7
UCD(Unicode Character Database): http://www.unicode.org/ucd/
Unicode的字符map: http://en.wikipedia.org/wiki/Mapping_of_Unicode_characters#Special_code_points
有了字符集,还要有相应的字体,对应的字符才能正确的显示出来。
Unicode字体:http://en.wikipedia.org/wiki/List_of_typefaces#Unicode_fonts
编码转换工具:
http://demo.icu-project.org/icu-bin/icudemos
http://www.unipad.org/main/
http://www.fmddlmyy.cn/myprog.html
http://www.kalytta.com/tools.php
http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&id=
再谈编码(很多都是拾人牙慧不要见笑)相关推荐
- python全栈开发-再谈编码 python_day_6
一. 回顾上周所有内容 一. python基础 Python是一门解释型. 弱类型语言 print("内容", "内容", end="\n" ...
- 小数据池 is和== 再谈编码
昨日回顾 上节课内容回顾1. 字典{key:value, key:value.....}成对的保存数据字典没有索引. 不能切片, 字典的key必须是可哈希的.不可变的1. 增加:dic[新key] = ...
- 06 小数据池 is 和 = = 再谈编码
今日主要内容 1. 小数据池, id() 小数据池针对的是: int, str, bool 在py文件中几乎所有的字符串都会缓存. id() 查看变量的内存地址 2. is和==的区别 is 比较的是 ...
- python之路--小数据池,再谈编码,is和 == 的区别
一 . 小数据池 # 小数据池针对的是: int, str, bool 在py文件中几乎所有的字符串都会缓存.# id() 查看变量的内存地址 s = 'attila' print(id(s)) 二 ...
- 小数据池/is和==/再谈编码作业
# 1,老男孩好声选秀大赛评委在打分的时候呢, 可以输入分数. 假设, 老男孩有10个评委. 让10个评委进行打分, 要求, 分数必须高于5分, 低于10分.将每个评委的打分情况保存在列表中. pin ...
- 网络协议报文理解刨析篇二(再谈Http和Https), 加上TCP/UDP/IP协议分析(理解着学习), 面试官都惊讶你对网络的见解
目录 前文链接(系列助学, 也为后文学习做铺垫, 可按需读取) 一. 再谈HTTP再理解 二. HTTP对比学习HTTPS HTTP和HTTPS的区别如下: 三.TCP协议 (三次握手四次挥手细节过 ...
- 海哥:再谈粉丝经济,你所知道的99%都是错误的。
事实上去年甚至是前年開始,小米的成功使得粉丝经济这个词開始火起来.可是非常多的企业对于粉丝经济有着不同的解释,那么.什么才是粉丝经济呢?我们又怎样发展发展粉丝?海哥在这里将从这个行业大局给大家分享. ...
- 再谈HTTP2性能提升之背后原理—HTTP2历史解剖
即使千辛万苦,还是把网站升级到http2了,遇坑如<phpcms v9站http升级到https加http2遇到到坑>. 因为理论相比于 HTTP 1.x ,在同时兼容 HTTP/1.1 ...
- JVM学习笔记之-垃圾回收相关概念 System.gc()的理解 内存溢出与内存泄漏 STW 垃圾回收的并行与并发 安全点与安全区域 再谈引用:强引用 软引用 弱引用 虚引用 终结器引用
System.gc()的理解 在默认情况下,通过System.gc()或者Runtime. getRuntime ( ).gc ()的调用,会显式触发Full GC,同时对老年代和新生代进行回收,尝试 ...
最新文章
- 一不小心肝出了4W字的Redis面试教程
- 问题解决:树莓派上Python用pip进行安装耗尽内存,卡死
- linux 后台运行程序
- python爬虫模块_python实现爬虫的模块总结
- re.compile
- 单片机的单个IO口可以发送数据吗_关于51单片机各个引脚它的功能你了解多少?...
- 用计算机对话的小品,爆笑小品剧本台词《作弊记》
- c++树及树与二叉树的转换
- SQlite数据库的C编程接口(六) 返回值和错误码(Result Codes and Error Codes) ——《Using SQlite》读书笔记
- 【TCP/IP】【测试】常用抓包软件一览
- 中兴机顶盒网关服务器超时,中兴机顶盒错误1302连接EPG服务失败解决方法
- 趋肤效应实验报告_电感耦合等离子体发射光谱实验报告
- 空间相册怎么移到计算机里,qq空间上传照片_怎样把电脑里存的照片传到qq空间??...
- 课程能力建设:提高五年制高职教学有效性的重要途径
- 三维游戏中的角色动画
- 如何解决input输入框只输入数字
- 哈工大计算机网络期末复习资料知识点总结
- php 精湛技术,【名医风采】范学民:用精湛技术温暖患者
- 环保设备物联网远程监控维护解决方案
- Error while Launching activity