字符集,也叫code page,最先来源于IBM。每个公司都有自己的字符集,并且相同的字符集在不同公司之间的名字也不一样,就算是ISO组织定义的一些标准字符集在不同的公司实现也有差别。
比如说微软和IBM的code page,参见。
微软:
http://msdn.microsoft.com/en-us/library/dd317756%28VS.85%29.aspx
http://msdn.microsoft.com/en-us/goglobal/bb964653.aspx(详细字符集)
IBM:
http://www-03.ibm.com/systems/i/software/globalization/codepages.html
http://demo.icu-project.org/icu-bin/convexp(详细字符集和别名)
再看看IANA的,就知道字符集和他们的别名有多少了。
http://www.iana.org/assignments/character-sets

下面是一些主要的字符集。
ASCII: http://en.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange
EBCDIC: http://en.wikipedia.org/wiki/Extended_Binary_Coded_Decimal_Interchange_Code
ISO 8859: http://www.unicodecharacter.com/charsets/iso8859.html

Unicode是一种用16位bit来表示字符的字符集,UTF-8,UTF-16等都是Unicode的编码方式;
有关什么是UCS-2,UCS-4,UTF-8,字节序,BOM等概念,请参见:
http://www.fmddlmyy.cn/mytext.html 中的谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词,这个作者是我在网上搜到的国内牛人
http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html

UTF-7是用来进行mail传输的编码方式,因为SMTP不支持非acsii字符,同时不能保证底层的传输设备是8-bit clean(就是它只认识7-bit的acsii字符http://en.wikipedia.org/wiki/8-bit_clean),
所以在传输非ascii字符时要先进行编码(UTF-7),传输二进制文件时进行base64编码。可参见:
http://en.wikipedia.org/wiki/UTF-7

UCD(Unicode Character Database):  http://www.unicode.org/ucd/
Unicode的字符map: http://en.wikipedia.org/wiki/Mapping_of_Unicode_characters#Special_code_points

有了字符集,还要有相应的字体,对应的字符才能正确的显示出来。
Unicode字体:http://en.wikipedia.org/wiki/List_of_typefaces#Unicode_fonts

编码转换工具:
http://demo.icu-project.org/icu-bin/icudemos
http://www.unipad.org/main/
http://www.fmddlmyy.cn/myprog.html
http://www.kalytta.com/tools.php
http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&id=

再谈编码(很多都是拾人牙慧不要见笑)相关推荐

  1. python全栈开发-再谈编码 python_day_6

    一. 回顾上周所有内容 一. python基础 Python是一门解释型. 弱类型语言 print("内容", "内容", end="\n" ...

  2. 小数据池 is和== 再谈编码

    昨日回顾 上节课内容回顾1. 字典{key:value, key:value.....}成对的保存数据字典没有索引. 不能切片, 字典的key必须是可哈希的.不可变的1. 增加:dic[新key] = ...

  3. 06 小数据池 is 和 = = 再谈编码

    今日主要内容 1. 小数据池, id() 小数据池针对的是: int, str, bool 在py文件中几乎所有的字符串都会缓存. id() 查看变量的内存地址 2. is和==的区别 is 比较的是 ...

  4. python之路--小数据池,再谈编码,is和 == 的区别

    一 . 小数据池 # 小数据池针对的是: int, str, bool 在py文件中几乎所有的字符串都会缓存.# id() 查看变量的内存地址 s = 'attila' print(id(s)) 二 ...

  5. 小数据池/is和==/再谈编码作业

    # 1,老男孩好声选秀大赛评委在打分的时候呢, 可以输入分数. 假设, 老男孩有10个评委. 让10个评委进行打分, 要求, 分数必须高于5分, 低于10分.将每个评委的打分情况保存在列表中. pin ...

  6. 网络协议报文理解刨析篇二(再谈Http和Https), 加上TCP/UDP/IP协议分析(理解着学习), 面试官都惊讶你对网络的见解

    目录 前文链接(系列助学, 也为后文学习做铺垫, 可按需读取) 一. 再谈HTTP再理解 二. HTTP对比学习HTTPS HTTP和HTTPS的区别如下: 三.TCP协议  (三次握手四次挥手细节过 ...

  7. 海哥:再谈粉丝经济,你所知道的99%都是错误的。

    事实上去年甚至是前年開始,小米的成功使得粉丝经济这个词開始火起来.可是非常多的企业对于粉丝经济有着不同的解释,那么.什么才是粉丝经济呢?我们又怎样发展发展粉丝?海哥在这里将从这个行业大局给大家分享. ...

  8. 再谈HTTP2性能提升之背后原理—HTTP2历史解剖

    即使千辛万苦,还是把网站升级到http2了,遇坑如<phpcms v9站http升级到https加http2遇到到坑>. 因为理论相比于 HTTP 1.x ,在同时兼容 HTTP/1.1 ...

  9. JVM学习笔记之-垃圾回收相关概念 System.gc()的理解 内存溢出与内存泄漏 STW 垃圾回收的并行与并发 安全点与安全区域 再谈引用:强引用 软引用 弱引用 虚引用 终结器引用

    System.gc()的理解 在默认情况下,通过System.gc()或者Runtime. getRuntime ( ).gc ()的调用,会显式触发Full GC,同时对老年代和新生代进行回收,尝试 ...

最新文章

  1. 一不小心肝出了4W字的Redis面试教程
  2. 问题解决:树莓派上Python用pip进行安装耗尽内存,卡死
  3. linux 后台运行程序
  4. python爬虫模块_python实现爬虫的模块总结
  5. re.compile
  6. 单片机的单个IO口可以发送数据吗_关于51单片机各个引脚它的功能你了解多少?...
  7. 用计算机对话的小品,爆笑小品剧本台词《作弊记》
  8. c++树及树与二叉树的转换
  9. SQlite数据库的C编程接口(六) 返回值和错误码(Result Codes and Error Codes) ——《Using SQlite》读书笔记
  10. 【TCP/IP】【测试】常用抓包软件一览
  11. 中兴机顶盒网关服务器超时,中兴机顶盒错误1302连接EPG服务失败解决方法
  12. 趋肤效应实验报告_电感耦合等离子体发射光谱实验报告
  13. 空间相册怎么移到计算机里,qq空间上传照片_怎样把电脑里存的照片传到qq空间??...
  14. 课程能力建设:提高五年制高职教学有效性的重要途径
  15. 三维游戏中的角色动画
  16. 如何解决input输入框只输入数字
  17. 哈工大计算机网络期末复习资料知识点总结
  18. php 精湛技术,【名医风采】范学民:用精湛技术温暖患者
  19. 环保设备物联网远程监控维护解决方案
  20. Error while Launching activity

热门文章

  1. python前景怎么样-Python 未来发展前景怎么样?
  2. python 灰色关联分析_基于灰色关联分析和功效组分的大黄药材质量评价
  3. 如何查看百度百家号审核进度
  4. Continue 玩转像素点,Python 图像处理学习的第 3 天
  5. 苹果称一矿泉水公司所申请 Logo 跟自家的太像
  6. iphone启用证书_如何在iPhone上启用低数据模式
  7. 自动化测试(一)手工测试用例与自动化测试用例
  8. pyecharts页面无法显示
  9. 大数据之路——日志采集
  10. animatioan自定义动画