php 字符编码转换类,支持ANSI、Unicode、Unicode big endian、UTF-8、UTF-8+Bom 互相转换。

四种常见文本文件编码方式

ANSI编码:

无文件头(文件编码开头标志性字节)

ANSI编码字母数字占一个字节,汉字占两个字节

回车换行符,单字节, 十六进制表示为0d 0a

UNICODE编码:

文件头,十六进制表示为FF FE

每一个字符都用两个字节编码

回车换行符, 双字节,十六进制表示为 000d 000a

Unicode big endian编码:

文件头十六进制表示为FE FF

后面编码是把字符的高位放在前面,低位放在后面,正好和Unicode编码颠倒

回车换行符,双字节,十六进制表示为0d00 0a00

UTF-8 编码:

文件头,十六进制表示为EF BB BF

UTF-8是Unicode的一种变长字符编码,数字、字母、回车、换行都用一个字节表示,汉字占3个字节

回车换行符,单字节,十六进制表示为0d 0a

转换原理:先把字符编码转为UTF-8,然后再从UTF-8转换为对应的字符编码。

CharsetConv.class.php

_allow_charset)){

$this->_in_charset = $in_charset;

}

// 检查输出编码

if(in_array($out_charset, $this->_allow_charset)){

$this->_out_charset = $out_charset;

}

}

/** 转换

* @param String $str 要转换的字符串

* @return String 转换后的字符串

*/

public function convert($str){

$str = $this->convToUtf8($str); // 先转为utf8

$str = $this->convFromUtf8($str); // 从utf8转为对应的编码

return $str;

}

/** 把编码转为UTF-8编码

* @param String $str

* @return String

*/

private function convToUtf8($str){

if($this->_in_charset=='utf-8'){ // 编码已经是utf-8,不用转

return $str;

}

switch($this->_in_charset){

case 'utf-8bom':

$str = substr($str, 3);

break;

case 'ansi':

$str = iconv('GBK', 'UTF-8//IGNORE', $str);

break;

case 'unicode':

$str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2));

break;

case 'unicodebe':

$str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2));

break;

default:

break;

}

return $str;

}

/** 把UTF-8编码转换为输出编码

* @param String $str

* @return String

*/

private function convFromUtf8($str){

if($this->_out_charset=='utf-8'){ // 输出编码已经是utf-8,不用转

return $str;

}

switch($this->_out_charset){

case 'utf-8bom':

$str = "\xef\xbb\xbf".$str;

break;

case 'ansi':

$str = iconv('UTF-8', 'GBK//IGNORE', $str);

break;

case 'unicode':

$str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str);

break;

case 'unicodebe':

$str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str);

break;

default:

break;

}

return $str;

}

} // class end

?>

demo:unicode big endian 转为 utf-8+bom

convert($str);

file_put_contents('response/utf-8bom.txt', $response, true);

?>

源码下载地址:点击查看

以上就介绍了php 字符编码转换类,支持ANSI、Unicode、Unicode big endian、UTF-8、UTF-8+Bom 互相转换,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

php 字符转ansi,php 字符编码转换类,支持ANSI、Unicode、Unicode big endian、UTF-8、UTF-8+Bom 互相转换...相关推荐

  1. 编码字典类特征、使用sklearn的DictVectorizer方法将字典组成的列表转换成向量、详解及实战

    编码字典类特征.使用sklearn的DictVectorizer方法将字典组成的列表转换成向量.详解及实战 sklearn.feature_extraction.DictVectorizer() 把字 ...

  2. VB 文件编码互换模块(支持 Ansi,UTF-8,Unicode(little endian),Unicode big endian)

    'VB 文件编码互换模块,支持对Ansi,UTF-8,Unicode(little endian),Unicode big endian编码之间进行转换. Option Explicit Privat ...

  3. 【字符编码】 简洁理解ANSI,UTF8,Unicode,ASCII编码的差别

    目录 简略 说明 1.  ASCII和ANSI编码 2. UNICODE 4.  UTF-8 参考 简略 ASCII             1个字节=1个文字 ANSI                ...

  4. 宽字符wchar_t和窄字符char区别和相互转换

    转自:http://blog.csdn.net/nodeathphoenix/article/details/7416725 1.    首先,说下窄字符char了,大家都很清楚,就是8bit表示的b ...

  5. 计算机编码简介(ASCII、ANSI、EBCDIC、Unicode)

    1) ASCII(American Standard Code for Information Interchange,美国信息交换标准码)是使用最广的.使用ASCII码编码的文件称为ASCII文件. ...

  6. 编码格式(UTF-8 与 ANSI)各种编码解码(encode、decode)

    Windows:默认为 ANSI,记事本程序另存为处,可以设置其他编码格式: Ubuntu:默认为 UTF-8 1. ANSI ANSI 编码表示英文字符时用一个字节,表示中文用两个或四个字节 -- ...

  7. 在项目中遇到导入TXT乱码现象。为什么UTF-8不行?ANSI是什么编码?

    问题描述: 在项目中导入中文txt文本,文本中的文字出现乱码现象. ANSI是什么编码?: 其实ANSI不是一种具体的编码格式,而是在不同的系统中,ANSI表示不同的编码.在英文的系统中ANSI表示的 ...

  8. 字符编码:ANSI、ASCII、Unicode、UTF-8、UTF-16、UTF-32概念和格式转换

    1.ASCII ASCII码是字符集,使用指定的7 位或8 位二进制数组合来表示128或256 种可能的字符.分为标准ASCII .扩展ASCII . 标准ASCII 码也叫基础ASCII码,使用7 ...

  9. 字符编码简介 ANSI Unicode Unicode big endian UTF-8

    1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和 1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte) ...

  10. php 设置字符集函数,PHP 数组字符集编码转换的函数

    摘要 腾兴网为您分享:PHP 数组字符集编码转换的函数,云南移动,学习计时,小米音乐,西餐菜谱等软件知识,以及酷狗旧版,摇骰子软件,易吧进销存软件,指南针,su楼梯插件,她趣,守卫剑阁大圣归来,vr设 ...

最新文章

  1. python爬取图片-Python爬取网页中的图片(搜狗图片)详解
  2. yocto中文环境搭建
  3. SQL—已更新或删除的行值要么不能使该行成为唯一行。。。
  4. couchbase_使用Couchbase分页
  5. 公务员计算机软件及相关专业,公务员计算机专业考试大纲和真题3
  6. django中设置url或者models中的slug字段
  7. MySQL优化详解(三)——MySQL慢查询与内参数优化
  8. 易班 使用接口快速刷完成学习任务
  9. word中批量调整图片大小的方法
  10. 华为机试真题 C++ 实现【乱序整数序列两数之和绝对值最小】
  11. U8二开之界面增加按钮处理事件
  12. photoshop7.0 排版一寸照片、2寸照片
  13. 自定义View之案列篇(三):仿QQ小红点
  14. [Python从零到壹] 四十.图像处理基础篇之图像量化处理
  15. WPE教学之-截取操作篇
  16. 黑客新型攻击技术,使用智能灯泡窃取数据
  17. Axure的动态面板制作tab切换效果
  18. 《SQL必知必会》读书笔记上(第1~15章)
  19. python爬虫-网易云音乐的歌曲热评
  20. 防抖和节流的理解与实现

热门文章

  1. Think in Java读书笔记--对象入门
  2. 【mysql】mysql常用语句
  3. VC++ 禁止WebBrowser网页跳转时发出的声音和禁止网页上的文字被选择
  4. 自己写的一个分享按钮的插件(可扩展,内附开发制作流程)
  5. Xfce 4.4 beta2
  6. 拓端tecdat|r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化
  7. envi反演水质参数_基于大气校正法的Landsat 8 TIRS地表温度反演
  8. TankGame1.0
  9. Ubuntu 18.04 8T硬盘挂载
  10. type(img).__module__ == np.__name__