引言

上次写过一篇关于 py2下hbase的字符串编码问题(\xe7\xbc\x96) 的文章,里面的解决方案是正则来进行转换,是一个有点傻但目前又无可奈何的解决方案,并且在最后留下了三个小坑。

本以为应该可以稳定的使用一段时间,没想到才过几天就掉坑里了。

=_=!!

所以这次就开始填坑了吧!!

修改后的代码

talk is cheap ,show me the code!

废话不多说,直接上代码!

import sys
import rereload(sys)
sys.setdefaultencoding("utf-8")def str_to_zhongwen(var):rule = "\\\\[xX][eE]\w{1}\\\\[xX]\w{2}\\\\[xX]\w{2}"words = re.findall(rule, var)for t in words:new_txt = re.sub('\\\\[xX]','',t).decode('hex')var = var.replace(t, new_txt)special_chars = {'\\\\[xX]0[dD]':'\r','\\\\[xX]0[aA]':'\n','\\\\[xX]09':'\t','\\\\[xX]0[Cc]':'\f',}for k,v in special_chars.items():var = re.sub(k,v,var)return var.decode('utf-8')

简单的解释一下:

  • 这里填了上文后面说到的问题2,3。
  • 解决方案都是使用正则来匹配,没有其他骚操作。
  • 所以依然感觉一般般。
  • 因为目前使用的环境是py2,所以也就没有去解决问题1,如果有在py3下遇到编码问题的朋友,计无可施后,可以尝试根据这个思路来解决一下。

over over! ?

【优化】py2下hbase的字符串编码问题(\\xe7\\xbc\\x96)相关推荐

  1. py2下hbase的字符串编码问题(\\xe7\\xbc\\x96)

    py2下hbase的字符串编码问题(\xe7\xbc\x96) -------start 2019年1月8日更新-------- 本文的代码有更新,解决的下面提到的问题2,问题3. 可移步另一篇文章[ ...

  2. python中文字符串编码_浅谈python下含中文字符串正则表达式的编码问题

    前言 Python文件默认的编码格式是ascii ,无法识别汉字,因为ascii码中没有中文. 所以py文件中要写中文字符时,一般在开头加 # -*- coding: utf-8 -*- 或者 #co ...

  3. python2字符串编码方式_一、基础部分-2.字符串编码

    一.字符编码历史 1. ASCII 美国人搞了个ASCII码表,把123abcABC%$#(数字.字母.特殊符号) ,全部用10进制的数字表示.例如数字65,代表着"A" ,ASC ...

  4. python2和python3的默认编码_Python2和Python3中的字符串编码问题解决

    原博文 2018-01-02 11:38 − Python2和Python3在字符串编码上是有明显的区别. 在Python2中,字符串无法完全地支持国际字符集和Unicode编码.为了解决这种限制,P ...

  5. 深入探索Android卡顿优化(下)

    前言 成为一名优秀的Android开发,需要一份完备的知识体系,在这里,让我们一起成长为自己所想的那样~. 在上篇文章中,笔者带领大家学习了卡顿优化分析方法与工具.自动化卡顿检测方案及优化这两块内容. ...

  6. python字符串编码及乱码解决方案

    http://blog.csdn.net/pipisorry/article/details/44136297 字符编码详解 [字符编码ASCII,Unicode和UTF-8] 主要非英文字符集的编码 ...

  7. String字符串编码解码格式

    https://blog.csdn.net/qq_35241080/article/details/83001149 //2 如何识别字符串编码 public static String getEnc ...

  8. Javascript对象的查询字符串编码

    您是否知道将Javascript对象编码为可通过GET请求传递的string的快速简便的方法? 没有jQuery ,没有其他框架-仅是纯Javascript :) #1楼 如果要递归转换嵌套对象,并且 ...

  9. python3中字符串编码常见种类_Python基础篇—标准数据类型—String字符串编码问题...

    我要开始写String编码问题了...脑壳疼.. 在String字符串的第一篇末尾有留一个坑,就是关于中文字符串编码.整个编码的故事说起来都是很费劲的,我也只能把我所知道的梳理整理一下,在日常敲码过程 ...

最新文章

  1. 数字化正在使CIO职责发生变化
  2. sql 取表的前10条记录,任意中间几行的记录
  3. WINCE---内核(kernel)---内存架构(memory archtitecture)学习
  4. Eclipse reports rendering library more recent than
  5. 习惯看新闻头条 一个程序员分享的工作心得
  6. 韩顺平轻松搞定网页设计(html+css+js),韩顺平轻松搞定网页设计方案(html+css+js)之javascript现场授课笔记(完整版).doc...
  7. 一本可能引发社会调查行业革命的书
  8. 《从零开始学Swift》学习笔记(Day 40)——析构函数
  9. python必备基础代码-新手上路必学的Python函数基础知识,全在这里了(多段代码举例)...
  10. 1537 学生干部虚基类
  11. 翻转数组,将数组倒序输出
  12. 推荐几款好用的去视频水印软件,快来看看吧
  13. (素材源码)猫猫学IOS(十九)UI之QQ好友列表
  14. 计算机健康小知识,电脑一族护肤保健小常识
  15. 史上最暴强老纳和师太-----全集!
  16. python学习 Day08 字符串和正则表达式
  17. 高通820(msm8996)camera hal源码分析
  18. 赛尔号7月17日服务器维护,赛尔号07月17日更新攻略汇总 环城之光圣芒降临
  19. 编写python程序实现分段函数_python分段函数如何编写?_后端开发
  20. 携手合作伙伴,傲腾技术加速释放数据中心潜能

热门文章

  1. GMail 波澜不惊
  2. 两名老人接力营救轻生女子一人溺亡
  3. Unexpected token u in JSON at position解决方法
  4. 给安卓手机里的Firefox安装AdGuard的https过滤证书
  5. sja1000 c语言,基于51单片机SJA1000 CAN通讯实现
  6. python怎么生成日志_python 生成模拟日志
  7. 计算机课教学日志,教师教学日志例文
  8. 来也科技总裁、按键精灵之父,给开发者的一封信
  9. 往期课程 | 翻阅指南
  10. Hibernate ORM映射中关clob及blob类型对应bo类 注解写法