p = re.compile(u'《(.*?)》') # 使用unicode编码

vid_drama_list = p.findall(info_util.get_id_field(vid,"name_cn").decode("utf8")) # utf8解码为unicode

vid_drama_list = [x.encode("utf8") for x in vid_drama_list] # unicode再编码为utf8,防止输出乱码。

注意:

pattern和string中,都需要使用unicode,否则编码不同,结果有误(如:《推拿》,《一切都好》等)。

正则提取编码解码问题相关推荐

  1. Python基础——第二章 第一部分 字符串方法 转义及编码解码

    1.字符串方法 1.1.查 (1)count:统计字符串中某元素出现的次数 >>>zf = 'hello world' >>>zf.count('l') 3 > ...

  2. 基于频谱注意力机制和编码解码模型的时间序列分类研究

    文章来源 浙江大学 2021年硕士论文 小论文 IEEE Spectrum Attention Mechanism for Time Series Classification 1 摘要 本文贡献 时 ...

  3. 【6】爬虫介绍/准备工作/构建流程/获取数据/BeautifulSoup/Re(正则表达式)/正则提取/标签解析/保存数据到excel

    爬虫介绍/准备工作/构建流程/获取数据/BeautifulSoup/Re(正则表达式)/正则提取/标签解析/保存数据到excel 更新时间:2021.9.16 vedio:15,16,17,18,19 ...

  4. python3 转码的函数_python基础3之文件操作、字符编码解码、函数介绍

    内容概要: 一.文件操作 二.字符编码解码 三.函数介绍 一.文件操作 文件操作流程: 打开文件,得到文件句柄并赋值给一个变量 通过句柄对文件进行操作 关闭文件 基本操作: 1 #/usr/bin/e ...

  5. .NET编码解码(HtmlEncode与HtmlEncode)

    原文:.NET编码解码(HtmlEncode与HtmlEncode) 编码代码: System.Web.HttpUtility.HtmlEncode("<a href=\"h ...

  6. js base64 编码解码

    js base64 编码解码 encode decode,可以直接使用 function Base64() {// private property_keyStr = "ABCDEFGHIJ ...

  7. python使用base64编码解码数据

    python使用base64编码解码数据 base64模块是用来作base64编码解码,常用于小型数据的传输.编码后的数据是一个字符串,其包括a-z.A-Z.0-9./.+共64个字符,即可用6个字节 ...

  8. python email模块详解_python模块之email: 电子邮件编码解码 (一、解码邮件)-阿里云开发者社区...

    python自带的email模块是个很有意思的东西,它可以对邮件编码解码,用来处理邮件非常好用. 处理邮件是一个很细致的工作,尤其是解码邮件,因为它的格式变化太多了,下面先看看一个邮件的源文件: Re ...

  9. java 正则提取$ 中内容_JAVA 使用正则从文字中提取想要的内容

    有时候我们想从一段文字中提取想要的内容,如省市区地址中提取出省市,从股票的数据中提取出关键的价格信息,抓取HTML文件后提取内容等等这些场景,这时我们可以使用JAVA正则表达式帮助我们提取出想要的数据 ...

最新文章

  1. 自定义标签 (转载)
  2. 服务器打不QQ显示00001,QQ登录超时00001怎么处理?
  3. kotlin学习之对象(九)
  4. linux清理整个磁盘空间,一次Linux磁盘空间清理的经历
  5. 【java】简述CGLIB常用API
  6. linux route配置网关,Linux使用route配置路由
  7. [转]Java杂谈(六)
  8. UITableViewCell delete button 上有其它覆盖层
  9. 从零开始学 Web 之 CSS(三)链接伪类、背景、行高、盒子模型、浮动
  10. 测试用例设计方法-正交试验常用正交表
  11. 广义pareto分布_帕累托分布
  12. 论文格式问题解决,标题前的黑点去除,分页后产生的空格消除。
  13. MySQL按指定字段自定义列表排序
  14. “物联网开发实战”学习笔记-(四)智能音箱制作和语音控制
  15. HP小型机系统管理员必读
  16. 确定位数的C语言程序设计,c语言程序设计
  17. 《Facebook启示录》的启示
  18. 【企业】财务思维之如何通过财报分析企业
  19. 程序员在小公司(没有大牛,人少)怎么成长?
  20. 国内各地网通电信DNS服务器

热门文章

  1. CodeForces-1294B排序+pair使用
  2. linux中sqlite3编译时出错,Sqlite3 交叉编译 undefined reference to `fdatasync' 错误解决
  3. 计算机没有autoCAD_挑战在一年内用晚上业余时间学会灵活运用CAD(1)|cad|autocad|图学|计算机|电子电路...
  4. mysql数据库优化大全_MySQL数据库优化技巧大全
  5. iis php session丢失,Session丢失的解决办法小结
  6. pandas把频数统计转换成数据表
  7. 中provide的用法_英语词法:中考动词用法系统梳理下
  8. 3400g主机用linux系统,最强整合平台!锐龙5 3400G小钢炮主机配置推荐
  9. 深入浅出C++虚函数的vptr与vtable
  10. Markovdecisionprocesses_Discretestochasticdynamicprogramming下载