参考的链接:
Url解码时,如何将汉字转化为以 %开头的 gb2312 编码
Python标准库urllib中parse.quote()
Python之quote()使用
python之urlencode(),quote()及unquote()

将汉字转化为以 %开头的 gb2312 编码
我的代码如下:将以%号开头的编码转化为汉字
(python3)

import urllib.parsecity_li = ['北京','上海']
citys = []
for city in city_li:city = city.encode('gb2312')city = urllib.parse.quote(city)citys.append(city)
print(citys[0],citys[1])key = '格力塔扇'
keywords = key.encode('gb2312') #如果编码格式为utf-8,那么这一步可以省略
keywords = urllib.parse.quote(keywords)
print(keywords)wine = '法国红酒'
wine = urllib.parse.quote(wine)  #默认编码格式为utf-8
print(wine)

打印结果:

%B1%B1%BE%A9 %C9%CF%BA%A3
%B8%F1%C1%A6%CB%FE%C9%C8
%E6%B3%95%E5%9B%BD%E7%BA%A2%E9%85%92

将以%号开头的gb2312编码转化为汉字
我的代码如下:

import urllib.parse
#urllib.parse.unquote(string,encoding ='utf-8',errors ='replace')key = '%B8%F1%C1%A6%CB%FE%C9%C8'  #此编码格式为gb2312
key = urllib.parse.unquote(key,encoding='gb2312') #urllib.parse.unquote()的默认编码格式为‘utf-8’
print(key)name = '%E6%B3%95%E5%9B%BD%E7%BA%A2%E9%85%92'  #此编码格式为utf-8
name = urllib.parse.unquote(name)
print(name)

打印结果:

格力塔扇
法国红酒

Python爬虫笔记——Url解码时,如何将汉字转化为以 %开头的 gb2312 编码 和 将以%号开头的编码转化为汉字 的示例相关推荐

  1. Python爬虫笔记

    Python爬虫笔记 总体看过程 赋予地址 获取网页信息 获取网页中所需的信息 将得到所需的信息保存到硬盘 总体看过程 爬虫-从网络上爬取所需要的信息,怎么爬取?首先得知道你要去哪里获取(即地址,首先 ...

  2. python爬虫笔记第二章

    前言 你好! 这是基于b站2021年路飞学成爬虫教程的python爬虫学习笔记,主要是方便作者复习和回顾课程内容. 已经发布了第一章和第二章,可以在主页中查看. python爬虫笔记(第二章) 前言 ...

  3. Python爬虫笔记(3)- 爬取丁香园留言

    Python爬虫笔记(3)- 爬取丁香园留言 爬取丁香园留言:主要用到了模拟登录 爬取丁香园留言:主要用到了模拟登录 import requests, json, re, random,time fr ...

  4. Python爬虫:URL管理器及其实现方式、网页下载器、网页解析器原理及其实现原理!

    Python爬虫之URL管理器: Python爬虫:URL管理器实现方式: Python爬虫之网页下载器: urllib2实现网页下载器的三种方法: 具体代码:                    ...

  5. Python爬虫笔记汇总

    文中介绍的比较详细的有,requests库,urllib.request库,BeautifulSoup库,re库和正则表达式,Scrapy常用命令. 一.requests库 课程小案例 京东商品详情页 ...

  6. 嵩天老师python爬虫笔记整理week3

    这里对北理爬虫课程第三周内容回顾,本周主要介绍了正则表达式 1.正则表达式的概念 正则表达式是用来简洁表达一组字符串的表达式 正则表达式是一种通用的字符串表达框架 进一步 正则表达式是一种针对字符串表 ...

  7. Python爬虫笔记——解析json数据(以周杰伦歌单为例)及Headers

    一.Network Network能够记录浏览器的所有请求.我们最常用的是:ALL(查看全部)/XHR(仅查看XHR)/Doc(Document,第0个请求一般在这里),有时候也会看看:Img(仅查看 ...

  8. Python爬虫笔记——分析AJAX传递的JSON获取数据-初步分析动态网页

    转载文章链接: Python爬虫:分析AJAX传递的JSON获取数据-初步分析动态网页(1) [4]实战:爬取动态网页的两种思路爬取新浪趣图(1) [5]实战:爬取动态网页的两种思路爬取新浪趣图(2) ...

  9. Python爬虫笔记——解决python 写入文件中文乱码问题

    原链接: python 爬虫写入文件中文乱码问题解决 分析过程 根据网上的一些建议,将文件的打开编码改为 utf-8 ,结果跟本不起作用 奇怪的是用notepad 打开 csv 文件竟然显示正常,看来 ...

最新文章

  1. 分类问题-样本权重(sample_weight)和类别权重(class_weight)
  2. DDD 领域驱动设计:贫血模型、充血模型的深入解读!
  3. 开发音频频谱_ToneBoosters音频效果器插件合集
  4. Nginx 源码分析-- 模块module 解析执行 nginx.conf 配置文件流程分析 一
  5. 判断集合相等_数学启蒙的每个关键阶段之集合分类
  6. c study_13
  7. linux面试题(填空部分)
  8. SCAU高级语言程序设计--实验9 函数的应用(1)
  9. 泰勒公式(泰勒展开式)通俗+本质详解
  10. scikit-learn KNN实现糖尿病预测
  11. 博途数据类型wstring怎么用_西门子博图数据类型说明
  12. 2022 Java 知识点总结
  13. LTE传输模式(TM1 - TM9)
  14. RNN及变体LSTM、GRU(在NILM中的应用)
  15. 【电影评价】——可爱的电影适合可爱的你!!!一直更新中
  16. 重磅综述|Nat Rev Gastroenterol Hepatol:人类胃肠道中的产甲烷古菌
  17. RK3128适配RTL8723DU
  18. BitmapFactory.decodeStream接收servlet传回的图片数据流慢、卡死、延迟问题
  19. 域名和SSL证书是什么关系
  20. Drilling fluids recycling system for China Trenchless Company

热门文章

  1. 游戏服务器的架构演进、多进程架构通信
  2. songtaste资源下载程序
  3. 【nginx】proxy_temp目录权限问题【open() “proxy_temp/8/00/0000000008“ failed (13: Pe】
  4. books,图书管理
  5. 上海软件自动化测试培训,上海培训自动化测试(工业机器)
  6. PyQt5桌面应用开发(2):事件循环
  7. 【网络编程套接字(一)】
  8. chrome浏览器webdriver相关下载与使用方法
  9. day_14 常用API
  10. 2014款宝马I8插电式混合动力跑车将成为“蓝光”前灯的首秀:这是这一技术首次在欧洲汽车市场正式使用。