Python爬虫笔记——Url解码时,如何将汉字转化为以 %开头的 gb2312 编码 和 将以%号开头的编码转化为汉字 的示例
参考的链接:
Url解码时,如何将汉字转化为以 %开头的 gb2312 编码
Python标准库urllib中parse.quote()
Python之quote()使用
python之urlencode(),quote()及unquote()
将汉字转化为以 %开头的 gb2312 编码
我的代码如下:将以%号开头的编码转化为汉字
(python3)
import urllib.parsecity_li = ['北京','上海']
citys = []
for city in city_li:city = city.encode('gb2312')city = urllib.parse.quote(city)citys.append(city)
print(citys[0],citys[1])key = '格力塔扇'
keywords = key.encode('gb2312') #如果编码格式为utf-8,那么这一步可以省略
keywords = urllib.parse.quote(keywords)
print(keywords)wine = '法国红酒'
wine = urllib.parse.quote(wine) #默认编码格式为utf-8
print(wine)
打印结果:
%B1%B1%BE%A9 %C9%CF%BA%A3
%B8%F1%C1%A6%CB%FE%C9%C8
%E6%B3%95%E5%9B%BD%E7%BA%A2%E9%85%92
将以%号开头的gb2312编码转化为汉字
我的代码如下:
import urllib.parse
#urllib.parse.unquote(string,encoding ='utf-8',errors ='replace')key = '%B8%F1%C1%A6%CB%FE%C9%C8' #此编码格式为gb2312
key = urllib.parse.unquote(key,encoding='gb2312') #urllib.parse.unquote()的默认编码格式为‘utf-8’
print(key)name = '%E6%B3%95%E5%9B%BD%E7%BA%A2%E9%85%92' #此编码格式为utf-8
name = urllib.parse.unquote(name)
print(name)
打印结果:
格力塔扇
法国红酒
Python爬虫笔记——Url解码时,如何将汉字转化为以 %开头的 gb2312 编码 和 将以%号开头的编码转化为汉字 的示例相关推荐
- Python爬虫笔记
Python爬虫笔记 总体看过程 赋予地址 获取网页信息 获取网页中所需的信息 将得到所需的信息保存到硬盘 总体看过程 爬虫-从网络上爬取所需要的信息,怎么爬取?首先得知道你要去哪里获取(即地址,首先 ...
- python爬虫笔记第二章
前言 你好! 这是基于b站2021年路飞学成爬虫教程的python爬虫学习笔记,主要是方便作者复习和回顾课程内容. 已经发布了第一章和第二章,可以在主页中查看. python爬虫笔记(第二章) 前言 ...
- Python爬虫笔记(3)- 爬取丁香园留言
Python爬虫笔记(3)- 爬取丁香园留言 爬取丁香园留言:主要用到了模拟登录 爬取丁香园留言:主要用到了模拟登录 import requests, json, re, random,time fr ...
- Python爬虫:URL管理器及其实现方式、网页下载器、网页解析器原理及其实现原理!
Python爬虫之URL管理器: Python爬虫:URL管理器实现方式: Python爬虫之网页下载器: urllib2实现网页下载器的三种方法: 具体代码: ...
- Python爬虫笔记汇总
文中介绍的比较详细的有,requests库,urllib.request库,BeautifulSoup库,re库和正则表达式,Scrapy常用命令. 一.requests库 课程小案例 京东商品详情页 ...
- 嵩天老师python爬虫笔记整理week3
这里对北理爬虫课程第三周内容回顾,本周主要介绍了正则表达式 1.正则表达式的概念 正则表达式是用来简洁表达一组字符串的表达式 正则表达式是一种通用的字符串表达框架 进一步 正则表达式是一种针对字符串表 ...
- Python爬虫笔记——解析json数据(以周杰伦歌单为例)及Headers
一.Network Network能够记录浏览器的所有请求.我们最常用的是:ALL(查看全部)/XHR(仅查看XHR)/Doc(Document,第0个请求一般在这里),有时候也会看看:Img(仅查看 ...
- Python爬虫笔记——分析AJAX传递的JSON获取数据-初步分析动态网页
转载文章链接: Python爬虫:分析AJAX传递的JSON获取数据-初步分析动态网页(1) [4]实战:爬取动态网页的两种思路爬取新浪趣图(1) [5]实战:爬取动态网页的两种思路爬取新浪趣图(2) ...
- Python爬虫笔记——解决python 写入文件中文乱码问题
原链接: python 爬虫写入文件中文乱码问题解决 分析过程 根据网上的一些建议,将文件的打开编码改为 utf-8 ,结果跟本不起作用 奇怪的是用notepad 打开 csv 文件竟然显示正常,看来 ...
最新文章
- 分类问题-样本权重(sample_weight)和类别权重(class_weight)
- DDD 领域驱动设计:贫血模型、充血模型的深入解读!
- 开发音频频谱_ToneBoosters音频效果器插件合集
- Nginx 源码分析-- 模块module 解析执行 nginx.conf 配置文件流程分析 一
- 判断集合相等_数学启蒙的每个关键阶段之集合分类
- c study_13
- linux面试题(填空部分)
- SCAU高级语言程序设计--实验9 函数的应用(1)
- 泰勒公式(泰勒展开式)通俗+本质详解
- scikit-learn KNN实现糖尿病预测
- 博途数据类型wstring怎么用_西门子博图数据类型说明
- 2022 Java 知识点总结
- LTE传输模式(TM1 - TM9)
- RNN及变体LSTM、GRU(在NILM中的应用)
- 【电影评价】——可爱的电影适合可爱的你!!!一直更新中
- 重磅综述|Nat Rev Gastroenterol Hepatol:人类胃肠道中的产甲烷古菌
- RK3128适配RTL8723DU
- BitmapFactory.decodeStream接收servlet传回的图片数据流慢、卡死、延迟问题
- 域名和SSL证书是什么关系
- Drilling fluids recycling system for China Trenchless Company
热门文章
- 游戏服务器的架构演进、多进程架构通信
- songtaste资源下载程序
- 【nginx】proxy_temp目录权限问题【open() “proxy_temp/8/00/0000000008“ failed (13: Pe】
- books,图书管理
- 上海软件自动化测试培训,上海培训自动化测试(工业机器)
- PyQt5桌面应用开发(2):事件循环
- 【网络编程套接字(一)】
- chrome浏览器webdriver相关下载与使用方法
- day_14 常用API
- 2014款宝马I8插电式混合动力跑车将成为“蓝光”前灯的首秀:这是这一技术首次在欧洲汽车市场正式使用。