使用python爬虫爬取规则数据后转化成来List格式,将其存储在.csv 文件中
使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position … 这个问题。 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗?不是的。 很多时候,我们使用了decode和encode,试遍了各种编码,utf8,utf-8,gbk,gb2312等等,该有的编码都试遍了,可是编译的时 候仍然出现: UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position XXX。 崩溃了。

我遇到的问题:

1.使用open("xxxx.csv",'w',newline='',encoding='utf-8')把数据存储在csv文件后,能够全部存储,但是乱码了,猜测是编码集不匹配造成的

2.使用open("xxxx.csv",'w',newline='',encoding='gbk')把数据存储在csv文件后,只能存储list集合中前面几个数据,中途终止且报错UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX,猜测原因:数据中包含一些gbk无法显示的字符,导致报错说gbk无法编码。

【解决办法】
方案1:
在对unicode字符编码时,添加ignore参数,忽略无法无法编码的字符,这样就可以正常编码为GBK了。
对应代码为:
print myUnWebItems.encode(“GBK“, ‘ignore’);
方案2:
或者,因为gbk有显示不了的字符,那么使用GBK编码的超集GB18030 (即,GBK是GB18030的子集):


诸事顺利了


数据存储在.csv文件乱码,数据写入才一部分就报错'gbk' codec can't encode character '\xee' in position 45: illegal multibyte相关推荐

  1. python 写数据入文件碰见的bug:UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xee‘ in position 21865:

    问题描述 获取网页数据时,避免多次获取被封ip,先将获取的数据给存成文件,发现解码后存入报错了 data = respon.read().decode("utf-8")file = ...

  2. Python 基于csv 读取文本文件提示:‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence

    报错 Python 基于csv 读取文本文件提示:'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequenc ...

  3. python中txt文件读取错误原因以及解决办法‘gbk‘ codec can‘t decode byte 0x80 in position 2: illegal multibyte sequence

    python的读写文件操作时,有时候会出现一些小问题,详细如下,(原因在前面,解决办法在文末). 读取txt文件时出现错误反馈如下: Traceback (most recent call last) ...

  4. python读取csv文件‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence

    encoding='utf-8 加上即可

  5. Matlab 变量保存csv:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xfb in position 4: illegal multiby

    Matlab 中的变量保存到本地txt或csv格式 positionerror2:为Matlab变量数据 xlswrite('C:\Users\Administrator\Desktop\candat ...

  6. python:读取文件内容解码 编码错误 UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xab in position 2: illegal

    一.错误1(代码如下):UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 2: illegal multibyte ...

  7. python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib

    python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib ...

  8. scrapy实战----将数据存储到csv文件和MySQL数据库中

    本章将通过爬取51jobs求职网站中的python职位信息来实现不同方式的数据存储的需求. github地址--->源代码 我们先来看一下:51jobs网站 我们需要的数据有,职位名 公司名 工 ...

  9. python打开xml文件报错:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xb7 in position 58: illegal multi

    本篇文章主要讲解,python打开xml文件报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xb7 in position 58: ille ...

最新文章

  1. 查询数据库表名,数据表信息,MySQL Key值(PRI, UNI, MUL)的含义
  2. 【加速实践】番外篇:numbajit
  3. 08 redis数据类型:hash
  4. 辽宁交通高等专科学校有计算机专业吗,辽宁省交通高等专科学校可以转专业吗,辽宁省交通高等专科学校新生转专业政策...
  5. 按住 ctrl 并滚动鼠标滚轮才可缩放地图_Firefox 73 将引入全局缩放功能,在所有网站都可适用...
  6. Master HA源码解析
  7. 2018-2019-1 20189210 《LInux内核原理与分析》第四周作业
  8. python 字符串替换_python字符串替换的2种方法
  9. 判断一个变量是否在一个数组里
  10. winform窗体在桌面右下角显示(任务栏上方)
  11. Axure RP 9基础教程(3)——添加图标元件
  12. 搭建 Harbor v2.2.0 docker私库
  13. 计算机网络情景分析 写在开始
  14. odoo服务器设置说明
  15. CSS3知识点笔记————基础(五星)
  16. ESP-BOX LVGL ask_wdt: Task watchdog got triggered问题 物联网
  17. easyflash源码分析流程图
  18. 22款奔驰C260L升级原厂360全景影像 倒车更加直观
  19. 我的生活(小兵,班长,连长....大将)
  20. 模块独立(耦合性与内聚性)

热门文章

  1. 使用 JSONP、jQuery 和 Yahoo! 查询语言构建 mashup
  2. 雷柏无线键盘linux驱动程序,虚拟键盘驱动程序
  3. Qualcomm luma的理解
  4. 集聚新潮流:iOS音乐合成器七大亮星
  5. mongodb管理工具下载
  6. IC研发常用英文术语缩写
  7. 最有名的文字冒险游戏 – 巨洞冒险
  8. SAP与ORACLE的区别分析及对比
  9. 啸叫抑制算法 ------陷波器
  10. 读书笔记-《你好哇,程序员》-安晓辉:把自己当作最后一道防线