Pandas.read_csv格式奇怪的问题

除了常见的utf-8,gbk,今天发现还有utf-8-sig

用默认格式打开是这样的:

明显是编码问题,但是用utf-8打开文件发现是这样的:

用open打开文件看到是这样的:

可以看到在文件的首部有一个\ufeff字段,那么feff是什么意思呢?
feff是一个BOM(Byte Order Mark),是一个不显示的标识字段,在utf-16或者utf-32等中,feff放在首位表示字节流高位在前还是低位在前;
但是一般的utf-8是不需要BOM的,为了解决这个问题,我们采用utf-8-sig编码打开csv文件,可以看到已经正常了:

总结:在遇到编码问题的时候,除了考虑gbk(国标扩)和utf-8之外,记得检查一下BOM等不可见但作怪的字符,用open直接打开文件看一看,回到最基础的层面往往能看的更清楚。

pd.read_csv()中encoding='utf-8'和'utf-8-sig'的区别相关推荐

  1. pd.read_csv,Error tokenizing data. C error: Expected 1 fields in line 2786, saw 2

    使用data = pd.read_csv("E:/test/datas/new/11-new.txt",encoding="utf-8",header=None ...

  2. python读取csv文件忽略空值_如何跳过/忽略csv文件中的空字节pd.read_csv?

    我有一个.csv文件,它有数百行/列,看起来像这样(小例子,请参阅图片,我无法复制/粘贴空字节必须手动键入它们):9142,16.04000000,14.65000000 <0x00>&l ...

  3. pd.read_csv用法

    pd.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None ...

  4. pd.read_csv读取txt时整型变成浮点型问题解决

    https://zhuanlan.zhihu.com/p/27440031 pandas中读取csv文件通常使用pd.read_csv()函数,正常情况下给出文件路径即可读取数据,不过在某些特殊情况下 ...

  5. python的read_csv_python,pd.read_csv成熟导入

    我需要导入 pd.read_csv 重复输入为 第一次我导入 node_t1 = pd.read_csv('5mins/nodes/N122') node_t2 = pd.read_csv('10mi ...

  6. pandas —— pd.read_csv 与df.to_csv

    对 DataFrame 对象迭代得到的是其各个属性列的列名,自然为 list 类型: 0. read_csv 与 df.to_csv df.to_csv na_rep='NA':缺失值替换为NA he ...

  7. pd.read_csv处理含中文的文件

    使用pd.read_csv读入含中文的csv文件时,会出现错误,需要设置encoding参数,命令如下: import pandas as pdafile=pd.read_csv("test ...

  8. pd.read_csv报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc8 in position 0: invalid contin

    报错代码: data = pd.read_csv('90data.csv') # 读取数据 解决方案: data = pd.read_csv('90data.csv', encoding= 'ISO- ...

  9. pd.read_csv()中文乱码,解决方法

    方法一:            df = pd.read_csv('1.csv', engine='python') 方法二:            df = pd.read_csv('1.csv', ...

最新文章

  1. nginx 反向代理和负载均衡
  2. 【Fanvas技术解密】HTML5 canvas实现脏区重绘
  3. 【软件开发】制作个人移动式Git服务器
  4. 程序员经常说的「设计模式」到底是什么?
  5. 使用缓存的9大误区(上)(转)
  6. linux安装python_如何在 Windows 上安装 Python | Linux 中国
  7. 新hp设备无法连接到计算机,联想的台式机,用的win7系统,无法装惠普1108打印机驱动,一直显示新设备现已连接,然后无限循环!!!...
  8. 如何做好学术演讲-01
  9. 如何在Excel选取想要的数据(特定行)
  10. 彻底研究jQuery教程
  11. 华为计算机的隐藏应用程序,华为平板5怎么隐藏软件 荣耀5平板怎么隐藏应用程序?...
  12. 怎么给PDF添加页面?推荐三个PDF如何插入页面小妙招
  13. 【spring 的 init and destory 方法】
  14. 入IC行业,需不需要找培训机构
  15. 服务器dump文件位置,为服务器核心安装配置内存转储文件
  16. 计算机图形学对勾函数,高一数学 : 最全函数图像汇总,不看准后悔!
  17. 1. 创建第一个harmonyos工程
  18. HoloLens论文笔记01
  19. matlab路面功率谱密度的代码,[转载]转:matlab求功率谱密度代码实例
  20. B12xx 的XP驱动

热门文章

  1. 《博客园精华集》WebService 篇(共79篇)
  2. Tsai库---分享一个好用的时间序列库
  3. Sql Server中and和or的优先级问题
  4. echarts中的map地图的使用
  5. 橱窗带货的视频素材在哪里找?新手做带货原创短视频哪里下载?
  6. 中基鸿业选择互联网理财不可忽视的几大事项
  7. PageAdmin环境配置要求
  8. 飞利浦Evnia 34M2C8600 显示器 评测
  9. 基于android平台的手机游戏的设计与实现,基于Android平台手机游戏社区的设计与实现...
  10. U-Boot的内存分布图