python3读文件编码格式_使用不同的编码格式读取文件系统标准在Python3中
我有很多文件(用utf8或gbk编码)。我的系统编码是utf-8(LANT=zh_中国UTF-8) ,所以我可以很容易地读取用utf8编码的文件。但我必须用gbk读取文件编码,如下所示(Python 3: How to specify stdin encoding):import sys
import io
input_stream = io.TextIOWrapper(sys.stdin.buffer, encoding='gbk')
for line in input_stream:
print(line)
我的问题是如何使用标准输入. 或者你能给我一些更好的解决办法吗?谢谢~
---------------我的问题之前不清楚,我会补充更多的信息----------------
简而言之,我想处理这样的文件:
^{pr2}$
*.in表示许多用utf8或gbk编码的文件。在
如果我在处理程序.py. 在for line in sys.stdin:
...some code
遇到gbk文件时,会抛出错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte
如果我使用这样的代码:input_stream = io.TextIOWrapper(sys.stdin.buffer, encoding='gbk')
for line in input_stream:
...some code
遇到utf8文件时,会抛出错误:UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 25: illegal multibyte sequence
我想找到一种安全的方法来处理两种类型的文件(utf8和gbk)。谢谢你的帮助
-------------------------问题已解决--------------------------------
感谢@tripleee和其他人的帮助!我终于用下面的代码解决了我的问题。在buffer_reader = sys.stdin.buffer
for line in buffer_reader:
line = line.strip()
try:
content = line.decode('utf-8')
except UnicodeDecodeError:
content = line.decode('gbk')
python3读文件编码格式_使用不同的编码格式读取文件系统标准在Python3中相关推荐
- python3读文件中文_详解Python3解决读取中文文件txt编码的问题
import jieba import jieba.analyse from matplotlib import pyplot as plt from scipy.misc import imread ...
- python找不到文件数据_如何用 Python 正确读取资源文件
我们知道,当你把一个资源文件和一个.py文件放在一起的时候,你可以直接在这个.py文件中,使用文件名读取它.例如: 运行效果如下图所示: 但请注意,这里我是直接运行的read.py这个文件.如果资源文 ...
- java单元测试读文件数据_如何将文本文件资源读入Java单元测试?
本问题已经有最佳答案,请猛点这里访问. 我有一个单元测试需要使用位于src/test/resources/abc.xml中的XML文件.把文件的内容放到String中最简单的方法是什么? 另外,sta ...
- python怎么读文件里的某一行-python如何读取文件中的某几行
python读取文件的指定行,可以使用以下的方法 1.os.mknod("test.txt") #创建空文件 2.fp = open("test.txt",w) ...
- dockerfile 修改文件权限_网易技术实践|Docker文件系统实战
在本文中,我们来实战构建一个Docker镜像,然后实例化容器,在Docker的生命周期中详细分析一下Docker的文件存储情况和DockerFile优化策略. 在开始实战之前,我们先介绍一个概念,联合 ...
- python3转为unicode编码_「小技能get记」· 如何用python3解码unicode
注:#小技能get记#,主要是为了记录日常生活.工作.学习中,get到的一些小小技能,希望可以帮助自己巩固知识,如果正好也能帮助需要的你,那就更好啦! 小小进步,天天get-- 1.故事背景 热爱学习 ...
- caj文件浏览器_解决CAJ阅读器读取学位论文卡到爆炸的问题
0. 绪论 相信很多研究僧在查阅文献的过程中,都免不了查阅大量的博硕论文,但是知网的CAJ阅读器真的是卡到爆炸(卡到怀疑我的i7-8750H怀疑人生),非常影响心情.首先查阅到知乎@Mooooooli ...
- python ini文件 遍历_【自动化测试】Python 读取 .ini 格式文件
大家应该接触过.ini格式的配置文件.配置文件就是把一些配置相关信息提取出去来进行单独管理,如果以后有变动只需改配置文件,无需修改代码.特别是后续做自动化的测试,需要拎出一部分配置信息,进行管理.比如 ...
- Java多种方式读文件,追加文件内容,等对文件的各种操作
一.多种方式读文件内容.1.按字节读取文件内容 2.按字符读取文件内容 3.按行读取文件内容 4.随机读取文件内容 import java.io.BufferedReader;import java. ...
最新文章
- 下一代防火墙的5个优点
- Maven 的dependency 的 classifier的作用
- 频率概率与贝叶斯概率
- linux实验目的能学会什么意思,Linux实验.doc
- Java GC系列(4):垃圾回收监视和分析
- TCP的2MSL问题
- VS2013 加快编译速度 的方法整理
- linux 父子进程结束,Linux下让父进程结束后,子进程自动结束
- cad lisp 两侧偏移并删除_CAD做钣金件展开的原理你知道吗?
- arraylist插入数据_集合系列 List(二):ArrayList
- python语言程序设计是干什么的-Python语言程序设计
- 团队作业-第1周-提交处-团队组建及项目启动
- D1、D系列分辨率是多少
- ssh实现远程登录服务器
- 【整理】system\app中的APK一览
- python 列表嵌套 元素全部相同
- java mp3合并_java如何实现把两首MP3一系列的帧进行合并
- 帝国源码php安装文件是哪个,帝国CMS数据库配置文件是哪个文件?
- win10操作系统官网如何下载ios境像文件安装操作系统
- 飞桨领航团AI达人创造营第一课2021.7.26