lxml解析html报错
报错如下:
lxml.etree.XMLSyntaxError: Opening and ending tag mismatch: meta line 4 and
例子:
html_str = ''' <html lang="en"> <head><meta charset="UTF-8"><title>The Dormouse's story</title> </head> <body> <p class="title"><b>The Dormouse's story</b></p> <p class="story">Once upon a time there were three little sisters;and their names were<a href="http://example.com/elsie" class="sister" id="link1"><!--Elsie--></a>,<a href="http://example.com/lacie" class="sister" id="link2"><!--Lacie--></a>and <a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>;and they lived at the boottom of a well. </p> <p class="story">...</p> </body> </html> '''
from lxml import etree
html = etree.parse('index.html')
result = etree.tostring(html,pretty_print=True)
print result
改为
from lxml import etree
parser = etree.HTMLParser(encoding='utf-8')
html = etree.parse('index.html',parser=parser)
result = etree.tostring(html,pretty_print=True)
print result
参考文档:
https://blog.csdn.net/qq_38418803/article/details/108630379
lxml解析html报错相关推荐
- 记录版本更新安装时解析包报错
记录版本更新安装时解析包报错 2020-07-09 17:05:52.785 24157-24213/? W/OPInstallStaging: Error staging apk from cont ...
- jwt解析token报错:Signed Claims JWSs are not supported.
jwt解析token报错:Signed Claims JWSs are not supported. Exception in thread "main" io.jsonwebto ...
- JSON.parse解析特殊字符报错解决方案
2019独角兽企业重金招聘Python工程师标准>>> 具体案例: 页面点击"下一任务" 会去请求后台,这里出现的问题是有虚拟任务的时候.然后会返回一个map,也 ...
- 利用json模块解析dict报错找不到attribute 'dumps'[python2.7]
[背景] 环境: RHEL 7.3 版本: python2.7 [错误情况] 写了一个简单的python脚本 将dict转换为json 脚本如下: #!/usr/bin/python #-*- cod ...
- Logstash5.4.1解析日志报错处理
下载最新的logstash5.4.1打开把之前的配置文件加入进去,启动logstash提示报错了,未使用geoip插件的配置文件正常启动.按照提示发现是maxmind的数据库解析出错,重新至maxmi ...
- 微信小程序 - 页面跳转传参 JSON.parse 解析失败报错(SyntaxError: Unexpected end of JSON input)解决方案
报错信息 报错原因 特殊字符:英文(半角)状态的 单引号 ' 双引号" 斜杠 \ 反斜杠 / and符号& 大于号 > 小于号 < 空格等. 常见的场景是页面携带的参数中 ...
- js解析json报错
问题出现: 在用ajax请求数据的时候,我们经常会用到eval来解析json格式数据,但是很多时候我们明明json格式是正确的但总是报index:1错误,这让人很恼火!!!网上很多回答试了很多也不行, ...
- java解析excel报错,poi解析excel文件报错
getFileMagic() only operates on streams which support mark(int) 使用 bis 解决 BufferedInputStream bis = ...
- sass-loader高版本问题,解析就报错!!
安装了sass-loader8.0版本后,webpack解析出现了报错,如下: Module build failed: TypeError: this.getResolve is not a fun ...
最新文章
- 7-26 单词长度 (C语言)
- Redis 数据结构的底层实现 (二) dict skiplist intset
- oracle命令格式,OraCmD(Oracle命令行工具) V3.1 官方版
- 手机浏览器页面知识收集
- 神策 FM:从 IT 到 DT,To B 市场走到了哪一步?
- Lua语言教程2 ——【表(Table) 类型】
- C++中数字与字符串之间的转换 scanf string总结(复习必读)
- SAP 电商云 Spartacus 5_0.md 迁移文档的编写格式
- uva 1632——Alibaba
- 几时几分几秒怎么写_泼尿 涂油漆 写威胁语 业主莫名被骚扰
- 支持windows 8的虚拟机软件
- 将Object对象转成 json串
- 为何最简单的破坏命令通过了众多杀软
- 简单matlab插值函数
- UCI on PUSCH
- 使用QT开发的简易音乐播放器
- 【机器学习基础】CH2 - 监督学习(5)决策树
- Java奇怪的位移_Java中位移的疑惑
- 渗透测试-11种绕过CDN查找真实IP的方法
- list_ndarray_csr_lil占用空间比较
热门文章
- 17965 幸运之星(优先做)
- 从Oracle新特性看数据库发展
- 百度地图获得POI及python实现
- Linux连不上网、常见网络错误
- 长城台式微型计算机开不了机,台式电脑开不了机怎么办?六个秒招教你排查电脑无法开机的故障所在...
- Github每日精选:连续霸榜 比 ping 强大百倍的可视化工具gping
- Python:ffmpeg修改视频分辨率
- Linux的打包命令都有哪些呢?
- 网页视频播放方案-jaris flv player和ckplayer
- oppor17山寨机的特点_OPPOR17最严重缺点 OPPOR17值得购买吗