报错如下:

lxml.etree.XMLSyntaxError: Opening and ending tag mismatch: meta line 4 and

例子:
html_str = '''
<html lang="en">
<head><meta charset="UTF-8"><title>The Dormouse's story</title>
</head>
<body>
<p class="title"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters;and their names were<a href="http://example.com/elsie" class="sister" id="link1"><!--Elsie--></a>,<a href="http://example.com/lacie" class="sister" id="link2"><!--Lacie--></a>and <a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>;and they lived at the boottom of a well.
</p>
<p class="story">...</p>
</body>
</html>
'''

from lxml import etree

html = etree.parse('index.html')

result = etree.tostring(html,pretty_print=True)

print result

改为

from lxml import etree
parser = etree.HTMLParser(encoding='utf-8')
html = etree.parse('index.html',parser=parser)
result = etree.tostring(html,pretty_print=True)
print result

参考文档:

https://blog.csdn.net/qq_38418803/article/details/108630379

lxml解析html报错相关推荐

  1. 记录版本更新安装时解析包报错

    记录版本更新安装时解析包报错 2020-07-09 17:05:52.785 24157-24213/? W/OPInstallStaging: Error staging apk from cont ...

  2. jwt解析token报错:Signed Claims JWSs are not supported.

    jwt解析token报错:Signed Claims JWSs are not supported. Exception in thread "main" io.jsonwebto ...

  3. JSON.parse解析特殊字符报错解决方案

    2019独角兽企业重金招聘Python工程师标准>>> 具体案例: 页面点击"下一任务" 会去请求后台,这里出现的问题是有虚拟任务的时候.然后会返回一个map,也 ...

  4. 利用json模块解析dict报错找不到attribute 'dumps'[python2.7]

    [背景] 环境: RHEL 7.3 版本: python2.7 [错误情况] 写了一个简单的python脚本 将dict转换为json 脚本如下: #!/usr/bin/python #-*- cod ...

  5. Logstash5.4.1解析日志报错处理

    下载最新的logstash5.4.1打开把之前的配置文件加入进去,启动logstash提示报错了,未使用geoip插件的配置文件正常启动.按照提示发现是maxmind的数据库解析出错,重新至maxmi ...

  6. 微信小程序 - 页面跳转传参 JSON.parse 解析失败报错(SyntaxError: Unexpected end of JSON input)解决方案

    报错信息 报错原因 特殊字符:英文(半角)状态的 单引号 ' 双引号" 斜杠 \ 反斜杠 / and符号& 大于号 > 小于号 < 空格等. 常见的场景是页面携带的参数中 ...

  7. js解析json报错

    问题出现: 在用ajax请求数据的时候,我们经常会用到eval来解析json格式数据,但是很多时候我们明明json格式是正确的但总是报index:1错误,这让人很恼火!!!网上很多回答试了很多也不行, ...

  8. java解析excel报错,poi解析excel文件报错

    getFileMagic() only operates on streams which support mark(int) 使用 bis 解决 BufferedInputStream bis = ...

  9. sass-loader高版本问题,解析就报错!!

    安装了sass-loader8.0版本后,webpack解析出现了报错,如下: Module build failed: TypeError: this.getResolve is not a fun ...

最新文章

  1. 7-26 单词长度 (C语言)
  2. Redis 数据结构的底层实现 (二) dict skiplist intset
  3. oracle命令格式,OraCmD(Oracle命令行工具) V3.1 官方版
  4. 手机浏览器页面知识收集
  5. 神策 FM:从 IT 到 DT,To B 市场走到了哪一步?
  6. Lua语言教程2 ——【表(Table) 类型】
  7. C++中数字与字符串之间的转换 scanf string总结(复习必读)
  8. SAP 电商云 Spartacus 5_0.md 迁移文档的编写格式
  9. uva 1632——Alibaba
  10. 几时几分几秒怎么写_泼尿 涂油漆 写威胁语 业主莫名被骚扰
  11. 支持windows 8的虚拟机软件
  12. 将Object对象转成 json串
  13. 为何最简单的破坏命令通过了众多杀软
  14. 简单matlab插值函数
  15. UCI on PUSCH
  16. 使用QT开发的简易音乐播放器
  17. 【机器学习基础】CH2 - 监督学习(5)决策树
  18. Java奇怪的位移_Java中位移的疑惑
  19. 渗透测试-11种绕过CDN查找真实IP的方法
  20. list_ndarray_csr_lil占用空间比较

热门文章

  1. 17965 幸运之星(优先做)
  2. 从Oracle新特性看数据库发展
  3. 百度地图获得POI及python实现
  4. Linux连不上网、常见网络错误
  5. 长城台式微型计算机开不了机,台式电脑开不了机怎么办?六个秒招教你排查电脑无法开机的故障所在...
  6. Github每日精选:连续霸榜 比 ping 强大百倍的可视化工具gping
  7. Python:ffmpeg修改视频分辨率
  8. Linux的打包命令都有哪些呢?
  9. 网页视频播放方案-jaris flv player和ckplayer
  10. oppor17山寨机的特点_OPPOR17最严重缺点 OPPOR17值得购买吗