HTMLParser模块怎么在python中使用

发布时间:2021-02-09 09:29:29

来源:亿速云

阅读:82

作者:Leah

今天就跟大家聊聊有关HTMLParser模块怎么在python中使用,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

安装:npm install htmlparser

htmlparser提供构造函数:function Parser(handler) {

this._handler = handler;

}

HTMLParser解析HTML:from html.parser import HTMLParser

from html.entities import name2codepoint

class MyHTMLParser(HTMLParser):

def handle_starttag(self, tag, attrs):

print('' % tag)

def handle_endtag(self, tag):

print('%s>' % tag)

def handle_startendtag(self, tag, attrs):

print('' % tag)

def handle_data(self, data):

print(data)

def handle_comment(self, data):

print('')

def handle_entityref(self, name):

print('&%s;' % name)

def handle_charref(self, name):

print('%s;' % name)

parser = MyHTMLParser()

parser.feed('''

Some html HTML tutorial...
END

''')

HTML本质上是XML的子集,但是HTML的语法没有XML那么严格,大家也可以尝试利用HTMLParser解析HTML。

知识点扩展:

常用方法介绍

l feed(data):主要用于接受带html标签的str,当调用这个方法时并提供相应的data时,整个实例(instance)开始执行,结束执行close()。

l handle_starttag(tag, attrs):这个方法接收Parse_starttag返回的tag和attrs,并进行处理,处理方式通常由使用者进行覆盖,本身为空。

例如,连接的start tag是,那么对应的参数tag='a'(小写)。attrs是start tag <>中的属性,以元组形式(name, value)返回(所有这些内容都是小写)。

例如,对于

python htmlparser怎么用_HTMLParser模块怎么在python中使用相关推荐

  1. python哪个关键字可以导入模块_关于python导入模块import与常见的模块详解

    0.什么是python模块?干什么的用的? Java中如果使用abs()函数,则需要需要导入Math包,同样python也是封装的,因为python提供的函数太多,所以根据函数的功能将其封装在不同的m ...

  2. python如何查看有什么模块_在python中如何查看模块功能

    在python中查看模块功能的方法:1.在python命令行输入help()函数进入help帮助文档界面:2.键入[modules]列出当前所有安装的模块:3.键入相应的模块名称即可得到该模块的功能信 ...

  3. c调用python代码找不到模块_构建 Python C 扩展模块

    有好几种扩展 Python 的功能的方法.其中一种就是用 C 或 C++ 编写 Python 模块.通过这个过程可以提高性能,更好地访问 C 库函数和系统调用.在本教程中,我将带大家了解如何使用 Py ...

  4. python英译汉库模块_翻译|Python标准功能库1

    上班的时候偷懒,把Python帮助里的标准功能库1过了一遍,顺便翻译了一下,虽然我知道基本没有人看,但不是说21世纪编程能力是基本的生存力嘛. 通过阅读本文,你将了解Python的11个标准功能库1. ...

  5. 一个完整的python文件即是一个模块_用python玩转数据|基本语法

    比较运算符 >>>3<4<7 True >>>3<4<1 False >>> 打开文件 >>> f=op ...

  6. 一个完整的python文件即是一个模块_用Python玩转数据:python的函数、模块和包

    标签: Python函数 函数可以看成类似于数学中的函数,完成一个特定功能的一段代码. -绝对值函数 abs() -类型函数 type() -四舍五入函数 round() Python中有很多内建函数 ...

  7. python调用jar包的模块_使用 Python 的 JPype 模块调用 Jar 包

    背景与需求 最近学习并安装使用了HttpRunner框架去尝试做接口测试,并有后续在公司推广的打算. HttpRunner由Python开发,调用接口时需要依赖Python:而大多数公司的扩展工具包使 ...

  8. python解析html用哪个模块_[转载]python模块学习---HTMLParser(解析HTML文档元素)

    HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析. 本文主要简单讲一下HTMLParser的用法. 使用时需要定义一个从类HTMLParser继承的类,重定义 ...

  9. python导入自己写的模块_大话python模块导入

    对于完成一些简单任务的程序我们编写一个源文件是可以的,但对于稍微复杂点的程序或大型程序时,我们往往需要把这个复杂任务按照一定的规则拆分成多个python文件来实现,最后再把多个文件组合在一起就可以了, ...

最新文章

  1. 鸿蒙电视哔哩哔哩,[4K视频] 65寸智能电视只要3299元?荣耀智慧屏X1开箱
  2. sql 怎样 得到 的客户端的ip地址_怎样用卷发棒?正确用法大揭密-装修攻略
  3. 2021年人工神经网络第四次作业:基于MATLAB的求解
  4. HDU多校5 - 6816 Boring Game(模拟)
  5. 【电路补习笔记】5、三极管的参数与选型
  6. k8s 查看pod流量_Kubernetes K8S之Pod生命周期与探针检测
  7. HDU - 4305 - Lightning 生成树计数 + 叉积判断三点共线
  8. Laravel最佳实践--事件驱动编程
  9. HDU 6274 Master of Sequence (暴力+下整除)
  10. 卧槽,又来一个 Java 大神器!!
  11. 081 re正则表达式模块
  12. Word技巧:快速将不同字数的姓名对齐
  13. 计算机常用端口号以及对应服务总结
  14. Chromium OS Autotest 服务端测试
  15. 如何使用阿里云的NAS云文件存储服务
  16. 用QEMU搭建arm开发环境之一:QEMU能干啥
  17. 纯html+css打造一款特殊的生日贺卡
  18. 卷积码编码和BCJR译码
  19. 破解利器C32Asm和IDApro
  20. Pycharm 引入类报错Unresolved reference ‘attempt_load‘

热门文章

  1. Qt之实现录音播放及raw(pcm)转wav格式
  2. 解决ERROR: cannot drop schema sc_base_1 because other objects depend on it.模式级联删除
  3. 储能电站建设运行及效益分析
  4. jquary学习之路--2
  5. 企业邮箱搭建费用,smtp邮件系统怎么搭建?验证码邮件群发,有哪些推荐邮件群发系统?
  6. Easy AR简单教程
  7. GacUI:XML Resource
  8. 基于改进YOLOv5的斑马线和汽车过线行为检测
  9. centos7花里胡哨之桌面美化
  10. ssm毕设项目哈尔滨市合欢婚庆公司管理588fz(java+VUE+Mybatis+Maven+Mysql+sprnig)