pyquery基本使用
pyquery基本使用
- 1.安装库
- 2.pyquery基本使用
- 2.1 导入库
- 3. 元素查找
- 3.1 css选择器查找
- 3.2 链式查找
- 3.3 后代选择器查找
- 3.4 类元素查找
- 3.5 attr,获取元素属性
- 3.6 获取元素文本
- 3.7 获取元素所有属性
- 4. html元素修改
- 4.1 after(),在标签后面添加新标签
- 4.2 append(),在标签里面添加新标签
- 4.3 修改属性
- 4.4 删除属性
- 4.5 删除标签
1.安装库
pip install pyquery
2.pyquery基本使用
2.1 导入库
from pyquery import PyQuery
# 加载html内容
p=PyQuery(html)
3. 元素查找
3.1 css选择器查找
a=p('a')
3.2 链式查找
a=p('li')('a')
3.3 后代选择器查找
a=p('li a')
3.4 类元素查找
a1=p1('.aaa a') # class="aaa"
a1=p1('#qq a') # id="qq"
3.5 attr,获取元素属性
href=p1('#qq a').attr('href') # 拿属性,默认获取第一个
3.6 获取元素文本
text=p1('#qq a').text() # 拿文本
3.7 获取元素所有属性
# 多个标签拿属性
its=p1('li a').items()
for it in its:href=it.attr('href')text=it.text()print(href,text)
4. html元素修改
4.1 after(),在标签后面添加新标签
p('div.a').after('<div class="c">我</div>')
4.2 append(),在标签里面添加新标签
p('div.a').append("<span>我</span>")
4.3 修改属性
p('div.bbb').attr('class','aaa')
# 新增属性, 前提是该标签没有这个属性
p('div.ccc').attr('id','aaa')
4.4 删除属性
p('div.ccc').remove_attr('id')
4.5 删除标签
p('div.ccc').remove()
pyquery基本使用相关推荐
- [Python爬虫] 之二十二:Selenium +phantomjs 利用 pyquery抓取界面网站数据
一.介绍 本例子用Selenium +phantomjs爬取界面(https://a.jiemian.com/index.php?m=search&a=index&type=news& ...
- 爬虫--pyquery使用
强大又灵活的网页解析库. 初始化 字符串初始化 html = ''' <div><ul><li class="item-0">first ite ...
- 【pyQuery】抓取startup news首页
#! /usr/bin/python # coding: utf-8 from pyquery import PyQueryc=PyQuery('http://news.dbanotes.net/') ...
- [Python爬虫] 之三十:Selenium +phantomjs 利用 pyquery抓取栏目
一.介绍 本例子用Selenium +phantomjs爬取栏目(http://tv.cctv.com/lm/)的信息 二.网站信息 三.数据抓取 首先抓取所有要抓取网页链接,共39页,保存到数据库里 ...
- ubuntu 10.04 安装 pyquery
本以为安装会比较简单,谁知中间还是遇到了几个问题,一番尝试之后的安装过程,小结如下: apt-get install libxml2 libxml2-dev libxslt-dev apt-get i ...
- python3 pyquery模块 解析html网页
pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,使用方法: 代码如下: from pyquery import PyQuery as pq 1.可加载一段HTML字符串 ...
- 同花顺python_python的解析库pyquery解析并读取同花顺网站的焦点新闻
代码如下: #本代码介绍requery第三方解析库的使用 #本代码用来读取同花顺网站的焦点新闻标题 #1.导入相应的模块 import requests from pyquery import PyQ ...
- 抓取猫眼电影top100的正则、bs4、pyquery、xpath实现方法
import requests import re import json import time from bs4 import BeautifulSoup from pyquery import ...
- Python爬虫应用实战案例-pyquery在爬虫中的应用,爬取猫眼电影数据
什么是pyquery pyquery是类似于jquery的网页解析工具,让你使用jquery的风格来遍历xml文档,它使用lxml操作html的xml文档,它的语法与jquery很像,和我们之前所讲的 ...
- Py之pyquery:pyquery的简介、安装、使用方法之详细攻略
Py之pyquery:pyquery的简介.安装.使用方法之详细攻略 目录 pyquery的简介 pyquery的安装 pyquery的使用方法 pyquery的简介 pyquery允许您对xml文档 ...
最新文章
- electron 安装import_Electron: 从零开始写一个记事本app
- eclipse问题 - windows版
- 文件复制软件绿化之dos命令
- wxWidgets:stream流类概述
- 检索数据_20_按照字符串数字组合的排序
- Django从理论到实战(part45)--下载CSV文件
- ASP.NET MVC3 异步刷新
- 【剑指Offer,JS版本】二维数组中的查找
- spark 的RDD各种转换和动作
- 数据结构12: 实践项目之进制转换器
- Android Studio实现简单的QQ登录界面
- 百度地图导航工具类,包含骑行步行及驾车导航
- Bootstrap 学习笔记1 - CSS
- 让 snoop 支持 .NET Core WPF 调试
- 面试官问你Java线程池--怎么样回答才能让面试官知道你真的懂了!
- 利用VBA在Excel中批量画图
- Daughter of Deceit
- mysql 空间不够_mysql磁盘空间不够怎么办.md
- 兄弟连的兄弟来自西安
- 博科Brocads SAN交换机常用命令