pyquery基本使用

  • 1.安装库
  • 2.pyquery基本使用
    • 2.1 导入库
  • 3. 元素查找
    • 3.1 css选择器查找
    • 3.2 链式查找
    • 3.3 后代选择器查找
    • 3.4 类元素查找
    • 3.5 attr,获取元素属性
    • 3.6 获取元素文本
    • 3.7 获取元素所有属性
  • 4. html元素修改
    • 4.1 after(),在标签后面添加新标签
    • 4.2 append(),在标签里面添加新标签
    • 4.3 修改属性
    • 4.4 删除属性
    • 4.5 删除标签

1.安装库

pip install pyquery

2.pyquery基本使用

2.1 导入库

from pyquery import PyQuery
# 加载html内容
p=PyQuery(html)

3. 元素查找

3.1 css选择器查找

a=p('a')

3.2 链式查找

a=p('li')('a')

3.3 后代选择器查找

a=p('li a')

3.4 类元素查找

a1=p1('.aaa a') # class="aaa"
a1=p1('#qq a')  # id="qq"

3.5 attr,获取元素属性

href=p1('#qq a').attr('href') # 拿属性,默认获取第一个

3.6 获取元素文本

text=p1('#qq a').text()   # 拿文本

3.7 获取元素所有属性

# 多个标签拿属性
its=p1('li a').items()
for it in its:href=it.attr('href')text=it.text()print(href,text)

4. html元素修改

4.1 after(),在标签后面添加新标签

p('div.a').after('<div class="c">我</div>')

4.2 append(),在标签里面添加新标签

p('div.a').append("<span>我</span>")

4.3 修改属性

p('div.bbb').attr('class','aaa')
# 新增属性, 前提是该标签没有这个属性
p('div.ccc').attr('id','aaa')

4.4 删除属性

p('div.ccc').remove_attr('id')

4.5 删除标签

p('div.ccc').remove()

pyquery基本使用相关推荐

  1. [Python爬虫] 之二十二:Selenium +phantomjs 利用 pyquery抓取界面网站数据

    一.介绍 本例子用Selenium +phantomjs爬取界面(https://a.jiemian.com/index.php?m=search&a=index&type=news& ...

  2. 爬虫--pyquery使用

    强大又灵活的网页解析库. 初始化 字符串初始化 html = ''' <div><ul><li class="item-0">first ite ...

  3. 【pyQuery】抓取startup news首页

    #! /usr/bin/python # coding: utf-8 from pyquery import PyQueryc=PyQuery('http://news.dbanotes.net/') ...

  4. [Python爬虫] 之三十:Selenium +phantomjs 利用 pyquery抓取栏目

    一.介绍 本例子用Selenium +phantomjs爬取栏目(http://tv.cctv.com/lm/)的信息 二.网站信息 三.数据抓取 首先抓取所有要抓取网页链接,共39页,保存到数据库里 ...

  5. ubuntu 10.04 安装 pyquery

    本以为安装会比较简单,谁知中间还是遇到了几个问题,一番尝试之后的安装过程,小结如下: apt-get install libxml2 libxml2-dev libxslt-dev apt-get i ...

  6. python3 pyquery模块 解析html网页

    pyquery库是jQuery的Python实现,可以用于解析HTML网页内容,使用方法: 代码如下: from pyquery import PyQuery as pq 1.可加载一段HTML字符串 ...

  7. 同花顺python_python的解析库pyquery解析并读取同花顺网站的焦点新闻

    代码如下: #本代码介绍requery第三方解析库的使用 #本代码用来读取同花顺网站的焦点新闻标题 #1.导入相应的模块 import requests from pyquery import PyQ ...

  8. 抓取猫眼电影top100的正则、bs4、pyquery、xpath实现方法

    import requests import re import json import time from bs4 import BeautifulSoup from pyquery import ...

  9. Python爬虫应用实战案例-pyquery在爬虫中的应用,爬取猫眼电影数据

    什么是pyquery pyquery是类似于jquery的网页解析工具,让你使用jquery的风格来遍历xml文档,它使用lxml操作html的xml文档,它的语法与jquery很像,和我们之前所讲的 ...

  10. Py之pyquery:pyquery的简介、安装、使用方法之详细攻略

    Py之pyquery:pyquery的简介.安装.使用方法之详细攻略 目录 pyquery的简介 pyquery的安装 pyquery的使用方法 pyquery的简介 pyquery允许您对xml文档 ...

最新文章

  1. electron 安装import_Electron: 从零开始写一个记事本app
  2. eclipse问题 - windows版
  3. 文件复制软件绿化之dos命令
  4. wxWidgets:stream流类概述
  5. 检索数据_20_按照字符串数字组合的排序
  6. Django从理论到实战(part45)--下载CSV文件
  7. ASP.NET MVC3 异步刷新
  8. 【剑指Offer,JS版本】二维数组中的查找
  9. spark 的RDD各种转换和动作
  10. 数据结构12: 实践项目之进制转换器
  11. Android Studio实现简单的QQ登录界面
  12. 百度地图导航工具类,包含骑行步行及驾车导航
  13. Bootstrap 学习笔记1 - CSS
  14. 让 snoop 支持 .NET Core WPF 调试
  15. 面试官问你Java线程池--怎么样回答才能让面试官知道你真的懂了!
  16. 利用VBA在Excel中批量画图
  17. Daughter of Deceit
  18. mysql 空间不够_mysql磁盘空间不够怎么办.md
  19. 兄弟连的兄弟来自西安
  20. 博科Brocads SAN交换机常用命令

热门文章

  1. 前程无忧揭晓2022年度中国典范雇主榜,129家雇主上榜 | 美通社头条
  2. UTF-8 8-bit Unicode Transformation Format 万国码
  3. 系统架构基础知识:软件生命周期
  4. IntelliJ IDEA 快速生成注释模板设置教程(超级详细)
  5. 赛元SC92F8463B/SC95F8523的PWM 实现无源蜂鸣器功能
  6. G7组合按键进入各种模式方法
  7. C++ JSON解析之jsoncpp库的使用
  8. web前端开发技术期末考试_web前端开发技术试卷六
  9. 什么充电宝物美价廉?物美价廉的充电宝推荐
  10. cpu throttle原理浅析