• 10分钟 GET 新技能 - CSS选择器

    • 1. CSS选择器是什么?
    • 2. CSS选择器 的基本规则
    • 3. Python 流行库 BeautifulSoup 中使用 CSS选择器

10分钟 GET 新技能 - CSS选择器

1. CSS选择器是什么?

CSS选择器 就是 选择 XML文件/HTML文件节点路径表达式

2. CSS选择器 的基本规则

表达式 描述
tagname 从当前节点向下的标签名称
#idname 根据id选择
.classname 根据class选择

3. Python 流行库 BeautifulSoup 中使用 CSS选择器

from bs4 import BeautifulSouptext = u"""
<ul><li class="blog-unit"><a href="/first">第一个</a></li><li class="blog-unit"><a href="/second">第二个</a></li>
</ul>
"""
html = BeautifulSoup(text,"lxml")
article_as = html.select("li.blog-unit a")
for article_a in article_as:print(article_a.get("href"))

打印结果是:

/first
/second
for article_a in article_as:print(article_a.string)

打印结果是:

第一个
第二个

版权声明:转载必须注明本文转自 East196 的博客:http://blog.csdn.net/east196

10分钟 GET 新技能 - CSS选择器相关推荐

  1. 10分钟 GET 新技能 - 导言

    10分钟 GET 新技能 - 导言 1. 10分钟可以做什么? 2. 10分钟 GET 一个新技能,可能么? 3. 所以 ~~ 10分钟 GET 新技能 - 导言 1. 10分钟可以做什么? 10分钟 ...

  2. 10分钟 GET 新技能 - 正则表达式

    10分钟 GET 新技能 - 正则表达式 1. 正则表达式是什么? 2. 正则表达式的基本规则 3. Python 标准库 re 中使用 正则表达式 10分钟 GET 新技能 - 正则表达式 1. 正 ...

  3. 10分钟 GET 新技能 - 协程

    10分钟 GET 新技能 - 协程 1. 协程 是什么? 2. 协程 的基本规则 3. Python 流行库 gevent 中使用 协程 10分钟 GET 新技能 - 协程 1. 协程 是什么? 协程 ...

  4. 10分钟 GET 新技能 - XPath

    10分钟 GET 新技能 - XPath 1. XPath 是什么? 2. XPath 的基本规则 3. Python 流行库 lxml 中使用 XPath 10分钟 GET 新技能 - XPath ...

  5. 10分钟 GET 新技能 - JSON

    10分钟 GET 新技能 - JSON 1. JSON是什么? 2. JSON 的基本规则 3. Python 标准库 json 中使用 JSON 10分钟 GET 新技能 - JSON 1. JSO ...

  6. 10分钟 GET 新技能 - Markdown

    [TOC] 目录 一级标题 二级标题 三级标题 # 一级标题 一级标题 ## 二级标题 二级标题 ### 三级标题 三级标题 > 引用 引用 --- 横线 - 列表项 - 列表项 列表项 列表项 ...

  7. 10分钟带你探索css中更为奇妙的奥秘

    10分钟带你探索css中更为奇妙的奥秘

  8. 在10分钟内在新Mac中设置Java开发环境(更新)

    这只是一个小的更新文章,它引用了2个较旧的条目( a , b ),我将它们合并为一个步骤,就像一步操作,并确保所有功能都在最新的MacOSX 10.9 Mavericks下工作 . 我主要针对的是初次 ...

  9. #今日论文推荐#1小时学会走路,10分钟学会翻身,世界模型让新生机器狗掌握多项技能

    #今日论文推荐#1小时学会走路,10分钟学会翻身,世界模型让新生机器狗掌握多项技能 人类宝宝在出生后的第1年里,就会逐渐掌握协调能力,学习坐.立.翻滚和爬行. 那么机器人呢? 机器人能完成多复杂的任务 ...

最新文章

  1. 普博去该知名城市,直接先赠送80㎡公寓,每月生活补贴5000,最高100万项目经费!...
  2. pycharm代码自动补全功能
  3. ABAP SUBMIT 程序时带屏幕默认值
  4. 【WebView】warnning:所有WebView方法必须在主线程调用(4.0) 所有WebView方法必须在同一线程调用(4.4)
  5. Google Guava BloomFilter
  6. pdf.js浏览中文pdf乱码的问题解决
  7. android url格式化,Android利用SpannableString实现格式化微博内容
  8. Scala类型系统的目的——Martin Odersky访谈(三)
  9. python爬虫05--添加header
  10. 使用NodeJS连接到MySQL数据库Client does not support authentication protocol requested by server; consider upg
  11. Spring boot 2.x 错误处理机制 与 定制错误页面
  12. 高德sdk定位当前位置_高德地图定位,获取当前位置坐标
  13. 三年的php简历_php应聘个人简历模板
  14. vscode:四个乱码问题及解决方法
  15. 可汗学院:宏观经济学笔记
  16. Git bash和 Git GUI设置中文
  17. ELK入门使用-与springboot集成
  18. Android 软键盘的那些坑,原理篇来了!
  19. 纪念2019年高教社杯全国大学生数学建模竞赛
  20. Single SPI、Dual SPI、Qaud SPI

热门文章

  1. centOS安装jenkins支持maven构建
  2. 【Leetcode】135. 分发糖果
  3. linux内核内存虚拟地址映射物理地址
  4. BoCloud博云获京东云、京东金融联合战略投资 云计算PaaS市场现重磅操作
  5. 阿里云、腾讯云、百度云三大云服务器商评价对比
  6. android wifi刷新数据与连接动画冲突问题的解决方案
  7. Eslint校验fragments标签报错
  8. vue 使用window的对象_浏览器对象的使用(window对象)
  9. 初探Web客户端追踪技术
  10. Python打开指定浏览器的指定网页