最近在爬虫中使用xpath的时候,发现了extract这个方法
我们今天就来说说 xpath.extract 叭

extract 的用法

  1. 不加extract时,返回一个SelectorList 对象
    这里没有用 extract 时,是这样的
    (文末附有 SelectorList 的一些信息)

  2. 使用extract() ,返回一个列表,里面是提取的内容
    然后,我们使用 extract()。 可读性是不是好多了呢~

    后面加 [0] ,即extract[0] ,就是列表操作啦
    返回1中list的第一个元素(如果list为空抛出异常)

  3. 在extract 前面加 [0]. ,即 [0].extract() 跟上面在后面加是一样的
    返回2中SelectorList里的第一个元素(如果list为空抛出异常)

  4. 前后都加的话,即 [0].extract()[0]
    就是对列表中第一项的操作了,返回第一项的第一个字符

SelectorList

SelectorList官方文件

xpath.extract() 的使用相关推荐

  1. 爬虫文档学习 xpath bs4 selenium scrapy...

    爬虫 一.介绍 1.什么是爬虫 1.1 爬虫(Spider)的概念 爬虫用于爬取数据, 又称之为数据采集程序. 爬取的数据来源于网络,网络中的数据可以是由Web服务器(Nginx/Apache).数据 ...

  2. scrapy中response的方法

    response.css('').xpath() response.xpath('').extract() response.xpath().re('') response.css().extract ...

  3. python语言简介-Python语言介绍

    原标题:Python语言介绍 Python简介 Python 是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言. Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其 ...

  4. python的scrapy爬虫模块间进行传参_Python | Scrapy 爬虫过程问题解决(持续更新...)...

    1.使用python的re模块过滤html标签 In [1]: response.xpath("//div[@class='zx-dis_content']/p").extract ...

  5. python爬虫企业级技术点_Python爬虫必备技术点(二)

    Python爬虫必备技术点[续] 一.非爬虫框架 1.1 爬虫的认知 数据请求(网络请求库) 数据解析(re/xpath/bs4) 数据存储(csv/pymysql/json??) 反反爬的策略 ip ...

  6. Scrapy框架的学习(7. 了解Scrapy中的debug信息以及Scrapy shell的使用)

    认识程序中的debug信息 https://blog.csdn.net/wei18791957243/article/details/86157707  这个博客里写了,怎么关闭这些debug信息 因 ...

  7. Scrapy将爬取的段落整合为字符串

    使用Scrapy框架爬取文章的时候,经常会遇到要爬取多个段落的问题,如果这个时候使用的是: text = response.xpath("......").extract() 那么 ...

  8. 两周从爬虫小白变大神,看完你就知道我不是标题党了【五万字教程,建议收藏】

    大家好,我是辣条,今天给大家带来最硬核的爬虫教程. 目录 Python爬虫第一天 什么是爬虫 爬虫与Web后端服务之间的关系 Python爬虫技术的相关库 常见反爬虫的策略 爬虫库urllib[重要] ...

  9. python爬取天猫_Python如何抓取天猫商品详细信息及交易记录

    本文实例为大家分享了Python抓取天猫商品详细信息及交易记录的具体代码,供大家参考,具体内容如下 一.搭建Python环境 本帖使用的是Python 2.7 涉及到的模块:spynner, scra ...

最新文章

  1. 【cocos2d-js官方文档】九、cc.loader
  2. DEBUGnbsp;设置监视点:判断变量值
  3. Linux中逻辑卷的快照与还原
  4. 【转载】对SVM的个人理解---浅显易懂
  5. 陆振波的svm的matlab代码的解释,陆振波SVM的MATLAB代码解释
  6. 关于写的Java书籍进展
  7. linux ubuntu git报错fatal: unsafe repository git config --global --add safe.directory解决方案
  8. [已解决]消除Flutter Sliver之间存在的间隙
  9. ThinkPhP关联查询setEagerlyType遇到的问题
  10. 印度乘法口诀双位数乘法详解
  11. c语言直方图最大矩形面积,利用枚举法求直方图中最大矩形面积的方法实例
  12. C语言的二维数组初始化的几种方式介绍(私藏大数组初始化方式)
  13. 搜狗拼音输入法7.2c正式版(支持win8)_去广告优化版
  14. selenium模拟浏览器-----爬取马蜂窝地区全部景点
  15. 最大边界相关算法MMR(Maximal Marginal Relevance) 实践
  16. win7系统如何加速计算机启动,win7电脑怎么提速_win7电脑提速方法-win7之家
  17. 定位模块如何实现公交系统智能化
  18. 台大李宏毅--keras
  19. Web性能优化:基本思路和常见工具
  20. 新闻发布系统的软件测试计划,新闻发布系统毕业设计.doc

热门文章

  1. 论地震、雷击和个人数据备份
  2. 通过实时语音驱动人像模拟真人说话
  3. sql server 学习教程
  4. 加密算法与大数据安全
  5. 牛津初阶字典精华总结
  6. Junit 实例精讲基础教程(一) 使用@Ignore注解跳过单元测试方法的执行
  7. UOS无法使用无线网络
  8. 如何通过检测微芯片操作来对抗硬件木马
  9. Pytorch 单机多卡训练DDP
  10. 网页聊天框发送表情图片实现方法