xpath.extract() 的使用
最近在爬虫中使用xpath的时候,发现了extract这个方法
我们今天就来说说 xpath.extract 叭
extract 的用法
不加extract时,返回一个SelectorList 对象
这里没有用 extract 时,是这样的
(文末附有 SelectorList 的一些信息)
使用extract() ,返回一个列表,里面是提取的内容
然后,我们使用 extract()。 可读性是不是好多了呢~
后面加 [0] ,即extract[0] ,就是列表操作啦,
返回1中list的第一个元素(如果list为空抛出异常)
在extract 前面加 [0]. ,即 [0].extract() 跟上面在后面加是一样的
返回2中SelectorList里的第一个元素(如果list为空抛出异常)
前后都加的话,即 [0].extract()[0]
就是对列表中第一项的操作了,返回第一项的第一个字符
SelectorList
SelectorList官方文件
xpath.extract() 的使用相关推荐
- 爬虫文档学习 xpath bs4 selenium scrapy...
爬虫 一.介绍 1.什么是爬虫 1.1 爬虫(Spider)的概念 爬虫用于爬取数据, 又称之为数据采集程序. 爬取的数据来源于网络,网络中的数据可以是由Web服务器(Nginx/Apache).数据 ...
- scrapy中response的方法
response.css('').xpath() response.xpath('').extract() response.xpath().re('') response.css().extract ...
- python语言简介-Python语言介绍
原标题:Python语言介绍 Python简介 Python 是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言. Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其 ...
- python的scrapy爬虫模块间进行传参_Python | Scrapy 爬虫过程问题解决(持续更新...)...
1.使用python的re模块过滤html标签 In [1]: response.xpath("//div[@class='zx-dis_content']/p").extract ...
- python爬虫企业级技术点_Python爬虫必备技术点(二)
Python爬虫必备技术点[续] 一.非爬虫框架 1.1 爬虫的认知 数据请求(网络请求库) 数据解析(re/xpath/bs4) 数据存储(csv/pymysql/json??) 反反爬的策略 ip ...
- Scrapy框架的学习(7. 了解Scrapy中的debug信息以及Scrapy shell的使用)
认识程序中的debug信息 https://blog.csdn.net/wei18791957243/article/details/86157707 这个博客里写了,怎么关闭这些debug信息 因 ...
- Scrapy将爬取的段落整合为字符串
使用Scrapy框架爬取文章的时候,经常会遇到要爬取多个段落的问题,如果这个时候使用的是: text = response.xpath("......").extract() 那么 ...
- 两周从爬虫小白变大神,看完你就知道我不是标题党了【五万字教程,建议收藏】
大家好,我是辣条,今天给大家带来最硬核的爬虫教程. 目录 Python爬虫第一天 什么是爬虫 爬虫与Web后端服务之间的关系 Python爬虫技术的相关库 常见反爬虫的策略 爬虫库urllib[重要] ...
- python爬取天猫_Python如何抓取天猫商品详细信息及交易记录
本文实例为大家分享了Python抓取天猫商品详细信息及交易记录的具体代码,供大家参考,具体内容如下 一.搭建Python环境 本帖使用的是Python 2.7 涉及到的模块:spynner, scra ...
最新文章
- 【cocos2d-js官方文档】九、cc.loader
- DEBUGnbsp;设置监视点:判断变量值
- Linux中逻辑卷的快照与还原
- 【转载】对SVM的个人理解---浅显易懂
- 陆振波的svm的matlab代码的解释,陆振波SVM的MATLAB代码解释
- 关于写的Java书籍进展
- linux ubuntu git报错fatal: unsafe repository git config --global --add safe.directory解决方案
- [已解决]消除Flutter Sliver之间存在的间隙
- ThinkPhP关联查询setEagerlyType遇到的问题
- 印度乘法口诀双位数乘法详解
- c语言直方图最大矩形面积,利用枚举法求直方图中最大矩形面积的方法实例
- C语言的二维数组初始化的几种方式介绍(私藏大数组初始化方式)
- 搜狗拼音输入法7.2c正式版(支持win8)_去广告优化版
- selenium模拟浏览器-----爬取马蜂窝地区全部景点
- 最大边界相关算法MMR(Maximal Marginal Relevance) 实践
- win7系统如何加速计算机启动,win7电脑怎么提速_win7电脑提速方法-win7之家
- 定位模块如何实现公交系统智能化
- 台大李宏毅--keras
- Web性能优化:基本思路和常见工具
- 新闻发布系统的软件测试计划,新闻发布系统毕业设计.doc