extract()经常使用来切片(脱壳)从一个对象中得到list

下面是scrapy的官方文档,里面有选择器(selector)的一些介绍

http://scrapy-chs.readthedocs.io/zh_CN/0.24/topics/selectors.html#selectorlist

常见的extract()的一些用法:

1. 返回一个list(就是系统自带的那个) 里面是一些你提取的内容

2.返回一个SelectorList 对象

3.返回2中list的第一个元素(如果list为空抛出异常)

有时候会报索引错误

删掉就不报错,(留坑,暂时不太明白为什么!!!!)

4.返回的是一个str(如果Python2为unicode应该), 所以5会返回str的第一个字符

5.返回1中SelectorList里的第一个元素(如果list为空抛出异常),和3达成的效果一致

xpath的extract()方法相关推荐

  1. python extract方法_在多个项目类中使用extract方法

    我不是一个有经验的程序员,不要生我的气- 我正在探索一些小的可能性(我有一些Python编程技巧).在 废弃一个网站:让我们想象一下,我们可以从opengraph(og:)中提取一些信息,比如&quo ...

  2. php extraxt,php中关于extract方法的使用和建议

    在分析Oauth 2.0的的一个开源服务端代码时,因为我是用netbeans来查看,在边上给了一些黄色感叹号的提示信息,提示变量没有初始化.我仔细查看上下文,确实没有初始化,但是代码执行是准确的,非常 ...

  3. xpath定位元素方法_测试数十次,总结了APP元素定位的万能方法

    定位不到元素时候,一定很头大,最近一直在跑自动化流程,经常因为各种原因定位不到元素,经过数十次的尝试,我发现尤其是H5页面,出现定位不到元素的可能性更大,也总结尝试发现了在H5里面,通过切换上下文后用 ...

  4. Python爬虫应用实战案例-xpath正则表达式使用方法,爬取精美壁纸

    使用XPath XPath,全称XML Path Language,即XML路径语言,它是在XML语言中查找信息的语言.它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索. 在上一篇文章 ...

  5. python xpath定位元素方法_Python爬虫杂记 - Xpath高级用法

    xpath 高级用法 1. 匹配当前节点下的所有: .// . 表示当前 // 表示当前标签下的所有标签 注: 要配合使用 2. 匹配某标签的属性值: /@属性名称 这里以input里的value值为 ...

  6. python xpath定位元素方法_python--通过xpath相对节点位置查找元素(续)

    之前写过相对父元素及下一个兄弟元素的方法. 这次补充一下xpath相对节点位置查找元素的所有方法.例子就不举了,自己可以去练练. xpath相对节点查找方法: 1.xpath('./ancestor: ...

  7. 一个Python爬虫案例,带你掌握xpath数据解析方法!

    文章目录 xpath基本概念 xpath解析原理 环境安装 如何实例化一个etree对象: xpath('xpath表达式') xpath爬取58二手房实例 爬取网址 完整代码 效果图 xpath图片 ...

  8. python xpath定位元素方法_二、appium+python xpath、android_uiautomator定位元素的方法

    1.继承webdriver的几个常见的定位方法 a.find_element_by_id("id") b.find_element_by_name() #text值,appium ...

  9. xpath之string(.)方法

    from lxml import etreehtml = '''<li class="tag_1">需要的内容1<a>需要的内容2</a>< ...

最新文章

  1. luogu P3455 [POI2007]ZAP-Queries (莫比乌斯反演 + 整除分块)
  2. 最简单的iOS网络请求
  3. Lesson 02:变量、数据类型
  4. 【HDU - 1022】Train Problem I (栈模拟,水题,思维)
  5. [改善Java代码] 推荐使用序列化实现对象的拷贝
  6. ie7中overflow:hidden无效解决办法
  7. elastic-job控制台部署与使用
  8. python 打印类型_让Python输出更漂亮:PrettyPrinter
  9. 第七章、epub文件处理 -- 解析 .xhtml文件 (一)
  10. 计算机一级考试试题难不难,计算机一级考试通过率是多少 考试难吗
  11. python ipaddr库_python访问纯真IP数据库的代码
  12. 如何养成早起的好习惯?
  13. 往年报名破千人,南京大学计算机系2022年夏令营来袭
  14. 算1 - n的阶乘和末6位(超详细)
  15. 什么是“高级灰”?哪些地方可以用到它?
  16. 用C语言实现shell
  17. 文件用手机拍照片打印时,打印出来总是有黑阴影,如何去掉黑色阴影打印清晰的图片
  18. 数据库课程设计--淘宝购物订单系统
  19. vs为什么打了断点不断_2019年亚洲羽毛球锦标赛决赛焦点对阵:桃田贤斗VS石宇奇 松本麻佑/永原和可那VS陈清晨/贾一凡 山口茜VS何冰娇...
  20. Login 2020:技术唤醒她力量进行时

热门文章

  1. 如何将平板设置为笔记本的扩展屏
  2. 谈VB.net里Optional关键字
  3. 【渝粤题库】陕西师范大学163211 会展管理作业
  4. nginx php .htaccess,Linux下nginx支持.htaccess文件实现伪静态的方法
  5. 海量数据挖掘MMDS week3:社交网络之社区检测:基本技巧
  6. IT项目管理小组分工情况
  7. 正交表设计法设计测试用例
  8. stitching.cpp鱼眼图像拼接融合 源码分析
  9. MySQL-数据查询语言(DQL)
  10. 《操作系统》第十二章习题加解析(重点学习内容)