我目前正在编写一个python selenium脚本来从网站上获取信息。我已经成功地以我想要的格式从第1页(共100+页)获取数据。不幸的是,我无法运行该程序并从后续页面收集所有信息。当我查看web站点target=https://www.freshfields.com/en-gb/contacts/find-a-lawyer/脚本时,它显示“Next”按钮的编译如下所示

/body/div[@id='main-content']/div[@t6a-grid']/div[@mmargin-bottom-30']/div[@id='grid']/div[@row-margin-bottom-10']/div[@col-md-12 padding-left-0 padding-right-20']/ul[@class='pagination']/li[11]/a

我写的部分脚本如下。脚本中的“#this is navigate to next page element”是当前不工作的区域。在

def get_links(驱动程序、目标):

#这是为了收集与Freshfields网站上的所有个人资料相关联的链接driver.get(target)

# get links associated to profiles on result page

list_links = []

while True:

list_ppl_link = driver.find_elements_by_xpath('//div[@class=" mix item col-xs-6 col-sm-4"]')

for item in list_ppl_link:

emp_name_obj = item.find_element_by_tag_name('a')

emp_name = emp_name_obj.text

emp_link = emp_name_obj.get_attribute('href')

list_links.append({'emp_name':emp_name, 'emp_link':emp_link})

try:

# this is navigate to next page

driver.find_element_by_xpath('//ul[@class="pagination"]/li').click()

time.sleep(1)

except NoSuchElementException:

break

return list_links

请问有人能帮我理解一下如何翻遍书页收集1960年的记录吗?在

非常感谢

克里斯

python点击下一页数据还是原来的_Python Selenium单击下一页相关推荐

  1. python select模块安装_python+selenium select下拉选择框定位处理方法

    一.前言 总结一下python+selenium select下拉选择框定位处理的两种方式,以备后续使用时查询: 二.直接定位(XPath) 使用Firebug找到需要定位到的元素,直接右键复制XPa ...

  2. mysql 下一条数据_mysql 查询一条记录的下一条和上一条记录

    如果ID是主键或者有索引,可以直接查找: 方法一: 查询上一条记录的SQL语句(如果有其他的查询条件记得加上other_conditions以免出现不必要的错误): select * from tab ...

  3. python爬微博数据中心_怎样用python爬新浪微博大V所有数据?

    最近为了做事件分析写了一些微博的爬虫,两个大V总共爬了超70W的微博数据. 官方提供的api有爬取数量上限2000,想爬取的数据大了就不够用了... 果断撸起袖子自己动手!先简单说一下我的思路: 一. ...

  4. 如何用python爬微博数据_怎样用python爬新浪微博大V所有数据?

    最近为了做事件分析写了一些微博的爬虫,两个大V总共爬了超70W的微博数据. 官方提供的api有爬取数量上限2000,想爬取的数据大了就不够用了... 果断撸起袖子自己动手!先简单说一下我的思路: 一. ...

  5. 用python爬微博数据_怎样用python爬新浪微博大V所有数据?

    最近为了做事件分析写了一些微博的爬虫,两个大V总共爬了超70W的微博数据. 官方提供的api有爬取数量上限2000,想爬取的数据大了就不够用了... 果断撸起袖子自己动手!先简单说一下我的思路: 一. ...

  6. 20221119day12作业:顶点小说全栈抓取、京东3页数据抓取、震坤行3页数据抓取

    文章目录 一.顶点小说全站抓取(代码运行下去理论上能抓就行) 二.京东商城三页数据抓取 三.震坤行三页数据抓取 一.顶点小说全站抓取(代码运行下去理论上能抓就行) 先获取所有分类链接import re ...

  7. Excel数据透视表经典教程八《创建单页/自定义字段透视表》

    前言: 一.单页字段透视表:当对多个表格进行数据透视分析时,不能直接点击插入数据透视表操作.因此,需要创建单页或者自定义字段透视表. 二.自定义字段透视表:由于上述创建的单页字段透视表,对于不同的表格 ...

  8. python爬虫爬取多个页面_Python 爬虫爬取多页数据

    但是,按照常规的爬取方法是不可行的,因为数据是分页的: 最关键的是,不管是第几页,浏览器地址栏都是不变的,所以每次爬虫只能爬取第一页数据.为了获取新数据的信息,点击F12,查看页面源代码,可以发现数据 ...

  9. html底部自动加载下一页,js页面滚动到底部时自动加载下一页数据

    一段滚动到页面底部自动加载更多数据的js代码,需要jquery.js . jquey.tmpl.js 支持 var Data = { PageCount: 1, PageSize: 30, IsCom ...

最新文章

  1. python杂记-读取png图像文件头数据
  2. 关于select中fd_set变量的一些通俗宏解释
  3. Linux 文件与目录基本操作
  4. pythonindexerror_Python index错误值不在list…on.index(value)
  5. HDU2009 求数列的和【迭代】
  6. HTML5 WebRTC API无需网络获取本地IP
  7. Markdown 编辑器 Editor.md 图片上传使用
  8. 置换元素和非置换元素
  9. 一晃眼这个blog已经丢弃两年。。。
  10. sql数据库增删改查
  11. No package erlang available
  12. 安装监控的地方没有WiFi,没有无线网络,如何实现远程监控?
  13. 危夷晨:来自“AI黄埔军校”的计算机视觉创业者
  14. csgo显示未加入国服服务器,csgo国服新手常见问题汇总介绍
  15. 服务器性能测试工具及实战,性能测试实战--《软件测试52讲》
  16. 【面试】896- 助力春招!2021 阿里字节快手新鲜面经
  17. 金蝶K3采购暂估案例教程4商业模式单到冲回
  18. 关于numpy数组shape的理解 比如:(3,) (2,3) (2,3,2) 以及对维度的小认识
  19. MQTT——EMQX学习笔记01——EMQX安装使用
  20. 互联网产品上线前,做些什么——产品、开发、测试的视角

热门文章

  1. java中mvc模式是什么_什么是MVC模式 MVC模式中三者之间关系
  2. 【时事观察】找寻城市发展的幸福之路
  3. DNS欺骗实验过程和分析
  4. php单双引号拼接,js字符串拼接中关于单引号和双引号的那些事
  5. Masm32多模块程序设计:1、掌握利用LINK将多模块连接起来的方法 2、掌握利用库文件将多模块连接起来的方法。
  6. Linux+Docker+Tensorlfow 部署探索
  7. 解决问题的方法和途径-问题分析
  8. 去除arr中的空数组项
  9. 14期 11月期刊自荐
  10. python-将文本复制到剪贴板与键盘监听