使用selenium打开微博

在之前的案例里面,我们学习了使用requests、BeautifulSoup库来爬取豆瓣读书的数据,今天我们要来学习一个新的工具:selenium.

selenium最初是一个自动化测试工具,在爬虫中使用它主要是为了解决requests无法执行javaScript代码的问题。

#安装selenium库

pip install selenium

先考一下大家,我们打开一个网页的第一步是什么?

当然是先打开浏览器对不对,那么我们使用selenium来打开浏览器时,还需要配合一个工具来进行,它就是浏览器驱动。

在这里,墙裂建议大家使用谷歌浏览器(chrome),接下来我会示范一下,如何在Windows系统下,安装谷歌浏览器对应的浏览器驱动!

查看浏览器版本号

打开谷歌浏览器,点击浏览器右上角的三个点,再单击设置,如下图所示

谷歌浏览器设置

选择下方的关于Chrome,如图所示,我的浏览器版本就是:80.0.3987.162(正式版本) (32 位)

谷歌浏览器版本号

选择跟自己浏览器版本号最接近的版本,点击进入下载,因为我的浏览器版本是32位的,所以驱动版本也选择32位的windows版本

浏览器驱动版本

驱动安装:把下载好zip文件解压以后的chromedriver.exe放到python安装路径的scripts目录中即可

如果你不知道你的python文件夹是在哪里,请安装如下图所示的方法进行操作:

使用快捷键 win + r 打开运行窗口,输入cmd,然后点击确定进入命令行窗口

在命令行输入:where python,回车,如图所示:

命令行输入:`where python`

在新的命令行中输入:explorer + python的路径,如图所示,我这里的输入就是:explorer D:\python (注意,后面的python.exe不需要输入)

文件路径

你也可以直接按文件夹的路径打开文件夹,不需要在命令行输入

将chromedriver.exe放到python安装路径的scripts目录中即可

chromedriver.exe

到这里我们的浏览器驱动就已经安装好了,接下来,我们用selenium打开谷歌浏览器看看:

# 从 selenium 中导入 webdriver(驱动)

from selenium import webdriver

# 打开Chrome 浏览器

browser = webdriver.Chrome()

#这里的browser实际上是浏览器的示例化对象

运行结果

我们看到运行代码之后,自动打开了谷歌浏览器,并提示:Chrome正受到自动测试软件的控制

接下来,我们尝试一下打开微博网页:

# 从 selenium 中导入 webdriver(驱动)

from selenium import webdriver

import time

# 打开Chrome 浏览器

browser = webdriver.Chrome()

# 打开微博网页

browser.get('https://weibo.com')

#微博加载比较慢,我们给它设置20s的打开时间,然后关闭浏览器

time.sleep(20)

# 关闭浏览器

browser.quit()

打开微博

接下来,我们要利用selenium自动登录微博,点此继续学习python3 爬虫学习:自动给你心上人的微博点赞(二)

python自动点赞软件_python3 爬虫学习:自动给你心上人的微博点赞(一)相关推荐

  1. python语音播报天气预报_Python3爬虫之自动查询天气并实现语音播报

    一.写在前面 之前写过一篇用Python发送天气预报邮件的博客,但是因为要手动输入城市名称,还要打开邮箱才能知道天气情况,这也太麻烦了.于是乎,有了这一篇博客,这次我要做的就是用Python获取本机I ...

  2. python自动点赞_python3 爬虫学习:自动给你心上人的微博点赞(二)

    selenium定位元素的八大方法: 在开始登录前,咱们得先学习一下selenium定位元素的方法,不然找不到元素是没办法完成自动操作 百度 python工程狮 find_element_by_id( ...

  3. python3 爬虫学习:自动给你心上人的微博点赞(一)

    使用selenium打开微博 在之前的案例里面,我们学习了使用requests.BeautifulSoup库来爬取豆瓣读书的数据,今天我们要来学习一个新的工具:selenium. selenium最初 ...

  4. python训练营 朋友圈点赞_python3 爬虫学习:自动给你心上人的微博点赞(三)

    from selenium import webdriver import time user = input('请输入你的微博用户名:') password = input('请输入你的微博密码:' ...

  5. python脚本自动qq签到_Python爬虫实现自动登录、签到功能 附代码

    这篇文章主要介绍了Python爬虫实现自动登录.签到功能的代码,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下 前几天在一个素材网站上下载东 ...

  6. 以下用于数据存储领域的python第三方库是-Python3爬虫学习之MySQL数据库存储爬取的信息详解...

    本文实例讲述了Python3爬虫学习之MySQL数据库存储爬取的信息.分享给大家供大家参考,具体如下: 数据库存储爬取的信息(MySQL) 爬取到的数据为了更好地进行分析利用,而之前将爬取得数据存放在 ...

  7. 计算机自动安装程序,如何防止软件自动安装软件?防止电脑自动安装软件的方法...

    一般在网上下载软件,一个不小心这些捆绑的软件蜂拥而至.说出来你可能不信,小编下载一个软件带过五六"毒瘤"软件,电脑直接卡死重启,毒瘤软件还难卸载...你遇到过这种情况吗?对于这些毒 ...

  8. python视频资料免费领取_python爬虫学习视频资料免费送,用起来非常666

    当我们浏持发秀事应差互过来商类如处.,到图近就这览网页的时候,经常会看到像下面这些好看的图片,你是否想把这些图片保存下载下来到二新,为都础过过发等宗和发制数事前理业待很理断到屏能击示和站公下图以使箭分 ...

  9. python微博批量点赞_python3 爬虫学习:自动给你心上人的微博点赞(二)

    selenium定位元素的八大方法: 在开始登录前,咱们得先学习一下selenium定位元素的方法,不然找不到元素是没办法完成自动操作 find_element_by_id() find_elemen ...

最新文章

  1. (C++)strlen(),strcmp(),strcpy(),strcat()用法
  2. linux底层硬件需求,Linux系统的硬件设备驱动的底层结构讲解
  3. mysql导入数据,涉及到时间转换,乱码问题解决
  4. 微信能远程控制电脑吗_牛皮!微信远程控制电脑这个神器太厉害了!
  5. Linux并发与竞争实验(一次只允许一个应用程序操作LED灯)
  6. 面试难点!常用算法技巧之“滑动窗口”
  7. C语言Main函数到底有几种,你真的懂吗?
  8. 基于RFM模型的用户价值的数据分析报告
  9. vsftp乱码问题解决
  10. hdu Intelligent IME
  11. 删除硬盘文件夹失败解决方法
  12. sever串口wifi拓展板_基于串口调试助手的WIFI模块调试-FPGA简单联网(点灯)...
  13. 黄反词测试,接口监控
  14. 菜鸟学习Python+Selenium遇到的第一个要崩溃的问题
  15. 论文---overcoming catastrophic forgetting in neural networks
  16. Pokémon Army (easy version)
  17. 这款App连夜被下架!
  18. (纪录片)数学的故事 The Story of Maths (2008)
  19. 强网杯2018 - nextrsa - Writeup
  20. ElasticSearch学习2_Java version:1.7.0_51 suffers from critical bug及ES对JDK版本要求

热门文章

  1. CKA考试经验:报考和考纲
  2. 思源笔记结合Everything+Quicker实现高效笔记记录
  3. 1.百度地图api3.0-设置点的弹跳点
  4. SBSGAN: Suppression of Inter-Domain Background Shift for Person Re-Identification 论文笔记 ReId-UDA(一)
  5. 跨境电商多平台运营库存管理难 选对erp软件很重要
  6. 霸道的 AliPaladin64.sys
  7. endnote能自动翻译吗_文献管理软件EndNote使用手册的术语翻译
  8. java 单例模式 懒汉和饿汉
  9. 手机QQ AndroidManifest 用于跳转
  10. Mendix用户角色权限设计思路