一、模拟登录jerry的QQ空间
使用一个第三方登录的链接:https://xui.ptlogin2.qq.com/cgi-bin/xlogin?proxy_url=https%3A//qzs.qq.com/qzone/v6/portal/proxy.html&daid=5&&hide_title_bar=1&low_login=0&qlogin_auto_login=1&no_verifyimg=1&link_target=blank&appid=549000912&style=22&target=self&s_url=https%3A%2F%2Fqzs.qzone.qq.com%2Fqzone%2Fv5%2Floginsucc.html%3Fpara%3Dizone&pt_qr_app=手机QQ空间&pt_qr_link=http%3A//z.qzone.com/download.html&self_regurl=https%3A//qzs.qq.com/qzone/v6/reg/index.html&pt_qr_help_link=http%3A//z.qzone.com/download.html&pt_no_auth=0
也就是说点击下图中的jerry头像就可以登录了。

from selenium import webdriver
import requests
import timedriver = webdriver.Chrome(r'C:\Users\Administrator\Desktop\chromedriver_win32\chromedriver.exe')
#加载第三方的登录方式
driver.get('https://xui.ptlogin2.qq.com/cgi-bin/xlogin?proxy_url=https%3A//qzs.qq.com/qzone/v6/portal/proxy.html&daid=5&&hide_title_bar=1&low_login=0&qlogin_auto_login=1&no_verifyimg=1&link_target=blank&appid=549000912&style=22&target=self&s_url=https%3A%2F%2Fqzs.qzone.qq.com%2Fqzone%2Fv5%2Floginsucc.html%3Fpara%3Dizone&pt_qr_app=手机QQ空间&pt_qr_link=http%3A//z.qzone.com/download.html&self_regurl=https%3A//qzs.qq.com/qzone/v6/reg/index.html&pt_qr_help_link=http%3A//z.qzone.com/download.html&pt_no_auth=0')
time.sleep(1)
button = driver.find_element_by_class_name('face').click()   #点击登录
time.sleep(2)
listCookies = driver.get_cookies() # 获取cookie数据,返回的是python中的list # 解析cookie数据 列表推导式 [] 返回的结果是一个新的列表
cookie = [item['name'] + '=' + item['value'] for item in listCookies]
cookie_str = '; '.join(item for item in cookie)# 测试代码 selenium获取和解析之后的cookie是否可以使用
url = 'https://user.qzone.qq.com/192149641'  # 目标url,也就是Jerry老师的QQ空间首页
headers = {'cookie':cookie_str,'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36'
}html = requests.get(url,headers=headers)
time.sleep(2)
with open('qzong.html','w',encoding='utf-8') as file_obj:file_obj.write(html.text)   #打开这个qzong.html是Jerry老师的,那就是成功了。
#print(html.text)   该text文件中有账号或者昵称等关键字可以证明是Jerry老师的,那就是成功了。

二、怎样保存cookie
json.loads():把json类型的字符串(str)转换成python的数据类型
json.dumps():把python的数据类型转换成json类型的字符串(str)

from selenium import webdriver
import jsondriver = webdriver.Chrome(r'C:\Users\Administrator\Desktop\chromedriver_win32\chromedriver.exe')
driver.get('https://www.baidu.com/')# 获取百度的cookie
listCookies = driver.get_cookies() # 返回的是python中的list#保存cookie
jsonCookies = json.dumps(listCookies)
# print(type(jsonCookies),jsonCookies)with open('qqzone.json','w') as file_obj:file_obj.write(jsonCookies)

结果:qqzone.json在sublime中打开

爬虫笔记19:模拟登录jerry的QQ空间(selenium获取cookie的应用案例)、怎么保存cookie相关推荐

  1. python爬虫(十四)selenium(select、17素材网、模拟登录豆瓣和QQ空间、获取cookie、行为链)

    selenium介绍(下) 不管页面是动态加载还是静态加载出来的,只要是elements中能找到的,都能用selenium来获取数据,selenium获取数据的方式是以页面最终渲染后的前端为基础的,不 ...

  2. selenium模拟登录豆瓣和qq空间

    selenium模拟登录豆瓣和qq空间 今天又重新学习了下selenium,模拟登录豆瓣,发现设置等待时间真的是很重要的一步,不然一直报错:selenium.common.exceptions.NoS ...

  3. python爬虫学习笔记2模拟登录与数据库

    前言 为了加入学校里面一个技术小组,我接受了写一个爬取学校网站通知公告的任务.这个任务比以前写的爬虫更难的地方在于,需要模拟登录才能获得页面,以及将得到的数据存入数据库. 本文按照日期来记录我完成任务 ...

  4. python爬虫分析模拟登录时会变的参数_Python爬虫之urllib模拟登录及cookie的那点事...

    在web  sprider crawl过程中,许多网站都需要登录后才能访问,一般如果我们不用爬虫框架的前提下,常规用的就两个库 ,urllib库和requests库,本文将用最基础的urllib库,以 ...

  5. python3爬虫模拟登录爬取教务系统成绩单(获取cookie操作)

    前言 今天来写写爬取教务系统的爬虫,此次的爬虫目的是爬取教务系统里面的成绩单,涉及到的库依旧是selenium,re,beautifulsoup,Options,今天多了个csv库用来处理爬取的数据, ...

  6. java爬虫-0022,模拟登录

    项目地址:https://github.com/wenrongyao/java_crawler 基本原理:用户输入登录信息=>登录成功,服务器将登录成功的信息发送的前台,通常存在cookie中= ...

  7. php curl如何模拟登录阿里妈妈|登陆阿里妈妈获取淘宝客推广数据

    php curl如何模拟登录阿里妈妈|登陆阿里妈妈获取淘宝客推广数据 模拟登录|登陆阿里妈妈 淘宝 阿里联盟账号|php模拟登录|登陆阿里妈妈 获取推广数据 佣金 现在api门槛高了 一些站长就不能用 ...

  8. python实现模拟登录云课堂智慧职教并获取课程信息(2)

    python实现模拟登录云课堂智慧职教并获取课程信息 1.说明 2.验证码图片内容识别解决方案 1.图片识别接口库的使用效果 1.百度ocr识别 2.腾讯ocr识别 3.图鉴 2.图片识别接口代码 3 ...

  9. 【Python爬虫】:模拟登录QQ空间

    观察了下QQ空间实在是太好登录了!只需要首先点击账号密码登录,然后输入你的账号和密码就可以了! 其中需要注意的是; 1.进行第一次点击的时候,点击"账号密码"的时候,需要首先切换到 ...

  10. 爬虫day01(上午) 模拟登录古诗文网

    前言:今天是学习爬虫的第一天,因为看的教学视频比较老,所以很多案例都不能用了,于是我自己发挥动手操作,做了个比视频里更有含金量的练习,由于与视频案例大有不同,所以期间发生了点问题,经过探索现已解决,留 ...

最新文章

  1. JavaWeb学习总结(二)——JSP中的九个内置对象
  2. windows7黑屏修复_如何在Windows 10更新后修复黑屏
  3. [vue] 你了解axios的原理吗?有看过它的源码吗?
  4. 第九章 隐马尔科夫模型HMM
  5. alter table add column多个字段_ElementUI表格el-table表头固定自适应高度解决方案
  6. java hibernate 表关联_Hibernate多表关联
  7. Hibernate讲解(三)-Hibernate的基本映射数据类型
  8. Bug,昂首走进2005
  9. Python3基础语法
  10. Windows Server 2012 搭建DHCP及远程路由访问
  11. python 调用海康sdk_Qt调用海康SDK实现摄像头视频播放
  12. 电子计算机及其部件,2021年电子计算机及其部件行业营销部门表格模板汇总.docx...
  13. 黑客之门的魅力:感染与加载
  14. html5播放 h.264裸流,[转载]成功在MP4封装的H264视频中提取能播放的裸流
  15. OpenWrt自定义luci页面来修改配置文件
  16. js通过base64编码显示图片
  17. 开涛spring3(6.9) - AOP 之 6.9 代理机制
  18. wordpress会员插件_最好的免费WordPress会员插件
  19. 谈谈我对上手MacOS的体验与macos常用快捷键总结
  20. table表格首列首行固定

热门文章

  1. 网络游戏外挂制作(3)
  2. DNS服务器常见的攻击方式
  3. Python系统学习第二十四课
  4. python实现获取ip、网站备案信息、whois查询
  5. 优秀后端架构师必会知识:史上最全MySQL大表优化方案总结
  6. 计算机课玩游戏检讨书,上微机课玩游戏检讨书.doc
  7. 20年进入下半赛程,你变强了吗?
  8. Gitee+PicGo+Typora图床搭建丨出现 Error: You must be logged in to use 的解决方法
  9. plsql登录Not logged on
  10. LVS配合piranha安装使用