需要cookie,使用插件:EditThisCookie,可以方便的获取格式化的cookie。

参考博文:https://www.jianshu.com/p/773c58406bdb

众所周知,使用常规方法爬取淘宝的难度是很高的,所以使用selenium+浏览器几乎成了爬取淘宝最理想的方法。然而现在淘宝搜索需要用户登录才可以,据说是为了收集匹配用户信息。

而每次使用selenium时(+chrome),chromedriver会新打开一个浏览器窗口,所以添加cookie便显得很必要了。
这里看一下selenium的add_cookie方法

与普通的在headers里添加{'Cookies':' '}不一样的是,此方法需要按照cookie的name,value,path,domain格式逐个cookie添加,如下图

淘宝的cookie很多,所以需要逐项添加
而手动复制的话很不方便,所以这里使用到一个chrome插件
EditThisCookie

它有个导出功能,当你登录完淘宝后点击导出便会得到一个list格式的字符串

cookies=
[
{"domain": ".baidu.com","expirationDate": 1563853177.468827,"hostOnly": false,"httpOnly": false,"name": "BAIDUID","path": "/","sameSite": "no_restriction","secure": false,"session": false,"storeId": "0","value": "C0E2BCF5DCEB680B2453F78AC4CD0956:FG=1","id": 1
},
{"domain": ".baidu.com","expirationDate": 1546756058.11283,"hostOnly": false,"httpOnly": false,"name": "BDORZ","path": "/","sameSite": "no_restriction","secure": false,"session": false,"storeId": "0","value": "FFFB88E999055A3F8A630C64834BD6D0","id": 2
},
{"domain": ".baidu.com","expirationDate": 3648534764.317173,"hostOnly": false,"httpOnly": false,"name": "BIDUPSID","path": "/","sameSite": "no_restriction","secure": false,"session": false,"storeId": "0","value": "CC0841B75FADCE2D56D45D685391FED0","id": 3
},
{"domain": ".baidu.com","hostOnly": false,"httpOnly": false,"name": "H_PS_PSSID","path": "/","sameSite": "no_restriction","secure": false,"session": true,"storeId": "0","value": "","id": 4
},
{"domain": ".baidu.com","expirationDate": 2493441539.633233,"hostOnly": false,"httpOnly": false,"name": "MCITY","path": "/","sameSite": "no_restriction","secure": false,"session": false,"storeId": "0","value": "-%3A","id": 5
},
{"domain": ".baidu.com","expirationDate": 3648534764.317246,"hostOnly": false,"httpOnly": false,"name": "PSTM","path": "/","sameSite": "no_restriction","secure": false,"session": false,"storeId": "0","value": "1501051117","id": 6
},
{"domain": ".www.baidu.com","expirationDate": 2492662056,"hostOnly": false,"httpOnly": false,"name": "bdime","path": "/","sameSite": "no_restriction","secure": false,"session": false,"storeId": "0","value": "0","id": 7
}
]

稍加修改就可以作为python的list来导入cookie了

for item in cookies:driver.add_cookie(item)

之后使用selenium就可以正常搜索了

作者:Gcider
链接:https://www.jianshu.com/p/773c58406bdb
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

Python+selenium使用cookie登录,如何获取cookie相关推荐

  1. 爬虫三(Bs4搜索、Selenium基本使用、无界面浏览器、Selenium自动登录百度案例、自动获取12306登录验证码案例、切换选项卡、浏览器前进后退、登录Cnblogs获取Cookie自动点赞)

    文章标题 一.Bs4搜索文档树 二.CSS选择器 三.selenium基本使用 四.无界面浏览器 五.selenium其他使用 1)自动登录百度案例 2)获取位置属性大小.文本 3)自动获取12306 ...

  2. 用Python+Selenium来测试登录自动登录163邮箱

    用Python+Selenium来测试登录自动登录163邮箱 1 准备条件 2 程序说明 3 代码 1 准备条件 ① windows系统(也许你是Linux,Mac,自行选择) ②安装了Anacond ...

  3. python获取cookie的方法_python实现登录后获取cookie并用于之后的请求

    初学python接口自动化,一些经验总结,希望遇到同样问题的小伙伴能较快解决: 依据项目的实现逻辑,用户发表评论时需检测用户当前为登录状态,即校验cookie. 用户登录后在响应头里可见到Set-co ...

  4. loginWeibo自制模块:使用selenium模拟登陆微博并获取cookie

    (一)编程环境 操作系统:Win 10 编程语言:Python 3.7 (二)安装selenium 这里使用selenium实现. 如果没有安装过python的selenium库,则安装命令如下 pi ...

  5. 模拟动态登录,获取cookie和图片验证码登录(AcFun和豆瓣)

    #模拟登录acfun #导入第三方库 import requests import pickle from bs4 import BeautifulSoup from fake_useragent i ...

  6. python+selenium实现微博登录和自动评论

    作为杨超越的粉丝,我并不甘心做一个完全的白嫖党,所以有时我也会帮忙做做数据,点点赞.刷刷评等.今天,我突发奇想,能不能用python实现自动化刷评呢?要实现这个想法肯定是要自动化登录微博的,于是有了以 ...

  7. Scrapy + Selenium 实现模拟登录,获取页面动态加载数据

    本文是模拟登录某八同城招聘网站,然后获取一个招聘信息页面中的浏览人数. 直接上代码! 1. Scrapy 爬虫文件 import scrapyclass TestSpider(scrapy.Spide ...

  8. Python+selenium+Gmail半自动登录-注销-修改密码

    工作中需要测试一批谷歌邮箱是否能正常登录. 做了半天手工,我就想起了python和我之前有学过的一点点selenium测试 一 开始通过edge浏览器的selenium插件录制登录注销的操作步骤 然后 ...

  9. Js设置cookie值和获取cookie值

    一.应用场景: 将值存储在cookie里,页面间调用cookie值. //设置cookie function setCookie(name, value) {document.cookie = nam ...

  10. javascript 中cookie的存储,获取cookie,删除cookie的方法

    <script language=javascript> /**//************************************************************ ...

最新文章

  1. 算法与数据结构重点归纳
  2. Java---实现运行任意目录下class中加了@MyTest的空参方法(实现图形界面)
  3. pythonlist特性_python 高级特性:List Comprehensions(列表生成式)
  4. make 命令_Vim 命令大全
  5. CentOS 7 DIG命令工具打上EDNS补丁
  6. 会议升降计算机主机,升降式无纸化多媒体会议系统
  7. pythonmysqldb_python中MySQLdb的使用
  8. tar:归档中找不到 tar: 由于前次错误,将以上次的错误状态退出
  9. ​芯片大神,英特尔、AMD、特斯拉前首席芯片架构师 Jim Keller 加盟 AI 初创公司...
  10. JAVA 8:Lambdas表达式初体验
  11. pandas 导入excel_三行Python代码,合并多个Excel文件
  12. 定时器和promise_如何讲清楚Promise?
  13. 材料成型及控制工程学计算机吗,材料成型及控制工程
  14. 手把手教你搭建一个属于自己的网站-适合零基础小白,文末附网站模板
  15. HDL4SE:软件工程师学习Verilog语言(七)
  16. 华中科技大学计算机潘再余,华中科技大学2016年免试攻读研究生名单
  17. SLF4J--日志门面担当
  18. 81.(cesium之家)cesium修改灰色背景(默认蓝色)
  19. 卿学姐与诡异村庄(并查集)
  20. 经常失眠怎么办?这些方法和好物可以帮到你

热门文章

  1. flvdec.c flv_read_header flv_read_packet解析
  2. 现代密码学的公钥密码体制
  3. 我的世界服务器自定义ui,我的世界主界面自定义修改教程
  4. 【正一专栏】《使徒行者2》——难得追完的剧
  5. Qt 字体族 font-family 一览表大全
  6. 英文论文中的“重要性”
  7. 几个流畅阅读与标记PDF文件的顶级 PDF 注释器
  8. 图片识别文字怎么做?这几种方法轻松解决
  9. 微信公众号 专辑(原页面模板) 功能
  10. 动力电池系统介绍(二)——BMS软硬件架构