2019独角兽企业重金招聘Python工程师标准>>>

代码

话不多说,直接上代码

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesdef getSource(url):headers = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8','Accept-Language': 'zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3','User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400','referer':'http://www.taobao.com'}#使用copy()防止修改原代码定义dictcap = DesiredCapabilities.PHANTOMJS.copy() for key, value in headers.items():cap['phantomjs.page.customHeaders.{}'.format(key)] = value# 不载入图片,爬页面速度会快很多cap["phantomjs.page.settings.loadImages"] = Falsedriver = webdriver.PhantomJS(desired_capabilities=cap)driver.get(encodeUrl(url))

部分博文提到设置User-Agent使用的是这个方法,好像也是可以的:

cap["phantomjs.page.settings.userAgent"] = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36'

检查

访问如下网址,可以回显你请求的数据,用来检查设置的header是否有效:
https://httpbin.org/get?show_env=1

例如我用如上的代码,访问这个地址,后面跟上两个实验参数:
https://httpbin.org/get?show_env=1&q=nihao&bbb=c
网页返回:

转载于:https://my.oschina.net/u/2396236/blog/1790714

Python下Selenium PhantomJs设置header的方法相关推荐

  1. vxWorks6.8 操作系统下 QT 安装设置、运行方法

    vxWorks6.8 操作系统下 QT 安装设置.运行方法 1. 前言 本文详细描述了在 vxworks6.8 操作系统下,如何安装设置 QT 的方法,给出 了详细的过程,图文并茂,并给出了在 vxs ...

  2. [Python爬虫] Selenium+Phantomjs动态获取CSDN下载资源信息和评论

    前面几篇文章介绍了Selenium.PhantomJS的基础知识及安装过程,这篇文章是一篇应用.通过Selenium调用Phantomjs获取CSDN下载资源的信息,最重要的是动态获取资源的评论,它是 ...

  3. python下selenium模拟浏览器常见操作

    本文主要记录下selenium的常见操作,如定位具体元素的不同方法.在具体元素内循环.提取文本等.具体代码如下: # -*- coding: utf-8 -*- ''' Created on 2019 ...

  4. python使用selenium + PhantomJs搭建的简单漫画爬虫工具

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  5. python中用Selenium驱动Edge浏览器的方法

    当我们需要用到webdriver.Edge(),如果没有安装相应的驱动,就会运行错误,显示: 'edgedriver' executable needs to be in PATH. 这是我们需要来到 ...

  6. python Scrapy Selenium PhantomJS 爬取微博图片

    1,创建项目 scrapy startproject weibo #创建工程 scrapy genspider -t basic weibo.com weibo.com #创建spider 目录结构 ...

  7. python下selenium测试报告整合

    使用过一段时间的Robot Framework测试框架,测试之前需要先搭环境,需要安装的东西很多,这一点个人有些排斥. 每一个测试内容对应一个Test_Case,Robot有自己语法格式,如判断.循环 ...

  8. Python 之selenium+phantomJS斗鱼抓取案例

    from selenium import webdriver from bs4 import BeautifulSoup import timeif __name__ == '__main__':dr ...

  9. 【Python】Selenium多级悬浮菜单定位方法分享

    举例图: 以下菜单选择需逐级鼠标悬浮显示才可选择 注明: """触发步骤:1.定位下拉框触发元素---点击----触发下拉框显示2.悬浮一级选择项,触发一级选择项3.悬浮 ...

最新文章

  1. c++以代理的方式来实现接口化编程
  2. 避免内存泄漏 - C++快速入门38
  3. 单片机modbus rtu通讯_Modbus-RTU通讯
  4. [SSH] 设置密钥登陆
  5. ISIS开发出加密安卓通信软件
  6. Java取邮箱名_邮件开发 中的邮箱地址提取!
  7. typedef struct LNode* list和struct LNode有什么区别?
  8. 腾讯云IM Web端支持发送语音消息
  9. python练习题:u2.1求三角形斜边长度
  10. matlab矩形滤波器,MATLAB结合矩形窗设计FIR滤波器
  11. CVPR 2019 Oral 论文解读 | 百度提出关于网络压缩和加速的新剪枝算法
  12. HAProxy 源代码阅读指引
  13. CODEVS 2491 玉蟾宫
  14. 英国将强制互联网公司遏制外国政府发布假信息,违法者或被罚款数十亿美元...
  15. 【PBR系列三】BRDF方程及渲染方程
  16. C语言输出对应星座,用c语言解决星座与诞生石关系
  17. “新DeFi”生态的构建,流支付协议Zebec或厚积薄发
  18. 扰码器(二)串行扰码器综述及设计思路
  19. RSA初探,聊聊怎么破解HTTPS
  20. TabControl 选项卡控件

热门文章

  1. React Native之箭头函数和延展操作符(...)
  2. 配置Tomcat使用https协议
  3. python参数估计_python简单实现最大似然估计scipy库的使用详解
  4. Windows服务器SYSTEM权限Webshell无法添加3389账户情况突破总结
  5. hihoCoder week3 KMP算法
  6. delphi 插入表格HTML代码
  7. (2) 第二章 WCF服务与数据契约 服务契约详解(二)- 如何引用WCF提供的服务
  8. jQuery:收集一些基于jQuery框架开发的控件/jquery插件2
  9. [转]Android fragment 重叠问题——通过hide,show方式导致的解决方法
  10. Entityframework:“System.Data.Entity.Internal.AppConfig”的类型初始值设定项引发异常。