本人使用的是Python3,导入的是requests库

使用的句式如下: 
response = requests.get(url,headers,proxies)

参数url就是你想要爬取的网址,没什么可说的;

参数headers就是将你的爬虫伪装一下,比如谷歌浏览器,而不是一串代码,格式如下: 
headers = {‘user-agent’:’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36’}

参数proxies就是爬虫所使用的ip代理,同一个ip在短时间内高频率的访问某个网站,往往会被服务器封掉ip,这时有两个办法可以解决被封ip的问题,一是降低频率,当然这也会降低爬虫的工作效率,二就是使用代理,也是本文的核心,格式如下: 
proxies = {‘proxy’:’https://110.216.18.44:80‘} 

最终的代码为:

import requestsurl = 'http://www.xicidaili.com/'
headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36'}
proxies = {'proxy':'https://110.216.18.44:80'}
response = requests.get(url,headers=headers,proxies=proxies)

详谈Python爬虫代理设置相关推荐

  1. Python爬虫——代理和代理池

    文章目录 Python爬虫--代理和代理池 1.代理 2.代理池 Python爬虫--代理和代理池 1.代理 代理用处: 突破自身IP访问限制,访问国外资源 访问单位或公司内部资源 提高访问速度 隐藏 ...

  2. scrapy爬虫-代理设置

    scrapy爬虫-代理设置 1.请求头User-Agent代理设置** 1.1 找到middlewares.py 1.2 找到一个绑定的DownloaderMiddlewar(生成scrapy爬虫目录 ...

  3. 干货|Python爬虫如何设置代理IP

    在学习Python爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术导致爬取失败.高强度.高效率地爬取网页信息常常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网页,就很可能被封,这里讲述 ...

  4. python爬虫代理的使用_从零开始写Python爬虫 --- 2.4 爬虫实践:代理的爬取和验证...

    爬网站的时候,由于各种原因,ip被锁了,这个时候我们就需要通过代理来突破封锁.网上有很多代理网站,付费和免费的都有,这次我们就来写一个scrapy爬虫,爬一些免费的代理下来用. 目标分析: 本次爬取了 ...

  5. Python爬虫代理ip异常和超时解决方案

    Python爬虫中的代理ip异常和超时如何解决?程序员在敲代码的过程中,一定会出现一定的错误,特别是像Python爬虫这种程序,并不能肯定每次请求都能保障稳定的返回同样的结果,例如反爬虫机制的强化,代 ...

  6. [python爬虫] BeautifulSoup设置Cookie解决网站拦截并爬取蚂蚁短租

    我们在编写Python爬虫时,有时会遇到网站拒绝访问等反爬手段,比如这么我们想爬取蚂蚁短租数据,它则会提示"当前访问疑似黑客攻击,已被网站管理员设置为拦截"提示,如下图所示.此时我 ...

  7. python爬虫 - 代理ip正确使用方法

    主要内容:代理ip使用原理,怎么在自己的爬虫里设置代理ip,怎么知道代理ip是否生效,没生效的话哪里出了问题,个人使用的代理ip(付费). 目录 代理ip原理 输入网址后发生了什么呢? 代理ip做了什 ...

  8. python爬虫代理ip_Python爬虫如何获取代理ip及ip验证?

    如何获取大量的公开数据信息,这是我们互联网在竞争激烈的环境中的生存之道,不管在什么环境下都要学习和了解用户市场,客户需求,竞争对手,如何能获取到大量的数据信息,那么就需要用到网络爬虫. 在我们从事py ...

  9. Python爬虫:设置Cookie解决网站拦截并爬取蚂蚁短租

    我们在编写Python爬虫时,有时会遇到网站拒绝访问等反爬手段,比如这么我们想爬取蚂蚁短租数据,它则会提示"当前访问疑似黑客攻击,已被网站管理员设置为拦截"提示,如下图所示.此时我 ...

最新文章

  1. tomcat源码研究
  2. Chapter34 创建主窗口/实现应用程序功能
  3. 改善EF代码的方法(下)
  4. Linux(树莓派)安装 python-opencv
  5. ubuntu 修改 ssh默认端口号
  6. java 中 正则 正则表达式 匹配 url
  7. 【MVC5】对MySql数据库使用EntityFramework
  8. ITU-T Technical Paper: 测量QoS的基本网络模型
  9. DirectX Audio和DirectShow入门
  10. QueryDSL介绍
  11. 去除winrar的弹窗广告方法(亲测有效)
  12. matlab符号运算求二阶微分方程,matlab二阶微分方程求解x 0.2x 0.4x=0.2u(t)
  13. 四旋翼飞行器——飞行原理
  14. Android MTK Metadata Configuration
  15. java 通用事件回调类(观察者队列)
  16. 桥接路由器总是掉线_桥接后副路由器网速特别慢,而且经常掉线
  17. 2M字节Flash Rom存储器W25Q16/W25X16 认识Flash
  18. springboot基于Java的多元化智能选课系统毕业设计源码040909
  19. Redis原子计数器incr,防止并发请求
  20. 高校校园网代理Motion pro持续重连解决办法

热门文章

  1. PHP对接农行快e通授权登录
  2. 曾经很火的BADUSB测试记录
  3. 指纹定位蓝牙打点工具
  4. NKUOJ 1004题 糖葫芦游戏
  5. Hive理论知识汇总
  6. 重置服务器硬件管理口 IMM IPMI BMC 密码
  7. [CF1705E Mark and Professor Koro]
  8. 男人必读 --看了永不后悔,女人想看也可以进去……
  9. 小米智能插座 离线 问题解决方法
  10. 数据分析--pandas--透视表与交叉表