有时候我们的爬虫程序添加了代理,但是我们不知道程序是否获取到了

ip,尤其是动态转发模式的,这时候就需要进行检测了,以下是一种代理是否伪装成功的检测方式,这里推介使用亿牛云提供的代码示例。

Python¶

requests

#! -*- encoding:utf-8 -*-

import requests

import random

# 要访问的目标页面

targetUrl = "http://httpbin.org/ip"

# 要访问的目标HTTPS页面

# targetUrl = "https://httpbin.org/ip"

# 代理服务器

proxyHost = "t.16yun.cn"

proxyPort = "31111"

# 代理隧道验证信息

proxyUser = "16ZKBRLB"

proxyPass = "234076"

proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {

"host" : proxyHost,

"port" : proxyPort,

"user" : proxyUser,

"pass" : proxyPass,

}

# 设置 http和https访问都是用HTTP代理

proxies = {

"http" : proxyMeta,

"https" : proxyMeta,

}

# 设置IP切换头

tunnel = random.randint(1,10000)

headers = {"Proxy-Tunnel": str(tunnel)}

resp = requests.get(targetUrl, proxies=proxies, headers=headers)

print resp.status_code

print resp.text

要检测代理是否获取到,直接在配置代理后访

http://httpbin.org/ip

网站,获取到

ip后再访问www.ip138.com就知道是否获取到了ip。

转载于:https://juejin.im/post/5d08b24a6fb9a07ea7131286

python爬虫时如何知道是否代理ip伪装成功相关推荐

  1. python爬虫教程:爬虫时如何知道是否代理ip伪装成功

    python爬虫教程:爬虫时如何知道是否代理ip伪装成功 有时候我们的爬虫程序添加了代理,但是我们不知道程序是否获取到了ip,尤其是动态转发模式的,这时候就需要进行检测了,以下是一种代理是否伪装成功的 ...

  2. Python爬虫热点项目之实现代理IP池(IP proxy pool)

    代理池概述 代理池就是由多个稳定可用代理IP组成的池子.用来应对ip反爬,而网上的免费代理稳定可用的极少,更有甚者连收费的也不都是稳定可用. 开发环境: windous,python3,sublime ...

  3. Python爬虫:爬取免费代理ip

    之前写的几个爬虫都只能爬取到少量的信息,这是由于一个ip频繁地访问网站,会被认定为非正常的爬虫从而被屏蔽,这时候就需要使用代理ip来访问网站了,具体方法就是在发送request时添加一个proxy参数 ...

  4. Python爬虫简单运用爬取代理IP

    功能1: 爬取西拉ip代理官网上的代理ip 环境:python3.8+pycharm 库:requests,lxml 浏览器:谷歌 IP地址:http://www.xiladaili.com/gaon ...

  5. python爬虫:批量抓取代理ip,进行验证,抓取豆瓣网站影视信息

    本文作为学习笔记参考用: [1]批量抓取代理ip: 找到第三方ip代理的网站,进行分析,并批量抓取,抓取程序放到Proxies_spider.py中,如下所示: import re import re ...

  6. python爬虫2.0.5ProxyIpPool---proxies使用代理IP

    代理IP定义:代替你原来的IP地址去对接网络的IP地址 作用:隐藏自身真是IP,避免被目标网站封掉.代理IP分类: 高匿代理:web端只能看到代理IP 普通代理:web端知道有人通过此代理IP访问,但 ...

  7. (python爬虫时)如何知道是否代理ip伪装成功

    通过请求  http://httpbin.org/get   获得类似以下信息: {"args": {}, "headers": {"Accept&q ...

  8. Python爬虫:制作一个属于自己的IP代理模块

    Python爬虫:制作一个属于自己的IP代理模块 Python爬虫常常会面临自己ip地址被封的情况,也许不懂的读者就只能等ip解封之后再进行接下来的操作了,为什么自己不做一个Python模块专门用于处 ...

  9. Python爬虫:制作一个属于自己的IP代理模块2

    Python爬虫:制作一个属于自己的IP代理模块2 小编前些日子写了一篇关于IP代理模块的博客(Python爬虫:制作一个属于自己的IP代理模块 ),但是那个还需要改进,今天小编改进了一下那个模块,爬 ...

最新文章

  1. 王道考研 计算机网络笔记 第二章:物理层
  2. 从TXT文本文档向Sql Server中批量导入数据
  3. 使用Moles框架实现HttpWebRequest与HttpWebResponse的单元测试
  4. android+adt+很慢,Android的模拟器,在ADT中调试运行AVD时,速度太慢
  5. mvc4 html.pager,MVC分页之MvcPager使用详解
  6. G List it all
  7. 一步步编写操作系统 66 浅析c库函数与系统调用1
  8. session丢失php,PHP Session丢失无效问题总结
  9. 洛谷P1312 Mayan游戏
  10. CentOS通过yum安装高版本gcc
  11. Redis基本数据类型、应用场景、操作指令
  12. 2016-2017 ACM Central Region of Russia Quarterfinal Programming Contest
  13. mysql 数据写入文件格式_数据写入
  14. 190708每日一句 努力VS天赋;假如生活欺骗了你
  15. 成功,动机与目标 读后感 -- 你苦于老大不小一事无成 我们成功的原因是什么
  16. win10共享计算机win7,win7和win10共享文件怎么设置_win10和win7建立局域网共享操作方法...
  17. Icode编程>>>图形化编程>>>1级训练场>>>重复执行练习【1】
  18. 电子面单打印模板规格汇总-快递鸟
  19. mysql数据对比_MySQL--如何快速对比数据
  20. 苹果手机点击input标签页面放大的解决方法

热门文章

  1. 阿里巴巴Java后端社招5面技术总结(Offer已拿)
  2. ui设计的色彩_设计中的色彩综合介绍
  3. lucene中StandardAnalyzer的理解
  4. html鼠标元素效果,如何使用CSS实现鼠标移动控制页面元素效果?(代码示例)...
  5. Linux lvm分区扩容/ gparted 扩容
  6. android 获取英文日期格式,android – 如何获取月和日的语言环境日期格式
  7. 手把手教程13: F460 WDG(看门狗)
  8. vue实现用户获取浏览记录功能
  9. JS添加事件和解绑事件:addEventListener()与removeEventListener()
  10. Redis快速入门——你确定不来瞅瞅?