今天闲来无事,随便写的一个从代理发布网站上提取可用代理列表的脚本。

运行后,可以获取http://cn-proxy.com/发布的可用代理ip和端口的列表。

运行效果如下:

源代码如下,请指教:


# -*- coding: utf-8 -*-
# Python:      2.7.8
# Platform:    Windows
# Author:      wucl
# Program:     从代理网站获取可用代理
# History:     2015.6.11import urllib2, re
from bs4 import BeautifulSoupdef get_proxies(url):"""从代理网站获取可用代理ip地址列表并返回"""resp = urllib2.urlopen(url)html = resp.read()soup = BeautifulSoup(html)contents = soup.find_all('tr')regex = re.compile('\d+')proxies = []for each in contents:sock = each.find_all('td')if sock:ip = sock[0].textport = sock[1].textif re.findall(regex, ip):proxy = '%s:%s' %(ip, port)proxies.append(proxy)return proxiesif __name__ == '__main__':url = 'http://cn-proxy.com/'proxies = get_proxies(url)print proxies

使用Python自动获取可用代理列表相关推荐

  1. python扫描proxy并获取可用代理ip列表

    mac或linux下可以work的代码如下: # coding=utf-8import requests import re from bs4 import BeautifulSoup as bs i ...

  2. Python 抓取可用代理IP

    问题描述 在做数据抓取的时候,经常会碰到有些网站对同一IP的访问频率做限制.遇到这种情况一般只有两种解决方案: 降低抓取频率.这种方法在数据变化不频繁,数据量不大的情况下还好,但是,如果数据变化频繁或 ...

  3. python自动获取微信公众号最新文章

    微信公众号获取思路 常用的微信公众号文章获取方法有搜狐.微信公众号主页获取和api接口等多个方法. 听说搜狐最近不怎么好用了,之前用的api接口也频繁维护,所以用了微信公众平台来进行数据爬取. 首先登 ...

  4. python 如何获取数组(列表)长度? len()

    获取单维列表或单维numpy数组的长度 1)单维列表 list1 = [1, 2, 3, 4, 5] print(len(list1)) # 5 2)单维numpy数组 array1 = np.arr ...

  5. Python自动获取Redi缓存验证码

    最近做UI自动化测试,登录是需要进行短信验证码验证,和开发聊了聊思路,就开始着手实施 打开cmd 安装redis库 pip install redis 安装完成后,开始写代码,因为是测试环境,Redi ...

  6. Python自动获取邮箱验证码【上集】

    本文阅读时长:3-5min 声明:本文只作学习研究,禁止用于非法用途,否则后果自负,如有侵权,请告知删除,谢谢! 前置:Google IMAP协议设置 与 专用密码设置 本次教程为自动获取邮箱验证码实 ...

  7. Python自动获取QQ群消息

    由于WebQQ关闭了,无法通过webQQ来自动的获取QQ中的消息,故采用模拟人查看消息的操作方式来实现自动获取消息.通过调用win32实现窗口监听,找到需要获取的消息窗口句柄,再通过模拟Ctrl+C和 ...

  8. python自动获取cookie_selenium3+python自动化12-cookie相关操作(获取和删除)

    前言 在进行接口测试或者自动化测试时,有时就要登录好多次,特别麻烦,那能不能不要一遍一遍输入账号,直接跳过登录页面进行操作.这个时候就要用到cookie,这次主要整理cookie的一些操作,包含获取c ...

  9. python自动获取号码归属地_Python批量获取并保存手机号归属地和运营商的示例

    从Excel读取一组手机号码,批量查询该手机号码的运营商和归属地,并将其追加到该记录的末尾.SAb免费资源网 import requests import json import xlrd from ...

最新文章

  1. 计算机网络中网络拓扑,计算机网络基础知识:不同的网络拓扑结构对网络的影响...
  2. linux简单设计与实现代码,《linux内核设计与实现》第五章(示例代码)
  3. 【科普】STP生成树协议
  4. RTS寻路相关资料收集
  5. word技巧 很有用~
  6. .git文件夹_将Git存储库中的文件夹转换为全新的存储库
  7. 与华为交换机用access_学校机房项目交换机的配置,理解这篇,交换机配置不再难...
  8. (14)Verilog HDL参数:parameter
  9. 服务器返回文件格式,iOS开发--服务器返回的数据解析
  10. 小米全球第二,雷军签发内部嘉奖令;亚马逊被欧盟处以创纪录的8.88亿美元罚款;​PyCharm 2021.2 发布|极客日报...
  11. 车牌号识别易语言代码
  12. Hibernate validator 官网前言中文版
  13. 读取图片java_用java读取图片的三种方式
  14. 网络附加存储(NAS)
  15. 关于如何在chrome中下载网页flash视频
  16. Proximity sensor---Px318J
  17. Ubuntu查看Cuda是否全部安装成功
  18. 中国传媒大学计算机课程表,中国传媒大学新学院课程表.doc
  19. 联想拯救者R720加装固态硬盘过程中遇到的小问题
  20. IPFS系列 - 默克有向无环图(Merkle DAG)

热门文章

  1. 我的项目部署到阿里云怎么就那么难?
  2. FANUC机器人如何查看诊断画面状态?
  3. 发光二极管封装常见方法有哪些?温升效应又是什么?
  4. 七天编写指标_操盘线指标公式源码(七天线 工作线 生命线)[通达信公式
  5. c语言指针赋值指针变量赋值吗,C语言_指针变量的赋值与运算,很详细
  6. oracle查看最近三十天的记录,以及排序一定要变成int类型
  7. eclipse工作空间-文件夹org.eclipse.m2e.core-maven索引占空间问题
  8. 互联网+项目计划书(运输市场智能研判计划书)
  9. php如何制作视频特效,视频特效怎么弄 给视频加一个主题样式,简单几步制作出属于自己风格的独特视频...
  10. MAC配置IOS、Android真机以及appium环境配置,最新版(三)