原文链接:python抓取美女图片实例

python脚本编程,和php类似,主要是作web项目及脚本抓取图片和文章、日志分析等,python比较有名的web开发框架有Django、Tornado、web.py、Bottle、Flask等,抓取图片的实例如下所示:

1、抓取煎蛋(http://jandan.net/)

#my blog:http://www.lylinux.org
import urllib2
from bs4 import BeautifulSoup
import socket#baseurl = "http://dbmeizi.com/"
baseurl = "http://jandan.net/ooxx/"
def user_agent(url):req_header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}req_timeout = 20try:req = urllib2.Request(url,None,req_header)page = urllib2.urlopen(req,None,req_timeout)html = pageexcept urllib2.URLError as e:print e.messageexcept socket.timeout as e:user_agent(url)return pagedef page_loop(pageid):# url = baseurl+'?p=%s'%pageurl = baseurl + 'page-%s'%pageidprint urlpage = user_agent(url)soup = BeautifulSoup(page)total_img = 0img = soup.find_all(['img'])for myimg in img:link = myimg.get('src')total_img += 1print link#  content2 = urllib2.urlopen(link).read()content2 = user_agent(link).read()with open(u'D:\myimg'+'/'+link[-11:],'wb') as code:   code.write(content2)print total_imgreturn total_img
page_start = 1000
page_stop = 1100
total = 0
for i in range(page_start,page_stop):total+=page_loop(i)print total

2、抓取豆瓣妹子(http://dbmeizi.com/)

#my blog:http://www.lylinux.org
import urllib2
from bs4 import BeautifulSoup
import socketbaseurl = "http://dbmeizi.com/"
#伪装浏览器,以免被封
def user_agent(url):req_header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}req_timeout = 20try:req = urllib2.Request(url,None,req_header)page = urllib2.urlopen(req,None,req_timeout)html = pageexcept urllib2.URLError as e:print e.messageexcept socket.timeout as e:user_agent(url)return htmldef page_loop(pageid):url = baseurl+'?p=%s'%pageidprint urlpage = user_agent(url)soup = BeautifulSoup(page)total_img = 0img = soup.find_all(['img'])for myimg in img:link = myimg.get('src')total_img += 1print link#  content2 = urllib2.urlopen(link).read()content2 = user_agent(link).read()#这句代码直接从OSC上面弄下来的#D:\myimg是保存路径,你可以自己改成自己的,但是路径必须要自己创建好with open(u'D:\myimg'+'/'+link[-11:],'wb') as code:code.write(content2)print total_imgreturn total_img
page_start = 0
page_stop = 4
total = 0
for i in range(page_start,page_stop):total+=page_loop(i)print total
#total就是统计下总共保存到本地的图片数量

网友有福了,闲得没事的时候可以下载看看,都很养眼呀。

python抓取美女图片实例相关推荐

  1. python爬虫学习基础教程,批量抓取美女图片!

    python的抓取功能其实是非常强大的,当然不能浪费,呵呵.下面就与大家分享一个python写的美女图自动抓取程序吧! 其中用到urllib2模块和正则表达式模块.下面直接上代码: 用python批量 ...

  2. python抓取网站图片_利用python抓取网站图片

    看了网上关于python抓取网站图片的例子,所以自己也尝试着写一个,但是发现这个网站的src不是标准的路径,需要自己添加前面的目录地址,尝试了几次也不成功,所以希望有经验的朋友指导下. 本人是初学者, ...

  3. python爬取美女图片的练习

    python 爬取美女图片的练习 主要使用 xpath 定位获取 图片的链接 本次练习使用到os库 ,lmxl库 , requests库 import requests from lxml impor ...

  4. python抓取网站图片_python抓取图片示例 python抓取网页上图片

    python抓取网页上图片 这个错误时是什么意思 下面是代码 import re import urllib.request imp正则表达式匹配的url有错误 for x in add: print ...

  5. python学习(24) 使用Xpath解析并抓取美女图片

    Xpath最初用来处理XML解析,同样适用于HTML文档处理.相比正则表达式更方便一些 Xpath基本规则 nodename 表示选取nodename 节点的所有子节点 / 表示当前节点的直接子节点 ...

  6. python抓取网页图片的小案例

    1.分析 ,要抓取的页面的信息以及对应的源码信息 blog.sina.com.cn/s/blog 93dc666c0101b1bj.html 2.代码模块: 导入正则表达的模块 导入url相关的模块 ...

  7. python抓取页面数据实例

    抓取文章数据保存在本地 #coding=utf-8 import urllib import redef getHtml(url):page = urllib.urlopen(url)html = p ...

  8. python抓取360图片之马自达

    #尝试抓取数量较多时,会提示403 forbidden,一次抓取20张图片就不会有问题 url = 'https://image.so.com/j?q=%E9%A9%AC%E8%87%AA%E8%BE ...

  9. 【爬虫实战】手把手教你使用python爬取美女图片

    本文目录 写作缘起 上代码 思路分析 效果展示 写在最后 写作缘起 用python爬虫实现的图片资源下载器,一页页下载图片过于缓慢,当我们要欣赏一些好看的图片时一页页翻太复杂了,干脆写一个图片下载器 ...

最新文章

  1. 华为10GE LAN板与Wan板区别
  2. 【Vue学习第三天】组件的使用
  3. jQuery中Map的使用
  4. java随机输出10计算题
  5. WDS 自动化部署安装 win2008 服务器实验
  6. jmeter执行python脚本,Jmeter+Python-1问题记录jmeter执行Python3的脚本时报 ValueErro
  7. gulp es5语法转换及js/css/html压缩过程
  8. mybatis扫描mapper的xml文件参数
  9. SQL Server 2008 R2 安装
  10. vb串口 任意波特率_串口通讯基本知识
  11. DataSetProvider的Option属性
  12. 最难游戏2计算机5关,最囧游戏2第5关通关攻略
  13. 清华大学计算机信息学院舒教授,清华大学出计算机与信息分社.ppt
  14. 在线字符或文本转二进制工具
  15. 思岚科技A1,A2雷达驱动安装
  16. Win10自带工具DISM修复系统
  17. 如何为word文档增加脚注
  18. 下载英文电子书网站,推荐
  19. 工作流引擎 html5,强大的工作流引擎管理软件平台_轻松实现流程管控_任务驱动...
  20. 绘制业务流程图—入门篇

热门文章

  1. Builder (建造者)模式
  2. 路径规划 | 图解概率路图PRM原理及其参数分析
  3. python全栈开发—函数整理(最后一次整理,不能再全了)
  4. 微博群发私信 php,用PHP基于Redis消息队列实现发布微博的方法
  5. 福特计划在美国销售中国制造的汽车
  6. 华为DHCP配置基础试验
  7. 7. 查询表customer——查询所在城市是北京的顾客姓名,顾客地址,顾客所在城市,邮编。
  8. For my love... Be a heathy gir~
  9. django ForeignKey参数
  10. 猫耳宝贝:“网络打女”身手不凡