python抓取美女图片实例

#my blog:http://www.lylinux.org
import urllib2
from bs4 import BeautifulSoup
import socket#baseurl = "http://dbmeizi.com/"
baseurl = "http://jandan.net/ooxx/"
def user_agent(url):req_header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}req_timeout = 20try:req = urllib2.Request(url,None,req_header)page = urllib2.urlopen(req,None,req_timeout)html = pageexcept urllib2.URLError as e:print e.messageexcept socket.timeout as e:user_agent(url)return pagedef page_loop(pageid):# url = baseurl+'?p=%s'%pageurl = baseurl + 'page-%s'%pageidprint urlpage = user_agent(url)soup = BeautifulSoup(page)total_img = 0img = soup.find_all(['img'])for myimg in img:link = myimg.get('src')total_img += 1print link#  content2 = urllib2.urlopen(link).read()content2 = user_agent(link).read()with open(u'D:\myimg'+'/'+link[-11:],'wb') as code:   code.write(content2)print total_imgreturn total_img
page_start = 1000
page_stop = 1100
total = 0
for i in range(page_start,page_stop):total+=page_loop(i)print total

2、抓取豆瓣妹子(http://dbmeizi.com/)

#my blog:http://www.lylinux.org
import urllib2
from bs4 import BeautifulSoup
import socketbaseurl = "http://dbmeizi.com/"
#伪装浏览器,以免被封
def user_agent(url):req_header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}req_timeout = 20try:req = urllib2.Request(url,None,req_header)page = urllib2.urlopen(req,None,req_timeout)html = pageexcept urllib2.URLError as e:print e.messageexcept socket.timeout as e:user_agent(url)return htmldef page_loop(pageid):url = baseurl+'?p=%s'%pageidprint urlpage = user_agent(url)soup = BeautifulSoup(page)total_img = 0img = soup.find_all(['img'])for myimg in img:link = myimg.get('src')total_img += 1print link#  content2 = urllib2.urlopen(link).read()content2 = user_agent(link).read()#这句代码直接从OSC上面弄下来的#D:\myimg是保存路径,你可以自己改成自己的,但是路径必须要自己创建好with open(u'D:\myimg'+'/'+link[-11:],'wb') as code:code.write(content2)print total_imgreturn total_img
page_start = 0
page_stop = 4
total = 0
for i in range(page_start,page_stop):total+=page_loop(i)print total
#total就是统计下总共保存到本地的图片数量

网友有福了，闲得没事的时候可以下载看看，都很养眼呀。

python抓取美女图片实例相关推荐

python爬虫学习基础教程，批量抓取美女图片！
python的抓取功能其实是非常强大的,当然不能浪费,呵呵.下面就与大家分享一个python写的美女图自动抓取程序吧! 其中用到urllib2模块和正则表达式模块.下面直接上代码: 用python批量 ...
python抓取网站图片_利用python抓取网站图片
看了网上关于python抓取网站图片的例子,所以自己也尝试着写一个,但是发现这个网站的src不是标准的路径,需要自己添加前面的目录地址,尝试了几次也不成功,所以希望有经验的朋友指导下. 本人是初学者, ...
python爬取美女图片的练习
python 爬取美女图片的练习主要使用 xpath 定位获取图片的链接本次练习使用到os库 ,lmxl库 , requests库 import requests from lxml impor ...
python抓取网站图片_python抓取图片示例 python抓取网页上图片
python抓取网页上图片这个错误时是什么意思下面是代码 import re import urllib.request imp正则表达式匹配的url有错误 for x in add: print ...
python学习(24) 使用Xpath解析并抓取美女图片
Xpath最初用来处理XML解析,同样适用于HTML文档处理.相比正则表达式更方便一些 Xpath基本规则 nodename 表示选取nodename 节点的所有子节点 / 表示当前节点的直接子节点 ...
python抓取网页图片的小案例
1.分析 ,要抓取的页面的信息以及对应的源码信息 blog.sina.com.cn/s/blog 93dc666c0101b1bj.html 2.代码模块: 导入正则表达的模块导入url相关的模块 ...
python抓取页面数据实例
抓取文章数据保存在本地 #coding=utf-8 import urllib import redef getHtml(url):page = urllib.urlopen(url)html = p ...
python抓取360图片之马自达
#尝试抓取数量较多时,会提示403 forbidden,一次抓取20张图片就不会有问题 url = 'https://image.so.com/j?q=%E9%A9%AC%E8%87%AA%E8%BE ...
【爬虫实战】手把手教你使用python爬取美女图片
本文目录写作缘起上代码思路分析效果展示写在最后写作缘起用python爬虫实现的图片资源下载器,一页页下载图片过于缓慢,当我们要欣赏一些好看的图片时一页页翻太复杂了,干脆写一个图片下载器 ...

python抓取美女图片实例

1、抓取煎蛋(http://jandan.net/)

2、抓取豆瓣妹子(http://dbmeizi.com/)

python抓取美女图片实例相关推荐

最新文章

热门文章