这里爬取的是http://sc.chinaz.com/tag_tupian/OuMeiMeiNv.html网站
献上欧美美女!!!!

from lxml import etree
import urllib.request,os,timeclass OuMeiSpider(object):def __init__(self,start_page,end_page):self.start_page = start_pageself.end_page = end_pageself.first_url = 'http://sc.chinaz.com/tag_tupian/OuMeiMeiNv.html'self.url = 'http://sc.chinaz.com/tag_tupian/OuMeiMeiNv_{}.html'self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36',}def get_request(self,page):#判断使得否为第一页if page == 1:url = self.first_urlelse:url = self.url.format(page)#构建请求对象request = urllib.request.Request(url=url,headers=self.headers)return requestdef parse_content(self,content):#生成tree对象tree = etree.HTML(content)#图片地址img_src_list = tree.xpath('//div[@id="container"]/div/div/a/img/@src2')# print(len(img_src))img_name_list = tree.xpath('//div[@id="container"]/div/div/a/img/@alt')#下载图片for img_src in img_src_list:filename = img_name_list[img_src_list.index(img_src)] + '.' + img_src.split('.')[-1]dirname = 'oumei'print("正在下载%s-----"%filename)filepath = os.path.join(dirname,filename)#写入图片urllib.request.urlretrieve(img_src,filepath)print("结束下载%s-----" % filename)time.sleep(2)def run(self):for page in range(self.start_page,self.end_page+1):#拼接地址request = self.get_request(page)#发送请求得到响应,并且将响应直接转化为内容content = urllib.request.urlopen(request).read().decode('utf8')#解析内容self.parse_content(content)def main():start_page = int(input("请输入起始页"))end_page = int(input("请输入终止页"))obj = OuMeiSpider(start_page,end_page)obj.run()if __name__ == '__main__':main()

python爬取欧美美女图片---xpath方法相关推荐

  1. python爬取百度美女图片

    首先用chrome浏览器打开百度图片官网,抓包发现url https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj& ...

  2. python爬取网站美女图片

    今天周五,项目刚刚上线完,有些时间,闲着无聊,继续复习爬虫,这次打算爬取网站的美女图片.得先找到目标,然后目标网站还不会反爬虫,因为自己只是小白,好了开始. 寻找目标,发现了目标,哈哈 http:// ...

  3. 利用Python爬取网页美女图片,哇太多了,我U盘装满了!

    最近几天,研究了一下一直很好奇的爬虫算法.这里写一下最近几天的点点心得.下面进入正文: 你可能需要的工作环境: Python 3.9官网下载 我们这里以sogou作为爬取的对象. 首先我们进入搜狗图片 ...

  4. Python—爬取简历模板案例(Xpath方法)

    源码: import requests import os from lxml import etreeif not os.path.exists('./简历模板'):os.mkdir('./简历模板 ...

  5. 使用Python爬虫爬取网络美女图片

    代码地址如下: http://www.demodashi.com/demo/13500.html 准备工作 安装python3.6 略 安装requests库(用于请求静态页面) pip instal ...

  6. python爬取网站美女图(附代码及教程)爬虫爬取海量手机壁纸,电脑壁纸,美女图片,风景图片等

    想要练习爬虫的兄弟们,可以看看这个 如果大神们看到有哪里可以改进的地方,请告诉小弟,我是个纯纯新手,练习了几次爬虫 以前一直用的BeautifulSoup,一直没有接触过正则表达式 正则表达式是一个非 ...

  7. Python爬取自然风景图片代码

    Python爬取自然风景图片代码 \qquad 需要用到python的etree库和requests库,需要提前下载安装. from lxml import etree import requests ...

  8. python爬取贴吧图片_Python爬取贴吧多页图片

    Python爬取贴吧图片都只能爬取第一页的,加了循环也不行,现在可以了. #coding:utf-8 import urllib import urllib2 import re import os ...

  9. python爬取网站的图片

    python爬取网站的图片 本次爬取图片所需要用到的库:Requests库,BeautifulSoup库,正则表达式,os库. 思路:先爬一张图片,再爬一个网站的图片 先爬一张图片: 首先要得到这张图 ...

最新文章

  1. CVPR2020论文点评: AdderNet(加法网络)
  2. diy nas配置推荐2020_2020适合大学生专业需求及玩游戏的电脑配置推荐
  3. jQuery的效果方法
  4. DM368开发 --IPNC 设置过程
  5. linux的硬件系统管理,Linux 系统硬件管理的基础知识(四)
  6. 25 WM配置-策略-入库策略5-定义托盘策略P(Pallet Strategy)
  7. matlab unicode,MATLAB中的汉字编码
  8. Android 系统(172)---如何使用addr2line命令解析native backtrace
  9. sql 可以多个分组吗_你知道吗?罗非鱼的品种多达100多个,不单是食用鱼也可以是观赏鱼...
  10. Hive四种数据导入方式介绍
  11. 轨迹分析_解析几何中的轨迹问题中经典问题,有详细分析及其解答
  12. 计算机应用基础试题及答案东师,计算机应用基础试题及答案东师
  13. AT89S52单片机之定时器/计数器
  14. 光模块测试CEI-28G-VSR 浅析1---背景基础介绍
  15. html中如何在数字上加方框,EXCEL单元格中方框添加数字(或者数字添加方框)
  16. 3.32 小猪短租的爬虫-
  17. 计算机大赛指导老师自评怎么写,教学大赛自我评价.docx
  18. 2048的C语言实现
  19. 小知识--电脑的快捷键
  20. python动态监控日志内容

热门文章

  1. [转]原子模型的历史演变
  2. 阿里三面:灵魂拷问——有react fiber,为什么不需要vue fiber?
  3. 微信分享 电脑端正常,手机端不行
  4. ZBrush笔刷设置快捷键方法
  5. ArcGIS10.5安装无法更改许可管理器,显示localhost不是有效的管理器
  6. 程序员谈恋爱的故事(一)
  7. QML笔记:QML基本概念及使用
  8. 微信——H5实现微信摇一摇
  9. You辉编程_kafka
  10. 经典合集 - WP8.1数据源