请复制粘贴的小伙伴注意,如果该程序被执行不主动停止的话,将会在你的电脑 D:/图片及视频/图片/爬虫 目录中一直自动创建分类文件夹并自动下载图片直到程序循环结束。
运行条件:需要在pycharm中安装request、lxml代码如下

pip install request
pip install lxml
import os
import requests
from lxml import etree
page = 1
while page <= 11:url = f"https://www.mmonly.cc/mmtp/qcmn/list_16_{page}.html"page+=1headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36"}response = requests.get(url,headers=headers)picture_html_str = response.content.decode("gbk")picture_html = etree.HTML(picture_html_str)picture_root = picture_html.xpath(".//div[@class='item masonry_brick masonry-brick']")for picture in picture_root:# time.sleep(2)#文件名dir_name = picture.xpath(".//div[@class='title']/span/a/text()")[0]#图片地址picture_adr = picture.xpath(".//div[@class='title']//a/@href")[0]#获取该类图片数位置picture_num_adr_str = picture.xpath(".//div[@class='items_likes']/text()")#对获取该位置的文本进行格式化picture_num_str = "".join(picture_num_adr_str).split("共")[-1]#获取该图片数量picture_num = int(picture_num_str.split("张")[0])# 创建目录try:os.mkdir(f"D:/图片及视频/图片/爬虫/{dir_name}")except Exception as e:print(e)#为防止第二次循环出现地址追加固定前部分地址字符picture_adr_fix = picture_adr[:-5]for i in range(picture_num):#获取每一种图的所有图链接img_response = requests.get(picture_adr, headers=headers)#每种图的地址picture_adr = picture_adr_fix + f"_{i+2}.html"img_html_str = img_response.content.decode("gbk")img_html = etree.HTML(img_html_str)# 获取图片的urlimg_url = img_html.xpath(".//div[@id='big-pic']//img/@src")[0]with open(f"D:/图片及视频/图片/爬虫/{dir_name}/{i}.jpg","wb") as f:f.write(requests.get(img_url).content)

python爬取“唯一图库->美图“前11页高清大图代码相关推荐

  1. Python爬取张家界风景美图

    这里利用周末的时间复习了一下关于爬虫的一些基本知识,分别是requests, BeautifulSoup库的基本知识: 如果还有不会的可以去看看这些内容: 参考 requests库 requests实 ...

  2. python爬取唯一图库高清壁纸

    文章目录 写在前面 标题非常可口 1:用到的包 2:定义主函数 3:获取图库的地址 4:创建图库路径并保存第一张 5:正则提取壁纸的URL特征 6:保存壁纸 完整代码 爬取结果 写在后面 写在前面 今 ...

  3. Python爬取动态加载的壁纸网站(高清壁纸福利)

    "静态网页"和"动态网页" "静态网页":一次性加载,爬虫可以爬到全部信息.关于静态网页的Demo "动态网页":分多次 ...

  4. 【Python爬虫系列教程 18-100】Python网络爬虫实战:小姐姐手把手教你爬取并下载英雄联盟所有英雄皮肤高清大图

    文章目录 前言 一.分析页面 二.分析第二个页面 三.代码 四.下载结果 前言 上次教你怎么爬取王者荣耀,今天小姐姐教你使用几十行代码下载英雄联盟所有皮肤,你看我下载的九尾妖狐.

  5. Python 爬取无版权美图

    这里还是为了温习,这里照例为了放水,涉及网址的地方,采取了url加密,一是scrapy,二是requests,首先是requests方法: import requests import re impo ...

  6. 深夜,我用python爬取了整个斗图网站,不服来斗

    深夜,我用python爬取了整个斗图网站,不服来斗 QQ.微信斗图总是斗不过,索性直接来爬斗图网,我有整个网站的图,不服来斗. 废话不多说,选取的网站为斗图啦,我们先简单来看一下网站的结构 网页信息 ...

  7. python 爬取5566图库图片

    python 爬取5566图库图片 1 import requests 2 import random 3 import re 4 import time 5 import os 6 from bs4 ...

  8. Python爬取百度图库

    Python爬取百度图库 页面分析 通过Chrome 的开发者模式,我们可以很发现 百度图库是通过ajax 加载图片的. 每一次都会发送一个请求:https://image.baidu.com/sea ...

  9. Python 爬取表情包-斗图不会输在起跑线

                   Python 爬取表情包-斗图不会输在起跑线 对于酷爱聊天的朋友来说,表情包应该是他们心中的灵魂,没有图的聊天只能算虾扯蛋了.图片(表情包)赋予了聊天更多的内涵,很多时候 ...

最新文章

  1. 硬件安全(一) 概述
  2. Spring Security OAuth2——自定义OAuth2第三方登录(Gitee)并与UsernamePassword登录关联解决方案
  3. DOM-7 【兼容】事件处理函数、冒泡捕获、阻止冒泡默认事件
  4. HALCON示例程序classify_image_class_svm.hdev使用SVM分类器对多通道图像进行分类
  5. word List 22
  6. mysql saveorupdate_Mybatis SaveOrUpdate插件
  7. 【原】让两个DIV高度一样的Javascript函数
  8. AltiumDesigner06——常见晶振封装尺寸
  9. 书名带冒号_书名号、引号、括号和冒号如何套用
  10. 《Nature》子刊发布,IIT科学家模仿“植物的触须”,打造可逆渗透致动的仿生软体机器人
  11. 关于win10 睡眠或关屏恢复后卡顿的问题
  12. app上线指南(中文版)
  13. 淘宝越来越重视的内容营销要怎么去做?
  14. 你不知道的css——4. 基线、中线、x-height、单位ex(含文本与图标对齐技巧)
  15. 「文献解读」RNAi在油菜研究中的应用
  16. 面向95后的营销和增长,你需要知道这些( ゜- ゜)つロ 乾杯
  17. Qt源码解析之QThread
  18. 神经网络阈值是什么意思,神经网络阈值如何确定
  19. 最近用360浏览器访问部分网站显示 se://error/ 打不开网站,但是用别的浏览器可以正常访问,摸索半天放出解决方法
  20. PC端使用百度地图查询经纬度

热门文章

  1. JAVA:实现Factorial阶乘算法(附完整源码)
  2. 铁甲小宝像车轮的是什么机器人_谁是铁甲小宝最强机器人?车轮滚滚不在其中,鲨鱼辣椒比它差太远...
  3. matlab中gad,听见朝鸣丨对话GAD:文化土壤中生长的建筑美学
  4. 【第二届青训营-寒假前端场】- 「构建Webpack知识体系」笔记
  5. 奔跑吧机器人发货_奔跑吧,机器人!
  6. matlab fdt,fsl中fdt操作指导
  7. FSL——FDT数据统计处理TBSS
  8. flask之搭建web服务
  9. Sleep、SleepEx
  10. 学习python-day01-01---转自Python分布式爬虫打造搜索引擎Scrapy精讲