ZOL桌面壁纸提取

这是爬虫的第一部分,对于python基础与网络编程部分重点突出,主要以每次小项目为主;更新时间不定,随缘之人,缘分到了,文章就出来了。

简单说下这次练手的小东西想法:在暑假的时候,看见自己的电脑壁纸有点。。。。,LOW,所以想着做一个WIN下的壁纸切换小程序。这次只是图片提取部分,话不多说来看看代码。

第一步:查看网页源代码(F12/右击审查元素),查看每个组图间、组图下的图片之间的关系。
可以看到该缩略图多对应的有href下的组图链接,以及自己本身的的链接,后缀为JPG,或者鼠标放上去可以看到相关的图片。

点进组图,再查看每个图片的URL结构。如下:

可以看到URL结构与组图相似,点击下一页,URL自动变化(URL后5个参数发生变化),没办法找到相关的规律,可能我比较菜。。。。

找到NetWork下的网页源代码,这个是没有任何渲染源代码,
我们找到这个:
发现规律了吗?有思路的可以试试。

然后我们写的代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# author:albert time:2019/7/8
import  requests
from lxml import etree
from random import  randinta = []# 每个组图的url
def This_Mosaic_Url():req = requests.get('http://desk.zol.com.cn/1920x1200/').texthtml = etree.HTML(req)url = html.xpath("//div//li[@class='photo-list-padding']//a/@href")for i in url:url_list = 'http://desk.zol.com.cn' + ia.append(url_list)def list_randan():it= iter(a)# print(next(it))return  next(it)# 每个组图下的所有图片
def img_picture():# 第一个url===>"http://desk.zol.com.cn/bizhi/7590_94212_2.html"list = [a[0]]while True:url_1 = 'http://desk.zol.com.cn'req = requests.get(list[-1],timeout=3).texthtml = etree.HTML(req)url_detail = ''.join(html.xpath("//div[@class='photo-next prev-next']//a/@href"))if url_detail == 'javascript:;':try:for i in range(15):href = list_randan()list.append(href)except:passelse:url = url_1 + url_detaillist.append(url)print(len(list))for x in list:print(x)if __name__ == '__main__':This_Mosaic_Url()img_picture()

这是以上实现的思路,如果有什么疑问欢迎在下面留言!

鸡汤:学习不是三分钟的热血,而是一辈子所为之努力的,加油吧,骚年!

ZOL桌面壁纸的提取相关推荐

  1. python桌面爬虫_爬虫项目实战十三:爬取zol桌面壁纸

    目标 爬取zol桌面壁纸,批量下载图片. 项目准备 软件:Pycharm 第三方库:requests,fake_useragent,re,lxml 网站地址:http://desk.zol.com.c ...

  2. Python运用urllib2和BeautifulSoup爬取网站ZOL桌面壁纸上的精美电脑壁纸

    Python运用urllib2和BeautifulSoup爬取网站ZOL桌面壁纸上的精美电脑壁纸 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Ti ...

  3. 使用requests+lxml爬取zol桌面壁纸

    明确爬取路线 我们要爬取的是ZOL桌面壁纸的壁纸下载排行榜系列壁纸 而要获取到每个下载排行榜系列的图片必须点击对应专题进入专题详情页才能看到专题对应的壁纸,这些壁纸就是我们要爬取的对象,归纳一下: 获 ...

  4. Python网络爬虫小试刀——抓取ZOL桌面壁纸图片3

    前篇回顾:下载一个类型集合的全部图片 本篇目标:获得一个集合页面中所有集合中所有的图片 使用urllib2获取已知集合网页页面的HTML代码,首先使用正则表达式获取本页图片集合的url,根据上篇所写戏 ...

  5. Python网络爬虫小试刀——抓取ZOL桌面壁纸图片2

    前篇回顾:如何已知图片的url下载图片 本篇目标:下载一个类型集合的全部图片 使用urllib2获取,首先使用正则表达式获取本页图片的url,根据上篇所写downloadImg函数将图片下载到指定文件 ...

  6. python爬取ZOL桌面壁纸图片

    最近迷上了爬虫,看了一丢丢视频学习之后,开始实战,爬取图片地址: http://desk.zol.com.cn/ 循环爬取"风景"图片,实现代码如下: from urllib im ...

  7. python手机壁纸超清_Python 爬取高清桌面壁纸

    今天写了一个脚本用来爬取ZOL桌面壁纸网站的高清图片: 本程序只爬了美女板块的图片,若要下载其他板块,只需修改程序中的"meinv"即可 代码如下: #coding=utf-8 i ...

  8. Python 爬取高清桌面壁纸

    今天写了一个脚本用来爬取ZOL桌面壁纸网站的高清图片: 链接:http://desk.zol.com.cn/1920x1080/ 本程序只爬了美女板块的图片,若要下载其他板块,只需修改程序中的&quo ...

  9. 如何把windows锁屏画面提取成JPG图像,并作为桌面壁纸

    Win10自带的锁屏界面很多都非常美观,如果我们想要获得其图像,其具体步骤如下: 第一步:找到保存锁屏壁纸的位置, C:\Users\(你的用户名)\AppData\Local\Packages\Mi ...

最新文章

  1. [Trie] Luogu P2580 于是他错误的点名开始了
  2. 影场与属性访问器界面
  3. 源码安装zabbix遇到的报错集锦
  4. vue3修改index.html中的link,icon无效问题,需要配置pwa
  5. java随机生成车牌_JDBC:随机生成车牌号,批量插入数据库
  6. kubernetes的常用命令
  7. 解决“‘pip‘ 不是内部或外部命令,也不是可运行的程序或批处理文件“的问题
  8. OpenCV——高效遍历图像(C++版本)
  9. android:windowSoftInputMode属性;界面关闭后软键盘不隐藏的解决方法;
  10. 计算机控制技术(本科生专业选修课) 期末考试总结
  11. ArcGIS——地理配准操作
  12. GaRy-Liang的linux成长日记2-系统安装
  13. 【Qt Quick】零基础入门系列之安装与卸载(一)
  14. 荣耀30sr升级鸿蒙,华为荣耀30怎么升级鸿蒙系统?
  15. mysql的join查询和多次查询比较
  16. 给你的网页加个二次元老婆吧
  17. 安全狗2周年“全民大抽奖”活动
  18. winform数独C#的数独游戏
  19. 两次考研失利!但这一次「我没输」
  20. 电脑微信linux安装程序,Ubuntu安装Linux网页版微信

热门文章

  1. 让人发狂的sql语句!
  2. 互联网快讯:SpaceX星链正测试为飞机提供宽带;极米科技高性能产品获好评;雷蛇宣布将从港交所退市
  3. 计算机网络常用端口和协议
  4. 怂了!马斯克被罚1.2亿并卸任董事,特斯拉可以歇歇了
  5. matlab多元回归
  6. 2022华为杯研究生数学建模竞赛B题方案及赛后总结:方形件组批优化问题
  7. Python入门笔记,看完直接玩几个小案例是没有问题滴~
  8. 杭州招银网络科技面经
  9. LeetCode每日一题,积少成多,量变到质变(最近比较忙不定期持续更新.........)
  10. word嵌入对象依损坏_和平精英辅助不好封技术员为你说明注解word临时文件处理步骤辅助...