python抓取wallhaven首页壁纸

"""
下载wallheaven首页图片,保存在同级文件夹image中
"""
from bs4 import BeautifulSoup
import requests
import re
import os"""
图片下载函数
Pic_url为图片的url
save_path为图片保存路径
Headers为请求头,有默认参数
"""# noinspection PyDefaultArgument
def DownloadImage(Pic_url, Save_path, Headers={"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/83.0.4103.61 Safari/537.36 '
}):if not os.path.exists(Save_path):os.mkdir(Save_path)pic_name = pic_url[-20:]pic = requests.get(url=Pic_url, headers=Headers)with open(Save_path + pic_name, 'wb') as f:for chunk in pic.iter_content():f.write(chunk)print("图片已保存")if __name__ == '__main__':# wallhaven的网址url = "https://wallhaven.cc/"# 请求头,用于通过wallhaven的检查,wallhaven不支持爬虫爬取headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/83.0.4103.61 Safari/537.36 '}# 获取html文件response = requests.get(url=url, headers=headers)html = BeautifulSoup(response.text, 'html5lib')# 获取每一张图片的高清图片链接,存入列表。由于从上一个页面获取到的链接是打开图片详情页的链接,所以在这再次发起请求。pic_page_url_list = []for item in html.find_all(name='a', href=re.compile("https://wallhaven.cc/w/")):pic_page_url_list.append(item.get("href"))# 逐一下载列表里面的图片for pic_page_url in pic_page_url_list:pic_response = requests.get(url=pic_page_url, headers=headers)pic_html = BeautifulSoup(pic_response.text, 'html5lib')pic_url = pic_html.select('#wallpaper')[0]["src"]if pic_url:print(pic_url)DownloadImage(pic_url, 'image/', headers)else:print("No url")

python抓取wallhaven首页壁纸相关推荐

  1. Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘

    更多详情请查看Honker Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘 给大家推荐一款超好用的壁纸下载网站-- wallhaven 第一次知道这个网站的时候,惊为天 ...

  2. python爬取必应首页壁纸,Windows每日自动运行

    本文所有文件皆默认存储在:D:\\bingImg python获取图片,并设置为桌面壁纸,python文件名保存为:SetBingImgAsWallpaper.py import urllib.req ...

  3. 我是如何白嫖 Github 服务器自动抓取每日必应壁纸的?

    如何使用 Github 服务器自动抓取必应搜索的每日壁纸呢? 如果你访问过必应搜索网站,那么你一定会被搜索页面的壁纸吸引,必应搜索的壁纸每日不同,自动更换,十分精美.这篇文章会介绍如何一步步分析出必应 ...

  4. 如何使用 Github Actions 自动抓取每日必应壁纸?

    Hello world : ) 微信搜「 程序猿阿朗 」.点赞再看,动力无限. 本文 Github.com/niumoo/JavaNotes 和 未读代码博客 已经收录,有很多知识点和系列文章. 如何 ...

  5. Python爬取wallhaven壁纸 2023.1.31

    Python爬取wallhaven壁纸 壁纸页面 前言 源码 壁纸页面 前言 学习中,未加多线程,由于网站.图片大小等因素导致下载缓慢 望各位大神提出建议并加以修善 网站主页及其爬取页如下,可自行修改 ...

  6. [Python] 抓取必应每日一图,设置为桌面壁纸

    在Windows 10 64位系统环境下,使用 Python 3.6 进行图片抓取和设置壁纸操作. 其中,图片链接 https://area.sinaapp.com/bingImg/ 为 Bing 每 ...

  7. python代码案例详解-我用Python抓取了7000 多本电子书案例详解

    安装 安装很简单,只要执行: pip install requests-html 就可以了. 分析页面结构 通过浏览器审查元素可以发现这个电子书网站是用 WordPress 搭建的,首页列表元素很简单 ...

  8. python抓取gb2312/gbk编码网页乱码问题

    做了个网络爬虫抓取网页,但如果网页是gbk/gb2312编码,则会出现乱码问题,如下: 取得文字后,直接打印,输出结果str如下:¹óÖÝÈËÊ¿¼ÊÔÐÅÏ¢Íø_¹óÖÝÈËÊ¿¼ÊÔÍø_¹ ...

  9. 手把手教你入侵网站修改数据_手把手教你使用Python抓取QQ音乐数据(第四弹)...

    [一.项目目标] 通过手把手教你使用Python抓取QQ音乐数据(第一弹)我们实现了获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名.专辑名.播放链接. 通过手把手教你使用Python抓取QQ音乐 ...

最新文章

  1. 51nod1040 最大公约数之和,欧拉函数或积性函数
  2. dom4j添加节点的父节点_HTML DOM节点介绍
  3. windows时间服务器状态,搭建window时间服务器:
  4. python制作查询工具发给别人使用_Python 制作查询商品历史价格的小工具
  5. Eclipse找不到或无法加载主类
  6. Linux上的tomcat版本升级
  7. 修改注册表解决每次打开office2010都会出现正在配置的问题
  8. obs源码分析【二】:录制功能剖析
  9. Android软键盘适配问题
  10. HTML简单静态页面的编写
  11. redis的主从同步及高可用集群
  12. Python+Cplex学习笔记(三)—— docplex官方示例之营养膳食选择
  13. abb 机械手臂 示例程序
  14. cp: -r not specified; omitting directory '/usr/local/'
  15. 配置IKAnalyzer扩展词库
  16. elo 评分_Elo评分系统:使用Clojure对欧洲冠军联赛球队进行排名
  17. 学英语(20200312)
  18. SpringMVC 参数映射与文件上传
  19. UIView 的部分圆角的设定
  20. 产品经理修炼需要注意的七个点

热门文章

  1. 数学归纳法 Mathematical Induction
  2. 哈工大2018软件构造期末试题答案
  3. SIM卡将逐渐消失,eSIM卡的风口已来?
  4. 合创视觉图文设计排版规则,让你的图文设计更胜一筹
  5. Redis面试汇总笔记
  6. cpu、进程、线程、多线程的一个简单解释(转载)
  7. Vue.js最最最基础入门的笔记整理
  8. 【MATLAB】求微分方程的通解
  9. 记录利用ettercap进行简单的arp欺骗和mitm攻击过程
  10. 细数企业级移动应用应该具备的5大特征