python抓取wallhaven首页壁纸

"""
下载wallheaven首页图片，保存在同级文件夹image中
"""
from bs4 import BeautifulSoup
import requests
import re
import os"""
图片下载函数
Pic_url为图片的url
save_path为图片保存路径
Headers为请求头,有默认参数
"""# noinspection PyDefaultArgument
def DownloadImage(Pic_url, Save_path, Headers={"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/83.0.4103.61 Safari/537.36 '
}):if not os.path.exists(Save_path):os.mkdir(Save_path)pic_name = pic_url[-20:]pic = requests.get(url=Pic_url, headers=Headers)with open(Save_path + pic_name, 'wb') as f:for chunk in pic.iter_content():f.write(chunk)print("图片已保存")if __name__ == '__main__':# wallhaven的网址url = "https://wallhaven.cc/"# 请求头，用于通过wallhaven的检查，wallhaven不支持爬虫爬取headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/83.0.4103.61 Safari/537.36 '}# 获取html文件response = requests.get(url=url, headers=headers)html = BeautifulSoup(response.text, 'html5lib')# 获取每一张图片的高清图片链接，存入列表。由于从上一个页面获取到的链接是打开图片详情页的链接，所以在这再次发起请求。pic_page_url_list = []for item in html.find_all(name='a', href=re.compile("https://wallhaven.cc/w/")):pic_page_url_list.append(item.get("href"))# 逐一下载列表里面的图片for pic_page_url in pic_page_url_list:pic_response = requests.get(url=pic_page_url, headers=headers)pic_html = BeautifulSoup(pic_response.text, 'html5lib')pic_url = pic_html.select('#wallpaper')[0]["src"]if pic_url:print(pic_url)DownloadImage(pic_url, 'image/', headers)else:print("No url")

python抓取wallhaven首页壁纸相关推荐

Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘
更多详情请查看Honker Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘给大家推荐一款超好用的壁纸下载网站-- wallhaven 第一次知道这个网站的时候,惊为天 ...
python爬取必应首页壁纸，Windows每日自动运行
本文所有文件皆默认存储在:D:\\bingImg python获取图片,并设置为桌面壁纸,python文件名保存为:SetBingImgAsWallpaper.py import urllib.req ...
我是如何白嫖 Github 服务器自动抓取每日必应壁纸的？
如何使用 Github 服务器自动抓取必应搜索的每日壁纸呢? 如果你访问过必应搜索网站,那么你一定会被搜索页面的壁纸吸引,必应搜索的壁纸每日不同,自动更换,十分精美.这篇文章会介绍如何一步步分析出必应 ...
如何使用 Github Actions 自动抓取每日必应壁纸?
Hello world : ) 微信搜「程序猿阿朗」.点赞再看,动力无限. 本文 Github.com/niumoo/JavaNotes 和未读代码博客已经收录,有很多知识点和系列文章. 如何 ...
Python爬取wallhaven壁纸 2023.1.31
Python爬取wallhaven壁纸壁纸页面前言源码壁纸页面前言学习中,未加多线程,由于网站.图片大小等因素导致下载缓慢望各位大神提出建议并加以修善网站主页及其爬取页如下,可自行修改 ...
[Python] 抓取必应每日一图，设置为桌面壁纸
在Windows 10 64位系统环境下,使用 Python 3.6 进行图片抓取和设置壁纸操作. 其中,图片链接 https://area.sinaapp.com/bingImg/ 为 Bing 每 ...
python代码案例详解-我用Python抓取了7000 多本电子书案例详解
安装安装很简单,只要执行: pip install requests-html 就可以了. 分析页面结构通过浏览器审查元素可以发现这个电子书网站是用 WordPress 搭建的,首页列表元素很简单 ...
python抓取gb2312/gbk编码网页乱码问题
做了个网络爬虫抓取网页,但如果网页是gbk/gb2312编码,则会出现乱码问题,如下: 取得文字后,直接打印,输出结果str如下:¹óÖÝÈËÊÂ¿¼ÊÔÐÅÏ¢Íø_¹óÖÝÈËÊÂ¿¼ÊÔÍø_¹ ...
手把手教你入侵网站修改数据_手把手教你使用Python抓取QQ音乐数据（第四弹）...
[一.项目目标] 通过手把手教你使用Python抓取QQ音乐数据(第一弹)我们实现了获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名.专辑名.播放链接. 通过手把手教你使用Python抓取QQ音乐 ...

python抓取wallhaven首页壁纸

python抓取wallhaven首页壁纸

python抓取wallhaven首页壁纸相关推荐

最新文章

热门文章