python抓取wallhaven首页壁纸
python抓取wallhaven首页壁纸
"""
下载wallheaven首页图片,保存在同级文件夹image中
"""
from bs4 import BeautifulSoup
import requests
import re
import os"""
图片下载函数
Pic_url为图片的url
save_path为图片保存路径
Headers为请求头,有默认参数
"""# noinspection PyDefaultArgument
def DownloadImage(Pic_url, Save_path, Headers={"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/83.0.4103.61 Safari/537.36 '
}):if not os.path.exists(Save_path):os.mkdir(Save_path)pic_name = pic_url[-20:]pic = requests.get(url=Pic_url, headers=Headers)with open(Save_path + pic_name, 'wb') as f:for chunk in pic.iter_content():f.write(chunk)print("图片已保存")if __name__ == '__main__':# wallhaven的网址url = "https://wallhaven.cc/"# 请求头,用于通过wallhaven的检查,wallhaven不支持爬虫爬取headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/83.0.4103.61 Safari/537.36 '}# 获取html文件response = requests.get(url=url, headers=headers)html = BeautifulSoup(response.text, 'html5lib')# 获取每一张图片的高清图片链接,存入列表。由于从上一个页面获取到的链接是打开图片详情页的链接,所以在这再次发起请求。pic_page_url_list = []for item in html.find_all(name='a', href=re.compile("https://wallhaven.cc/w/")):pic_page_url_list.append(item.get("href"))# 逐一下载列表里面的图片for pic_page_url in pic_page_url_list:pic_response = requests.get(url=pic_page_url, headers=headers)pic_html = BeautifulSoup(pic_response.text, 'html5lib')pic_url = pic_html.select('#wallpaper')[0]["src"]if pic_url:print(pic_url)DownloadImage(pic_url, 'image/', headers)else:print("No url")
python抓取wallhaven首页壁纸相关推荐
- Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘
更多详情请查看Honker Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘 给大家推荐一款超好用的壁纸下载网站-- wallhaven 第一次知道这个网站的时候,惊为天 ...
- python爬取必应首页壁纸,Windows每日自动运行
本文所有文件皆默认存储在:D:\\bingImg python获取图片,并设置为桌面壁纸,python文件名保存为:SetBingImgAsWallpaper.py import urllib.req ...
- 我是如何白嫖 Github 服务器自动抓取每日必应壁纸的?
如何使用 Github 服务器自动抓取必应搜索的每日壁纸呢? 如果你访问过必应搜索网站,那么你一定会被搜索页面的壁纸吸引,必应搜索的壁纸每日不同,自动更换,十分精美.这篇文章会介绍如何一步步分析出必应 ...
- 如何使用 Github Actions 自动抓取每日必应壁纸?
Hello world : ) 微信搜「 程序猿阿朗 」.点赞再看,动力无限. 本文 Github.com/niumoo/JavaNotes 和 未读代码博客 已经收录,有很多知识点和系列文章. 如何 ...
- Python爬取wallhaven壁纸 2023.1.31
Python爬取wallhaven壁纸 壁纸页面 前言 源码 壁纸页面 前言 学习中,未加多线程,由于网站.图片大小等因素导致下载缓慢 望各位大神提出建议并加以修善 网站主页及其爬取页如下,可自行修改 ...
- [Python] 抓取必应每日一图,设置为桌面壁纸
在Windows 10 64位系统环境下,使用 Python 3.6 进行图片抓取和设置壁纸操作. 其中,图片链接 https://area.sinaapp.com/bingImg/ 为 Bing 每 ...
- python代码案例详解-我用Python抓取了7000 多本电子书案例详解
安装 安装很简单,只要执行: pip install requests-html 就可以了. 分析页面结构 通过浏览器审查元素可以发现这个电子书网站是用 WordPress 搭建的,首页列表元素很简单 ...
- python抓取gb2312/gbk编码网页乱码问题
做了个网络爬虫抓取网页,但如果网页是gbk/gb2312编码,则会出现乱码问题,如下: 取得文字后,直接打印,输出结果str如下:¹óÖÝÈËÊ¿¼ÊÔÐÅÏ¢Íø_¹óÖÝÈËÊ¿¼ÊÔÍø_¹ ...
- 手把手教你入侵网站修改数据_手把手教你使用Python抓取QQ音乐数据(第四弹)...
[一.项目目标] 通过手把手教你使用Python抓取QQ音乐数据(第一弹)我们实现了获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名.专辑名.播放链接. 通过手把手教你使用Python抓取QQ音乐 ...
最新文章
- 51nod1040 最大公约数之和,欧拉函数或积性函数
- dom4j添加节点的父节点_HTML DOM节点介绍
- windows时间服务器状态,搭建window时间服务器:
- python制作查询工具发给别人使用_Python 制作查询商品历史价格的小工具
- Eclipse找不到或无法加载主类
- Linux上的tomcat版本升级
- 修改注册表解决每次打开office2010都会出现正在配置的问题
- obs源码分析【二】:录制功能剖析
- Android软键盘适配问题
- HTML简单静态页面的编写
- redis的主从同步及高可用集群
- Python+Cplex学习笔记(三)—— docplex官方示例之营养膳食选择
- abb 机械手臂 示例程序
- cp: -r not specified; omitting directory '/usr/local/'
- 配置IKAnalyzer扩展词库
- elo 评分_Elo评分系统:使用Clojure对欧洲冠军联赛球队进行排名
- 学英语(20200312)
- SpringMVC 参数映射与文件上传
- UIView 的部分圆角的设定
- 产品经理修炼需要注意的七个点