文章目录

  • 一.絮叨
    • 1.接上
    • 2.启下
  • 二.代码
  • 三.查看数据
  • 四.总结

一.絮叨

1.接上

自己挖的坑,自己填。上一篇python3APP爬虫–爬取王者荣耀英雄图片(附源码)爬取了王者荣耀英雄图片,数据量有些少,是不是不过瘾?这篇带您使用线程池爬取王者荣耀小姐姐cosplay照片,依然是APP爬虫。
准备工作和思路和上一篇大致相同,由于图片数据量大,加入了线程池,提高下载效率。

2.启下

本次要爬取王者荣耀盒子APP-辅助-精彩合集中所有图片,并且实现分类存储。

二.代码

import json
import requests
import os
from concurrent.futures import ThreadPoolExecutorclass Wzry_Cosplay_Spider(object):def __init__(self):self.base_dir='./wzry_cosplay_pics/'self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'}def get_pics(self):n=1while True:url=f'http://gamehelper.gm825.com/wzry/gallery/list?pn={n}'try:r=requests.get(url,headers=self.headers)json_data=json.loads(r.text)pics_list=json_data.get('list')if len(pics_list)!=0:for pic in pics_list:pic_title=pic.get('title')pic_imgs=pic.get('thumb_img')yield pic_title,pic_imgselse:breakn+=1except:passdef download_pics(self,dirname,imgs):path=self.base_dir+dirnametry:os.makedirs(path)except:passfor img in imgs:filename=img.split('/')[-1]r=requests.get(img,headers=self.headers)with open(path+'/'+filename,'wb')as f:f.write(r.content)print(f'----------------------------\033[31;44m下载{filename}\033[0m成功----------------------------')print(f"----------------------------\033[35;46m[{dirname}]\033[0m下载完成----------------------------")def main():#使用线程池,创建四个线程pool=ThreadPoolExecutor(max_workers=4)wzry_cosplay_spider=Wzry_Cosplay_Spider()for pic_title,pic_imgs in wzry_cosplay_spider.get_pics():pool.submit(wzry_cosplay_spider.download_pics,pic_title,pic_imgs)pool.shutdown()if __name__ == '__main__':main()

在代码中使用了线程池,创建了四个线程,您需量力而行。
控制台一直在输出数据。

三.查看数据

好多小姐姐cosplay图片,都分别存储到了对应的文件夹中,至于您做什么,我就无权多问了。

四.总结

  • 本次爬取了王者荣耀盒子的所有cosplay图片,数据量相比上一篇
    有明显的增加,因此加入了线程池,创建了四条线程,并行地执行任务,大大提高了下载效率。思路、代码方面有什么不足欢迎各位大佬指正、批评!

python3APP爬虫--爬取王者荣耀小姐姐cosplay照片(附源码)相关推荐

  1. python爬虫爬取王者荣耀官网全部英雄头像(源码分享)

    这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests import json from bs4 i ...

  2. python爬虫爬取王者荣耀官网全部装备图片(源码分享)

    这篇文章为源码分享,爬虫的分析过程请阅读文章 <用python爬取王者荣耀官网的英雄皮肤海报(含源码)> 源码 import requests from bs4 import Beauti ...

  3. python3APP爬虫--爬取王者荣耀英雄图片(附源码)

    文章目录 一.准备工作 1.工具 二.思路 1.整体思路 2.爬虫思路 三.获取数据 1.抓包 2.分析json 四.撰写爬虫 五.得到数据 六.总结 之前有写过抖音app用户信息爬虫,因为当时是第一 ...

  4. 用python爬小说_今天分享一个用Python来爬取小说的小脚本!(附源码)

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章天气预报数据分析与统计之美 ,作者:❦大头雪糕❦ Python GUI制作小说下载器教学讲 ...

  5. python爬取天气预报数据并保存为txt格式_今天分享一个用Python来爬取小说的小脚本!(附源码)...

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章天气预报数据分析与统计之美 ,作者:❦大头雪糕❦ Python GUI制作小说下载器教学讲 ...

  6. 今天分享一个用Python来爬取小说的小脚本!(附源码)

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于大邓和他的Python ,作者:大邓 Python爬取知乎数据案例讲解视频 http ...

  7. Java爬虫 --- 爬取王者荣耀英雄图片

    Java爬虫 - 爬取王者荣耀英雄图片 import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Docu ...

  8. Python爬虫 | 爬取高质量小姐姐照片

    Python爬虫 | 爬取高质量小姐姐照片 1.数据来源分析 2.获取author_id_list和img_id 3.制作detial 4.制作detial_list 5.数据保存 6.批量获取 7. ...

  9. Python爬虫爬取王者荣耀英雄人物高清图片

    Python爬虫爬取王者荣耀英雄人物高清图片 实现效果: 网页分析 从第一个网页中,获取每个英雄头像点击后进入的新网页地址,即a标签的 href 属性值: 划线部分的网址是需要拼接的 在每个英雄的具体 ...

最新文章

  1. linux管理用户组,技术|如何在 Linux 系统中通过用户组来管理用户
  2. 【Groovy】MOP 元对象协议与元编程 ( 使用 Groovy 元编程进行函数拦截 | 实现 GroovyInterceptable 接口 | 重写 invokeMethod 方法 )
  3. 我的Ubuntu9.10安装与配置
  4. C++ Builder 5编HOOK程序
  5. IntelliJ Idea 常用快捷键 列表
  6. 推荐一款功能强大的Tomcat 管理监控工具,可替代Tomcat Manager
  7. 【全】.net core平台单元/集成测试结果、覆盖率、圈复杂度到可视化HTML报告之路...
  8. java 添加等待时间_Java中线程等待特定时间的最有效方法 - java
  9. java设计一百亿的计算器_请设计一个一百亿的计算器
  10. jpg怎么合成一份_海外商标注册申请程序复杂吗?应该怎么注册?
  11. python内置模块_三分钟读懂Python内置模块collections
  12. 血管穿刺机器人研究汇总
  13. 中晋最新消息2020年_最新消息!洛阳市第一高级中学发布2020年招生简章
  14. 【组合数学】递推方程 ( 有重根下递推方程通解结构 | 线性无关解 | 有重根下的通解 | 有重根下的递推方程求解示例 | 递推方程公式解法总结 ) ★
  15. java拼音_Java获取汉字对应的拼音(全拼或首字母)
  16. xmind linux,xmind linux免费版下载
  17. 尚医通(二十四)微信退款(取消预约功能)
  18. 关于外国人报考美国专利代理人的基础介绍
  19. PHP 中如何正确统计中文字数
  20. Lyndon的量化修炼之路——均线差与MACD联动策略(一)

热门文章

  1. 小贾同学博客园开通啦
  2. python数据分析及可视化
  3. 股票软件破解常用破解工具介绍
  4. RDP是什么意思?有什么用?
  5. ORB-SLAM2的源码阅读(十二):Optimizer类
  6. Tushare财经数据接口(五)案例——优质基本面的股票池创建
  7. Luogu P3346 [ZJOI2015]诸神眷顾的幻想乡 广义SAM 后缀自动机
  8. 强化学习应用简述---强化学习方向优秀科学家李玉喜博士创作
  9. 精选合辑 | 30个Python数据分析及实战项目(含源码)
  10. input输入框按照字符数限制输入