第一次真正的完成了一个爬虫,爬的是煎蛋网图片,望大神指点

爬取的时候只需要设置PAGE参数就可以来,爬取的总页数会比设置的页数多一页

# @Time    : 2020-07-20
# @Author  : 黎先生
# @FileName: jandan.py
# @Blog    :https://blog.csdn.net/q79815321import requests
from bs4 import BeautifulSoup
import re#正则表达式匹配图片
FIND_IMG = re.compile(r'src="//(.*?)"')#爬取页数
PAGE = 0#初始首页
URL = "http://i.jandan.net/ooxx"#请求头
HEADERS = {"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36","Connection":"keep-alive",}#下载图片
def Get_Img(URL):#发送请求response = requests.get(URL,headers=HEADERS)bs = BeautifulSoup(response.text,"html.parser")#用BeautifulSoup对象查找图片标签data_list = bs.find_all("img",referrerpolicy="no-referrer")#循环写入图片for i in data_list:#用正则匹配图片urlimg = re.findall(FIND_IMG,str(i))#写入图片with open("./pic/{}".format(img[0][-10:]),'wb') as f:#打开图片链接response = requests.get(url="http://" + img[0],headers=HEADERS)#写入f.write(response.content)#得到下一页的链接
def Get_Next_Url(URL):response = requests.get(URL,headers=HEADERS)bs = BeautifulSoup(response.text,"html.parser")#用BeautifulSoup查找下一页的标签html = bs.find_all('a',class_="previous-comment-page")#正则匹配下一页链接next_url = re.findall(r'href="//(.*?)#comments',str(html[0]))#返回链接return "http://" + next_url[0]if __name__ == "__main__":#爬取起始页得图片Get_Img(URL)#循环爬取for i in range(PAGE):#得到下一页的链接URL = Get_Next_Url(URL)#传入下一页得链接并开始爬取Get_Img(URL)

爬虫爬取煎蛋网美女图片相关推荐

  1. python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  2. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  3. Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  4. python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!

    前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...

  5. python3网络爬虫:爬取煎蛋网美女照片

    1.1 前言 今天开学不久,课也不多,就想着来做个爬虫,看着好多老司机喜欢看美女图片,想做个爬去煎蛋网的小爬虫.哈哈,下面开车了,各位,上车记得滴卡 参考: http://blog.csdn.net/ ...

  6. python学习之 爬取煎蛋网美女图

    用到库 os ,requests, base64 os简单介绍:点这里 requests介绍:点这里 base64介绍:点这里 其中 requests和 base64属于第三方库,需要自己安装 pip ...

  7. Python Scrapy 爬取煎蛋网妹子图实例(一)

    前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例 爬取 煎蛋网 妹子图,遗憾的是 上周煎蛋网还有妹子图了,但是这周妹子图变成了 随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...

  8. selenium爬取煎蛋网

    selenium爬取煎蛋网 直接上代码 from selenium import webdriver from selenium.webdriver.support.ui import WebDriv ...

  9. 利用Selenium爬取煎蛋网妹纸图原来是这么简单!!!

    上期说到,下期更新爬取煎蛋网妹纸的selenium版本,它来了!!! 获取页面url信息 获取图片url信息 永久性保存图片 注释: 想要获取GeckoDriver安装包的小伙伴,可以给博主留言或者搜 ...

  10. python爬取煎蛋网妹子图

    看了小甲鱼的python教学视频,爬取煎蛋网妹子图的代码已经不适用了,网上其它人的代码多有报错,本萌新结合其他人的方法,终于写出一个可行的,在此分享_(:з)∠)_(运行非常慢就是了) import ...

最新文章

  1. 谈谈android反编译和防止反编译的方法
  2. 前端需要了解的 Cookies 和 WebStorage
  3. 启明云端分享|在应用SSD201\SSD202D 核心板时,文件系统只读相关问题解决
  4. hihocoder1051 补提交卡(贪心)
  5. 虚拟机中centos安装gcc
  6. android数据持久化存储(2)
  7. Windows10配置CUDA10.0+cudnn7.5.1
  8. python 时间函数小总结
  9. 开始使用 TypeScript
  10. 【优化分配】基于matlab鱼群算法求解无线电功率分配优化问题【含Matlab源码 1523期】
  11. 配置阿里云maven仓库地址
  12. Linux中删除文件,磁盘空间未释放问题追踪
  13. FPGA开发中常见报错或警告汇总
  14. 【国企笔试】263、山有色:水发声 A 山河在:草木深 B 客舍青:柳色新 C 鸟飞绝:人踪灭 D 花作尘:鸟不惊
  15. python加权求和_加权随机算法的python实现
  16. 关于excel选定任意行截图的操作
  17. 什么是ftp,什么是ftp?以及具体使用教程
  18. 红石外汇 RedstoneFX|每日汇评:澳元在非农后的反弹停滞,受困于下降趋势线
  19. 【数据压缩2】TGA格式图片文件分析
  20. Windows Update禁用后自动开启的解决办法

热门文章

  1. HTML之表单元素“Password”引发的思考-你的密码安全吗???
  2. python mysql就业情况_影响员工离职因素分析—Mysql/python
  3. python3.5.2 mysql Exccel
  4. 2016书单总结--看透SpringMvc源代码分析与实践-概述
  5. UPC2022/3/18 晚训练赛补题
  6. 服务器通过ilo安装系统,如何通过ilo开启服务器远程桌面
  7. leaflet所有示例下载
  8. 微信自动加好友可以使用python实现
  9. 中国曲谱网爬虫研究(Python)
  10. Rust: Descending Order