大致步骤:

第一步:找到我们要爬取的网站 https://www.vmgirls.com/这是个妹子图片的私人网站

第二步:打开Vscode或者Pycharm都可以 复制我的代码,详细的解释写好了

ps:requests库需要手动下载,按win+R输入cmd进入命令行模式,输入pip install
requests安装requests库。

第一部分,请求网页。

# 导入requests库
import requests # 导入re正则表达式库
import re # 导入系统内置库
import os headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}# 用request.get方法访问网址得到网页HTML内容
response = requests.get('https://www.vmgirls.com/12985.html', headers = headers)#网页内容以文本形式打印出来
html = response.text 

设置标题headers防止反爬,标题这样设置的原因是因为我们要模仿我们真的是从这个网页下载图片而不是通过python来获取图片,所以用网站的标题就行了。
查看网站的标题: 在网页中按F12,在菜单栏中选择network可以看到网页的headers,复制粘贴就可以得到原headers了!

第二部分,获取网页内容

#为文件夹起名字用图片的名字命名。
dir_name = re.findall('<h1 class="post-title h3">(.*?)</h1>', html)[-1] # 如果文件夹不存在那么就建立文件夹,不然就不建立
if not os.path.exists(dir_name):os.mkdir(dir_name)# 获取图片地址
urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">', html)# 打印获得的urls
print(urls)

第三部分,保存图片

# 通过for循环来遍历筛选过的urls,然后分别下载保存!
for url in urls:file_name = url.split('/')[-1]response = requests.get(url, headers = headers)with open(dir_name + '/' + file_name, 'wb') as f:f.write(response.content)

以上是详细教程
完成啦!!!!!!!!!!!!!!

完整代码:

# 导入requests库
import requests # 导入re正则表达式库
import re # 导入系统内置库
import os headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}# 用request.get方法访问网址得到网页HTML内容
response = requests.get('https://www.vmgirls.com/12985.html', headers = headers)#网页内容以文本形式打印出来
html = response.text #为文件夹起名字用图片的名字命名。
dir_name = re.findall('<h1 class="post-title h3">(.*?)</h1>', html)[-1] # 如果文件夹不存在那么就建立文件夹,不然就不建立
if not os.path.exists(dir_name):os.mkdir(dir_name)# 获取图片地址
urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">', html)# 打印获得的urls
print(urls)# 通过for循环来遍历筛选过的urls,然后分别下载保存!
for url in urls:file_name = url.split('/')[-1]response = requests.get(url, headers = headers)with open(dir_name + '/' + file_name, 'wb') as f:f.write(response.content)

福利!!!Python爬取好看的妹子图!!!相关推荐

  1. 深夜,我用python爬取了整个斗图网站,不服来斗

    深夜,我用python爬取了整个斗图网站,不服来斗 QQ.微信斗图总是斗不过,索性直接来爬斗图网,我有整个网站的图,不服来斗. 废话不多说,选取的网站为斗图啦,我们先简单来看一下网站的结构 网页信息 ...

  2. Python 爬取表情包-斗图不会输在起跑线

                   Python 爬取表情包-斗图不会输在起跑线 对于酷爱聊天的朋友来说,表情包应该是他们心中的灵魂,没有图的聊天只能算虾扯蛋了.图片(表情包)赋予了聊天更多的内涵,很多时候 ...

  3. 利用python爬取历代中国行政图,从先周到中华人民共和国,jpg格式边框带经纬度,可自行配准矢量化

    古代地图,对于历史相关研究人员,是需要的工具,本想找到历代矢量的历史地图数据,但是发现很难有资源,因此只能找到已经公开制图了jpg数据,如果你有耐心,可以配准后矢量化,获取历代矢量数据,不够工作量浩大 ...

  4. 每日一笑,Python爬取全网baisi趣图

    2019独角兽企业重金招聘Python工程师标准>>> 前言 baisi里面有各种各样的趣图,搞笑视频,搞笑GIF图,搞笑段子,Python为你批量下载全网最搞笑的图片,让你每天都能 ...

  5. Python爬取张家界风景美图

    这里利用周末的时间复习了一下关于爬虫的一些基本知识,分别是requests, BeautifulSoup库的基本知识: 如果还有不会的可以去看看这些内容: 参考 requests库 requests实 ...

  6. 我用python爬取了整个斗图网站

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  7. Python爬取好看的风景照,速看!

    ​ 大家好,我今天给大家分享一个爬取图片的小爬虫,网站是挖好图. 接下来我们就先进行这个网站的板块的分析, 首先,我们按F12或者Ctrl + Shift + I打开开发者工具,切换到网络,然后点击F ...

  8. Python 爬取无版权美图

    这里还是为了温习,这里照例为了放水,涉及网址的地方,采取了url加密,一是scrapy,二是requests,首先是requests方法: import requests import re impo ...

  9. python爬取好看视频_Python 爬取好看视频

    importrefrom bs4 importBeautifulSoupimporturllib.requestimportrequestsimportrandomdefxiazai(url): ur ...

最新文章

  1. php从数据库读取中文显示问号??的解决办法
  2. 如何让引擎蜘蛛天天光临你的网站
  3. 系统mysql数据库服务器,系统mysql数据库服务器
  4. 快速搭建Nextcloud+OnlyOffice私有云办公平台
  5. ILP32和LP64数据模型
  6. ASA下邮件发送经常失败
  7. 在线看Android系统源码,相见恨晚的几种方案
  8. java连接FTP下载文件
  9. 硬盘变成Raw格式 与 移动硬盘报I/O错误问题
  10. python加载图片的方法_python实现读取并显示图片的两种方法
  11. python ffmpeg模块_python 模块之-ffmpeg 中文参数对照表
  12. Note: the configuration keeps the entry point 'XXX', but not the descriptor class 'XXX'
  13. TSP_旅行商问题 - 模拟退火算法(三)
  14. matlab命令窗口作用是什么,wcodemat这个命令在matlab中是实现什么功能的
  15. java mocked_java – 使mocked方法返回传递给它的参数
  16. 浙江正高级计算机职称,浙江省厅:最终名单!共5207人通过高级职称评审/272人通过正高级职称!附全名单...
  17. 只有毅力和决心无往不利
  18. 微信小程序设置导航栏标题颜色
  19. 一直搞不懂SIMNOW网站的逻辑
  20. 《计算方法》---雅克比迭代法和高斯赛德尔迭代法(python实现)

热门文章

  1. Fastjson1.2.47版本远程命令执行漏洞
  2. 新基建赛场上 宁畅ODM为何备受青睐?
  3. 对element-upload二次封装文件图片上传
  4. Win98 源代码(特别版)
  5. 云媒体服务器设置在哪个文件夹,安装和使用Jellyfin配置Linux媒体服务器
  6. docker部署apache服务(使用存储卷)
  7. 《牛奶可乐经济学》---机会成本
  8. 华为鸿蒙六月更新机型,华为鸿蒙OS带来好消息,这8款机型6月2日升级,有你的手机吗?...
  9. c语言实现磁盘存储空间的分配和回收,操作系统磁盘管理 借鉴资料
  10. 如何恢复 Linux 上删除的文件:ext2