环境:python3.8
IDE:pycharm

# coding: utf-8
import requests
from lxml import etree
import re
import uuid
import time
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/63.0.3239.132 Safari/537.36'}class Spider:def imgrun(self,url,count):# 设置保存路径imgpath="A:\img"num = 1self.url=urlself.count=countprint('url========'+url)res=requests.get(url=url,headers=header)# utf8编码res.encoding = 'utf8'# 输出访问网站返回codeprint(res.status_code)# 将request.content 转化为 Elementhtml = etree.HTML(res.content)# 选取图片items = html.xpath('//*[@id="main"]/div[3]/div[1]/div[2]/div/a[1]/img/@src')# print(type(items))for i in items:i+=''imgurl = 'https:' + iprint('开始第'+str(count)+'次 的第'+str(num)+'张图片')# 去掉400*400# imgurl = re.sub(r'!400x400', "", imgurl)print(imgurl)result=requests.get(imgurl)with open(imgpath+'\\'+str(uuid.uuid1())+'.jpeg', 'wb') as f:f.write(result.content)time.sleep(1)num+=1print('download ok')def imgmain(self):# 拼接下一页,从第几次开始就是range起始值加2for i in range(103,110):print("开始第" + str(i-1) + "次")url = "https://www.woyaogexing.com/touxiang/nv/index_{}.html".format(i)self.imgrun(url,i-1)# time.sleep(1)# print(url)sp=Spider()
# sp.modular()
sp.imgmain()

python入门爬虫,爬取女生头像(无需反爬)相关推荐

  1. python可以爬取58同城代码_爬取58同城—字体反爬

    我爬取的是58同城北京租房的索引页. url:https://bj.58.com/chuzu/?PGTID=0d100000-0000-1e00-4039-99b26a4fedeb&Click ...

  2. 爬取起点中文网字体反爬取

    参考文章:https://www.jianshu.com/p/fbc99cf4d557 个人比较喜欢看小说,于是乎想爬取小说网站--起点中文网,在爬取定位过程中遇到了反爬取,咨询了我旁边的前端大神,说 ...

  3. Python网络爬虫数据采集实战:同花顺动态网页爬取

    前文的爬虫都建立在静态网页基础之上,首先通过请求网站url获取到网页源代码.之后对源代码进行信息提取进而存储即可,本文则针对动态网页进行数据采集,首先介绍Ajax相关理论,之后实战爬取同花顺动态网页, ...

  4. 运用Python爬虫爬取一个美女网址,爬取美女图

    运用Python爬虫爬取一个美女网址,爬取美女图 要运用到的python技术: 导入库 1.request 发送请求,从服务器获取数据 2.BeautifulSoup 用来解析整个网页的源代码 imp ...

  5. 用Python实现爬取微信头像

    如何用python实现爬取微信头像 python里面有个itchat包,用这个可以实现 1.先下载 itchat pip install itchat 2.创建一个py文件 import itchat ...

  6. python爬虫能爬取微信密码吗_如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例...

    今天我们继续focus on微信,不过这次给大家带来的是利用Python网络爬虫抓取微信好友总数量和微信好友男女性别的分布情况.代码实现蛮简单的,具体的教程如下. 相信大家都知道,直接通过网页抓取微信 ...

  7. python爬虫微信朋友圈怎么发文字_如何利用Python网络爬虫抓取微信朋友圈的动态(上)...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  8. python抓取微信朋友圈动态_2018最全如何利用Python网络爬虫抓取微信朋友圈的动态...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  9. 2018最全如何利用Python网络爬虫抓取微信朋友圈的动态

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

最新文章

  1. ASP.NET MVC学习:MVC 特性作用(二)
  2. 经典案例之MouseJack
  3. Hadoop入门进阶步步高(三-配置Hadoop
  4. linux ntfs 密码,linux 加载ntfs和fat32分区
  5. 将TQ2440的ADS测试程序放到MDK下或Ubuntu下开发
  6. shell命令技巧——文本去重并保持原有顺序
  7. vm16安装efi win7 方案
  8. linux 系统业务迁移,记录一次linux系统迁移过程
  9. 2021阿里云服务器购买攻略-618年中大促专场
  10. 志愿者报名图片大小调整
  11. Activity的七大生命周期
  12. word/ppt中如何插入11以上带圆圈的数字序号
  13. 长安战疫网络安全卫士守护赛 Shiro?
  14. 如何入门“动物杂交:新视野”
  15. 秘笈分享! 24 小时无人自习室为什么这么火?
  16. Android 4.0.1 源码下载,编译和运行
  17. 启动nacos-server报错:java.io.IOException: java.lang.IllegalArgumentException: db.num is null
  18. 搞技术的要不要学习财务知识
  19. 在aws中使用阿里云的SSL证书
  20. 第1章CRM核心业务介绍

热门文章

  1. YTU 2573: 连续奇数和
  2. uniapp(新手入门)
  3. OpenVINO之二:Windows环境下OpenVINO安装与配置
  4. 计算机技术与科学学费,计算机科学与技术在职研究生学制与学费各是多少?
  5. Adobe Reader 安装后打包绿色版安装
  6. Leader AP是什么?带你了解Leader AP的原理及特性
  7. 华为手机内存卡的照片音乐误删除还能恢复么
  8. 可以看netflix吗_为何Netflix问“您还在看吗?” (以及如何阻止它)
  9. 解决校园网每次连接需要输入账号密码
  10. 用一台计算机操控另一台计算机关机的问题