python入门爬虫,爬取女生头像(无需反爬)
环境:python3.8
IDE:pycharm
# coding: utf-8
import requests
from lxml import etree
import re
import uuid
import time
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/63.0.3239.132 Safari/537.36'}class Spider:def imgrun(self,url,count):# 设置保存路径imgpath="A:\img"num = 1self.url=urlself.count=countprint('url========'+url)res=requests.get(url=url,headers=header)# utf8编码res.encoding = 'utf8'# 输出访问网站返回codeprint(res.status_code)# 将request.content 转化为 Elementhtml = etree.HTML(res.content)# 选取图片items = html.xpath('//*[@id="main"]/div[3]/div[1]/div[2]/div/a[1]/img/@src')# print(type(items))for i in items:i+=''imgurl = 'https:' + iprint('开始第'+str(count)+'次 的第'+str(num)+'张图片')# 去掉400*400# imgurl = re.sub(r'!400x400', "", imgurl)print(imgurl)result=requests.get(imgurl)with open(imgpath+'\\'+str(uuid.uuid1())+'.jpeg', 'wb') as f:f.write(result.content)time.sleep(1)num+=1print('download ok')def imgmain(self):# 拼接下一页,从第几次开始就是range起始值加2for i in range(103,110):print("开始第" + str(i-1) + "次")url = "https://www.woyaogexing.com/touxiang/nv/index_{}.html".format(i)self.imgrun(url,i-1)# time.sleep(1)# print(url)sp=Spider()
# sp.modular()
sp.imgmain()
python入门爬虫,爬取女生头像(无需反爬)相关推荐
- python可以爬取58同城代码_爬取58同城—字体反爬
我爬取的是58同城北京租房的索引页. url:https://bj.58.com/chuzu/?PGTID=0d100000-0000-1e00-4039-99b26a4fedeb&Click ...
- 爬取起点中文网字体反爬取
参考文章:https://www.jianshu.com/p/fbc99cf4d557 个人比较喜欢看小说,于是乎想爬取小说网站--起点中文网,在爬取定位过程中遇到了反爬取,咨询了我旁边的前端大神,说 ...
- Python网络爬虫数据采集实战:同花顺动态网页爬取
前文的爬虫都建立在静态网页基础之上,首先通过请求网站url获取到网页源代码.之后对源代码进行信息提取进而存储即可,本文则针对动态网页进行数据采集,首先介绍Ajax相关理论,之后实战爬取同花顺动态网页, ...
- 运用Python爬虫爬取一个美女网址,爬取美女图
运用Python爬虫爬取一个美女网址,爬取美女图 要运用到的python技术: 导入库 1.request 发送请求,从服务器获取数据 2.BeautifulSoup 用来解析整个网页的源代码 imp ...
- 用Python实现爬取微信头像
如何用python实现爬取微信头像 python里面有个itchat包,用这个可以实现 1.先下载 itchat pip install itchat 2.创建一个py文件 import itchat ...
- python爬虫能爬取微信密码吗_如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例...
今天我们继续focus on微信,不过这次给大家带来的是利用Python网络爬虫抓取微信好友总数量和微信好友男女性别的分布情况.代码实现蛮简单的,具体的教程如下. 相信大家都知道,直接通过网页抓取微信 ...
- python爬虫微信朋友圈怎么发文字_如何利用Python网络爬虫抓取微信朋友圈的动态(上)...
今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...
- python抓取微信朋友圈动态_2018最全如何利用Python网络爬虫抓取微信朋友圈的动态...
今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...
- 2018最全如何利用Python网络爬虫抓取微信朋友圈的动态
今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...
最新文章
- ASP.NET MVC学习:MVC 特性作用(二)
- 经典案例之MouseJack
- Hadoop入门进阶步步高(三-配置Hadoop
- linux ntfs 密码,linux 加载ntfs和fat32分区
- 将TQ2440的ADS测试程序放到MDK下或Ubuntu下开发
- shell命令技巧——文本去重并保持原有顺序
- vm16安装efi win7 方案
- linux 系统业务迁移,记录一次linux系统迁移过程
- 2021阿里云服务器购买攻略-618年中大促专场
- 志愿者报名图片大小调整
- Activity的七大生命周期
- word/ppt中如何插入11以上带圆圈的数字序号
- 长安战疫网络安全卫士守护赛 Shiro?
- 如何入门“动物杂交:新视野”
- 秘笈分享! 24 小时无人自习室为什么这么火?
- Android 4.0.1 源码下载,编译和运行
- 启动nacos-server报错:java.io.IOException: java.lang.IllegalArgumentException: db.num is null
- 搞技术的要不要学习财务知识
- 在aws中使用阿里云的SSL证书
- 第1章CRM核心业务介绍
热门文章
- YTU 2573: 连续奇数和
- uniapp(新手入门)
- OpenVINO之二:Windows环境下OpenVINO安装与配置
- 计算机技术与科学学费,计算机科学与技术在职研究生学制与学费各是多少?
- Adobe Reader 安装后打包绿色版安装
- Leader AP是什么?带你了解Leader AP的原理及特性
- 华为手机内存卡的照片音乐误删除还能恢复么
- 可以看netflix吗_为何Netflix问“您还在看吗?” (以及如何阻止它)
- 解决校园网每次连接需要输入账号密码
- 用一台计算机操控另一台计算机关机的问题