python用xpath爬取10页网站图片
#爬取网站图片
import requests
from lxml import etree
import osi=0 #计数
#请求头
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36"}
for x in range(1,11):html="https://www.zerochan.net/Yukinoshita+Yukino?p="+str(x) #一共10页图片r=requests.get(html,headers=headers) #请求响应#解析网页内容html=etree.HTML(r.text)root="F://z yukinoshita/" #需要存储的根目录if not os.path.exists(root): #判断根目录是否存在os.mkdir(root) #不存在则创建文件夹url=html.xpath('//*[@id="thumbs2"]/li/a/img/@src') #从网页信息中获取图片链接z=len(url)for y in range(0,z):html_1="https://static.zerochan.net/Yukinoshita.Yukino.full."+url[y].split('/')[-1]image_name=html_1.split('/')[-1] #图片的名字path=root+image_name #图片在电脑的路径及名字try:if not os.path.exists(path): #如果电脑中不存在该图片with open(path,'wb') as f: #把图片写进图片文件con=requests.get(html_1) #请求图片链接的信息f.write(con.content) #将图片的二进制写入文件i=i+1print("爬取成功"+str(i))else:i=i+1print("文件已存在"+str(i)) except: i=i+1print("爬取失败"+str(i))
python用xpath爬取10页网站图片相关推荐
- python爬虫:爬取猎聘网站职位详情
python爬虫:爬取猎聘网站职位详情 第一次学习python,也是刚开始学习爬虫,完成的第一个实例,记录一下. baseurl.py # @author centao # @time 2020.10 ...
- python利用bs4爬取外国高清图片网站
python利用bs4爬取外国高清图片网站 爬取高清图片 爬取高清图片 import re import requests from bs4 import BeautifulSoup import o ...
- python爬取贴吧所有帖子-Python实现的爬取百度贴吧图片功能完整示例
本文实例讲述了Python实现的爬取百度贴吧图片功能.分享给大家供大家参考,具体如下: #coding:utf-8 import requests import urllib2 import urll ...
- Python三步爬取VMgirls小姐姐图片
Python三步爬取VMgirls小姐姐图片 具体思路 第一步:确定目标 第二步:分析目标网站 第三步:代码编写 具体思路 第一步:确定目标:寻找目标网站,我选择的网站是http://www.VMgi ...
- python第一天----爬取优美图库的图片
python第一天----爬取优美图库的图片 首先我们需要爬取的步骤: 1.选择爬取的网页,这里我选取的是https://www.umei.net/bizhitupian/,直接爬取的首页第一页的图片 ...
- Python爬虫之爬取绝对领域美女图片
Python爬虫之爬取绝对领域美女图片 第一步: 导入模块: import requests from lxml import etree 第二步:定义函数: def get_url(start_ur ...
- Python爬虫之利用xpath爬取ip代理网站的代理ip
爬虫工具 python3 pycharm edge/chrome requests库的用法 requests库是python中简单易用的HTTP库 用命令行安装第三方库 pip install req ...
- [python爬虫] selenium爬取局部动态刷新网站(URL始终固定)
在爬取网站过程中,通常会遇到局部动态刷新情况,当你点击"下一页"或某一页时,它的数据就进行刷新,但其顶部的URL始终不变.这种局部动态刷新的网站,怎么爬取数据呢?某网站数据显示如下 ...
- python按关键字爬取必应高清图片
通过查询前人的博客,发现必应可通过url按关键字查找图片: https://www.bing.com/images/async?q=查询关键字&first=图片编号&count=图片数 ...
最新文章
- 为什么说++i的效率比i++高?
- python可以从事什么工作-学完Python开发可以从事哪些行业?
- oracle的连接字符串
- C#LeetCode刷题之#665-非递减数列( Non-decreasing Array)
- [转]Java5泛型的用法,T.class的获取和为擦拭法站台
- Python的底气,是从哪儿来的?
- MySQL-快速入门(14)MySQL性能优化
- android平板电脑维修电路图,图解Windows10平板电脑电路原理和维修
- 【图片】批量获取几万张图片
- GSM/CDMA区别
- 手把手带你入门 API 开发
- 百度地图迁徙大数据_百度地图迁徙大数据:复工后北上广深城内出行年后首次大幅增长...
- 蓝桥杯 Java 算法提高 盾神与积木游戏
- Javascript removeChild()删除节点及删除子节点的方法
- 0725(016天 多态复习 java中级-抽象类01)
- 巴拉特比印度大分水岭
- 鼠标手是否算工伤 专家:法定职业病才能获赔
- VSCode 连接 Linux 远程服务器
- 导入Excel至数据库中 quot;外部表不是预期格式quot;错误信息
- SIGCOMM13论文简要选读
热门文章
- jigsaw kaggle_使用Project Jigsaw的JDK 9 Early Access上的Eclipse IDE
- HATEOAS的RESTful服务。 超媒体:REST的秘密要素
- JMetro版本11.5.11和8.5.11发布
- 高效的企业测试-单元和用例测试(2/6)
- cassandra使用心得_使用Cassandra和Nutch爬网
- java六大原则_六大Java功能
- java核心面试_Java核心面试问题
- 使用正确的垃圾收集器将Java内存使用量降至最低
- java jee curd_Java / JEE中的有效日志记录–映射的诊断上下文
- jHipster入门,第1部分