#爬取网站图片
import requests
from lxml import etree
import osi=0  #计数
#请求头
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36"}
for x in range(1,11):html="https://www.zerochan.net/Yukinoshita+Yukino?p="+str(x)   #一共10页图片r=requests.get(html,headers=headers)  #请求响应#解析网页内容html=etree.HTML(r.text)root="F://z yukinoshita/"  #需要存储的根目录if not os.path.exists(root):    #判断根目录是否存在os.mkdir(root)    #不存在则创建文件夹url=html.xpath('//*[@id="thumbs2"]/li/a/img/@src')  #从网页信息中获取图片链接z=len(url)for y in range(0,z):html_1="https://static.zerochan.net/Yukinoshita.Yukino.full."+url[y].split('/')[-1]image_name=html_1.split('/')[-1]    #图片的名字path=root+image_name     #图片在电脑的路径及名字try:if not os.path.exists(path):       #如果电脑中不存在该图片with open(path,'wb') as f:   #把图片写进图片文件con=requests.get(html_1)    #请求图片链接的信息f.write(con.content)  #将图片的二进制写入文件i=i+1print("爬取成功"+str(i))else:i=i+1print("文件已存在"+str(i))     except:    i=i+1print("爬取失败"+str(i))

python用xpath爬取10页网站图片相关推荐

  1. python爬虫:爬取猎聘网站职位详情

    python爬虫:爬取猎聘网站职位详情 第一次学习python,也是刚开始学习爬虫,完成的第一个实例,记录一下. baseurl.py # @author centao # @time 2020.10 ...

  2. python利用bs4爬取外国高清图片网站

    python利用bs4爬取外国高清图片网站 爬取高清图片 爬取高清图片 import re import requests from bs4 import BeautifulSoup import o ...

  3. python爬取贴吧所有帖子-Python实现的爬取百度贴吧图片功能完整示例

    本文实例讲述了Python实现的爬取百度贴吧图片功能.分享给大家供大家参考,具体如下: #coding:utf-8 import requests import urllib2 import urll ...

  4. Python三步爬取VMgirls小姐姐图片

    Python三步爬取VMgirls小姐姐图片 具体思路 第一步:确定目标 第二步:分析目标网站 第三步:代码编写 具体思路 第一步:确定目标:寻找目标网站,我选择的网站是http://www.VMgi ...

  5. python第一天----爬取优美图库的图片

    python第一天----爬取优美图库的图片 首先我们需要爬取的步骤: 1.选择爬取的网页,这里我选取的是https://www.umei.net/bizhitupian/,直接爬取的首页第一页的图片 ...

  6. Python爬虫之爬取绝对领域美女图片

    Python爬虫之爬取绝对领域美女图片 第一步: 导入模块: import requests from lxml import etree 第二步:定义函数: def get_url(start_ur ...

  7. Python爬虫之利用xpath爬取ip代理网站的代理ip

    爬虫工具 python3 pycharm edge/chrome requests库的用法 requests库是python中简单易用的HTTP库 用命令行安装第三方库 pip install req ...

  8. [python爬虫] selenium爬取局部动态刷新网站(URL始终固定)

    在爬取网站过程中,通常会遇到局部动态刷新情况,当你点击"下一页"或某一页时,它的数据就进行刷新,但其顶部的URL始终不变.这种局部动态刷新的网站,怎么爬取数据呢?某网站数据显示如下 ...

  9. python按关键字爬取必应高清图片

    通过查询前人的博客,发现必应可通过url按关键字查找图片: https://www.bing.com/images/async?q=查询关键字&first=图片编号&count=图片数 ...

最新文章

  1. 为什么说++i的效率比i++高?
  2. python可以从事什么工作-学完Python开发可以从事哪些行业?
  3. oracle的连接字符串
  4. C#LeetCode刷题之#665-非递减数列( Non-decreasing Array)
  5. [转]Java5泛型的用法,T.class的获取和为擦拭法站台
  6. Python的底气,是从哪儿来的?
  7. MySQL-快速入门(14)MySQL性能优化
  8. android平板电脑维修电路图,图解Windows10平板电脑电路原理和维修
  9. 【图片】批量获取几万张图片
  10. GSM/CDMA区别
  11. 手把手带你入门 API 开发
  12. 百度地图迁徙大数据_百度地图迁徙大数据:复工后北上广深城内出行年后首次大幅增长...
  13. 蓝桥杯 Java 算法提高 盾神与积木游戏
  14. Javascript removeChild()删除节点及删除子节点的方法
  15. 0725(016天 多态复习 java中级-抽象类01)
  16. 巴拉特比印度大分水岭
  17. 鼠标手是否算工伤 专家:法定职业病才能获赔
  18. VSCode 连接 Linux 远程服务器
  19. 导入Excel至数据库中 quot;外部表不是预期格式quot;错误信息
  20. SIGCOMM13论文简要选读

热门文章

  1. jigsaw kaggle_使用Project Jigsaw的JDK 9 Early Access上的Eclipse IDE
  2. HATEOAS的RESTful服务。 超媒体:REST的秘密要素
  3. JMetro版本11.5.11和8.5.11发布
  4. 高效的企业测试-单元和用例测试(2/6)
  5. cassandra使用心得_使用Cassandra和Nutch爬网
  6. java六大原则_六大Java功能
  7. java核心面试_Java核心面试问题
  8. 使用正确的垃圾收集器将Java内存使用量降至最低
  9. java jee curd_Java / JEE中的有效日志记录–映射的诊断上下文
  10. jHipster入门,第1部分