文章目录

  • 什么是爬虫
  • 爬取网页图片实现步骤
    • 第一步:打开所操作的网站(任意一个网站)
    • 第二步:通过python访问这个网站
    • 第三步:点击F12查询相关信息
    • 第四步:爬取图片,下载到本地
    • 第五步:显示测试
  • 核心代码

什么是爬虫

网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟浏览器发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。
原则上,只要是浏览器(客户端)能做的事情,爬虫都能够做。

爬取网页图片实现步骤

第一步:打开所操作的网站(任意一个网站)

http://github.com/

第二步:通过python访问这个网站

headers = {'User-Agent': 'python-requests/2.25.1', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}
response = requests.get('http://github.com/',headers=headers)
print(response.request.headers)

{'User-Agent': 'python-requests/2.25.1', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}

第三步:点击F12查询相关信息


查找到图片信息

获取headers:

第四步:爬取图片,下载到本地

headers = {'User-Agent': 'python-requests/2.25.1', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}
response = requests.get('https://avatars.githubusercontent.com/nplasterer?s=64&v=4',headers=headers)
print(response.request.headers)
with open('icon.ico', 'wb') as f:f.write(response.content)print("爬取图片成功")

第五步:显示测试

img = cv2.imread("icon.ico")
cv2.imshow('icon',img)
cv2.waitKey(0)

核心代码

import requests
import  cv2headers = {'User-Agent': 'python-requests/2.25.1', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}
response = requests.get('https://avatars.githubusercontent.com/nplasterer?s=64&v=4',headers=headers)
print(response.request.headers)
with open('icon.ico', 'wb') as f:f.write(response.content)print("爬取图片成功")
img = cv2.imread("icon.ico")
cv2.imshow('icon',img)
cv2.waitKey(0)

python爬取网页图片详解相关推荐

  1. 使用Python爬取网页图片

    使用Python爬取网页图片 李晓文 21 天前 近一段时间在学习如何使用Python进行网络爬虫,越来越觉得Python在处理爬虫问题是非常便捷的,那么接下来我就陆陆续续的将自己学习的爬虫知识分享给 ...

  2. 利用python爬取网页图片

    学习python爬取网页图片的时候,可以通过这个工具去批量下载你想要的图片 开始正题: 我从尤物网去爬取我喜欢的女神的写真照,我们这里主要用到的就两个模块 re和urllib模块,有的时候可能会用到t ...

  3. Python爬取网页图片至本地

    Python爬取网页图片至本地 爬取网页上的图片至本地 参考代码如下: # -*- codeing = utf-8 -*- import requests import rephotos = [] h ...

  4. Python 爬取网页图片

    因为训练数据需求,需要爬取一些图片做训练.爬取的是土巴兔 网站的 家装图片 根据风格进行爬取图片 http://xiaoguotu.to8to.com/list-h3s13i0 可以看到该页面上每一个 ...

  5. java爬取网页并保存_第九讲:Python爬取网页图片并保存到本地

    上一讲我们说了如何把网页的数据通过分析后存储到数据库,我们这次讲如何将网页上的图片提取并下载到本地. 思路如下: 我们本次要爬取的是昵图网首页的图片. 1.首先分析我们要爬取的网页的代码结构,每个网页 ...

  6. 第九讲:Python爬取网页图片并保存到本地

    上一讲我们说了如何把网页的数据通过分析后存储到数据库,我们这次讲如何将网页上的图片提取并下载到本地. 思路如下: 我们本次要爬取的是昵图网首页的图片. 1.首先分析我们要爬取的网页的代码结构,每个网页 ...

  7. python爬取一张图片并保存_第九讲:Python爬取网页图片并保存到本地

    上一讲我们说了如何把网页的数据通过分析后存储到数据库,我们这次讲如何将网页上的图片提取并下载到本地. 思路如下: 我们本次要爬取的是昵图网首页的图片. 1.首先分析我们要爬取的网页的代码结构,每个网页 ...

  8. python爬取静态数据详解

    目的 爬取http://seputu.com/数据并存储csv文件 导入库 lxml用于解析解析网页HTML等源码,提取数据.一些参考:https://www.cnblogs.com/zhangxin ...

  9. 第十讲:Python爬取网页图片并保存到本地,包含次层页面

    上一讲我们讲到了从昵图网的首页下载图片到本地,但是我们发现首页上面的大部分链接其实都可以进入到二级页面. 在二级页面里面,我们也可以同样进行图片的下载,通过层层循环我们可以把网址的一部分图片下载到本地 ...

最新文章

  1. sangerbox平台使用(二)差异分析
  2. 应用DIV+CSS编码时容易犯的一些错误
  3. Android之Lollipop DevicePolicyManager学习(上)
  4. python之pymysql的使用
  5. Tips on rendering interiors
  6. 限制内核printk的打印频率
  7. 跨域单点登录方案实现
  8. python开发游戏脚本_Python开发游戏开服脚本
  9. 数据结构和算法详解(三)——递归、排序、散列表
  10. Eclipse配Tomcat服务器
  11. PHP设计模式——原型模式
  12. js中base64编码
  13. c 压缩java解压文件,java 压缩文件 解压缩文件
  14. java 大富翁 游戏下载_大富翁4-大宇正版
  15. 织梦域名后缀.html,织梦cms建站教程之首页域名后缀index.html去除的方法
  16. 程序员必备Java API和类搜索辅助工具-Jadeite和Apatite
  17. RRP拷贝目录内的所有文件及子目录到指定目录
  18. Lua Busted 单元测试简介(Windows 环境)
  19. 民办二本学计算机,2020湖南最垃圾的民办大学-湖南最差的民办二本
  20. Batch Normalization 批归一化是什么? 有什么用?

热门文章

  1. 【学习笔记】循环组织感知网络《Recurrent Tissue-Aware Network for Deformable Registration of Infant Brain MR Images》
  2. 全志Tina Linux MPP (多媒体框架)开发指南支持百问网T113 D1-H哪吒DongshanPI-D1s V853-Pro等开发板
  3. 蓝光视频转换软件VidMobie Blu-ray Ripper Mac
  4. 从MP3中提取歌曲信息
  5. 信息度量(二):信息熵与平均互信息
  6. 华南会为促行业发展,邀请院校共商校企合作,人才引进
  7. 什么是WebRTC?
  8. python5-PIL的其他图像处理模块
  9. 计算机中管理员设置方法,怎么设置以管理员身份运行
  10. 第十八届全国大学生智能车竞赛分赛区比赛赛道简化建议