大家好,我是@xiaomeng 小孟

您好

欢迎大家阅读今天的文章————Python爬取图片(爬虫)

最近爬虫挺火的,所以我今天也来一个爬虫!

正文:

首先,我们先下载模块,pip install requests(不多说了)

#1.导入模块

import requests
import re

##2.填写网址 并且 请求 (网址需要你们自己填写,想什么图片就是什么)

#确定网址url='https://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=%E6%B0%B4%E6%9E%9C'
form_header = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.190 Safari/537.36","Host":"image.baidu.com","Accept-Language":"zh-CN,zh;q=0.9","Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9"}
res=requests.get(url, headers=form_header).text
print(res)

###3.正则表达式筛选数据

image_urls = re.findall('"objURL":"(.*?)",', res)

####4.利用for.....in:的句型找到图片网址

​
for image_url in image_urls:print(image_url)​

#####5.设置图片名称,如果图片后缀没有,就添加一个‘.jpg’(正则筛选数据 re.search)

#图片名称image_name = image_url.split('/')[-1]print(image_name)image_end=re.search('(.jpg/.png/.jpeg/.gif)$',image_name)if image_end == None:image_name = image_name + '.jpg'

######6. 下载保存图片(必须在同目录内新建一个 image 文件夹,才可以下载保存)

#保存image = requests.get(image_url).contentwith open('./image/%s'% image_name.split("&")[0], 'wb')as file:file.write(image)​

以下为完整的源代码:

#请求import requests
import re#确定网址url='https://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=%E6%B0%B4%E6%9E%9C'
form_header = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.190 Safari/537.36","Host":"image.baidu.com","Accept-Language":"zh-CN,zh;q=0.9","Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9"}
res=requests.get(url, headers=form_header).text
print(res)
image_urls = re.findall('"objURL":"(.*?)",', res)for image_url in image_urls:print(image_url)#图片名称image_name = image_url.split('/')[-1]print(image_name)image_end=re.search('(.jpg/.png/.jpeg/.gif)$',image_name)if image_end == None:image_name = image_name + '.jpg'#保存image = requests.get(image_url).contentwith open('./image/%s'% image_name.split("&")[0], 'wb')as file:file.write(image)

运行截图:

最后我再说一句:

编程语言很神奇

深不可测

还有很多知识等待着我们去探索,加油!!

_____________________________________________我是华丽的分割线~_________________________________________________

如果你喜欢这篇文章,请关注我并且点个赞吧!

谢谢您的阅读!下期再见!

再见!

*我的邮箱是 cv6_post@163.com 大家有问题可以联系我哦~*

@文章作者: 小孟

Python——爬取图片相关推荐

  1. python爬取图片然后保存在文件夹中

    python爬取图片然后保存在文件夹中 直接上代码: import os import requests import redef getimg(soup,i):print('http:'+ soup ...

  2. python爬取图片并保存到本地

    Python爬取图片(你懂得) requests与Bs4 这两个模块是本文使用的主要模块,requests可以获取连接,bs4全名BeautifulSoup,是编写python爬虫常用库之一,主要用来 ...

  3. Python爬取图片、视频以及将数据写入excel的方法小摘要

    Python爬取图片.视频以及将数据写入excel的方法小摘要 1.爬取图片 2.爬取视频 3.将获取的数据存入excel 4.备注 1.爬取图片 import requests #导入request ...

  4. python爬取图片链接标签的src属性值_python爬取图片遇见src乱码: data:image/png;base64...

    python爬取图片遇见src乱码: data:image/png;base64 向爬取自己喜欢的图片,但是在爬取下来的代码当中图片的src会出现乱码的情况:data:image/png;base64 ...

  5. Python爬取图片实例

    网络爬虫又叫网络蜘蛛.网络机器人等名词.网络爬虫就是自动化的去抓取网络数据,可以在网络中获取满足自己需求的相关信息和资料.通过网络爬虫可以获取大量的数据并且集中在一起,然后就可以进行数据的批量分析和处 ...

  6. python爬取图片并写入excel

    目标: 1)python爬取图片并下载到本地文件夹 2)python爬取图片并写入到excel文件 Ⅰ.python程序 # 导入库 import requests import parsel imp ...

  7. php直播源码,python爬取图片

    php直播源码,python爬取图片的相关代码 import requests import osfrom bs4 import BeautifulSoupheaders = {'user-agent ...

  8. python爬取图片并以二进制方式保存到本地

    本篇主要介绍python 爬取图片并以二进制形式保存到本地 这回爬取的是一个写真图片网站,上面有一个365日365枚照片写真 写真图片网站链接 明确目标,爬取每一页的20张图片,循环生成没一页的url ...

  9. python爬取图片并且保存到本地指定文件夹内

    python爬取图片 先上代码: from urllib.request import Request, urlopen, urlretrieve from fake_useragent import ...

最新文章

  1. C#接收串口RS232的CD、CTS、DSR信号
  2. [译]高效的TensorFlow 2.0:应用最佳实践以及有什么变化
  3. 怎样安全的使用可变参数宏__VA_ARGS__
  4. linux下通过命令来下载视频
  5. 3520a新板做内存测试
  6. 收件箱java项目源码,Java物资管理系统项目源码(含数据库).zip
  7. java电脑类的接口_java 一个类实现两个接口的案例
  8. php团队奖,PHP生成奖状
  9. java爬虫技术的作用_Java网络爬虫怎么实现?
  10. 微分方程求解二(偏微分方程求解)
  11. 引用腾讯地图时出现”鉴权失败,请传入正确的key“
  12. 计算机强制关机后重启报错,电脑开起来就自动关机
  13. 景深决定照相机什么特性_相机的景深是什么
  14. 将Visual Leak Detector集成至Visual Studio 2019
  15. Bouncy Castle使用(一)【开始】
  16. vue项目之H5 app 生成海报功能
  17. 2022年煤矿探放水题库及模拟考试
  18. Java学习笔记:SQL数据排序
  19. JavaScript专题(一)变量提升与预编译,一起去发现Js华丽的暗箱操作
  20. 照度/感光度(Lux)

热门文章

  1. Borland 賣掉 CodeGear
  2. 全球及中国金融科技即服务平台行业动态发展与运营规模研究报告2022版
  3. 计算机丢失UxTheme无法修复,win7电脑系统开机提示uxtheme.dll丢失怎么办
  4. Libnet简单学习
  5. 网站域名历史记录批量查询-老域名建站历史快照数据查询
  6. 全国计算机等级考试二级cpp试题,2017年全国计算机二级C++考试试题附答案
  7. hfss天线方向图导入matlab,MATLAB在天线方向图中应用和研究.PDF
  8. xx.exe 中的 0x014180bd 处有未经处理的异常: 0xC0000005: 读取位置 0xfeeefeee 时发生访问冲突(当指针访问异常时,应考虑是不是对象未创建)。
  9. jython mysql_jython安装与配置
  10. SSVEP干电极介绍及其分类算法研究