前提:使用的python是python3版本,2和3还是有很大的区别的。

1、先找一个有图片的网页(这里找到的是新浪:http://photo.sina.com.cn)。右键,选择最后一个检查,就可以看到网页的源代码。然后是图片的都是在标签()中。
urllib.request是爬取网页时需要用到的一个库,re是正则匹配的一个库。
具体可以参考一下这篇文章:
https://blog.csdn.net/duxu24/article/details/77414298

import urllib.request,ref=urllib.request.urlopen("http://photo.sina.com.cn")
source = f.read()
source = source.decode('utf-8')
#先将截取的目标代码取下来
print(re.search(r'(<img src=\")(.*)(\")',source))


可以看到是这样的输出,但是我们的目的是只选取蓝色的部分
改进

import urllib.request,ref=urllib.request.urlopen("http://photo.sina.com.cn")
source = f.read()
source = source.decode('utf-8')
# print(source)
res = re.search(r'(<img src=\")(.*)(\")',source)
#加入这一部分
print(res.groups()[1])

但是输出结果是这样,说明上面分组的时候最后一个”被当成了最后面的”,所以加个alt即可

http://n.sinaimg.cn/news/transform/700/w1000h500/20180921/ebN_-hiixpup3269628.jpg" alt="2018年喜剧野生动物摄影大赛入围作品" usemap="#Map01

最终

import urllib.request,reurl=urllib.request.urlopen("http://photo.sina.com.cn")
source = url.read()
#将中文字符解码成utf-8的形式
source = source.decode('utf-8')res = re.search(r'(<img src=\")(.*)(\" alt)',source)
link=res.groups()[1]link_jpg=urllib.request.urlopen(link)
f=open("test.jpg",'wb')
f.write(link_jpg.read())
f.close()

爬取的图片

用python3从网页中爬取图片下载到本地相关推荐

  1. JAVA获取网页中的电影下载地址小程序

    现在电影资源越来越少了,今天想看看吸血鬼日记,结果网上搜出的网址不支持迅雷批量下载,我一个一个点,很累.于是就看看网页源代码发现影片都以FTP开头,rmvb结尾.于是就写了个小程序能够获取网页中所有的 ...

  2. 教你如何使用Java代码从网页中爬取数据到数据库中——网络爬虫精华篇

    文章目录 1:网络爬虫介绍 2:HttpClients类介绍 2.1 HttpGet参数问题 2.2 HttpPost参数问题 2.3 连接池技术问题 3:Jsoup介绍 4:动手实践如何抓取网页上数 ...

  3. php提取网页mp3,怎么提取网页中的音乐|下载网页中的音乐 网页音乐提取工具及使用教程分享...

    相信很多人都比较了解怎么下载网页上的视频吧,那么现在怎么提取网页中的音乐或者说怎么下载网页中的音乐 ,嗯~ o(* ̄▽ ̄*)o ,不懂的孩纸,路过走过不要错过啦,快来看看小编分享的网页音乐提取工具及使 ...

  4. python scrapy框架 抓取的图片路径打不开图片_Python使用Scrapy爬虫框架全站爬取图片并保存本地的实现代码...

    大家可以在Github上clone全部源码. 基本上按照文档的流程走一遍就基本会用了. Step1: 在开始爬取之前,必须创建一个新的Scrapy项目. 进入打算存储代码的目录中,运行下列命令: sc ...

  5. 使用Scrapy爬虫框架简单爬取图片并保存本地(妹子图)

    使用Scrapy爬虫框架简单爬取图片并保存本地(妹子图) 初学Scrapy,实现爬取网络图片并保存本地功能 一.先看最终效果 保存在F:\pics文件夹下 二.安装scrapy 1.python的安装 ...

  6. android 抓取webview中的所有图片_Python|任意网页中的所有图片下载

    参考代码: import requestsfrom bs4 import BeautifulSoupurl = 'https://movie.douban.com/chart' # 设置爬取网址hd ...

  7. 使用pdf.js将PDF嵌入HTML网页中,并禁止下载打印

    有的项目需要显示PDF类的文档, 大多需要在项目中禁止将PDF打印, 下载 我最初采用embed标签显示 PDF, iframe,object标签都可以显示 但是这类标签的打印和下载按钮 不可以禁止, ...

  8. 网页中flash 如何下载

    最近又有同事问我怎么下载网页上的flash ,下面介绍几种方法供大家参考 1.用迅雷下载 在迅雷的设置里打开监视功能就可以监视网页上的flash,鼠标移动到 flash上就会出现提示下载的按钮,点击就 ...

  9. scrapy自定义网页中图片的下载策略

    自定义的初衷是:想修改保存文件的默认名称, 我们希望保留图片原始的文件名. 此外,scrapy图片的下载过滤策略是用了过期时间,可以通过在settings.py中配置如下参数来设置图片的过期时间: I ...

最新文章

  1. redis 学习笔记——redis集群
  2. 在Mac终端下使用conda命令提示未找到命令conda
  3. gitlab上传文件到group_gitlab恢复备份数据
  4. Neo4j:使隐式关系成为显式和双向关系
  5. 如果看了此文你还不懂傅里叶变换,那就过来掐死我吧【完整版】(ZZ伯乐在线)...
  6. Emmet 快速编写html代码
  7. 孩子学习缺乏主动性,应该怎么做?
  8. 装备制造业的变革时代,SCM供应链管理系统如何赋能装备制造企业转型升级
  9. 【信息系统项目管理师】第十六章 变更管理思维导图
  10. 计算机网络——常见协议
  11. 实验二 Linux下Vi编辑器的使用
  12. Windows如何根据代码签名生态系统确定要信任的软件
  13. Centos 8 安装 Openbravo 之安装 httpd mod_jk
  14. 2.words平均长度
  15. HTML判断夏令时,美国夏令时,要记得拨钟表哦Daylight Saving Time
  16. ma5671怎么设置_华为MA5671怎样设置POE供电
  17. 建立标准编码规则(二)-DiagnosticAnalyzer 增加诊断分析代码
  18. Android Studio链接夜神模拟器
  19. Windows 微秒级 延时
  20. Lake Shore定制探针台

热门文章

  1. JavaScript 字符串格式化输出
  2. Python字符串格式化%s输出
  3. 2021-07-01笔记
  4. 如何用three.js将3D医学图像渲染到网页上
  5. 生日小助手V3.0——跨平台的农历生日提醒软件
  6. 适合小白的网络安全书籍推荐
  7. javase安装win1064位
  8. Jedec China简介
  9. python 象棋 ai 入门教程-Python学员作品-中国象棋之pygame篇
  10. lol1.7更新服务器维护,LOL7.1版本更新维护补偿