2019独角兽企业重金招聘Python工程师标准>>>

# -*- coding: utf-8 -*-import re
import requests
import time# 读取源代码文档
f = file("wenben.txt",'r')
html = f.read()
f.close()# 匹配图片网址
pic_url = re.findall('<img src="(.*?)"',html,re.S)
i = 0
for each in pic_url:print "now downloading: " + each;pic = requests.get(each)fp = open('pic\\'+str(time.time())+'.png','wb')fp.write(pic.content)fp.close()i += 1
  1. wenben.txt为包括图片标签的html代码

  2. 遍历并保存。open('pic\\'+str(time.time())+'.png','wb') 保存在pic目录之下

转载于:https://my.oschina.net/houzhong/blog/625361

极客学院文本爬虫实战相关推荐

  1. 极客学院单线程爬虫py3.x版本

    极客学院单线程爬虫实战篇,老师是用的py2.x版本,而我是3.5版本,因此有一些在解码上的不同. 因此,比照老师的代码写了一遍,放在这里. #tips: 貌似py3.x在file操作上没有writel ...

  2. python极客学院爬虫_学习极客学院多线程爬虫课程的收获

    昨天开始了极客学院<XPath与多线程爬虫>课程的学习,主要涉及到XPath和requests的使用,在测试过程中出现了很多问题,经过不断摸索以及前辈们的帮助,现将经验总结如下: 1. P ...

  3. python极客学院爬虫_基于requests实现极客学院课程爬虫

    #coding=utf-8 __author__ = 'scaleworld' importrequestsimportreimportsys reload(sys) sys.setdefaulten ...

  4. 极客时间和极客学院_极客在海滩

    极客时间和极客学院 As reported by Jeremy, Andy and Jon, last weekend was a chance for that rare creature – th ...

  5. Python爬虫实战:极客学院

    今天我们来爬取一下极客学院的课程,这次我们用requests和xpath,小伙伴们看好了,这真是一对神奇组合,棒棒哒! 爬取前我们先看一下我们的目标: 1.抓取极客学院的课程 2.抓取每一门课程的课程 ...

  6. Python简单网页爬虫——极客学院视频自动下载

    一.需求背景 最近正好在研究Python,看了菜鸟教程上的基本教程,然后又再看极客学院的教学视频,向实战进军. 极客学院的视频是需要年费会员才能下载的,客户端倒是可以批量下载,但是下载之后,没有目录结 ...

  7. 极客学院腾讯 TAPD·极客开放日 [敏捷开发畅想与实战]

    极客学院&腾讯 TAPD -极客开放日活动,本次主题「敏捷开发畅想与实战」. 多位行业大佬亲临:嘉宾包括中国 IT 界著名意见领袖.敏捷开发布道师熊节先生,源自硅谷.扎根香港的行业独角兽 Af ...

  8. python爬虫下载极客学院视频

    这两天在极客学院看视频,感觉在网上看好不方便,所以写了个爬虫来下载视频. 具体思路是: 1.先登录极客学院 2.获取指定页面中的课程网址 3.获取每个课程中的视频的地址 4.下载视频 首先要访问这个网 ...

  9. 极客学院 Docker全面解读零基础实战(云盘下载)

    课程名称:  极客学院 Docker全面解读零基础实战 视频教程 课程简介:    非常系统的一套Docker视频教程,很全面的解读了Docker系统学习过程中各个重要知识点 可以作为一套入门级的Do ...

  10. 2019最新最全极客学院 Docker全面解读零基础实战

    课程名称:  极客学院 Docker全面解读零基础实战 视频教程 课程简介:     非常系统的一套Docker视频教程,很全面的解读了Docker系统学习过程中各个重要知识点 可以作为一套入门级的D ...

最新文章

  1. SVN冲突出现原因及解决方法浅谈
  2. EF6 MySQL错误之“Specified key was too long; max key length is 767 bytes”
  3. python工具-文件及文件夹移动及处理
  4. Netty(一)——Netty入门程序
  5. oracle多久断开连接,Oracle自动断开连接
  6. python下俄罗斯方块的游戏设计_[源码和文档分享]基于Python的PyGame的俄罗斯方块游戏设计与实现...
  7. c语言 prototype_(创建型模式)Prototype——原型模式
  8. android优化中国风应用、完整NBA客户端、动态积分效果、文件传输、小说阅读器等源码...
  9. 【oracle】获取近30天日期、近5年、近6个月
  10. 【操作系统】死等状态、忙等状态、有限等待、让权等待
  11. iframe在ios设备宽度不能100%
  12. php练手的项目,learnphp.beginmaker.com
  13. IP信息解析和地理定位,以及免费GeoLite2-City.mmdb的使用教程
  14. vs2003在win7+后pdb锁住报LNK1201解决方案
  15. CIS Benchmarks
  16. 柔顺控制 - 技术发展综述
  17. USB数据端子 type-A/B/C
  18. 基于C#+SQL Server实现(Web)学生选课管理系统【100010309】
  19. 电源接反了烧电路怎么办?电源防反接技术讨论
  20. java odbc 实现access连接并导出mdb格式文件

热门文章

  1. 关于IOS6屏幕旋转
  2. 重定向telnet方法
  3. java有主函数的类_Android Project中运行带有main函数的Java类
  4. pjsip代码分析(1)——modules框架
  5. 51nod 1133 不重叠的线段
  6. LeetCode入门题 两数之和
  7. python论文题目_有关利用python获取网页, 以及KDD近几年论文标题与摘要链接
  8. leetcode319 Bulb Switcher
  9. 二分查找 python实现
  10. linux定时器时间来源,linux 时间定时器 介绍