一直挺喜欢逛虎扑的,今天想到下载虎扑的图片的问题,于是写了个爬虫,初级的规模,而且url也是写死的,玩玩也行嘛~~~

#!/usr/bin/python
#-*-coding:utf-8-*-
import re
import os
import urllibdef getHtml(url):page = urllib.urlopen(url)html = page.read()return htmldef getImg(html):reg = r'src="(.*?\.jpg)"'imgre = re.compile(reg)imglist = re.findall(imgre,html)x = 0for imgurl in  imglist:local = os.path.join('D:\Workspaces\Pythonworkspace\jpg','%s.jpg' % x) #提供路径urllib.urlretrieve(imgurl,local)#使用urllib中的urlretrieve函数来下载图片x+=1html_1 = getHtml("http://bbs.hupu.com/9592923.html")#开始执行
getImg(html_1)

有图有真相:

python实现虎扑网站图片爬虫相关推荐

  1. python爬取虎扑评论_python爬虫系列Selenium定向爬取虎扑篮球图片详解

    前言: 作为一名从小就看篮球的球迷,会经常逛虎扑篮球及湿乎乎等论坛,在论坛里面会存在很多精美图片,包括NBA球队.CBA明星.花边新闻.球鞋美女等等,如果一张张右键另存为的话真是手都点疼了.作为程序员 ...

  2. python爬虫真假网址,python爬取福利网站图片完整代码,懂得人都懂

    网址需要自己替换懂的人都懂512*2,主要学习简单的爬虫,别乱用,否则后果自负! [Python] 纯文本查看 复制代码 import requests,bs4,re,os,threadingclas ...

  3. python:从零开始的百度图片爬虫

    python百度图片爬虫 最近打算尝试接触人工智障,于是发现需要先搞到数据集,制作数据集又需要带量数据 我打算先搞个图片判断的,类似于看有没有猫这种 所以我需要数据集,需要图片,需要很多很多图片 所以 ...

  4. 虎扑网站服务器垃圾,虎扑拿下域名hupu.com 游击队摇身一变正规军

    域名快讯:今日,国内知名的体育社区虎扑网正式启用全新域名hupu.com,原域名hoopchina.com保留使用并永久有效.据虎扑网发布公告称,此次启用新域名,让虎扑的四个分站"虎扑篮球. ...

  5. 百度热议新增网易虎扑网站作为展现内容

    百度热议内容来源大范围调整,新增虎扑.网易.百家号动态作为抓取来源,不在单一抓取新浪微博的内容,逐渐开始降权回收流量! 这阵子有关注百度搜索的站长估计听说" 百度热议"了,其实,简 ...

  6. Python爬取网站图片(爬虫入门demo)

    代码功能: 爬取网站的教师图片,在用户主机上创建好PNG文件夹保存共110张图片,同时把每张图片的老师介绍内容写入H3.txt文件中. 实现思路: 打开该网页后用F12查看网页的html原代码,发现图 ...

  7. 基于JavaWeb的网站图片爬虫系统

    资源下载地址:https://download.csdn.net/download/sheziqiong/85811020 资源下载地址:https://download.csdn.net/downl ...

  8. python爬取pexels网站图片

    #coding:utf-8from lxml import etree import requests import urllib.request import progressbar header= ...

  9. python爬取某网站图片

    程序运行需要导包 具体看代码中的,缺啥导啥✌. import requests import re import time import os url="https://pic.netbia ...

  10. python爬取论坛图片_[python爬虫] Selenium定向爬取虎扑篮球海量精美图片

    前言: 作为一名从小就看篮球的球迷,会经常逛虎扑篮球及湿乎乎等论坛,在论坛里面会存在很多精美图片,包括NBA球队.CBA明星.花边新闻.球鞋美女等等,如果一张张右键另存为的话真是手都点疼了.作为程序员 ...

最新文章

  1. 过滤Linux下不同大小的文件,linux查找当前目录下 M/G 大小的文件,删除Linux下指定大小的文件
  2. LUA学习之路--初识LUA
  3. html table设置行高_html 表格单元格的宽度和高度的设置方法
  4. 爬虫系列---Scrapy框架学习
  5. win10下安装ubuntu,双系统,免U盘
  6. MFC不能多线程操作控件的原因
  7. 1-8:学习shell之高级键盘技巧
  8. xmind怎么在左边创建_威纶通 触摸屏自动化应用篇 创建程序界面及画面应用
  9. jQuery操作DOM元素
  10. flex 引入html,在Flex中嵌入完整HTML页面
  11. C/C++网络编程详解(Windows版)
  12. 秩和检验-matlab函数ranksum用法详解
  13. OpenKG 祝大家 2021 新年快乐 —「2020 精选文章汇编」
  14. lr常见问题汇总(持续更新版)
  15. 贸易相关术语[C-E]
  16. 毫末追击智能驾驶1000天,对战蔚小理将现胜负手
  17. SX1278 Lora网关
  18. 七牛云配置怎么配CDN
  19. CICD -- pipeline 流水线
  20. 【微信小程序】生命周期

热门文章

  1. 2023年欧洲科学院院士中的华人学者简介
  2. 【性能脚本】psql数据库存储过程构造方法
  3. 3D格式转换工具助力Shapr3D公司产品实现了 “无障碍的用户体验”,可支持30多种格式转换!
  4. 工业园区减污降碳与数字赋能(附下载)
  5. IOS关闭虚拟键盘的几种方法
  6. 点成分享 | 水浴设备在食品生物活性测定中的应用
  7. 计算机网络原理-网络层
  8. 数据库实验 | 第2关:建立和调用存储过程(带输出参数)
  9. JVM类加载器命名空间的详细总结
  10. 设置log4j2自动删除过期日志