前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:一行数据

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入


这里想问大家三个问题:

  • 你还在为表情包各种偷图吗?
  • 你还在为找不到好看的图片素材在烦恼吗?
  • 你还在为各种精美壁纸的挑选和下载找遍各大网站吗?

30行Python代码来帮你解决这个问题,现在你只要对代码进行复制、粘贴、运行三连就可以爬取你想要的图片。

import os
import requests
import rekeyWord = "杨超越" # 设置爬取图片的主题
number = 10       # 爬取图片数量
if not os.path.exists(keyWord):os.makedirs(keyWord)
url = r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq' \r'=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd' \r'=1497491098685%5E00_1519X735&word=' + keyWord
get = requests.get(url)
pciture_url = re.findall(r'objURL":"(.*?)",', get.text)
a = 1
for i in pciture_url:p_type = i.split('.')[-1]a += 1try:picture = requests.get(i, timeout=10)name = "%s/%s_%d.%s" % (keyWord, keyWord, a, p_type)with open(name, 'wb') as f:f.write(picture.content)print('第%d张图片正在下载' % a)except:print('第%d张图片下载失败!已跳过...' % a)if a >= number:break

代码逻辑主要是爬取百度图片网站的网页源码,然后从源码中提取每张图片的地址链接,使用循环保存每一张图片。

可以将这份代码直接拷贝到Python编辑器里,只需要修改keyWord变量和num变量,设置成自己想爬取的图片主题和数量就可以运行下载了。爬取的结果如下图所示:

爬取代码高级版本

上面的代码只能爬取一页,因为他只对一个网址里的图片链接进行提取,如果想爬取大批量的图片,需要提取图片网站下一页的链接,这个核心代码如下:

def get_url_one_page(url):html = requests.get(url)html.encoding = 'utf-8'html = html.texturl_pic_this_page = re.findall(r'"objURL":"(.*?)",', html)url_next_page_prefix = re.findall(r'<a href="(.*?)" class="n">下一页', html)if len(url_next_page_prefix) != 0:url_next_page = 'http://image.baidu.com' + url_next_page_prefix[0]else:print("已到达最后一页!")url_next_page = Nonereturn url_pic_this_page, url_next_page

在爬取关键词里输入想要爬取的图片主题,然后输入爬取图片张数,最后选择图片保存的路径并点击开始爬取就只需要静静等待即可(网速够快的话,一般来说一秒下载一张图片)最后下载后的结果如下

3秒爬取百度图片网站,批量下载各种图片相关推荐

  1. python3爬虫系列16之多线程爬取汽车之家批量下载图片

    python3爬虫系列16之多线程爬取汽车之家批量下载图片 1.前言 上一篇呢,python3爬虫系列14之爬虫增速多线程,线程池,队列的用法(通俗易懂),主要介绍了线程,多线程,和两个线程池的使用. ...

  2. python爬取贴吧所有帖子-Python爬虫实例(一)爬取百度贴吧帖子中的图片

    程序功能说明:爬取百度贴吧帖子中的图片,用户输入贴吧名称和要爬取的起始和终止页数即可进行爬取. 思路分析: 一.指定贴吧url的获取 例如我们进入秦时明月吧,提取并分析其有效url如下 ?后面为查询字 ...

  3. python爬表情包_教你用Python来爬取表情包网站的所有表情图片

    教你用Python来爬取表情包网站的所有表情图片 配置环境 安装Python 开发环境 3X系列 win + R 打开运行,输入cmd,输入python,进行验证是否安装Python win + R ...

  4. img绝对路径图片显示_使用python爬虫去风景图片网站批量下载图片

    使用python爬虫(requests,BeautifulSoup)去风景图片网站批量下载图片 1.写代码背景: 今天闲来无事,想弄点图片放到电脑,方便以后使用,故去百度查找一些风景图片网站,发现图片 ...

  5. python 爬取百度知道,Python 爬虫爬取百度百科网站

    利用python写一个爬虫,爬取百度百科的某一个词条下面的全部链接和每一个链接内部的词条主题和摘要.利用request库爬取页面,然后利用BeautifulSoup对爬取到的页面提取url和关键内容. ...

  6. 下载网页图片-如何批量下载网页图片-批量图片下载工具免费

    下载网页图片,今天给大家分享一款免费批量下载网页图片软件,支持任意格式的图片批量下载,只需要输入关键词或批量导入网页链接即可下载图片.批量下载任意网页上的图片,每个人都可以拥有各种高清图源.支持批量图 ...

  7. python下载网页里面所有的图片-Python批量下载网页图片详细教程

    很多朋友在网上查找批量下载图片的方法~发觉挺凌乱的,无从下手.这里绿茶小编就来跟大家分享下使用Python批量下载图片方法. 目标:爬取某个网站上n多页的链接,每个链接有n多张图片,每一页对应一个文件 ...

  8. 案例精选:爬取美食杰所有图片批量下载并入库

    import shutil,os #文件处理的高级模块 from bs4 import BeautifulSoup from urllib.request import Request,urlopen ...

  9. Java爬虫历险记 -- (1)爬取百度首页的logo

    Java爬虫历险记 – (1)爬取百度首页的logo 在这篇文章里,介绍两种方式来获取百度网页的logo: (1)Httpclient (2) jsoup + Httpclient ,详细的运行结果可 ...

最新文章

  1. 熬夜翻译完的PureFTPd配置文件
  2. [leetcode]1007. 行相等的最少多米诺旋转
  3. 微型计算机的评估指标,T∕CECA-G 0060-2020 “领跑者”标准评价要求 微型计算机(9页)-原创力文档...
  4. 特性总览:核心特性、数据存储、Web技术、框架整合与测试
  5. WPR-007:WPF中窗体的透明设置
  6. 蓝桥杯-算法提高-凶手 断案
  7. 嵌入式仿真用Qt播放器和录像机
  8. LSTM神经网络在证券市场分析上的应用
  9. python 通达信k线_python日线通达信,通达信 主图默认显示每只股票上市以来所有日线...
  10. 【原创】软件测试(原书第二版)
  11. Linux开发板实现 NTP时间获取
  12. 3D游戏编程 作业六 打飞碟改进
  13. java咖啡机如何清洗_这样清洗咖啡机最简单有效
  14. 给一个长度为n的字符串,找出长度为m的最小字典子序列【单调栈】
  15. 华硕电脑改光驱启动计算机,华硕笔记本怎么在BIOS里设置从光驱开启重装系统...
  16. 简单的Winform秒表工具
  17. C语言练习盲打的小程序
  18. c语言 输入x, y=(x-5)^1/2+lgx,输出y,C题求解!!(带详细解说)帮帮忙!
  19. 世上无难事,只要肯攀登
  20. wps多人协作后怎么保存_清华WPS定制版使用攻略

热门文章

  1. 触摸屏实验(触摸屏介绍+硬件设计+软件设计。注:软件部分代码过长,理解即可)
  2. Hyperledger Fabric 1.0 公有云安装6--集群部署之坑
  3. 对3D显示技术的初步分类
  4. 效率丨顶级项目管理工具 Top10
  5. 测试工程师,跳槽涨了4k,年总包算下来还降薪了?
  6. HaaS100硬件规格
  7. 垃圾桶苹果计算机开机不显示器,苹果垃圾桶Mac Pro不配显示器怎么办?4K显示器大盘点!...
  8. lockup latch clock gating cell
  9. 制作优品新手指南页面
  10. 带你们轻松玩遍吃遍张家界