3秒爬取百度图片网站，批量下载各种图片

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者：一行数据

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料以及群交流解答点击即可加入

这里想问大家三个问题：

你还在为表情包各种偷图吗？
你还在为找不到好看的图片素材在烦恼吗？
你还在为各种精美壁纸的挑选和下载找遍各大网站吗？

30行Python代码来帮你解决这个问题，现在你只要对代码进行复制、粘贴、运行三连就可以爬取你想要的图片。

import os
import requests
import rekeyWord = "杨超越" # 设置爬取图片的主题
number = 10       # 爬取图片数量
if not os.path.exists(keyWord):os.makedirs(keyWord)
url = r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq' \r'=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd' \r'=1497491098685%5E00_1519X735&word=' + keyWord
get = requests.get(url)
pciture_url = re.findall(r'objURL":"(.*?)",', get.text)
a = 1
for i in pciture_url:p_type = i.split('.')[-1]a += 1try:picture = requests.get(i, timeout=10)name = "%s/%s_%d.%s" % (keyWord, keyWord, a, p_type)with open(name, 'wb') as f:f.write(picture.content)print('第%d张图片正在下载' % a)except:print('第%d张图片下载失败！已跳过...' % a)if a >= number:break

代码逻辑主要是爬取百度图片网站的网页源码，然后从源码中提取每张图片的地址链接，使用循环保存每一张图片。

可以将这份代码直接拷贝到Python编辑器里，只需要修改keyWord变量和num变量，设置成自己想爬取的图片主题和数量就可以运行下载了。爬取的结果如下图所示：

爬取代码高级版本

上面的代码只能爬取一页，因为他只对一个网址里的图片链接进行提取，如果想爬取大批量的图片，需要提取图片网站下一页的链接，这个核心代码如下：

def get_url_one_page(url):html = requests.get(url)html.encoding = 'utf-8'html = html.texturl_pic_this_page = re.findall(r'"objURL":"(.*?)",', html)url_next_page_prefix = re.findall(r'<a href="(.*?)" class="n">下一页', html)if len(url_next_page_prefix) != 0:url_next_page = 'http://image.baidu.com' + url_next_page_prefix[0]else:print("已到达最后一页！")url_next_page = Nonereturn url_pic_this_page, url_next_page

在爬取关键词里输入想要爬取的图片主题，然后输入爬取图片张数，最后选择图片保存的路径并点击开始爬取就只需要静静等待即可（网速够快的话，一般来说一秒下载一张图片）最后下载后的结果如下

3秒爬取百度图片网站，批量下载各种图片相关推荐

python3爬虫系列16之多线程爬取汽车之家批量下载图片
python3爬虫系列16之多线程爬取汽车之家批量下载图片 1.前言上一篇呢,python3爬虫系列14之爬虫增速多线程,线程池,队列的用法(通俗易懂),主要介绍了线程,多线程,和两个线程池的使用. ...
python爬取贴吧所有帖子-Python爬虫实例（一）爬取百度贴吧帖子中的图片
程序功能说明:爬取百度贴吧帖子中的图片,用户输入贴吧名称和要爬取的起始和终止页数即可进行爬取. 思路分析: 一.指定贴吧url的获取例如我们进入秦时明月吧,提取并分析其有效url如下 ?后面为查询字 ...
python爬表情包_教你用Python来爬取表情包网站的所有表情图片
教你用Python来爬取表情包网站的所有表情图片配置环境安装Python 开发环境 3X系列 win + R 打开运行,输入cmd,输入python,进行验证是否安装Python win + R ...
img绝对路径图片显示_使用python爬虫去风景图片网站批量下载图片
使用python爬虫(requests,BeautifulSoup)去风景图片网站批量下载图片 1.写代码背景: 今天闲来无事,想弄点图片放到电脑,方便以后使用,故去百度查找一些风景图片网站,发现图片 ...
python 爬取百度知道,Python 爬虫爬取百度百科网站
利用python写一个爬虫,爬取百度百科的某一个词条下面的全部链接和每一个链接内部的词条主题和摘要.利用request库爬取页面,然后利用BeautifulSoup对爬取到的页面提取url和关键内容. ...
下载网页图片-如何批量下载网页图片-批量图片下载工具免费
下载网页图片,今天给大家分享一款免费批量下载网页图片软件,支持任意格式的图片批量下载,只需要输入关键词或批量导入网页链接即可下载图片.批量下载任意网页上的图片,每个人都可以拥有各种高清图源.支持批量图 ...
python下载网页里面所有的图片-Python批量下载网页图片详细教程
很多朋友在网上查找批量下载图片的方法~发觉挺凌乱的,无从下手.这里绿茶小编就来跟大家分享下使用Python批量下载图片方法. 目标:爬取某个网站上n多页的链接,每个链接有n多张图片,每一页对应一个文件 ...
案例精选：爬取美食杰所有图片批量下载并入库
import shutil,os #文件处理的高级模块 from bs4 import BeautifulSoup from urllib.request import Request,urlopen ...
Java爬虫历险记 -- （1）爬取百度首页的logo
Java爬虫历险记 – (1)爬取百度首页的logo 在这篇文章里,介绍两种方式来获取百度网页的logo: (1)Httpclient (2) jsoup + Httpclient ,详细的运行结果可 ...

3秒爬取百度图片网站，批量下载各种图片

前言

3秒爬取百度图片网站，批量下载各种图片相关推荐

最新文章

热门文章