效果

目标网站

图片网站



目标接口:

# GET 请求
https://www.logosc.cn/api/so/get?page=0&pageSize=20&keywords=&category=local&isNeedTranslate=undefined

通过分析,我们可以知道应该可以修改pagepageSize参数来控制获取的图片。

导入第三方模块

import requests
import os.path

分析要爬取的信息

代码

封装getPicture(page,pageSize)方法,来爬取图片素材的地址,在通过download(urls)方法来进行下载!

# author: LiuShihao
# data: 2020/12/3 5:23 下午
# youknow: 各位老铁,我的这套代码曾经有人出价三个亿我没有卖,如今拿出来和大家分享,不求别的,只求大家免费的小红心帮忙点一点,这里谢过了。
# desc:  爬取搜图神器网站的图片素材
"""
https://www.logosc.cn/so/
目标接口: https://www.logosc.cn/api/so/get?page=0&pageSize=20&keywords=&category=local&isNeedTranslate=undefined
"""
import requests
import os.path
# page = 0
# pageSize = 50headers = {"user-agent": "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36",
}
# 获取素材地址
def getPicture(page,pageSize):urls = []url = f"https://www.logosc.cn/api/so/get?page={page}&pageSize={pageSize}&keywords=&category=local&isNeedTranslate=undefined"print(url)response = requests.get(url=url, headers=headers)content = response.json()if "data" in content:i = 0while True:try:if content["data"][i]["large_img_path"]["url"]:picture_url = content["data"][i]["large_img_path"]["url"]print("picture_url" + str(i) + ":", picture_url)i = i + 1urls.append(picture_url)except:breakprint("没有数据!")else:print("没有获取到数据!")return urls# 下载素材
def download(urls):i = 0for image in urls:i += 1image = requests.get(image).contentif os.path.exists('images'):with open('images/' + str(i) + '.jpg', 'wb') as f:  # 注意打开的是就jpg文件 w 只读 b二进制print(str(i) + '.jpg 正在保存。。。')f.write(image)else:print('目录不存在')if __name__ == '__main__':urls = getPicture(0,40)print(f"获取到{len(urls)}个地址")download(urls)

Python爬虫学习(四)爬取图片素材网站素材相关推荐

  1. python爬虫学习之爬取某网站上的视频

    """ 实现步骤:发送请求 >>> 获取数据 >>> 解析数据 >>> 保存数据 1.发送请求,对于视频信息数据包发 ...

  2. Python爬虫学习笔记 -- 爬取糗事百科

    Python爬虫学习笔记 -- 爬取糗事百科 代码存放地址: https://github.com/xyls2011/python/tree/master/qiushibaike 爬取网址:https ...

  3. Python爬虫学习之爬取淘宝搜索图片

    Python爬虫学习之爬取淘宝搜索图片 准备工作 因为淘宝的反爬机制导致Scrapy不能使用,所以我这里是使用selenium来获取网页信息,并且通过lxml框架来提取信息. selenium.lxm ...

  4. 爬虫学习,尝试爬取小说网站

    初步学习了scrapy 尝试着爬取小说网站全部小说(发现没问题就停了) 以下为scrapy中基础爬虫的写法 # -*- coding: utf-8 -*- import scrapy from scr ...

  5. python爬虫学习之爬取全国各省市县级城市邮政编码

    实例需求:运用python语言在ip查询 查ip 网站ip查询 同ip网站查询 iP反查域名 iP查域名 同ip域名网站爬取全国各个省市县级城市的邮政编码,并且保存在excel文件中 实例环境:pyt ...

  6. python爬虫学习一--爬取网络小说实例

    最近疫情猖獗,长假憋在家里实在无聊,早上突然看了一篇python爬虫文章,当场决定试验一下,参照了一下别人的案例,自己各种踩坑捣鼓了好几个小时,终于成功最后把具体步骤和注意点分享给大家: 1.Pyth ...

  7. 为了部落 来自艾泽拉斯勇士的python爬虫学习心得 爬取大众点评上的各种美食数据并进行数据分析

    为了希尔瓦娜斯 第一个爬虫程序 csgo枪械数据 先上代码 基本思想 问题1 问题2 爬取大众点评 URL分析 第一个难题 生成csv文件以及pandas库 matplotlib.pyplot库 K- ...

  8. python爬虫学习之爬取超清唯美壁纸

    简介 壁纸的选择其实很大程度上能看出电脑主人的内心世界,有的人喜欢风景,有的人喜欢星空,有的人喜欢美女,有的人喜欢动物.然而,终究有一天你已经产生审美疲劳了,但你下定决定要换壁纸的时候,又发现网上的壁 ...

  9. 杭州python爬虫招聘_python爬取招聘网站(智联,拉钩,Boss直聘)

    刚好最近有这需求,动手写了几个 就贴上代码算了 1.智联 将结果保存为python的一个数据框中 import requests from requests.exceptions import Req ...

  10. python爬虫学习(2) —— 爬一下ZOL壁纸

    我喜欢去ZOL找一些动漫壁纸当作桌面,而一张一张保存显然是太慢了. 那怎么办呢,我们尝试使用简单的爬虫来解决这个问题. 0. 本爬虫目标 抓取给定分类「或子分类」网址的内容 分析并得到每个分类下的所有 ...

最新文章

  1. 带你轻而易举的学习python——八皇后问题
  2. 神在夏至祭降下了神谕(oracle)
  3. 八数码 poj 1077 广搜 A* IDA*
  4. 宇宙第一 IDE Visual Studio 2019 正式发布
  5. 高等数学:第三章 微分中值定理与导数的应用(3)曲线的凹凸 拐点 曲率
  6. 信息系统项目管理师:第5章:项目范围管理-重点汇总
  7. 二十一、“一枝一叶一花语,一生一世一英名。”(2021.5.29)
  8. 面向对象编程之:封装、继承、多态
  9. 学好java再学c 可以吗_再论学好C的重要性!!!
  10. ros如何订阅关节力矩信息_ROS中阶笔记(二):机器人系统设计—URDF机器人建模...
  11. 学习Linux第一天
  12. 存储过程(简单入门)
  13. gitLab下载安装和使用教程
  14. 解决趋势OfficeScan11自动显示隐藏文件等问题
  15. springcloud alibaba 整合 seata 完整 安装和配置
  16. Matlab 解非线性方程组
  17. js 调用 百度/腾讯/高德地图app 导航 初始位置为我的位置
  18. 软件架构模式 mark Richards - 读后总结 6 - 整合
  19. 黑马程序员--一个初中没毕业的苦逼,到8.5k的程序人生,感谢黑马
  20. VS Code 高效“摸鱼”插件推荐

热门文章

  1. android显示伽玛曲线,android – 伽玛曲线实验 – 将2.2转换为1.8的相反值?
  2. 云有约 | 在斩获“数据金羊毛”的途中,易观造船现行,人称Argo号~
  3. 自媒体短视频搬运如何伪原创上热门!老司机教你伪原创短视频的做法
  4. AI 建模师 素养手冊(2)
  5. 替补者的旅行(巨长,慎入)
  6. 程序员该如何去写自己的简历-代码而成的简历
  7. RationalDMIS 7.1 程序示例
  8. 打包后自定义attr找不到_80后长沙文物修复师刘胄造“精绝古城”,修复实力连X光都找不到破绽...
  9. VHDL数字频率计的设计
  10. 资深数据科学家教你如何在求职过程中找到心仪工作