学习python应用的暑假(1、爬取图片)
暑假学习python的应用,希望可以让大家作为参考使用,有错的地方请大家指出,以下是本人自己学习的,本人也是大白一枚,如果有个别错误的地方,希望大家见谅
首先我写一下这个暑假,希望自己完成的任务
- python爬取图片
- python爬取视频
- python填写Excel表格
第一个任务python爬取照片
你好!如果你和我一样是都是大白的话建议先学习一下,requests,BeautifulSoup。 如果大家感觉我的这语言风格容易让你接受,可以关注我,看我接下来的推送。可以在评论中留言提问,如果有什么问题可以通过邮箱的形式进行笔者(⊙o⊙)
话不多说我们开始喽!!!!(先给自己(作者)打个气)
介绍:
今天我们的任务是简单的对一个已经有url(网络地址)的图片进行爬取,并保存。这篇文章对你来说,可能会让你学对
1、对python有个了解
2、两个第三方库(requesrts\os)的简单应用
可以利用学到的做些什么呢?
1、爬取只知道url(网络地址)的图片
2、了解部分网站的结构
第一步:建立框架
明确我们的战略目标是我们能打一个胜仗的关键,接下来我们应该明确我们的战斗目标。通过对目标进行向上推,建立我们的任务框架。
1.引入我们所需要的第三方库
2.爬取目标的网站
3.需要爬取的图片对应的代码找到
4.将图片储存在电脑本地
第二步:开始行动了
1.引入我们需要的第三方库,考虑整个过程中我们所需要的第三方库包括requests(获取文本) 、 os(存储文件)
import requests
import os
2.爬取我们的目标网站,我在百度图片中找到了一个小猪猪的图片,进行爬取
我们对里面这只可爱的小猪进行爬取保存
首先我们要找到这只小猪对应的url(网络连接地址啦 高大上一点),建议用谷歌浏览器比较方便,对准照片按鼠标的右键点击检查。
此时会和上面的图片一样出现一些代码,对于我们这些大白来说,完完全全的读懂这些代码是不可能的,咱们只要将这个图片对应的代码找到及可。在图上可以找到是
data_imgurl="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=264175563,1523946490&fm=26&gp=0.jpg"
这是这个图片对应的网络链接,到这里你离成功就不远了。
我们也可以对这个代码进行检验,将这个代码直接复制粘贴,看看可不可以出现一张照片呢?
import requests
import os
data_imgurl="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=264175563,1523946490&fm=26&gp=0.jpg"
html = requests.get(data_imgurl)
3.马上就是最后一步了,将我们从网站上提取处理的图片以二进制的方式储存在我们的电脑上。
import requests
import os
data_imgurl="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=264175563,1523946490&fm=26&gp=0.jpg"
html = requests.get(data_imgurl)
with open('小猪.jpg','wb') as f:f.write(html.content)
其实通过上面的步骤我们已经将图片储存起来了,但是如果我们想对图片进行修改,地址或者名字可以用os库进行
4.os库介绍
os库可以灵活的对目标进行位置存放,同时对文件的名字进行修改,方便我们对文件进行查找和处理。
import requests
import os
data_imgurl="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=264175563,1523946490&fm=26&gp=0.jpg"
html = requests.get(data_imgurl)
root = "D://"
path1 =root+'小猪.jpg'if not os.path.exists(root):os.mkdir(root)
if not os.path.exists(path1):with open(path1,'wb') as f:f.write(html.content)
大家仔细观察这个代码,自己修改一些地方相信你会有自己想要的收获。
今天的心得:
今天是2020年1月28号,今天鼓捣了一天。看了看mooc视频,在CSDN上看了不少大神的作品,给我的感觉是超赞,我相信我以后也会像大神一样厉害。相信时间是对努力的最好检验,从今天开始每两天推送一篇文章,附带我这两天学习到的,希望可以对大家有些帮助!!!
学习python应用的暑假(1、爬取图片)相关推荐
- python爬取知乎话题广场_学习python爬虫---爬虫实践:爬取B站排行榜2(爬取全部分类排行榜、利用pygal库作图)...
前面我们爬取了B站上全站的排行榜,详细见:魏勇:学习python爬虫---爬虫实践:爬取B站排行榜zhuanlan.zhihu.com 一.爬取全部分类排行榜 我们观察一下B站排行榜,那里还有番剧排 ...
- python爬虫系列:xpath爬取图片讲解(零基础向)
系列文章目录 python爬虫系列:BeautifulSoup爬取小说讲解(零基础向)(版权问题下架) python爬虫系列:requests下载酷我音乐讲解(零基础向)(版权问题下架) 文章目录 目 ...
- python爬虫抓取图片-简单的python爬虫教程:批量爬取图片
python编程语言,可以说是新型语言,也是这两年来发展比较快的一种语言,而且不管是少儿还是成年人都可以学习这个新型编程语言,今天南京小码王python培训机构变为大家分享了一个python爬虫教程. ...
- Python 自学记录(自定义爬取图片类型,页数 爬取站长之家图片)
入门级别 需要用到 lxml库和相关知识,用到 代理的知识(没用到代理池)等 lxml 方法知识记录 获取responce 返回的页面数据 tree = etree.HTML(context) 路径查 ...
- Python斗图网多线程爬取图片
coding:utf-8import requests import threading #多线程 from lxml import etree #解析网页 from bs4 import Beaut ...
- 快看,这是我为你准备的Python爬取图片教程
爬取图片实例 •selenium+win32爬取图片 Python学习交流Q群:903971231##### """爬取图片""" impo ...
- 这两个月——我的学习Python学习之路
笔者的大一是浑浑噩噩的,逃课,玩手机,挂科都干过,正所谓体验了一把堕落的美好,一年下来,是时间离我而去,知识我求之,不得.但庆幸的是我加入了物联网与AI协会,浪子回头并遇到了张智老师,在他的教导下,我 ...
- 孤荷凌寒自学python第八十一天学习爬取图片1
孤荷凌寒自学python第八十一天学习爬取图片1 (完整学习过程屏幕记录视频地址在文末) 通过前面十天的学习,我已经基本了解了通过requests模块来与网站服务器进行交互的方法,也知道了Beauti ...
- [python学习] 简单爬取图片网站图库中图片
最近老师让学习Python与维基百科相关的知识,无聊之中用Python简单做了个爬取"游讯网图库"中的图片,因为每次点击下一张感觉非常浪费时间又繁琐.主要分享的是如何爬取HTML的 ...
最新文章
- 16-acrobat por 简单使用指南
- 互联网企业烧钱抢占公交Wi-Fi市场
- php设置at定时,laravel定时任务
- Unix toolbox注解2之Linux系统状态用户和限制
- Nginx配置upstream实现负载均衡
- 二级路由dhcp关闭连不上wifi_酒店网络故障:原来还与DHCP服务器有关
- css使两个盒子并列_css如何去掉重叠部分的边框?
- 关于WKWebView高度的问题的解决
- SQLServer 优化SQL语句 in 和not in的替代方案
- drools动态配置规则_微服务实战系列(八)-网关springcloud gateway自定义规则
- Win10如何配置数据源ODBC数据源
- kotlin的Viewpage2+Fragment的简单使用(setUserVisibleHint方法过时)
- 淘宝APP用户行为分析
- 即时通信多媒体分享与文件共享
- 暂停影片剪辑_暂停声音剪辑
- 什么原因导致LED发光二极管的光衰?
- Python打开记事本
- lerna 使用详解
- Chrome 的哪些功能改变了我们浏览网页的方式?
- 涂鸦智能CFO刘尧:谁说高速发展的创新型企业就不能用SAP?