python学习之爬取煎蛋网美女图

用到库 os ，requests, base64
os简单介绍：点这里
requests介绍：点这里
base64介绍：点这里

其中 requests和 base64属于第三方库，需要自己安装
pip 一下就好

重点看一下requests 库的介绍，看上面那篇文章我觉得够了
其中，带参数的url请求,就是相当于打开该网页的一个子网页

然后就是煎蛋网网址:http://jandan.net/ooxx
右键，检查，点到页码看到

点到图片

ok，到时候查找地址的时候就用到这几个，简易的通过字符串查找，不过用正则也行（还不会）
还有注意到

网页的url中表示页数的数字是通过base64的方式进行编码的，所以我们需要在代码中进行转换

上代码各模块封装

import requests as rs
import os
import base64def url_open(url):headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36'}respones=rs.get(url,headers=headers)return respones.contentdef get_page(url):html = url_open(url).decode('utf-8')a = html.find('current-comment-page')+23b = html.find(']',a)return html[a:b]def get_url(page_num):targt_num = '20200101-' + str(page_num)targt_num = base64.b64encode(targt_num.encode('utf-8'))page_url = 'http://jiandan.net/ooxx/' + str(targt_num,'utf-8')+'#comments'#网页链接return page_urldef save_image(folder,image_adress):for each in image_adress:filename = each.split('/')[-1]with open(filename,'wb') as f:# 获取的文本实际上是图片的二进制文本each = 'http:' + eachimg = url_open(each)f.write(img)def find_images_address(page_url):html = url_open(page_url).decode('utf-8')img_addrs = []a = html.find('img src=')while a != -1:b = html.find('.jpg',a,a+255)if b != -1: img_addrs.append(html[a+9:b+4])else:b = a + 9a = html.find('img src=',b)return img_addrsdef downloads(folder="学习资料"):os.mkdir(folder)os.chdir(folder)url='http://jiandan.net/ooxx'page_num=int(get_page(url))for i in range(page_num):page_url=get_url(page_num)images_address=find_images_address(page_url)#找到图片的地址save_image(folder, images_address )#存到指定的文件page_num -= 1
if __name__=='__main__':downloads()

python学习之爬取煎蛋网美女图相关推荐

Python Scrapy 爬取煎蛋网妹子图实例（一）
前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例爬取煎蛋网妹子图,遗憾的是上周煎蛋网还有妹子图了,但是这周妹子图变成了随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...
python3网络爬虫：爬取煎蛋网美女照片
1.1 前言今天开学不久,课也不多,就想着来做个爬虫,看着好多老司机喜欢看美女图片,想做个爬去煎蛋网的小爬虫.哈哈,下面开车了,各位,上车记得滴卡参考: http://blog.csdn.net/ ...
B站小甲鱼零基础python视频P57爬取煎蛋网OOXX妹纸图代码修改
问题描述在B站看[小甲鱼]零基础入门学习PythonP57集时遇到了一些问题,现在煎蛋网的的图片每一页的网址和视频里的不太一样,看弹幕有的说能爬,有的说不能爬,也没有标明日期,当时挺懵逼的,不知道该 ...
python爬取煎蛋网妹子图
看了小甲鱼的python教学视频,爬取煎蛋网妹子图的代码已经不适用了,网上其它人的代码多有报错,本萌新结合其他人的方法,终于写出一个可行的,在此分享_(:з)∠)_(运行非常慢就是了) import ...
python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下今天,试着爬取了煎蛋网的图片. 用到的包: ...
python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下今天,试着爬取了煎蛋网的图片. 用到的包: ...
Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下今天,试着爬取了煎蛋网的图片. 用到的包: ...
python 爬虫爬取煎蛋网妹子图，我1T的硬盘装满了！
前言大家好,这里是「brucepk」爬虫系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...
利用Selenium爬取煎蛋网妹纸图原来是这么简单！！！
上期说到,下期更新爬取煎蛋网妹纸的selenium版本,它来了!!! 获取页面url信息获取图片url信息永久性保存图片注释: 想要获取GeckoDriver安装包的小伙伴,可以给博主留言或者搜 ...

python学习之爬取煎蛋网美女图

python学习之爬取煎蛋网美女图相关推荐

最新文章

热门文章

python学习之 爬取煎蛋网美女图

python学习之 爬取煎蛋网美女图相关推荐

最新文章

热门文章

python学习之爬取煎蛋网美女图

python学习之爬取煎蛋网美女图相关推荐