2020/7/31 今天学习得是关于小甲鱼得python课程,根据这个课程也确确实实得学到了不少东西,所以希望大家也可以一起去学习
下面是我在小甲鱼上课改造之后得代码
这个课程是在b站上看的,号码是 av27789609

这个是第五十节左右得爬虫 ooxx

他的教学视频是很早的时候录得,现在的网站进行了base64的加密等反爬措施,所以在原有的基础上需要进行修改
下面是我的代码,希望可以给大家一些启发,同时也希望大佬们给与指点。

import urllib.request
import urllib.parse
import os
import base64
def urlopen(url):req=urllib.request.Request(url)req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 Edge/18.18362')response=urllib.request.urlopen(req)html=response.read()return html

上面的这一个urlopen简单的说是为了进入网站,然后阅读网站的代码,从而之后为了找到图片的地址等等提供帮助

def getpage(url):html=urlopen(url).decode('utf-8')a=html.find('current-comment-page')+23b=html.find(']',a)return (html[a:b])

这个是网站里面的有个页数,选择第几页的时候会用的到,写道这里的时候可以尝试先print(html[a:b]),看是否出来对应的页数在进行操作,那里的"+23"其实是’current-comment-page’的长度,这样做+23之后就直接到达了页数所在的地方。

def findimg(url):html=urlopen(url).decode('utf-8')imgaddrs=[]a=html.find('src=')b=html.find('.jpg',a,a+255)while a!= -1:b=html.find('.jpg',a,a+255)if b!= -1:imgaddrs.append('https:'+html[a+5:b+4])else:b=a+5a=html.find('src=',b)return imgaddrs

这里是找图片的函数,在网站的源码中寻找src=,这样就可以找到网站里图片的地址,但是图片里的地址没有http:,所有就需要拼接一下使得网站里read()到的地址加上http:,从而获得一个完整的网络地址。

def xiazai(floder='ooxx',pages=10):os.mkdir(floder)os.chdir(floder)url='http://jandan.net/pic/'pagenum=int(getpage(url))s = '20200730-'d='%d'%pagenumc=s+db =base64.b64encode(c.encode('utf-8')).decode("utf-8")for i in range(pages):pagenum -= ipageurl=url+b+'#comments'imgaddrs=findimg(pageurl)imgaddrs=imgaddrssaveimg(floder,imgaddrs)if __name__ == '__main__':xiazai()

这个就是从网上下载的具体方法,这里注意的是原来的网站里面的代码经过了base64加密,就是这里面的s代表着每天的日期
这个其实放在最后好一些点。

def saveimg(folder,imgaddrs):for each in imgaddrs:filename=each.split('/')[-1]with open(filename,'wb') as f:img =urlopen(each)f.write(img)

这个是网站得到的图片进行保存,保存到指定的文件夹里面

这就是改完之后的了,亲测可以运行,希望大佬们给点指点

小甲鱼python视频xxoo爬虫代码改进--煎蛋网相关推荐

  1. Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  2. python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  3. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  4. Python爬虫入门,煎蛋网XXOO图片抓取!

    今天写一个爬虫爱好者特别喜欢的网站煎蛋网 http://jandan.net/ooxx ,这个网站其实还是有点意思的,网站很多人写了N多的教程了,各种方式的都有,当然网站本身在爬虫爱好者的不断进攻下, ...

  5. python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!

    前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...

  6. python小课文件_[Python]小甲鱼Python视频第030课(文件系统:介绍一个高大上的东西)课后题及参考解答...

    # -*- coding: utf-8 -*- """ Created on Fri Mar 8 15:49:32 2019 @author: Administrator ...

  7. 小甲鱼python视频bilibili_在B站上学编程,这几个视频你知道了么?

    原标题:在B站上学编程,这几个视频你知道了么? 来自:程序员书库(ID:OpenSourceTop) 视频来源:B站 说到B站,你第一反应是什么?追新番,发弹幕,还是看鬼畜视频?实际上,现在B站已经是 ...

  8. 小甲鱼python猜题_[Python]小甲鱼Python视频第033课(except)课后题及参考解答

    # -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. "&quo ...

  9. 小甲鱼python视频第八讲(课后习题)

    1.for循环的使用,注意下面代码的区别 for i in range(0,10,2):print("i love you") for i in range(0,10):print ...

最新文章

  1. php 去掉img,php如何删除img标签
  2. openresty读取环境变量
  3. To B服务想做移动化?腾讯云案例了解一下
  4. Unity之Update与FixedUpdate区别
  5. Element UI级联选择器(Cascader)获取级联对象
  6. 【转】Impala导出查询结果到文件
  7. 项目收获与体会_践行“十个一”在劳动中收获成长——青岛六十六中高二年级学农实践活动圆满结束...
  8. 将matlab中数据输出保存为txt或dat格式
  9. 【RK3399Pro学习笔记】二、Thinker Edge R 内网穿透以实现远程SSH
  10. 五句话足以改变人生[转]
  11. POJ - 1459 Power Network(最大流)(模板)
  12. 拓端tecdat|使用R语言随机波动模型SV处理时间序列中的随机波动率
  13. DPDK - TX-Offload Checksum
  14. 算法导论--麻省理工学院公开课
  15. GTK+ GUI库使用现状
  16. 谷粒商城 高级篇 (十四) ---------- 商品详情
  17. 计算机java相关英文文献,计算机专业 Java外文翻译 外文文献 英文文献.docx
  18. 云服务器租赁维护合同,云服务器 租赁 服务合同
  19. 2023年华南师范大学汉语国际教育考研上岸前辈备考经验
  20. C语言课设会员计费系统(大作业)

热门文章

  1. java-php-python-ssm雷士灯具管理系统计算机毕业设计
  2. 为什么使用Python, Python应用场景 特点
  3. Promethus-day2-普罗米修斯容器化与PromQL
  4. html flex 上中下布局,flex 布局
  5. Android 性能优化 - 彻底解决内存泄漏
  6. 魅族魅蓝A5完美打开Usb调试模式的方法
  7. 学计算机专业 要画素描吗,【推荐】新手如何学电脑绘画
  8. 相对路径和绝对路径(带例子,详解)
  9. 【详解】绝对路径和相对路径
  10. 《深入理解计算机系统》读书笔记(1)