文章分两部分,先简单介绍下feapder,然后通过阅读原文里的视频教程教大家快速上手feapder。相信你耐心看完,会有所收获!

目录

  • 简介
    • 1.拥有强大的监控,保障数据质量
    • 2. 简单易用,框架内置3种爬虫,适应各种需求场景
    • 3. 文档地址
  • 环境要求:
  • 安装:
  • 小试一下

简介

feapder是一款上手简单,功能强大的Python爬虫框架

读音: [ˈfiːpdə]

1.拥有强大的监控,保障数据质量


2. 简单易用,框架内置3种爬虫,适应各种需求场景

**AirSpider 轻量爬虫:**学习成本低,可快速上手

**Spider 分布式爬虫:**支持断点续爬、爬虫报警、数据自动入库等功能

**BatchSpider 批次爬虫:**可周期性的采集数据,自动将数据按照指定的采集周期划分。(如每7天全量更新一次商品销量的需求)

feapder对外暴露的接口类似scrapy,可由scrapy快速迁移过来。支持断点续爬、数据防丢、监控报警、浏览器渲染下载、海量数据去重等功能

3. 文档地址

官方文档:http://feapder.com
国内文档:https://boris-code.gitee.io/feapder
github:https://github.com/Boris-code/feapder
更新日志:https://github.com/Boris-code/feapder/releases
爬虫管理系统:http://feapder.com/#/feapder_platform/feaplat

环境要求:

Python 3.6.0+
Works on Linux, Windows, macOS

安装:

From PyPi:

通用版

pip3 install feapder

完整版:

pip3 install feapder[all]

通用版与完整版区别:

完整版支持基于内存去重
完整版可能会安装出错,若安装出错,请参考安装问题

小试一下

创建爬虫

feapder create -s first_spider

创建后的爬虫代码如下:

import feapderclass FirstSpider(feapder.AirSpider):def start_requests(self):yield feapder.Request("https://www.baidu.com")def parse(self, request, response):print(response)if __name__ == "__main__":FirstSpider().start()

直接运行,打印如下:


Thread-2|2021-02-09 14:55:11,373|request.py|get_response|line:283|DEBUG|-------------- FirstSpider.parse request for ----------------url  = https://www.baidu.commethod = GETbody = {'timeout': 22, 'stream': True, 'verify': False, 'headers': {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.93 Safari/537.36'}}<Response [200]>
Thread-2|2021-02-09 14:55:11,610|parser_control.py|run|line:415|DEBUG| parser 等待任务...
FirstSpider|2021-02-09 14:55:14,620|air_spider.py|run|line:80|INFO| 无任务,爬虫结束

代码解释如下:

start_requests:生产任务
parse:解析数据

在这里我也整理了一份学习资料,主要包含爬虫入门(爬虫工作流程 http工作流程)、逆向工程、逆向算法、异步爬虫、安卓逆向这几个板块,适合Python入门的朋友学习,都是精华,有需要的话可以添加名片领取。

feapder入门教程之AirSpider相关推荐

  1. ​HealthKit开发快速入门教程之HealthKit数据的操作

    ​HealthKit开发快速入门教程之HealthKit数据的操作 数据的表示 在HealthKit中,数据是最核心的元素.通过分析数据,人们可以看到相关的健康信息.例如,通过统计步数数据,人们可以知 ...

  2. HealthKit开发快速入门教程之HealthKit框架体系创建健康AppID

    HealthKit开发快速入门教程之HealthKit框架体系创建健康AppID HealthKit开发准备工作 在开发一款HealthKit应用程序时,首先需要讲解HealthKit中有哪些类,在i ...

  3. HealthKit开发快速入门教程之HealthKit开发概述简介

    HealthKit开发快速入门教程之HealthKit开发概述简介 2014年6月2日召开的年度开发者大会上,苹果发布了一款新的移动应用平台,可以收集和分析用户的健康数据.该移动应用平台被命名为&qu ...

  4. nodejs入门教程之http的get和request简介及应用

    nodejs入门教程之http的get和request简介及应用 前言 上一篇文章,我介绍了nodejs的几个常用的模块及简单的案例,今天我们再来重点看一下nodejs的http模块,关于http模块 ...

  5. python语言if语句-Python入门教程之if语句的用法

    这篇文章主要介绍了Python入门教程之if语句的用法,是Python入门的基础知识,需要的朋友可以参考下 OK分享完毕!需要Python资料的可以加QQ群:832339352 进群免费领取下面资料! ...

  6. java jni helloword_JNI入门教程之HelloWorld篇

    JNI入门教程之HelloWorld篇 来源:互联网  宽屏版  评论 2008-05-31 09:07:11 本文讲述如何使用JNI技术实现HelloWorld,目的是让读者熟悉JNI的机制并编写第 ...

  7. linux lvm界面,Linux使用入门教程之LVM

    Linux使用入门教程之LVM 1.pvscan #查看当前系统是否存在 PV(物理卷) 2.fdisk -l #查看当前系统分区 3.pvcreate /dev/sda{5,6} /dev/sdb1 ...

  8. php zend framework 教程,Zend Framework入门教程之Zend_Session会话操作详解

    本文实例讲述了Zend Framework入门教程之Zend_Session会话操作.分享给大家供大家参考,具体如下: 会话命名空间 实现会话 代码: require_once "Zend/ ...

  9. python3菜鸟教程-python3入门教程之hello world

    概述 python 这门语言这几年非常的火,很多技术都用的到,像爬虫,大数据,人工智能等,包括很多的小孩都首选python作为入门学习语言,那python 究竟是怎样一门语言呢? Python 是一个 ...

最新文章

  1. 苹果公司揭秘首批列入 Swift 源代码兼容性开源项目清单
  2. python私有方法应用场景_Python私有属性私有方法应用实例解析
  3. python3.8安装插件locust报错error: Microsoft Visual C++ 14.0 is required. Get it with Microsoft Visual C++
  4. java sdp_[java,SDP] java 7 SDP 技术/Socket Direct Protocol 2
  5. php数据关系图,如何利用navicat查看数据表的ER关系图
  6. linux 屏幕输出 高亮_通过printf设置Linux终端输出的颜色和显示方式
  7. 2018-08-10 Netty:4.x
  8. python3pygame 游戏程序_python3 pygame实现接小球游戏
  9. [jQuery]计算年龄
  10. QT 播放器之界面布局
  11. Chip Probe(CP)测试
  12. 数据库系统概念第六版课后习题答案-第一章
  13. java全碳硬叉好不_山地自行车跑长途为什么锁死避震前叉或者用硬叉好些?
  14. apollo 阿波罗使用
  15. 语音识别-声纹识别-语音合成【专题三】
  16. 2021年618小红书行业投放报告,小红书品类种草数据分析
  17. win10 edge切换窗口,取消edge窗口为多个,改为独立窗口
  18. 我辛辛苦苦做了一个月的项目,组长年底用来写了晋升PPT
  19. 为什么Hashtable ConcurrentHashmap不支持key或者value为null
  20. 电梯、签到、黑板测试用例

热门文章

  1. 字符串和字符数组作为函数参数传递
  2. c# jobject 的数据结构的解析
  3. Unity真机非全屏播放视频
  4. php入门python简单,python基础教学入门
  5. IOI车机系统刷机和改包笔记
  6. 【23考研】计算机择校信息库-这些学校计算机考研只考数据库
  7. 巴顿将军粗野的战前动员
  8. 二、搭建mysql服务器,创建数据库
  9. Vue数组更新相关方法和过滤与排序的使用
  10. 可能是全网最细的Android-资源加载机制剖析,醍醐灌顶!