创建第一个Scrapy项目
d:
进入D盘
scrapy startproject tutorial
建立一个新的Scrapy项目
工程的目录结构:
tutorial/
scrapy.cfg # 部署配置文件
tutorial/ # 项目的Python模块,您将从这里导入代码
__init__.py
items.py # 项目项目定义文件
middlewares.py # 项目中间件文件
pipelines.py # 项目管道文件
settings.py # 项目设置文件
spiders/ # 一个目录,你以后会把你的爬虫放进去
__init__.py
新建quotes_spider.py:
import scrapy class QuotesSpider(scrapy.Spider): # QuotesSpider类继承scrapy.Spider类 name = "quotes" # 标识蜘蛛。它在项目中必须是唯一的,也就是说,不能为不同的蜘蛛设置相同的名称 def start_requests(self): # 必须返回Spider将开始抓取的请求的迭代(您可以返回请求列表或编写生成器函数) # 后续请求将从这些初始请求中连续生成 urls = [ 'http://quotes.toscrape.com/page/1/', 'http://quotes.toscrape.com/page/2/', ] for url in urls: yield scrapy.Request(url=url, callback=self.parse) def parse(self, response): # 将被调用来处理为每个请求下载的响应的方法。 # 响应参数是TextResponse保存页面内容的一个实例,并有更多有用的方法来处理它 # 该parse()方法通常解析响应,将提取的数据提取为字符串,并查找新的URL并Request根据它们创建新的请求 page = response.url.split("/")[-2] filename = 'quotes-%s.html' % page with open(filename, 'wb') as f: f.write(response.body) self.log('Saved file %s' % filename)
scrapy crawl quotes
运行爬虫
已经创建了两个新文件:quotes-1.html和quotes-2.html,以及各个URL的内容,正如我们的parse方法所指示的那样
转载于:https://www.cnblogs.com/yjlch1016/p/9261158.html
创建第一个Scrapy项目相关推荐
- 创建第一个IOS项目
今天我们创建第一个IOS项目,并在模拟器上运行 首先进入Xcode 点击创建新项目后,接下来该给项目起一个名字啦 HelloWorld! 点击下一步,开始选择模板啦 我们选择SingleView Ap ...
- 五十一、创建第一个Maven项目和pom.xml 详解
@Author:Runsen @Date:2020/6/12 人生最重要的不是所站的位置,而是内心所朝的方向.只要我在每篇博文中写得自己体会,修炼身心:在每天的不断重复学习中,耐住寂寞,练就真功,不畏 ...
- 创建第一个Django项目
创建第一个Django项目: 我们将介绍Django 管理工具及如何使用 Django 来创建项目,第一个项目我们以 HelloWorld 来命令项目. 测试版本说明: python 3.7 Djan ...
- python创建django项目_搭建Python-Django环境,创建第一个Django项目
曾想学爬虫,没想到误入python web班,在美女老师shirely的指导下,搭建了好Django环境,试着开始做第一个web项目 一.Python环境安装 1.Python2.7的下载 从Pyth ...
- 跟小静学MVC3[01]--创建第一个MVC3项目
[前言]从今天开始,小静要学习Pro ASP.NET MVC3 Framework这本经典大作了,我是下载的电子版学习的.在这里只是用作学习的记录,便于以后查阅,也为了督促自己坚持下去.不用于任何商业 ...
- 将Maven集成到idea中并创建第一个Maven项目
在将Maven集成到idea中之前,你需要确保你已经安装过了Maven,在DOS下输入mvn -v如果显示如下,则证明已安装,如果没有安装,可以参考Maven的下载安装,如果你不知道Maven的一些基 ...
- VsCode创建第一个vue项目
转载自:https://www.cnblogs.com/z45281625/p/9015380.html VsCode创建第一个vue项目 使用vue-cli快速构建项目 ( vue-cli 是vu ...
- 创建第一个phpstorm项目(phpstorm+Apache)
创建第一个phpstorm项目 1.点击新建项目 2.选择新建空项目 3.选择新建项目位置(由于要使用apache,所以项目一定要建在apache下的htdocs下) 4.给项目命完名 5.再次确认文 ...
- Flutter入门——创建第一个Flutter项目
Flutter入门--创建第一个Flutter项目 一.创建项目 第一个项目使用Android Studio创建,步骤如下: 先打开Android Studio,会有一个创建新的Flutter应用的选 ...
最新文章
- TFS数据库变成可疑状态的处理
- 关于用户升级到MacOS10.10系统后versions崩溃的问题
- 【Python-ML】SKlearn库决策树(DecisionRegression) 使用
- 59 javabean的创建
- dell笔记本插上耳机没有声音_跑男的耳机没有声音,沙溢只用一句话诈出来,不愧是《王牌》常客...
- Java杂记3—流程控制之条件 1
- SharePoint 2010 使用代码创建视图查询条件
- 大型企业网络配置系列课程详解(六) --PPP链路的配置与相关概念的理解
- 毕业设计 ASP.Net+EasyUI开发 X X露天矿调度管理信息系统(一)
- android webview 选择图片上传,Android webview打开本地图片上传实现代码
- date比较大小 mybatis_面试官:给我说说你使用Mybatis的过程中遇到过哪些坑?
- rails debug
- loadrunner11破解技巧
- java数据流编辑 kylo,Kylo 在个推信息流推荐引擎中的使用及扩展
- 分享一个经验模态分解分解视频,讲的超好
- 【价值积累】属于我的创业感悟
- python调用foxmail 发邮件_foxmail 收取已发送邮件
- 服务器加什么网站才打开快,如何优化让网站打开速度更快些呢?
- 魔方cfop公式软件_魔方与群论(一)(不要被标题吓到,高中生就可以看)
- 从高级程序员-资深程序员-技术总监,我都为你整理好了学习路径