d:
进入D盘

scrapy startproject tutorial
建立一个新的Scrapy项目

工程的目录结构:

tutorial/
scrapy.cfg # 部署配置文件

tutorial/ # 项目的Python模块,您将从这里导入代码
__init__.py

items.py # 项目项目定义文件

middlewares.py # 项目中间件文件

pipelines.py # 项目管道文件

settings.py # 项目设置文件

spiders/ # 一个目录,你以后会把你的爬虫放进去
__init__.py

新建quotes_spider.py:

import scrapy

class QuotesSpider(scrapy.Spider):    # QuotesSpider类继承scrapy.Spider类    name = "quotes"    # 标识蜘蛛。它在项目中必须是唯一的,也就是说,不能为不同的蜘蛛设置相同的名称

    def start_requests(self):        # 必须返回Spider将开始抓取的请求的迭代(您可以返回请求列表或编写生成器函数)        # 后续请求将从这些初始请求中连续生成        urls = [            'http://quotes.toscrape.com/page/1/',            'http://quotes.toscrape.com/page/2/',        ]        for url in urls:            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response):        # 将被调用来处理为每个请求下载的响应的方法。        # 响应参数是TextResponse保存页面内容的一个实例,并有更多有用的方法来处理它        # 该parse()方法通常解析响应,将提取的数据提取为字符串,并查找新的URL并Request根据它们创建新的请求        page = response.url.split("/")[-2]        filename = 'quotes-%s.html' % page        with open(filename, 'wb') as f:            f.write(response.body)        self.log('Saved file %s' % filename)

scrapy crawl quotes
运行爬虫

已经创建了两个新文件:quotes-1.html和quotes-2.html,以及各个URL的内容,正如我们的parse方法所指示的那样

转载于:https://www.cnblogs.com/yjlch1016/p/9261158.html

创建第一个Scrapy项目相关推荐

  1. 创建第一个IOS项目

    今天我们创建第一个IOS项目,并在模拟器上运行 首先进入Xcode 点击创建新项目后,接下来该给项目起一个名字啦 HelloWorld! 点击下一步,开始选择模板啦 我们选择SingleView Ap ...

  2. 五十一、创建第一个Maven项目和pom.xml 详解

    @Author:Runsen @Date:2020/6/12 人生最重要的不是所站的位置,而是内心所朝的方向.只要我在每篇博文中写得自己体会,修炼身心:在每天的不断重复学习中,耐住寂寞,练就真功,不畏 ...

  3. 创建第一个Django项目

    创建第一个Django项目: 我们将介绍Django 管理工具及如何使用 Django 来创建项目,第一个项目我们以 HelloWorld 来命令项目. 测试版本说明: python 3.7 Djan ...

  4. python创建django项目_搭建Python-Django环境,创建第一个Django项目

    曾想学爬虫,没想到误入python web班,在美女老师shirely的指导下,搭建了好Django环境,试着开始做第一个web项目 一.Python环境安装 1.Python2.7的下载 从Pyth ...

  5. 跟小静学MVC3[01]--创建第一个MVC3项目

    [前言]从今天开始,小静要学习Pro ASP.NET MVC3 Framework这本经典大作了,我是下载的电子版学习的.在这里只是用作学习的记录,便于以后查阅,也为了督促自己坚持下去.不用于任何商业 ...

  6. 将Maven集成到idea中并创建第一个Maven项目

    在将Maven集成到idea中之前,你需要确保你已经安装过了Maven,在DOS下输入mvn -v如果显示如下,则证明已安装,如果没有安装,可以参考Maven的下载安装,如果你不知道Maven的一些基 ...

  7. VsCode创建第一个vue项目

    转载自:https://www.cnblogs.com/z45281625/p/9015380.html VsCode创建第一个vue项目 使用vue-cli快速构建项目  ( vue-cli 是vu ...

  8. 创建第一个phpstorm项目(phpstorm+Apache)

    创建第一个phpstorm项目 1.点击新建项目 2.选择新建空项目 3.选择新建项目位置(由于要使用apache,所以项目一定要建在apache下的htdocs下) 4.给项目命完名 5.再次确认文 ...

  9. Flutter入门——创建第一个Flutter项目

    Flutter入门--创建第一个Flutter项目 一.创建项目 第一个项目使用Android Studio创建,步骤如下: 先打开Android Studio,会有一个创建新的Flutter应用的选 ...

最新文章

  1. TFS数据库变成可疑状态的处理
  2. 关于用户升级到MacOS10.10系统后versions崩溃的问题
  3. 【Python-ML】SKlearn库决策树(DecisionRegression) 使用
  4. 59 javabean的创建
  5. dell笔记本插上耳机没有声音_跑男的耳机没有声音,沙溢只用一句话诈出来,不愧是《王牌》常客...
  6. Java杂记3—流程控制之条件 1
  7. SharePoint 2010 使用代码创建视图查询条件
  8. 大型企业网络配置系列课程详解(六) --PPP链路的配置与相关概念的理解
  9. 毕业设计 ASP.Net+EasyUI开发 X X露天矿调度管理信息系统(一)
  10. android webview 选择图片上传,Android webview打开本地图片上传实现代码
  11. date比较大小 mybatis_面试官:给我说说你使用Mybatis的过程中遇到过哪些坑?
  12. rails debug
  13. loadrunner11破解技巧
  14. java数据流编辑 kylo,Kylo 在个推信息流推荐引擎中的使用及扩展
  15. 分享一个经验模态分解分解视频,讲的超好
  16. 【价值积累】属于我的创业感悟
  17. python调用foxmail 发邮件_foxmail 收取已发送邮件
  18. 服务器加什么网站才打开快,如何优化让网站打开速度更快些呢?
  19. 魔方cfop公式软件_魔方与群论(一)(不要被标题吓到,高中生就可以看)
  20. 从高级程序员-资深程序员-技术总监,我都为你整理好了学习路径

热门文章

  1. linux 删除桌面环境变量,linux下export命令添加、删除环境变量(转载)
  2. CentOS添加并挂载新硬盘
  3. 最强自定义PHP集成环境,系统缺失dll和vc也能正常运行
  4. 浙江富润拟12亿并购泰一指尚 跨界互联网及大数据
  5. 前端框架——bootstrap/knockoutjs/angularjs
  6. Ranorex中Global变量的使用
  7. 从C# 到 Java 点滴
  8. WPF中的命令与命令绑定(二)
  9. tensorflow单变量线性回归
  10. face3000 c++ 代码运行