scrapy命令有哪些,其实灰常少,也就十四五个,在这十四五个中,常用的就纳么两三个而已,如:

scrapy startproject XXX(创建项目)、

scrapy genspider XX (创建XX蜘蛛)

scrapy crawl XX(运行XX蜘蛛)、

scrapy shell http://www.163.com(调试网址为http://www.163.com的网站)

1、startproject 创建项目命令:

这个是见得最多,创建项目的,如,创建一个名为:taobao的项目:

scrapy strartproject taobao

2、genspider 创建蜘蛛命令:

cd进入startproject 创建的项目,然后运行genspider 命令创建进行爬取的蜘蛛,这个命令的话是根据蜘蛛模板创建蜘蛛的命令,如,创建一个爬取店铺的蜘蛛

scrapy genspider shop

3、crawl 命令是运行创建的蜘蛛:

scrapy crawl shop

4、shell蜘蛛调试工具:

这个命令比较重要,主要是调试用,比如我们要调试http://www.taobao.com,看我们的选择器到底有木有正确选中某个元素,那我们就可以这样来玩,首先用调试打开:http://www.taobao.com:

scrapy shell http://www.163.com

然后我们可以直接执行命令,response,比如我们要测试我们获取标题的选择器正不正确,我们可以这样:

response.css("title::text").extract_first()

python爬虫scrapy比较常用的三个命令相关推荐

  1. Python爬虫——Scrapy 的基本使用

    文章目录 Python爬虫--Scrapy 的基本使用 1.创建 Scrapy 爬虫项目 2.Scrapy-创建爬虫文件 3.Scrapy-运行爬虫文件 Python爬虫--Scrapy 的基本使用 ...

  2. Python爬虫 - scrapy - 爬取妹子图 Lv1

    0. 前言 这是一个利用python scrapy框架爬取网站图片的实例,本人也是在学习当中,在这做个记录,也希望能帮到需要的人.爬取妹子图的实例打算分成三部分来写,尝试完善实用性. 系统环境 Sys ...

  3. python爬虫--Scrapy框架--Scrapy+selenium实现动态爬取

    python爬虫–Scrapy框架–Scrapy+selenium实现动态爬取 前言 本文基于数据分析竞赛爬虫阶段,对使用scrapy + selenium进行政策文本爬虫进行记录.用于个人爬虫学习记 ...

  4. python 爬虫 数据抓取的三种方式

    python 爬虫   数据抓取的三种方式 常用抽取网页数据的方式有三种:正则表达式.Beautiful Soup.lxml 1.正则表达式 正则表达式有个很大的缺点是难以构造.可读性差.不易适用未来 ...

  5. Python爬虫 scrapy框架爬取某招聘网存入mongodb解析

    这篇文章主要介绍了Python爬虫 scrapy框架爬取某招聘网存入mongodb解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 创建项目 sc ...

  6. Python爬虫—Scrapy框架—Win10下载安装

    Python爬虫-Scrapy框架-Win10下载安装 1. 下载wheel 2.下载twisted 3. 下载pywin32 4. 下载安装Scrapy 5. 创建一个scrapy项目 6. fir ...

  7. Python爬虫——Scrapy 简介和安装

    文章目录 Python爬虫--Scrapy 简介和安装 1.Scrapy 简介 2.Scrapy 下载安装 Python爬虫--Scrapy 简介和安装 1.Scrapy 简介 Scrapy 简介 S ...

  8. Python爬虫-Scrapy框架(四)- 内置爬虫文件 - 4.2 初探Crawl Spider

    Python爬虫-Scrapy框架(四)- 内置爬虫文件 - 4.2 初探Crawl Spider 写在前面 初探Crawl Spider 创建Crawl Spider项目 对比Basic与Crawl ...

  9. Python爬虫基础:常用HTML标签和Javascript入门

    1  HTML基础 大部分HTML标签是闭合的,由开始标签和结束标签构成,二者之间是要显示的内容,例如:<title>网页标题</title>.也有的HTML标签是没有结束标签 ...

最新文章

  1. 轻量级的c语言开发环境搭建,win下轻量级的c语言开发环境配置:vsc + gcc
  2. databricks使用
  3. 在虚拟机上安装Docker并运行Nginx
  4. Java基础篇:Iterator迭代器
  5. python的division函数_Python/Numpy:Division给了我一个意外的弃用警告
  6. Springboot 启动时Bean初始化,启动异常-Assert.isTrue(condition,message) 报错
  7. c语言strlren函数的原代码,VB常用函数
  8. JS小技巧 ----- 关于 ... 运算符的使用场景
  9. Framework7 + Angular 开发问题解决汇总
  10. 如何解决打开PDF文件时显示已损坏无法修复的问题!
  11. 可转债数据一览表集思录_可转债投资每周记录20200816
  12. java发送邮件带附件
  13. 福利彩票-双色球爬虫数据分析实战
  14. 【有限元】最简单fluent流体分析实例-2D模型中带障碍物计算流体流速与压力分布
  15. qt QAxObject word文档添加页码(页眉和页脚)
  16. 折线统计html,canvas制作简单的HTML图表,折线或者矩形统计(原创)
  17. 全裸或半裸的大肚照国际接轨 细数女星大尺度斗艳孕照
  18. weight和weightSum的区别
  19. 雷锋微视点:腾讯电商、搜搜、微信将出门独立
  20. 警校计算机专业考研,一名警校毕业生的跨专业考研路

热门文章

  1. 19-10-15(msgbox、inputbox、注释)
  2. 【JavaSE】多态数组的使用
  3. 赵小楼《天道》《遥远的救世主》深度解析(134)做了你该做的,就要受你该受的
  4. 设位于第一象限的曲线y=f(x)上的任一点P(x,y)的切线在x轴上的截距等于该点发现在y轴上截距的相反数,且曲线经过(1,0),求该曲线
  5. taro+vue微信小程序文本换行
  6. 几何光学学习笔记(10)- 3.4 理想光学系统的放大率
  7. Access根据出生日期计算年龄_WPS表格技巧—如何根据出生年月日求虚岁年龄
  8. Jmeter入参POST data乱码传入‘--VRES...SER--’的问题
  9. U深度U盘启动不了Thinkpad X250怎么办?
  10. 计算机仿真稿件没有消息,计算机核心期刊排名和投稿信息(2)