我想得到与此命令行相同的结果:

scrapy crawl linkedin_anonymous -a first = James -a last = Bond -o output.json

我的脚本如下:

import scrapy

from linkedin_anonymous_spider import LinkedInAnonymousSpider

from scrapy.crawler import CrawlerProcess

from scrapy.utils.project import get_project_settings

spider = LinkedInAnonymousSpider(None, "James", "Bond")

process = CrawlerProcess(get_project_settings())

process.crawl(spider) ##

process.start()

我发现(1)中的process.crawl()创建了另一个LinkedInAnonymousSpider,其中第一个和最后一个是None(打印在(2)中),如果是这样,那么就没有创建对象蜘蛛的意义了,怎么可能首先传递参数,最后传递给process.crawl()?

linkedin_anonymous:

from logging import INFO

import scrapy

class LinkedInAnonymousSpider(scrapy.Spider):

name = "linkedin_anonymous"

allowed_domains = ["linkedin.com"]

start_urls = []

base_url = "https://www.linkedin.com/pub/dir/?first=%s&last=%s&search=Search"

def __init__(self, input = None, first= None, last=None):

self.input = input # source file name

self.first = first

self.last = last

def start_requests(self):

print self.first ##

if self.first and self.last: # taking input from command line parameters

url = self.base_url % (self.first, self.last)

yield self.make_requests_from_url(url)

def parse(self, response): . . .

python process参数_将参数传递给Scrapy python中的process.crawl相关推荐

  1. Python灰帽子_黑客与逆向工程师的Python编程之道

    收藏自用 链接:Python灰帽子_黑客与逆向工程师的Python编程之道

  2. python process返回值_如何恢复传递给multiprocessing.Process的函数的返回值?

    如何恢复传递给multiprocessing.Process的函数的返回值? 在下面的示例代码中,我想恢复函数的返回值worker.我该怎么做呢?这个值存储在哪里? 示例代码: import mult ...

  3. python ray定时_使用 Ray 用 15 行 Python 代码实现一个参数服务器

    使用 Ray 用 15 行 Python 代码实现一个参数服务器 参数服务器是很多机器学习应用的核心部分.其核心作用是存放机器学习模型的参数(如,神经网络的权重)和提供服务将参数传给客户端(客户端通常 ...

  4. js有默认参数的函数加参数_函数参数:默认,关键字和任意

    js有默认参数的函数加参数 PYTHON开发人员的提示 (TIPS FOR PYTHON DEVELOPERS) Think that you are writing a function that ...

  5. mysql 传递数组_将数组传递给MySQL存储例程

    我需要将字符串数组作为参数传递给MySQL存储例程.该数组可能很长,其元素数量不是固定的.然后,我想将字符串值放入具有一列的内存表中,以便可以处理数据.我不知道这是否可以在MySQL中完成.也许需要肮 ...

  6. powerbuilder TriggerEvent 参数_静态参数-输入失调电压

    对于运放的认知,初学者可能只记得虚短虚断.输入阻抗/开环增益无穷大,但是若要设计一个性能优良的放大器,熟悉运放其他一些参数指标必不可少.这些参数可分成两大类:静态参数和动态参数.静态参数主要描述运放的 ...

  7. python方法重载_关于类:如何在Python中使用方法重载?

    我尝试在python中实现方法重载: class A: def stackoverflow(self): print 'first method' def stackoverflow(self, i) ...

  8. python老师武_跟着廖雪峰老师学python (5)

    若想技术精进,当然得把基础知识打得牢牢的. 廖雪峰的官方网站  python3教程,该网站提供的教程浅显易懂,还附带了讲学视频,非常适合初学者正规入门. 以下是通过廖雪峰python官方网站学习的个人 ...

  9. python 面试问题_值得阅读的30个Python面试问题

    python 面试问题 Interview questions are quite tricky to predict. In most cases, even peoples with great ...

最新文章

  1. 云栖2050 —— 面向年青人的科技公益大会
  2. java证明ArrayList是线程不安全的
  3. Google Protobuf 使用介绍
  4. 服务器ios文件,ios 文件到服务器
  5. oracle十进制函数语法,Oracle 十进制、二进制互相转换自定义函数
  6. CentOS 报no acceptable C compiler found in $PATH的解决办法
  7. MYSQL数据库字符编码设置
  8. 大容量nc文件解析_分布式文件系统浅谈
  9. 心仪数据拨号服务器无响应,宽带拨号服务器未响应
  10. java pdf添加图片_Java 给 PDF 设置背景图片
  11. openvswitch vxlan 源码分析
  12. 服务器vga接显示器无信号,显示器用HDMI转VGA接口后,无信号怎么解决
  13. android设备怎么支持8021x,android WiFi ASSOC_REJECT 流程跟踪
  14. 光伏箱变保护测控装置
  15. 基于springboot的茶叶销售商城网站
  16. 大学四年,因为这些网站,他顺利拿下字节跳动的offer!
  17. 农用地转为建设用地审批(农转用审批)
  18. VMware要求更新,系统更新后VMware打不开,要求更新
  19. HGETALL key
  20. Games104 Lecture 6 游戏地形大气和云的渲染

热门文章

  1. cloudstack 术语
  2. HGC告警北向接口系统
  3. 如何修复“您需要注意的” Windows 10安装错误
  4. 奔跑吧,协同时代的“普及哥”!
  5. 2021-09-08 设置电脑网络唤醒
  6. 有依赖的背包问题--java
  7. 家具抽屉滑轨行业调研报告 - 市场现状分析与发展前景预测
  8. java不统计冠词_java中输入一段英文文章,请统计出该文章中的冠词数有多少个....
  9. 独家:资和信刘娟:CIO像战士般在战场上体会快乐
  10. android开发书籍推荐!知乎上已获千赞,已拿offer附真题解析