python process参数_将参数传递给Scrapy python中的process.crawl
我想得到与此命令行相同的结果:
scrapy crawl linkedin_anonymous -a first = James -a last = Bond -o output.json
我的脚本如下:
import scrapy
from linkedin_anonymous_spider import LinkedInAnonymousSpider
from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings
spider = LinkedInAnonymousSpider(None, "James", "Bond")
process = CrawlerProcess(get_project_settings())
process.crawl(spider) ##
process.start()
我发现(1)中的process.crawl()创建了另一个LinkedInAnonymousSpider,其中第一个和最后一个是None(打印在(2)中),如果是这样,那么就没有创建对象蜘蛛的意义了,怎么可能首先传递参数,最后传递给process.crawl()?
linkedin_anonymous:
from logging import INFO
import scrapy
class LinkedInAnonymousSpider(scrapy.Spider):
name = "linkedin_anonymous"
allowed_domains = ["linkedin.com"]
start_urls = []
base_url = "https://www.linkedin.com/pub/dir/?first=%s&last=%s&search=Search"
def __init__(self, input = None, first= None, last=None):
self.input = input # source file name
self.first = first
self.last = last
def start_requests(self):
print self.first ##
if self.first and self.last: # taking input from command line parameters
url = self.base_url % (self.first, self.last)
yield self.make_requests_from_url(url)
def parse(self, response): . . .
python process参数_将参数传递给Scrapy python中的process.crawl相关推荐
- Python灰帽子_黑客与逆向工程师的Python编程之道
收藏自用 链接:Python灰帽子_黑客与逆向工程师的Python编程之道
- python process返回值_如何恢复传递给multiprocessing.Process的函数的返回值?
如何恢复传递给multiprocessing.Process的函数的返回值? 在下面的示例代码中,我想恢复函数的返回值worker.我该怎么做呢?这个值存储在哪里? 示例代码: import mult ...
- python ray定时_使用 Ray 用 15 行 Python 代码实现一个参数服务器
使用 Ray 用 15 行 Python 代码实现一个参数服务器 参数服务器是很多机器学习应用的核心部分.其核心作用是存放机器学习模型的参数(如,神经网络的权重)和提供服务将参数传给客户端(客户端通常 ...
- js有默认参数的函数加参数_函数参数:默认,关键字和任意
js有默认参数的函数加参数 PYTHON开发人员的提示 (TIPS FOR PYTHON DEVELOPERS) Think that you are writing a function that ...
- mysql 传递数组_将数组传递给MySQL存储例程
我需要将字符串数组作为参数传递给MySQL存储例程.该数组可能很长,其元素数量不是固定的.然后,我想将字符串值放入具有一列的内存表中,以便可以处理数据.我不知道这是否可以在MySQL中完成.也许需要肮 ...
- powerbuilder TriggerEvent 参数_静态参数-输入失调电压
对于运放的认知,初学者可能只记得虚短虚断.输入阻抗/开环增益无穷大,但是若要设计一个性能优良的放大器,熟悉运放其他一些参数指标必不可少.这些参数可分成两大类:静态参数和动态参数.静态参数主要描述运放的 ...
- python方法重载_关于类:如何在Python中使用方法重载?
我尝试在python中实现方法重载: class A: def stackoverflow(self): print 'first method' def stackoverflow(self, i) ...
- python老师武_跟着廖雪峰老师学python (5)
若想技术精进,当然得把基础知识打得牢牢的. 廖雪峰的官方网站 python3教程,该网站提供的教程浅显易懂,还附带了讲学视频,非常适合初学者正规入门. 以下是通过廖雪峰python官方网站学习的个人 ...
- python 面试问题_值得阅读的30个Python面试问题
python 面试问题 Interview questions are quite tricky to predict. In most cases, even peoples with great ...
最新文章
- 云栖2050 —— 面向年青人的科技公益大会
- java证明ArrayList是线程不安全的
- Google Protobuf 使用介绍
- 服务器ios文件,ios 文件到服务器
- oracle十进制函数语法,Oracle 十进制、二进制互相转换自定义函数
- CentOS 报no acceptable C compiler found in $PATH的解决办法
- MYSQL数据库字符编码设置
- 大容量nc文件解析_分布式文件系统浅谈
- 心仪数据拨号服务器无响应,宽带拨号服务器未响应
- java pdf添加图片_Java 给 PDF 设置背景图片
- openvswitch vxlan 源码分析
- 服务器vga接显示器无信号,显示器用HDMI转VGA接口后,无信号怎么解决
- android设备怎么支持8021x,android WiFi ASSOC_REJECT 流程跟踪
- 光伏箱变保护测控装置
- 基于springboot的茶叶销售商城网站
- 大学四年,因为这些网站,他顺利拿下字节跳动的offer!
- 农用地转为建设用地审批(农转用审批)
- VMware要求更新,系统更新后VMware打不开,要求更新
- HGETALL key
- Games104 Lecture 6 游戏地形大气和云的渲染
热门文章
- cloudstack 术语
- HGC告警北向接口系统
- 如何修复“您需要注意的” Windows 10安装错误
- 奔跑吧,协同时代的“普及哥”!
- 2021-09-08 设置电脑网络唤醒
- 有依赖的背包问题--java
- 家具抽屉滑轨行业调研报告 - 市场现状分析与发展前景预测
- java不统计冠词_java中输入一段英文文章,请统计出该文章中的冠词数有多少个....
- 独家:资和信刘娟:CIO像战士般在战场上体会快乐
- android开发书籍推荐!知乎上已获千赞,已拿offer附真题解析