Scrapy安装在win7-32
Scrapy安装在win7-32
- Scrapy安装在win7-32
- 总结
- 经验谈
- 几个例子供进一步学习
总结
Scrapy之所以不是很多人在用,我想可能与其复杂的安装配置有关,这一点我深有感触。其实我几个月前曾试图在win7-32上安装Scrapy,最终以失败告终,但是心有不甘,昨天从中午奋战到晚12点多,竟然突破瓶颈,直捣黄龙,成功地安装了scrapy。兴奋之余,记述如下。
基本流程我就不重复了,相关内容在网上已经泛滥成灾,这里推荐一个英文的安装教程,讲得很详细,不至于误人子弟,呵呵。给出链接
width="680" height="500" class="preview-iframe" scrolling="no" src="http://download.csdn.net/source/preview/8500187/17906d3876bfa203f6adfb5d32f38353">
经验谈
这里只介绍一下我在安装过程中遇到的问题和克服问题的经验。
- scrapy 安装之前需要安装Python和若干相关的Python模块,安装这些软件或模块时,如果能找到可执行的二进制安装文件(如.exe或.msi,一定要与操作系统和Python版本相符)就尽量用二进制安装文件,否则尽量用
pip
工具或easy_install
工具,迫不得已就只能下载源码,然后用python setup.py intall
命令进行安装了。 需要提到的是OpenSSL的安装,如果处理的不好,在后面安装scrapy时会提示错误。下面是两个典型的错误
错误提示
error: command ‘C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\cl.exe’ failed with exit status 2
搜遍了中英文的帖子,发现不但提问者寥寥,而且回帖中明确给出处理方法的也没有。没办法,我只能查看安装日志(自觉查看日志记录,这可能是我今天最大的收获了),发现了该错误的上下文内容如下
C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\cl.exe /c /nologo /Ox /MD /W3 /GS- /DNDEBUG -IC:\Python27\include -IC:\Python27\PC /Tcsrc\cryptography\hazmat\bindings\__pycache__\_Cryptography_cffi_f3e4673fx399b1113.c /Fobuild\temp.win32-2.7\Release\src\cryptography\hazmat\bindings\__pycache__\_Cryptography_cffi_f3e4673fx399b1113.obj_Cryptography_cffi_f3e4673fx399b1113.csrc\cryptography\hazmat\bindings\__pycache__\_Cryptography_cffi_f3e4673fx399b1113.c(216) : fatal error C1083: Cannot open include file: 'openssl/aes.h': No such file or directoryerror: command 'C:\\Program Files\\Microsoft Visual Studio 9.0\\VC\\BIN\\cl.exe' failed with exit status 2
从上面的三句话可以看出发生错误的根源:第一行执行了cl.exe命令,该命令的路径是
C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\cl.exe
,该行后面的长串字符是该命令的参数。第二行是一个C源文件的名字_Cryptography_cffi_f3e4673fx399b1113.c
,表示执行第一行的命令时用到了该文件。第三行,可以看到就出错了,并且提示说_Cryptography_cffi_f3e4673fx399b1113.c
文件需要include(包含)头文件openssl/aes.h
,但是却找不到该文件。
从上面的分析我们知道错误原因是找不到头文件openssl/aes.h
,我们在C盘搜索到该文件,如下图
据此我们建立系统环境变量include
,如下图所示
重启机器使环境变量有效。
错误提示
error: command ‘C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\link.exe’ failed with exit status 1181
仍然查找日志记录的上下文,如下
- C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\link.exe /DLL /nologo /INCREMENTAL:NO /LIBPATH:C:\Python27\libs /LIBPATH:C:\Python27\PCbuild libeay32mt.lib ssleay32mt.lib advapi32.lib crypt32.lib gdi32.lib user32.lib ws2_32.lib /EXPORT:init_Cryptography_cffi_f3e4673fx399b1113 build\temp.win32-2.7\Release\src\cryptography\hazmat\bindings__pycache___Cryptography_cffi_f3e4673fx399b1113.obj /OUT:build\lib.win32-2.7\cryptography_Cryptography_cffi_f3e4673fx399b1113.pyd /IMPLIB:build\temp.win32-2.7\Release\src\cryptography\hazmat\bindings__pycache___Cryptography_cffi_f3e4673fx399b1113.lib /MANIFESTFILE:build\temp.win32-2.7\Release\src\cryptography\hazmat\bindings__pycache___Cryptography_cffi_f3e4673fx399b1113.pyd.manifest /MANIFEST
- LINK : fatal error LNK1181: cannot open input file ‘libeay32mt.lib’
- error: command ‘C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\link.exe’ failed with exit status 1181
可以看到执行line.exe
命令时出错,从第二行可以看到引入库文件 libeay32mt.lib
出错。
查找库文件 libeay32mt.lib
,如下
可以看到找到了两个名为libeay32mt.lib
的库文件,一个是动态库,一个是静态库。干脆将这两个库都加入系统变量 lib
,如下图
仍然要重启机器才能使lib
有效。
- 安装scrapy成功后,在具体执行某个爬虫程序时,如果某个需要的包没有被安装,再安装即可。
如果要重装scrapy,先用
pip
工具卸载,命令pip uninstall Scrapy
我安装过程中安装的相关软件打包地址
http://download.csdn.net/detail/u012176591/8500485- 我在安装过程中新建或增加的环境变量
- path :C:\Python27;C:\Python27\Scripts;C:\Program Files\Sublime Text 3;C:\OpenSSL-Win32\bin;C:\Program Files\Microsoft SQL Server\100\Tools\Binn\;C:\Program Files\Microsoft SQL Server\100\DTS\Binn\;C:\Program Files\Microsoft Visual Studio 9.0\VC\bin;C:\Program Files\Microsoft Visual Studio 9.0\Common7\IDE;C:\Program Files\Microsoft Visual Studio 9.0\Common7;C:\Program Files\Microsoft Visual Studio 9.0\VC\vcpackages;
- VS110COMNTOOLS:C:\Program Files\Microsoft Visual Studio 11.0\Common7\Tools\
- VS90COMNTOOLS:C:\Program Files\Microsoft Visual Studio 9.0\Common7\Tools
- lib:C:\OpenSSL-Win32\lib;C:\OpenSSL-Win32\lib\VC;C:\OpenSSL-Win32\lib\VC\static;
- include:C:\OpenSSL-Win32\include;
几个例子供进一步学习
- 一个简单的多线程爬虫
http://www.cnblogs.com/fengfenggirl/p/cnblogs-crawler.html - Scrapy 0.24 文档
https://scrapy-chs.readthedocs.org/zh_CN/0.24/ - scrapy爬虫测试项目,爬取知乎信息
https://github.com/wangyeming/scrapy-zhihu/tree/develop - 用scrapy写的京东爬虫
https://github.com/taizilongxu/scrapy_jingdong - scrapy爬虫下载口袋百科上神奇宝贝的信息
https://github.com/Vespa314/pokemon-scrapy - 用Scrapy实现的一个博客爬虫
https://github.com/hackrole/blog-scrapy - 基于Scrapy的iTunes爬虫,用于爬取iTunes上的应用信息
https://github.com/Adoni/appSpiner - 新浪微博爬虫
https://github.com/DianaCody - Zhou’s Blog
基于UID的WEIBO信息抓取框架WEIBO_SCRAPY https://github.com/yoyzhou/weibo_scrapy http://yoyzhou.github.io/blog/2013/04/08/weibo-scrapy-framework-with-multi-threading/ - 微博名人关注网络的社会网络分析
http://yoyzhou.github.io/blog/2013/04/29/viz-following-networks-of-weibo-celebrities/ - 博客备份工具
http://blog.csdn.net/gzshun/article/category/932960
源码 http://download.csdn.net/detail/gzshun/4041869 - 网络爬虫系列
http://blog.csdn.net/column/details/spiders.html - 开源爬虫Scrapy的学习及应用
http://blog.csdn.net/heiyeshuwu/article/details/42170017
Scrapy安装在win7-32相关推荐
- 外网win10 64位环境下 为内网win7 32位安装三方包的最靠谱手段:python64位、32位全安装。...
经过一周的各种折磨,如题.以下是我的经验和教训. 我的外网是win10 64位,内网环境win7 32位.由于未知原因,anaconda无法安装!!! 其实最靠谱的安装三方包的还是whl包.但是很有可 ...
- win10、win7系统64位oracle11g安装教程以及32位plsql连接教程
win10.win7系统64位oracle11g安装教程以及32位plsql连接教程 转载cxin917 最后发布于2016-02-05 14:16:55 阅读数 24354 收藏 展开 win10 ...
- 服务器优盘启动安装win7系统教程,晨枫u盘启动工具安装原版Win7的两种方法(32位64位系统通用)...
安装原版Win7两类方法 第一类方法(32位64位系统通用): 具体步骤: [1]先使用晨枫U盘启动制作工具制作完启动U盘(参照制作教程). [1]找到Windows7系统的iso镜像,用UltraI ...
- cx oracle 提示32位,Python安装cx_Oracle模块遇到的问题(32bit),pythoncx_oracle,环境:win7 32...
Python安装cx_Oracle模块遇到的问题(32bit),pythoncx_oracle,环境:win7 32 环境: win7 32位系统 Python3.6 (32bit) 安装模块: cx ...
- ArcGIS Desktop 10.2 完全破解安装教程(含win7 32/64位+下载地址+亲测可用)
在之前的ArcGIS 10.1的破解安装教程中,得到了很多人的认可,也帮助了一些人成功的安装上了ArcGIS的软件.这次换了台电脑需要重装ArcGIS,这次我选择的是ArcGIS10.2,并且成功破解 ...
- android启动windows7,WIN7 32位系统里安装和配置 Android Studio - 20130604
用户评价: / 30 差好 最后更新于 2013年6月04日 点击数:34627 菜鸟日记1-20130604 : 如何在没有安装过JAVA的WIN7 32位系统里安装和配置 Android Stu ...
- 谈谈Win7 32位和64位的区别及安装须知。
转载自品略图书馆 http://www.pinlue.com/article/2020/04/0621/0510123321316.html Win7系统32位和64位的区别已经是一个老话题了,可是还 ...
- Win7 32位安装.net framework 4失败的解决过程
Win7 32位安装.net framework 4失败的解决方法(比较全). 以前安装过.net framework 4,3.5,2,1,后来全部在控制面板中卸载,近来想重新装回去,发现无法安装.折 ...
- 【转】win7 32位安装oracle10g步骤
转自:http://blog.sina.com.cn/s/blog_72f5b9810101ccn9.html [今天在win7安装oracle时出现"先决条件检查失败:OUI-11002: ...
- win732位oracle,win7 32位安装oracle10g步骤
1.Oracle数据库的安装(指办事器的安装,不是客户真个安装) 对于Win7系统来说,首先要下载支持Vista版本的Oracle 10g,而今如同短好下载了(下载地址:),下载完成后解压到不含中文的 ...
最新文章
- Tomcat目录介绍以及运行时寻找class的顺序
- 【NOI2016】优秀的拆分(后缀数组)
- java开启线程的方法_Java有几种方法开启线程?怎么实现带有返回值的线程?
- .net 测试工具类
- java线程并发库之--线程同步工具Exchanger的使用
- 【Java】HashMap源码(1.7)
- 并查集(Disjiont Set)
- 一年收入多少才能支撑自驾环游中国?
- java中线程的生命周期_Java中的线程生命周期– Java中的线程状态
- VMware共享文件夹Input/output error解决办法
- 软件开发工程师应该具备哪些证书_初级软件工程师证书简介
- AtCoder Beginner Contest 158 D.String Formation
- 练习孙氏太极拳的感悟
- 如何将PC上的Word文档分享到朋友圈
- Lenovo system x3650 M5 Win2016U盘安装过程
- 搭建一个多对多的音视频通信服务
- SpringBoot实现扫码登录
- matlab polyfit c语言,算法——纯C语言最小二乘法曲线拟合
- *Java软件开发面试知识整理*
- emqtt 启动报错 Erlang closed the connection 查看状态报错 Node 'emq@192.168.*.*' not responding to pings.