Scrapy安装在win7-32

  • Scrapy安装在win7-32

    • 总结
    • 经验谈
    • 几个例子供进一步学习

总结

Scrapy之所以不是很多人在用,我想可能与其复杂的安装配置有关,这一点我深有感触。其实我几个月前曾试图在win7-32上安装Scrapy,最终以失败告终,但是心有不甘,昨天从中午奋战到晚12点多,竟然突破瓶颈,直捣黄龙,成功地安装了scrapy。兴奋之余,记述如下。

基本流程我就不重复了,相关内容在网上已经泛滥成灾,这里推荐一个英文的安装教程,讲得很详细,不至于误人子弟,呵呵。给出链接

width="680" height="500" class="preview-iframe" scrolling="no" src="http://download.csdn.net/source/preview/8500187/17906d3876bfa203f6adfb5d32f38353">

经验谈

这里只介绍一下我在安装过程中遇到的问题和克服问题的经验。

  • scrapy 安装之前需要安装Python和若干相关的Python模块,安装这些软件或模块时,如果能找到可执行的二进制安装文件(如.exe或.msi,一定要与操作系统和Python版本相符)就尽量用二进制安装文件,否则尽量用pip 工具或easy_install 工具,迫不得已就只能下载源码,然后用 python setup.py intall 命令进行安装了。
  • 需要提到的是OpenSSL的安装,如果处理的不好,在后面安装scrapy时会提示错误。下面是两个典型的错误

    • 错误提示

      error: command ‘C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\cl.exe’ failed with exit status 2

      搜遍了中英文的帖子,发现不但提问者寥寥,而且回帖中明确给出处理方法的也没有。没办法,我只能查看安装日志(自觉查看日志记录,这可能是我今天最大的收获了),发现了该错误的上下文内容如下

 C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\cl.exe /c /nologo /Ox /MD /W3 /GS- /DNDEBUG -IC:\Python27\include -IC:\Python27\PC /Tcsrc\cryptography\hazmat\bindings\__pycache__\_Cryptography_cffi_f3e4673fx399b1113.c /Fobuild\temp.win32-2.7\Release\src\cryptography\hazmat\bindings\__pycache__\_Cryptography_cffi_f3e4673fx399b1113.obj_Cryptography_cffi_f3e4673fx399b1113.csrc\cryptography\hazmat\bindings\__pycache__\_Cryptography_cffi_f3e4673fx399b1113.c(216) : fatal error C1083: Cannot open include file: 'openssl/aes.h': No such file or directoryerror: command 'C:\\Program Files\\Microsoft Visual Studio 9.0\\VC\\BIN\\cl.exe' failed with exit status 2

从上面的三句话可以看出发生错误的根源:第一行执行了cl.exe命令,该命令的路径是

C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\cl.exe

,该行后面的长串字符是该命令的参数。第二行是一个C源文件的名字_Cryptography_cffi_f3e4673fx399b1113.c,表示执行第一行的命令时用到了该文件。第三行,可以看到就出错了,并且提示说_Cryptography_cffi_f3e4673fx399b1113.c 文件需要include(包含)头文件openssl/aes.h,但是却找不到该文件。

从上面的分析我们知道错误原因是找不到头文件openssl/aes.h,我们在C盘搜索到该文件,如下图

据此我们建立系统环境变量include ,如下图所示

重启机器使环境变量有效。

  • 错误提示

    error: command ‘C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\link.exe’ failed with exit status 1181

仍然查找日志记录的上下文,如下

  1. C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\link.exe /DLL /nologo /INCREMENTAL:NO /LIBPATH:C:\Python27\libs /LIBPATH:C:\Python27\PCbuild libeay32mt.lib ssleay32mt.lib advapi32.lib crypt32.lib gdi32.lib user32.lib ws2_32.lib /EXPORT:init_Cryptography_cffi_f3e4673fx399b1113 build\temp.win32-2.7\Release\src\cryptography\hazmat\bindings__pycache___Cryptography_cffi_f3e4673fx399b1113.obj /OUT:build\lib.win32-2.7\cryptography_Cryptography_cffi_f3e4673fx399b1113.pyd /IMPLIB:build\temp.win32-2.7\Release\src\cryptography\hazmat\bindings__pycache___Cryptography_cffi_f3e4673fx399b1113.lib /MANIFESTFILE:build\temp.win32-2.7\Release\src\cryptography\hazmat\bindings__pycache___Cryptography_cffi_f3e4673fx399b1113.pyd.manifest /MANIFEST
  2. LINK : fatal error LNK1181: cannot open input file ‘libeay32mt.lib’
  3. error: command ‘C:\Program Files\Microsoft Visual Studio 9.0\VC\BIN\link.exe’ failed with exit status 1181

可以看到执行line.exe 命令时出错,从第二行可以看到引入库文件 libeay32mt.lib 出错。

查找库文件 libeay32mt.lib ,如下

可以看到找到了两个名为libeay32mt.lib 的库文件,一个是动态库,一个是静态库。干脆将这两个库都加入系统变量 lib ,如下图

仍然要重启机器才能使lib 有效。

  • 安装scrapy成功后,在具体执行某个爬虫程序时,如果某个需要的包没有被安装,再安装即可。
  • 如果要重装scrapy,先用pip 工具卸载,命令

    pip uninstall Scrapy

  • 我安装过程中安装的相关软件打包地址
    http://download.csdn.net/detail/u012176591/8500485

  • 我在安装过程中新建或增加的环境变量
    • path :C:\Python27;C:\Python27\Scripts;C:\Program Files\Sublime Text 3;C:\OpenSSL-Win32\bin;C:\Program Files\Microsoft SQL Server\100\Tools\Binn\;C:\Program Files\Microsoft SQL Server\100\DTS\Binn\;C:\Program Files\Microsoft Visual Studio 9.0\VC\bin;C:\Program Files\Microsoft Visual Studio 9.0\Common7\IDE;C:\Program Files\Microsoft Visual Studio 9.0\Common7;C:\Program Files\Microsoft Visual Studio 9.0\VC\vcpackages;
    • VS110COMNTOOLS:C:\Program Files\Microsoft Visual Studio 11.0\Common7\Tools\
    • VS90COMNTOOLS:C:\Program Files\Microsoft Visual Studio 9.0\Common7\Tools
    • lib:C:\OpenSSL-Win32\lib;C:\OpenSSL-Win32\lib\VC;C:\OpenSSL-Win32\lib\VC\static;
    • include:C:\OpenSSL-Win32\include;

几个例子供进一步学习

  • 一个简单的多线程爬虫
    http://www.cnblogs.com/fengfenggirl/p/cnblogs-crawler.html
  • Scrapy 0.24 文档
    https://scrapy-chs.readthedocs.org/zh_CN/0.24/
  • scrapy爬虫测试项目,爬取知乎信息
    https://github.com/wangyeming/scrapy-zhihu/tree/develop
  • 用scrapy写的京东爬虫
    https://github.com/taizilongxu/scrapy_jingdong
  • scrapy爬虫下载口袋百科上神奇宝贝的信息
    https://github.com/Vespa314/pokemon-scrapy
  • 用Scrapy实现的一个博客爬虫
    https://github.com/hackrole/blog-scrapy
  • 基于Scrapy的iTunes爬虫,用于爬取iTunes上的应用信息
    https://github.com/Adoni/appSpiner
  • 新浪微博爬虫
    https://github.com/DianaCody
  • Zhou’s Blog
    基于UID的WEIBO信息抓取框架WEIBO_SCRAPY https://github.com/yoyzhou/weibo_scrapy http://yoyzhou.github.io/blog/2013/04/08/weibo-scrapy-framework-with-multi-threading/
  • 微博名人关注网络的社会网络分析
    http://yoyzhou.github.io/blog/2013/04/29/viz-following-networks-of-weibo-celebrities/
  • 博客备份工具
    http://blog.csdn.net/gzshun/article/category/932960
    源码 http://download.csdn.net/detail/gzshun/4041869
  • 网络爬虫系列
    http://blog.csdn.net/column/details/spiders.html
  • 开源爬虫Scrapy的学习及应用
    http://blog.csdn.net/heiyeshuwu/article/details/42170017

Scrapy安装在win7-32相关推荐

  1. 外网win10 64位环境下 为内网win7 32位安装三方包的最靠谱手段:python64位、32位全安装。...

    经过一周的各种折磨,如题.以下是我的经验和教训. 我的外网是win10 64位,内网环境win7 32位.由于未知原因,anaconda无法安装!!! 其实最靠谱的安装三方包的还是whl包.但是很有可 ...

  2. win10、win7系统64位oracle11g安装教程以及32位plsql连接教程

    win10.win7系统64位oracle11g安装教程以及32位plsql连接教程 转载cxin917 最后发布于2016-02-05 14:16:55 阅读数 24354  收藏 展开 win10 ...

  3. 服务器优盘启动安装win7系统教程,晨枫u盘启动工具安装原版Win7的两种方法(32位64位系统通用)...

    安装原版Win7两类方法 第一类方法(32位64位系统通用): 具体步骤: [1]先使用晨枫U盘启动制作工具制作完启动U盘(参照制作教程). [1]找到Windows7系统的iso镜像,用UltraI ...

  4. cx oracle 提示32位,Python安装cx_Oracle模块遇到的问题(32bit),pythoncx_oracle,环境:win7 32...

    Python安装cx_Oracle模块遇到的问题(32bit),pythoncx_oracle,环境:win7 32 环境: win7 32位系统 Python3.6 (32bit) 安装模块: cx ...

  5. ArcGIS Desktop 10.2 完全破解安装教程(含win7 32/64位+下载地址+亲测可用)

    在之前的ArcGIS 10.1的破解安装教程中,得到了很多人的认可,也帮助了一些人成功的安装上了ArcGIS的软件.这次换了台电脑需要重装ArcGIS,这次我选择的是ArcGIS10.2,并且成功破解 ...

  6. android启动windows7,WIN7 32位系统里安装和配置 Android Studio - 20130604

    用户评价:  / 30 差好 最后更新于 2013年6月04日 点击数:34627 菜鸟日记1-20130604 : 如何在没有安装过JAVA的WIN7 32位系统里安装和配置 Android Stu ...

  7. 谈谈Win7 32位和64位的区别及安装须知。

    转载自品略图书馆 http://www.pinlue.com/article/2020/04/0621/0510123321316.html Win7系统32位和64位的区别已经是一个老话题了,可是还 ...

  8. Win7 32位安装.net framework 4失败的解决过程

    Win7 32位安装.net framework 4失败的解决方法(比较全). 以前安装过.net framework 4,3.5,2,1,后来全部在控制面板中卸载,近来想重新装回去,发现无法安装.折 ...

  9. 【转】win7 32位安装oracle10g步骤

    转自:http://blog.sina.com.cn/s/blog_72f5b9810101ccn9.html [今天在win7安装oracle时出现"先决条件检查失败:OUI-11002: ...

  10. win732位oracle,win7 32位安装oracle10g步骤

    1.Oracle数据库的安装(指办事器的安装,不是客户真个安装) 对于Win7系统来说,首先要下载支持Vista版本的Oracle 10g,而今如同短好下载了(下载地址:),下载完成后解压到不含中文的 ...

最新文章

  1. Tomcat目录介绍以及运行时寻找class的顺序
  2. 【NOI2016】优秀的拆分(后缀数组)
  3. java开启线程的方法_Java有几种方法开启线程?怎么实现带有返回值的线程?
  4. .net 测试工具类
  5. java线程并发库之--线程同步工具Exchanger的使用
  6. 【Java】HashMap源码(1.7)
  7. 并查集(Disjiont Set)
  8. 一年收入多少才能支撑自驾环游中国?
  9. java中线程的生命周期_Java中的线程生命周期– Java中的线程状态
  10. VMware共享文件夹Input/output error解决办法
  11. 软件开发工程师应该具备哪些证书_初级软件工程师证书简介
  12. AtCoder Beginner Contest 158 D.String Formation
  13. 练习孙氏太极拳的感悟
  14. 如何将PC上的Word文档分享到朋友圈
  15. Lenovo system x3650 M5 Win2016U盘安装过程
  16. 搭建一个多对多的音视频通信服务
  17. SpringBoot实现扫码登录
  18. matlab polyfit c语言,算法——纯C语言最小二乘法曲线拟合
  19. *Java软件开发面试知识整理*
  20. emqtt 启动报错 Erlang closed the connection 查看状态报错 Node 'emq@192.168.*.*' not responding to pings.

热门文章

  1. 反模式之Continuous Obsolescence
  2. Kaggle网站数据集抓取
  3. 一键脚本解决Windows系统更新错误(0x80070003)
  4. 任务系统 java_当前主流网络游戏任务系统形式研究(转)
  5. 专硕与学硕的11个区别,不纠结!
  6. 2023企业数字化转型组织人才发展
  7. 古典文学--本经阴符七术
  8. 【MySQL】MySQL 建库授权语句
  9. ViewModel变量初始化方式
  10. 连Python产生器(Generator)的原理都解释不了,还敢说Python用了5年?