租房助手

发现官网的筛选方式不能满足自己的需求,所以爬取相关网站制作出现在的东西来

效果预览-> 在线预览

下面进行详细分析

一.首先爬取起始地和终点地的路线及沿途地铁站名称

1.爬取8684.cn的地铁查询:

pattern = 'http://bjdt.8684.cn/so.php?k=p2p&q={}&q1={}'

  • q->起始位置,q1为目标位置。返回的是html页面。

    2.采用scrapy进行xpath解析,提取相关的html标签和值

  • 如提取线路方案列表的xpath表达式
            Selector(text=body).xpath("//div[@class='iContainer clear']/div[@class='iMain']/div[@class='transferMainShowWrap']/ul[@class='tms-mn tms-project']/li").extract()

3.提取出线路方案列表后,针对列表中的每个元素进行提取站点的操作,可参考提取a标签,但剔除带有class属性的html值。

4.将所有的站点放到一个列表中,同时针对列表元素进行去重操作,记得记录路线描述和距离,可定义相关对象来维护。

二.通过站点查询租房信息

1.主要对自如官网进行爬取。

pattern=http://www.ziroom.com/z/nl/z2.html?qwd={}
  • qwd可能需要进行urlencode
  • 返回的是html页面,需要对页面进行分析,首先提取出总页数,然后根据总页数去请求其余页面。上面的url附加q参数,q参数为页面索引,即是单独页面链接

    2.针对单个页面提取各个单条项目的信息。
    如提取单个页面的信息列表

     ls = Selector(text=body).xpath("//ul[@id='houseList']/li").extract();
  • 针对列表进行单个处理,提取感兴趣的信息。

    3.处理封装返回。
    针对提取的信息,进行筛选,例如对价格进行筛选,对大小进行筛选,不用做排序。采用前端框架来进行排序。后台做的处理已经够多了。

三.接入到公众号中

可以接入到公众号中,提高公众号的影响力,具体的公众平台对接请参考访问github开源项目

python爬取北京租房信息相关推荐

  1. Python爬取自如租房信息(价格)笔记——笨办法

    爬取自如租房信息 最近正在学习python爬虫,顺便又要租房子,于是就想爬去自如上的租房信息顺便来联系一下. ·掉进价格的大坑里 在爬取过程中一切都听顺利的,可是到了最关键的房租部分就遇到了问题.居然 ...

  2. python爬取豆瓣租房信息

    文章目录 任务描述 完整代码 运行结果 任务描述 使用python爬虫,实现获取豆瓣"北京租房"的租房信息,并筛选适合个人的房源存入Excel.使用方法都写在注释里了,请认真阅读哦 ...

  3. python爬取网上租房信息_Python爬虫入门 | 5 爬取小猪短租租房信息

    小猪短租是一个租房网站,上面有很多优质的民宿出租信息,下面我们以成都地区的租房信息为例,来尝试爬取这些数据. 1.爬取租房标题 按照惯例,先来爬下标题试试水,找到标题,复制xpath. 多复制几个房屋 ...

  4. python爬取网上租房信息_用python爬取租房网站信息的代码

    自己在刚学习python时写的,中途遇到很多问题,查了很多资料,下面就是我爬取租房信息的代码: 链家的房租网站 两个导入的包 1.requests 用来过去网页内容 2.BeautifulSoup i ...

  5. 使用python爬取蛋壳租房信息

    蛋壳页面上的租房信息不直观,举个例子,如果我是一个程序员,在望京上班的话,附近的地铁线路有13,14,15号线,如果我要尽可能的减少通勤时间,希望能够找到一个价格便宜距离地铁站又比较近的居所,在蛋壳的 ...

  6. 九十二、Python爬取深圳租房信息小案例

    @Author:Runsen @Date:2020/6/19 人生最重要的不是所站的位置,而是内心所朝的方向.只要我在每篇博文中写得自己体会,修炼身心:在每天的不断重复学习中,耐住寂寞,练就真功,不畏 ...

  7. 利用Python爬取杭州租房信息,发现月薪没有8K还是不要租房了吧

    前言 小编的一个好朋友跑去杭州工作了,跟我吐槽杭州的租房太贵了,房租正在成为摧垮年轻人的"第一根稻草",在杭州打拼的你,所在的城区房租涨了吗?你是否还能潇洒地说出 "买不 ...

  8. 深圳python爬虫培训南山科技园钽电容回收_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题...

    为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...

  9. python解决租房问题_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题

    为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...

最新文章

  1. php在用js_encode()转换时,实现斜杠不转义
  2. classpath详解
  3. 托管数据中心之间的PUE比较(下)
  4. 深度增强学习前沿算法思想
  5. 【阅读推荐】LiveVideoStack 精彩内容集锦
  6. 关于 SAP UI5 Table 控件中行合并的实现方式
  7. 小程序提供几种结算周期? T+1是什么意思?
  8. Docker最全教程——数据库容器化(十一)
  9. c++中的STL的常用算法---3(排序算法,拷贝和替换算法,算术生成算法,集合算法)
  10. 2345王牌浏览器九宫格个性化设置
  11. 雷军谈小米10的3999元起售价:定价比华为苹果厚道
  12. IV.Indexes(索引)
  13. 王道考研计算机网络笔记目录
  14. win7修复音频服务器,win7系统下realtek高清晰音频管理器没有声音怎么修复
  15. Tableau插入自定义图片
  16. 用CMD命令查看局域网电脑IP地址,电脑名称及MAC地址
  17. OSChina 周四乱弹 ——士可杀不可辱,这句话用英语怎么说?
  18. 成为顶尖的AI算法工程师,你该具备些什么?
  19. 将tif文件转换成mrc文件
  20. 第979期机器学习日报(2017-05-24)

热门文章

  1. PVT(Process Voltage Temperature)
  2. 免费好用的在线字体转换工具~~
  3. winpe修复计算机无法启动,用winpe来修复无法进入系统的问题
  4. RISC-V双周报1.12-1.26
  5. flow hive 新型蜂箱_流动的蜂蜜盛宴:Flow Hive蜂箱获数百万美元众筹款
  6. 认识单元测试中的打桩
  7. ib中文文学课如何学习重点?
  8. 地图APP的产品分析-驴迹导游
  9. wr885n 虚拟服务器,TP-Link TL-WR885N V1-V3路由器桥接设置教程 | 192路由网
  10. 【圣诞来了】3分钟教你用java画一颗彩色圣诞树,送给别人作为圣诞礼物吧