python爬取北京租房信息
租房助手
发现官网的筛选方式不能满足自己的需求,所以爬取相关网站制作出现在的东西来
效果预览-> 在线预览
下面进行详细分析
一.首先爬取起始地和终点地的路线及沿途地铁站名称
1.爬取8684.cn的地铁查询:
pattern = 'http://bjdt.8684.cn/so.php?k=p2p&q={}&q1={}'
q->起始位置,q1为目标位置。返回的是html页面。
2.采用scrapy进行xpath解析,提取相关的html标签和值
- 如提取线路方案列表的xpath表达式
Selector(text=body).xpath("//div[@class='iContainer clear']/div[@class='iMain']/div[@class='transferMainShowWrap']/ul[@class='tms-mn tms-project']/li").extract()
3.提取出线路方案列表后,针对列表中的每个元素进行提取站点的操作,可参考提取a标签,但剔除带有class属性的html值。
4.将所有的站点放到一个列表中,同时针对列表元素进行去重操作,记得记录路线描述和距离,可定义相关对象来维护。
二.通过站点查询租房信息
1.主要对自如官网进行爬取。
pattern=http://www.ziroom.com/z/nl/z2.html?qwd={}
- qwd可能需要进行urlencode
返回的是html页面,需要对页面进行分析,首先提取出总页数,然后根据总页数去请求其余页面。上面的url附加q参数,q参数为页面索引,即是单独页面链接
2.针对单个页面提取各个单条项目的信息。
如提取单个页面的信息列表ls = Selector(text=body).xpath("//ul[@id='houseList']/li").extract();
针对列表进行单个处理,提取感兴趣的信息。
3.处理封装返回。
针对提取的信息,进行筛选,例如对价格进行筛选,对大小进行筛选,不用做排序。采用前端框架来进行排序。后台做的处理已经够多了。
三.接入到公众号中
可以接入到公众号中,提高公众号的影响力,具体的公众平台对接请参考访问github开源项目
python爬取北京租房信息相关推荐
- Python爬取自如租房信息(价格)笔记——笨办法
爬取自如租房信息 最近正在学习python爬虫,顺便又要租房子,于是就想爬去自如上的租房信息顺便来联系一下. ·掉进价格的大坑里 在爬取过程中一切都听顺利的,可是到了最关键的房租部分就遇到了问题.居然 ...
- python爬取豆瓣租房信息
文章目录 任务描述 完整代码 运行结果 任务描述 使用python爬虫,实现获取豆瓣"北京租房"的租房信息,并筛选适合个人的房源存入Excel.使用方法都写在注释里了,请认真阅读哦 ...
- python爬取网上租房信息_Python爬虫入门 | 5 爬取小猪短租租房信息
小猪短租是一个租房网站,上面有很多优质的民宿出租信息,下面我们以成都地区的租房信息为例,来尝试爬取这些数据. 1.爬取租房标题 按照惯例,先来爬下标题试试水,找到标题,复制xpath. 多复制几个房屋 ...
- python爬取网上租房信息_用python爬取租房网站信息的代码
自己在刚学习python时写的,中途遇到很多问题,查了很多资料,下面就是我爬取租房信息的代码: 链家的房租网站 两个导入的包 1.requests 用来过去网页内容 2.BeautifulSoup i ...
- 使用python爬取蛋壳租房信息
蛋壳页面上的租房信息不直观,举个例子,如果我是一个程序员,在望京上班的话,附近的地铁线路有13,14,15号线,如果我要尽可能的减少通勤时间,希望能够找到一个价格便宜距离地铁站又比较近的居所,在蛋壳的 ...
- 九十二、Python爬取深圳租房信息小案例
@Author:Runsen @Date:2020/6/19 人生最重要的不是所站的位置,而是内心所朝的方向.只要我在每篇博文中写得自己体会,修炼身心:在每天的不断重复学习中,耐住寂寞,练就真功,不畏 ...
- 利用Python爬取杭州租房信息,发现月薪没有8K还是不要租房了吧
前言 小编的一个好朋友跑去杭州工作了,跟我吐槽杭州的租房太贵了,房租正在成为摧垮年轻人的"第一根稻草",在杭州打拼的你,所在的城区房租涨了吗?你是否还能潇洒地说出 "买不 ...
- 深圳python爬虫培训南山科技园钽电容回收_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题...
为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...
- python解决租房问题_记一次python 爬虫爬取深圳租房信息的过程及遇到的问题
为了分析深圳市所有长租.短租公寓的信息,爬取了某租房公寓网站上深圳区域所有在租公寓信息,以下记录了爬取过程以及爬取过程中遇到的问题: 爬取代码: import requests from reques ...
最新文章
- php在用js_encode()转换时,实现斜杠不转义
- classpath详解
- 托管数据中心之间的PUE比较(下)
- 深度增强学习前沿算法思想
- 【阅读推荐】LiveVideoStack 精彩内容集锦
- 关于 SAP UI5 Table 控件中行合并的实现方式
- 小程序提供几种结算周期? T+1是什么意思?
- Docker最全教程——数据库容器化(十一)
- c++中的STL的常用算法---3(排序算法,拷贝和替换算法,算术生成算法,集合算法)
- 2345王牌浏览器九宫格个性化设置
- 雷军谈小米10的3999元起售价:定价比华为苹果厚道
- IV.Indexes(索引)
- 王道考研计算机网络笔记目录
- win7修复音频服务器,win7系统下realtek高清晰音频管理器没有声音怎么修复
- Tableau插入自定义图片
- 用CMD命令查看局域网电脑IP地址,电脑名称及MAC地址
- OSChina 周四乱弹 ——士可杀不可辱,这句话用英语怎么说?
- 成为顶尖的AI算法工程师,你该具备些什么?
- 将tif文件转换成mrc文件
- 第979期机器学习日报(2017-05-24)
热门文章
- PVT(Process Voltage Temperature)
- 免费好用的在线字体转换工具~~
- winpe修复计算机无法启动,用winpe来修复无法进入系统的问题
- RISC-V双周报1.12-1.26
- flow hive 新型蜂箱_流动的蜂蜜盛宴:Flow Hive蜂箱获数百万美元众筹款
- 认识单元测试中的打桩
- ib中文文学课如何学习重点?
- 地图APP的产品分析-驴迹导游
- wr885n 虚拟服务器,TP-Link TL-WR885N V1-V3路由器桥接设置教程 | 192路由网
- 【圣诞来了】3分钟教你用java画一颗彩色圣诞树,送给别人作为圣诞礼物吧