记录一次学习研究自如友家租房模块遇到的反爬问题。

(这里仅提供思路,做技术分享,不提供完整代码)

自如房源页面截图:

查看html源代码:

<div class="Z_price">
<span>

</span>

<i class="num" style="background-position:-93.72px;background-image: url(//static8.ziroom.com/phoenix/pc/images/2019/price/7995074a73302d345088229b960929e9.png);" >
</i>

<i class="num" style="background-position:-124.96px;background-image: url(//static8.ziroom.com/phoenix/pc/images/2019/price/7995074a73302d345088229b960929e9.png);" >
</i>

<i class="num" style="background-position:-281.16px;background-image: url(//static8.ziroom.com/phoenix/pc/images/2019/price/7995074a73302d345088229b960929e9.png);" >
</i>

<i class="num" style="background-position:-0px;background-image: url(//static8.ziroom.com/phoenix/pc/images/2019/price/7995074a73302d345088229b960929e9.png);" >
</i>

<span>
/月(季付价)
</span>

</div>

发现都是图片,但图片来源都是同一张,如下图:

发现代码里,出现“background-position”,猜测应该就是通过偏移量截取数字图片进行显示。

1、用ocr将图片识别为数字存储为数组。

2、计算偏移量获取下标(计算时得考虑比例)

3、在数组里通过下标得到对应价格数字。

注意:自如的图片每次也会变化,所以每次都要下载图片进行ocr识别。

自如租房价格加密分析相关推荐

  1. python最终价格_python分析北京租房现状,最后的价格分布地图亮了

    租房信息已经有了,为了能对北京目前的租房市场有个直观认识,我对数据进行深度分析,并进行可视化展示 从分析结果中,我得到了哪些位置房源多.各区租房平均价格以及心仪价格地理位置分布等重要信息,为帮助我租房 ...

  2. R语言分位数回归Quantile Regression分析租房价格

    全文链接:http://tecdat.cn/?p=18422 本文想在R软件中更好地了解分位数回归优化.在查看分位数回归之前,让我们从样本中计算中位数或分位数(点击文末"阅读原文" ...

  3. Python爬取自如租房信息(价格)笔记——笨办法

    爬取自如租房信息 最近正在学习python爬虫,顺便又要租房子,于是就想爬去自如上的租房信息顺便来联系一下. ·掉进价格的大坑里 在爬取过程中一切都听顺利的,可是到了最关键的房租部分就遇到了问题.居然 ...

  4. python—简单数据抓取四(利用超级鹰的ocr识别图片验证码模拟登录超级鹰网站、利用百度云的ocr识别自如租房网价格图片获取到自如网的价格)

    学习目标: python学习二十四 -简单数据抓取四 学习内容: 1.利用超级鹰的ocr识别图片验证码模拟登录超级鹰网站 2.利用百度云的ocr识别自如租房网的价格图片,获取到自如网的价格数据 1.利 ...

  5. tesseract破解css反爬抓取自如租房信息

    引言 作为一个刚毕业两年的打工人,在深圳这种房价压死人的城市,买房是不可能买房了,只能寄希望于租到一个便宜又舒适的房子.今天给大家带来的案例是tesseract破解css反爬抓取自如租房信息,将好房源 ...

  6. 爬取了 31502 条北京自如租房数据,看看是否居者有其屋?

    作者 | 小狮子是LEO 责编 | 郭芮 自如友家作为北京租房的主要途径之一,租房数据都展示在官方网站之上,价格等房屋信息与网站数据一致,数据可信度较高.格式规整.因而选取自如友家官方网站作为租房数据 ...

  7. 深圳租房数据可视化分析【Plotly库绘图】

    深圳租房数据可视化分析[plotly库绘图] 一.技术介绍 1.可视化技术支持来源: 2.选择plotly理由: 二.代码实现及分析: 1.导入库及解读数据集: 2.数据清洗与转换 3.统计数据 4. ...

  8. python 爬取自如租房的租房数据,使用图像识别获取价格信息

    python 爬取自如租房的租房数据 完整代码下载:https://github.com/tanjunchen/SpiderProject/tree/master/ziru #!/usr/bin/py ...

  9. 【JS 逆向百例】X球投资者社区 cookie 参数 acw_sc__v2 加密分析

    关注微信公众号:K哥爬虫,持续分享爬虫进阶.JS/安卓逆向等技术干货! 文章目录 声明 逆向目标 抓包分析 加密查找 参数逆向 完整代码 JavaScript 加密代码 Python 测试代码 声明 ...

最新文章

  1. 9.path Sum III(路径和 III)
  2. 计算机维护常识_系统篇
  3. 新注册了一个BLOG
  4. Android JNI的第一步——从HelloWorld开始
  5. P3810-[模板]三维偏序(陌上花开)【CDQ分治,树状数组】
  6. Docker制作dotnet core控制台程序镜像
  7. c++基础学习(10)--(文件、流、异常处理、动态内存、命名空间)
  8. request payload怎么发_做了一个个人博客,但不知道怎么介绍
  9. Namomo Spring Camp Div2 Week1 - 第五次打卡
  10. hql查询过滤器及相关聚合函数查询详解
  11. 为什么现在辞职的年轻教师越来越多?
  12. 一文带你实现RPC框架
  13. openstack trove实例状态转换条件--Mitaka版本
  14. 华为NP课程笔记8-BGP2
  15. php js 批量打开页面
  16. codeblocks下载
  17. vmware workstations 共享虚拟机 failed to connect 903
  18. CAD学习笔记中级课【CAD快捷键】
  19. 【JavaScript】案例1:使用JS完成注册页面校验
  20. 水务综合运营管理系统

热门文章

  1. android 布局滚动条,Android 布局控件——滚动条视图,日期,时间
  2. python机器人视觉编程——入门篇(下)
  3. 5月24 文件操作
  4. 关于Http请求中 Status code: 431 Request Header Fields Too Large 的问题处理
  5. std::string 收缩到合适大小_你的网球拍柄粗细合适吗?请收下这份测量手册
  6. python prettytable输出对齐,Python使用prettytable库打印表格(美化输出)
  7. 英语单词 每日 3.8
  8. java 出差淮安_这就是三线城市:在淮安出差体验当地的发展
  9. python 绘图 背景颜色_python作图坐标轴与图像标签、画布背景的颜色设置
  10. mAP@0.5与mAP@0.50.95的含义