python爬虫解决赶集网扫码获取手机号
(1)正常的抓取页面:
不需要扫码,需要点击查看的
但是没有这个必要,我们仔细看html代码:
发现里面就已经包含了手机号码;点击查看手机号只是个摆设。
(2)需要扫码的一个页面,网址为:
http://hz.ganji.com/fang1/2938272612x.htm
这个的话我们再次查看html代码:
发现并没有手机号存在;
先别着急,我们先研究一下二维码到底包含了什么信息:
用(草料识别二维码或者python库识别)发现解析出来是:
http://3g.ganji.com/hz_fang1/2938272612x
我们发现:
我们访问的网址和二维码访问得到的网址如下:
访问:
http://hz.ganji.com/fang1/2938272612x.htm
二维码解析:
http://3g.ganji.com/hz_fang1/2938272612x
主要不同的就是多了(3g),然后就是hz和fang1位置变了。
我们用电脑访问解析出来的网址:
看到没,出现了手机号。
我们只需要把原网址拼接成http://3g.ganji.com/…这种类型
就可以不用理会二维码了。二维码也是个摆设。
欢迎阅读我的更多文章。
欢迎进(Q)群,帮你解决问题:
python爬虫解决赶集网扫码获取手机号相关推荐
- 【工作小tip】项目活动签到码扫码获取不到数据的bug的解决
先总结 解决了项目活动签到码扫码获取不到数据的bug 1.先跟后端大佬沟通后思考认为扫码是小程序的问题,于是着手改小程序 2.两个微信开发团队用了同一个工程,导致一开始不能二维码编译,换了利军哥的账号 ...
- python爬虫17K小说网资料
python爬虫17K小说网资料 爬虫作业要求:抓取小说网站为例,必须抓取一系列小说(不是一部小说)的篇名.作者.出版单位(或首发网站).出版时间(或网上发布时间).内容简介.小说封面图画.价格.读者 ...
- 「微信群合影2.5.0」- 微信网页版账号不能登录解决办法,扫码登录
「微信群合影qunheying.com」- 一键生成微信全家福 「 微信群合影 2.5.0 」版本更新: 支持微信网页版不能登录账号生成群合影, 通过扫码登录获取 在一键生成全家福的过程中,有一些用户 ...
- python爬虫爬取网易云音乐歌曲_Python网易云音乐爬虫进阶篇
image.png 年前写过一篇爬网易云音乐评论的文章,爬不了多久又回被封,所以爬下来那么点根本做不了什么分析,后面就再改了下,加入了多线程,一次性爬一个歌手最热门50首歌曲的评论,算是进阶版了- 思 ...
- 解决xdd机器人扫码登录异常
文章目录 前言 解决方案 方案一 方案二 前言 这里提供两种方案解决XDD机器人扫码登录异常,由于QQ的安全机制问题,扫码登录增加了限制,扫码地区须和服务器地区一致 如图所示,xdd扫码登录提示登录环 ...
- Python爬虫 | 斗图网表情包抓取
Python爬虫 | 斗图网表情包抓取 1.数据来源分析 2.制作div_list 3.发起请求 4.保存图片 5.批量获取 6.完整代码 声明 1.数据来源分析 打开斗图吧的主页,发现网址非常有 ...
- Python 爬虫 斗图网啦 (bs4)
Python 爬虫 斗图网啦 (bs4) 可以多种形式,我用的BeautifulSoup,因为觉得简单 xpath有点复杂 import requests from bs4 import Beauti ...
- python爬虫解决网页重定向问题
python爬虫解决网页重定向问题 参考文章: (1)python爬虫解决网页重定向问题 (2)https://www.cnblogs.com/zhumengke/articles/9618368.h ...
- python网易云_用python爬虫爬取网易云音乐
标签: 使用python爬虫爬取网易云音乐 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页版找一下你想要听的歌曲点击进去.按键盘F12打开网页调试工具,点击Ne ...
最新文章
- 利用git 进行多人协作开发
- iOS PUSH功能图文教程链接
- Java Attach API
- 081212 晴
- python程序执行时间_用于在Python中查找程序执行时间的程序
- python 全栈开发,Day63(子查询,MySQl创建用户和授权,可视化工具Navicat的使用,pymysql模块的使用)...
- 在没有图片的情况下用css3实现一个圆形
- [Angularjs]国际化
- .NET Core 3.0 RC1 发布,最终版本将于下周发布
- .bash_profile和.bashrc的什么区别
- Ext.gridPanel中内容对齐
- java的xsd文件_java – 如何通过相对路径引用本地XSD文件
- Docker-ce在线安装
- WIN7共享WIFI
- 银行钱数(带小数位)转大写
- 学计算机理论课要记笔记吗,学生应该用笔记本电脑记笔记吗?
- 让WiFi更安全的新协议WPA3,再也不用担心妈妈的WiFi?
- react使用二级(多级)路由(rout)实现局部跳转
- 3.css3深入,高级选择器浮动布局,html5/css3基础开始(推荐收藏)
- PTA python 币值转换 ,逆序数