Python爬虫采集微信公众号阅读量点赞量等数据
1、安装相关的库
requests、json、re、lxml等
2、完整代码
3、获取登录信息
首先我们用自己的公众号登陆,点击“新的创作”,打开创作页面后点击上方超链接选项,f12(如果没反应就Fn+f12)打开查看网页代码工具
然后在公众号那里输入要获取数据的公众号名字,回车选择,网页工具中会出现一条appmsg?action=list_ex&begin=0&count=5&fakeid=MzA4MzA4MDc5Mg==&type=9&query=&token=6503456&lang=zh_CN&f=json&ajax=1
其中Headers内包含访问网站所需要的四个信息
cookie:些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息。
user-agent:用户代理
token:在计算机身份认证中是令牌(临时)的意思
fakeid:对应我们的公众号,如果爬取其他公众号只需要更改这个参数。
将对应的信息复制到python代码中
4、获取推送信息
需要下载抓包软件fiddler,打开fiddler后,从微信公众号点击一篇推送,找到蓝色这个网址,复制cookie,user-agent
然后找到getsppmsg这个网址,复制url、key、pass_ticket、appmsg_token
5、结果
Python爬虫采集微信公众号阅读量点赞量等数据相关推荐
- Python 爬虫之微信公众号
Python 爬虫之微信公众号 源代码放在文末. 本次爬虫需要的工具如下: selenium 驱动器 对应浏览器的 webdriver 一个微信订阅号 在 2017 年 6 月左右,微信官方发布一篇文 ...
- url 里面 等号_【Python成长之路】从零学爬虫给微信公众号阅读量作个弊:刷阅读量...
[写在前面] 小燕同学:鹏哥,我在微信公众号上写的一些美妆博客,都没什么阅读量,老板要求我在这个月底至少让几篇博客阅读量达到10W+,你说我要不要每天自己去刷或者找水军呀? 鹏哥:博客刷阅读量?这不是 ...
- Python爬虫,微信公众号话题标签内容采集打印PDF输出
微信公众号内容采集,比较怪异,其参数,post参数需要话费时间去搞定,这里采集的是话题标签的内容,同时应用了pdfkit打印输出内容. 这里实现应用了两个版本,第一个是直接网页访问,其真实地址即pos ...
- python爬虫之微信公众号关注度排行榜
摘要:根据一个运营朋友的需求,取出上万个微信公众号的关注度排行,最终用python实现了这一需求,工作量从至少3天缩减至2小时. 简介:本文使用python+requests框架实现接口访问,通过字典 ...
- 【开源Python爬虫】微信公众号爬虫weixin_crawler开源啦
作者 | 抽丝剥茧 出品 | 爱迪斯 微信公众号爬虫weixin_crawler开源啦 正式介绍weixin_crawler之前,我准备了两个问题,这两个问题通过weixin_crawler自带的报告 ...
- Python爬虫之微信公众号(一)
之前有位朋友,听说是搞科研的,需要一些公众号的文章数据,特别是需要拿到含有关键字为"武汉"的公众号的文章.所以今天就写了一个爬虫爬取微信公众号的文章 一.大多数的爬取思路 现在,我 ...
- 【Python爬虫】微信公众号历史文章和文章评论API分析
上一篇文章爬取微信公众号文章信息准备工作介绍了微信公众号历史文章和文章评论API的组成情况,历史文章API格式:https://mp.weixin.qq.com/mp/profile_ext?acti ...
- Python爬取微信公众号文章、点赞数
代码还是热乎的,只要你细心一步步的慢慢调试,绝壁没问题 前期准备 订阅号: Python: Fiddler: 微信账号: 流程 使用用微信公众号生成cookie 使用Fiddler抓取微信公众号数据, ...
- python爬虫公众号_python爬虫_微信公众号推送信息爬取的实例
问题描述 利用搜狗的微信搜索抓取指定公众号的最新一条推送,并保存相应的网页至本地. 注意点 搜狗微信获取的地址为临时链接,具有时效性. 公众号为动态网页(JavaScript渲染),使用request ...
最新文章
- Atitit.提升 升级类库框架后的api代码兼容性设计指南
- 团队项目个人进展——Day10
- Distcp 分布式拷贝
- oracle 客户端访问数据库,ORACLE数据库客户端连接访问服务器
- 【TensorFlow-windows】MobileNet理论概览与实现
- EMOS1.3安装后的相关安全设置
- Makefile 中:= ?= += =的差别 和条件运行
- 里程碑式突破!我国量子计算原型机“九章”问世
- hadoop 命令行相关操作
- 使用gc、objgraph干掉python内存泄露与循环引用!
- RFC792翻译(ICMP主要内容)
- 计算机网络 全章节思维导图
- Web前端零基础入门HTML5+CSS3基础教程——了解前端
- vs code语言模式自动检测设置
- Resend messages one by one
- 在 jdk 1.4 中打印iteye技术网站
- 内网通过映射后的公网IP访问内网服务测试--ASA842 hairpin NAT测试
- 图——图的广度优先遍历
- MySQL 5.7中sync_binlog参数和半同步中after_commit和after_sync的区别
- 一站式在线医疗解决方案,即构音视频技术助建互联网医疗