1.分析背景

公众号的红利期有没有过,火热的公众号市场到底有多少受众,费心费力编写的公众号文章到底有没有人看,是真的起到了宣传教育的效果,还是单位自娱自乐、给领导算KPI的工具,我们要一探究竟。

市场上是有如微小宝之类的第三方平台,可以获得公众号的排名、阅读量、文章发送情况等信息,但是对于我关注的评论情况,无法获取,这点比较无奈,而且对比了几个数据后,感觉观感上的文章底部阅读量和平台的统计量有偏差,数据不够真实,因此想要甩开膀子自己做。

2.目标选择

自娱自乐可能性最高的就是政务类平台,因为一般企业如果起不到宣传效果还不如去投广告,运营的动力不会那么强。但是政务平台不一样,前些年处于僵死状态的各个政府机关门户网站,到现在天天催着要,但是效果是个无底洞的公众号,个人认为真得探究一下。目标选择还在列清单,初步准备选择15个公众号进行分析,别问为啥是十五,因为我现在还不知道能不能爬取到数据,如果数据充分,那我就一个分类选5个分3组,如果不理想,那就15个就1个分类的吧,当然还有夭折的可能,毕竟前面是微信这么一座大山,不知道给我加了多少层壳。

3.预备动作

3.1 文章链接获取

https://mp.weixin.qq.com/s/hhA7LkaUPYhWJptL0GEshw
https://mp.weixin.qq.com/s/6SpiyDG_ws0vFOWFkdv8VA
https://mp.weixin.qq.com/s/n7ic77uIA-QtniYSRD6gcg

以上是一个公众号同一天的前三条推送的文章链接,均为原创(非转载),由于链接经过加密,不能得到明显的规律。
而之前的文章链接如下:

https://mp.weixin.qq.com/s?src=3&timestamp=1496819538&ver=1&signature=2Ui56lfdJ7txnkcz0Y0tXtfKXX8Dnh2Thra4pQiyV8afGJ7Z8umwqEgLqWpgQt1uWFlkcEvgEV7yKCRVTxf2SZvYCDYWAjMXIAk0ECAObyjWqOsAvrhAxy3x5WJSi64BwJKSzuGvujRRyay7suJRGDFIyW0bxWOPbwnavAtfA=&uin=OTM1MDQxMDQw

可以看到十分明显的字段。

字段名分别为:
src
timestamp
ver
signature
uni

通过公众号编发文章的临时链接可以看到

https://mp.weixin.qq.com/s?__biz=MzU1NjA3MjcwOA==&tempkey=MTA1Nl9IYlI5TFlzdVVwOEQ2VzB0OUdtVlZ5QXRDMDVZRDNaMGxfVWlkOUdRSHFKTTUwT0lVQnhva3E0VFdWdXhwWjJnMUNYMHNmM0xQc1JLa2RYRGtKX0hFMF9FcW51c3pGT3dJaGJCbGdjVThTSlY2aHRraGFaV2xxeEVzR2VqVDM0OExtclJvaGxPNG05a2pQanFaVnFCNWlmaTVlaFhfQ2RJMFQ5QWt3fn4%3D&chksm=7bcbeb3a4cbc622c36762db8fc38501d882a7d7e56d81b21f691e26b0c5e3b66bf6fd9861b46#rd
字段名:
biz
tempkey
chksm

临时链接中还是存在字段名
将其正式发送出来

https://mp.weixin.qq.com/s?__biz=MzU1NjA3MjcwOA==&mid=2247483730&idx=1&sn=9d5d93006dafcb0754fefadff2db6ac9&chksm=fbcbeb39ccbc622f865379303e5b913a7e992a69d4cf9dcc9d0aa8676ef230d4cbf706cc636a&token=1513032356&lang=zh_CN#rd
字段名:
biz
mid
idx
sn
chksm
token
lang

对比与之前的链接,没有看到十分明显的重叠。
对比临时与正式的链接,发现

biz=MzU1NjA3MjcwOA

是相同的,应该为账户的ID

而共有字段

chksm=7bcbeb3a4cbc622c36762db8fc38501d882a7d7e56d81b21f691e26b0c5e3b66bf6fd9861b46
chksm=fbcbeb39ccbc622f865379303e5b913a7e992a69d4cf9dcc9d0aa8676ef230d4cbf706cc636a

两者是不同的。
我们换个思路

找来一篇文章

https://mp.weixin.qq.com/s/mantKd1ih4HUcgisLxCVMg

按F12打开

在NETWORK中查找不到相关文章内容,但是在SOURCES可以看到与文章链接mantKd1ih4HUcgisLxCVMg相同的一个文件,其中找到了这样一个链接

https://mp.weixin.qq.com/s?__biz=MjM5OTU4Nzc0Mg==&mid=2658655606&idx=1&sn=d7670835e6ee340ab8d2dea3d3c63153&chksm=bcba47878bcdce91d1fb7974643d9383e7fb75086e74e6e8728d27006ce0265ac60c3fa31e4d#rd

诶?这不是以前的长链接吗?原来有段时间微信文章链接太长,转发不易,所以改成了短链接,所以要获取长链接,我们需要读取一下这个文件。
如果不读取,光靠biz这个字段,是无法获取完整的链接的。
同时还有个问题,如果使用浏览器打开,则无法获取到阅读量和评论等数据。
因此,需要使用微信电脑客户端进行数据读取。

下一步,使用fiddler进行抓包查询。
fiddler下载地址
http://down10.zol.com.cn/wangba/Fiddlerv5.0.20182.28034.zip
抓取设置参考文章

https://blog.csdn.net/Memory_and_Dream/article/details/101693632?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158691908019725211956945%2522%252C%2522scm%2522%253A%252220140713.130056874…%2522%257D&request_id=158691908019725211956945&biz_id=0&utm_source=distribute.pc_search_result.none-task-blog-1blogdefault~default-1

以及文章

https://blog.csdn.net/qq_28804275/article/details/82150874?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158691912319726869008945%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=158691912319726869008945&biz_id=0&utm_source=distribute.pc_search_result.none-task-blog-2allfirst_rank_v2~rank_v25-1

对于公众号文章

https://mp.weixin.qq.com/s/mantKd1ih4HUcgisLxCVMg


看一下REQUEST和返回信息

POST https://mp.weixin.qq.com/mp/appmsgreport?action=page_time&__biz=MjM5OTU4Nzc0Mg==&uin=MTk0MTkyOTU%253D&key=bb0ddf399b9bf75cbd6d92130ea8cb6e8dcfe93b6f44a90a412333160ae25f0247fe84e17494e3caa1a06eae4d05abfbf1e60980029dbd35dcf32488017dbb6be5867a27e53bf227744f9c759fd81694&pass_ticket=GI0IteT5S6OtYrcOy%25252FkQe5en%25252FHlTCNDAODVY1FGE5xU%25253D&wxtoken=777&devicetype=Windows%26nbsp%3B7&clientversion=62080085&__biz=MjM5OTU4Nzc0Mg%3D%3D&appmsg_token=1056_MjS6tN%252BHEafDoBwSYPhQ6ab4MzW7XVNYyvSiGVxoczButfJnP8EbJbduWVQ~&x5=0&f=json HTTP/1.1
Host: mp.weixin.qq.com
Connection: keep-alive
Content-Length: 1699
Origin: https://mp.weixin.qq.com
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36 QBCore/4.0.1295.400 QQBrowser/9.0.2524.400 Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2875.116 Safari/537.36 NetType/WIFI MicroMessenger/7.0.5 WindowsWechat
Content-Type: application/x-www-form-urlencoded; charset=UTF-8
Accept: */*
Referer: https://mp.weixin.qq.com/s?__biz=MjM5OTU4Nzc0Mg==&mid=2658655606&idx=1&sn=d7670835e6ee340ab8d2dea3d3c63153&chksm=bcba47878bcdce91d1fb7974643d9383e7fb75086e74e6e8728d27006ce0265ac60c3fa31e4d&scene=126&sessionid=1586916510&key=bb0ddf399b9bf75cbd6d92130ea8cb6e8dcfe93b6f44a90a412333160ae25f0247fe84e17494e3caa1a06eae4d05abfbf1e60980029dbd35dcf32488017dbb6be5867a27e53bf227744f9c759fd81694&ascene=1&uin=MTk0MTkyOTU%3D&devicetype=Windows+7&version=62080085&lang=zh_CN&exportkey=AzobYvoaioqFo1w2Oh9Nlh8%3D&pass_ticket=GI0IteT5S6OtYrcOy%2FkQe5en%2FHlTCNDAODVY1FGE5xU%3D&winzoom=1
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.5;q=0.4
Cookie: wxtokenkey=777; rewardsn=; wxuin=19419295; devicetype=Windows7; version=62080085; lang=zh_CN; pass_ticket=GI0IteT5S6OtYrcOy/kQe5en/HlTCNDAODVY1FGE5xU=; wap_sid2=CJ+hoQkSXHVVS21Fbk82eFJfU21EdUdXdnhzcnNlenRsYVRhRDJzT29XTExseG13bnNXbnV4d0lINFBoeVZyOHV0Y05HdTB1amJqM0lHTHo4UmhJbmNMNEpJWFF5QUVBQUF+MOPx2fQFOA1AAQ==report_bizuin=MjM5OTU4Nzc0Mg%3D%3D&title=%E9%92%88%E5%AF%B9%E8%BF%99%E4%B8%80%E9%87%8D%E5%A4%A7%E9%97%AE%E9%A2%98%EF%BC%8C%E4%B8%AD%E5%A4%AE%E5%86%8D%E5%8F%91%E6%96%87%E4%BB%B6%EF%BC%81%E6%9C%89%E4%BD%95%E6%B7%B1%E6%84%8F%EF%BC%9F&mid=2658655606&idx=1&subscene=10000&sessionid=1586916510&read_cnt=57335&like_cnt=211&screen_width=1904&screen_height=966&screen_num=8&idkey=64469_15_1%3B28307_84_1%3B28307_77_1%3B28307_78_1%3B28307_80_1%3B28307_85_1%3B28307_87_1%3B28307_64_1%3B27613_31_394&copyright_stat=1&ori_article_type=%E7%A4%BE%E4%BC%9A%E6%96%B0%E9%97%BB&video_cnt=0&read_screen_num=2&is_finished_read=0&scene=126&content_len=834137&start_time=1586919432157&end_time=1586919669301&handup_time=0&total_height=7691&exit_height=1666&img_640_cnt=1&img_0_cnt=0&img_300_cnt=0&wtime=47135&ftime=4094&ptime=46583&onload_time=47135&reward_heads_total=0&reward_heads_fail=0&outer_pic=0&publish_time=1586914471&item_show_type=0&page_req_info=%7B%22startGetAppmsgExtTime%22%3A1586919474731%2C%22startGetAppmsgAdTime%22%3A1586919474777%2C%22receiveGetAppmsgExt%22%3A%22200%7C1586919474863%22%2C%22receiveGetAppmsgAd%22%3A%22200%7C1586919474896%22%2C%22jsapiReadyTime%22%3A1586919475268%2C%22domCompleteTime%22%3A1586919432229%7D&wifi_all_imgs_cnt=1&wifi_read_imgs_cnt=0&webp_total=1&webp_lossy=1&webp_lossless=1&webp_alpha=1&webp_animation=1&download_cdn_webp_img_cnt=1&download_img_cnt=1&download_cdn_img_cnt=1&img_cnt=2&img_jpeg_cnt=1&source=&req_id=1510dfD0PjxyfJqyqtGKp3P1&recommend_version=&class_id=&ascene=1&hotspotjson=%7B%22hotspotinfolist%22%3A%5B%5D%7D&is_pay_subscribe=0&is_paid=0&preview_percent=0&is_finished_preview=0&fee=undefined&pay_cnt=undefined&worthy_cnt=undefined&report_time=1586919669

可以得到杂项中的完整链接,超级完整,比上面最长的字段还多,让我看看都有些啥

https://mp.weixin.qq.com/s?__
biz=MjM5OTU4Nzc0Mg==&
mid=2658655606&idx=1&
sn=d7670835e6ee340ab8d2dea3d3c63153&
chksm=bcba47878bcdce91d1fb7974643d9383e7fb75086e74e6e8728d27006ce0265ac60c3fa31e4d&
scene=126&
sessionid=1586916510&
key=bb0ddf399b9bf75cbd6d92130ea8cb6e8dcfe93b6f44a90a412333160ae25f0247fe84e17494e3caa1a06eae4d05abfbf1e60980029dbd35dcf32488017dbb6be5867a27e53bf227744f9c759fd81694&
ascene=1&
uin=MTk0MTkyOTU%3D&
devicetype=Windows+7&
version=62080085&
lang=zh_CN&
exportkey=AzobYvoaioqFo1w2Oh9Nlh8%3D&
pass_ticket=GI0IteT5S6OtYrcOy%2FkQe5en%2FHlTCNDAODVY1FGE5xU%3D&
winzoom=1

其中一部分就是图中cookies的内容
同时在WEB表单中,找到了我想要的阅读量和在看量

既然手动找到了我们需要的数据了,那么下一步就要考虑怎么通过request等方法批量获得数据了
TO BE CONTINUE

公众号运营情况分析 DAY01(获取公众号文章阅读量、在看和评论内容)相关推荐

  1. 今日头条运营秘诀分享:让你的文章阅读量和收入都“飞”起来

    1. 互联网发展纯熟,我们进入了自媒体时代.人们借助自媒体平台可以分享内容,这种分享有私人化.平民化.普泛化.自主化的特点.而这也让我们迎来了内容创业这个大机遇. 对于内容创作者来说,在这个时代,无疑 ...

  2. 公众号运营情况分析 DAY02(获取公众号文章阅读量、在看和评论内容)

    我们继续,上次是用fiddler找到了想要的阅读数,和在看数,再回顾一下,顺便把数据找全. 对于文章 https://mp.weixin.qq.com/s/tvD9xz6kywtcmbKQV7SnCw ...

  3. 你运营的公众号文章阅读量上不来,怎么回事?

    很多操作公众号的小伙伴都在烦恼就是阅读量上不来,看那些大号一发文章动不动就是10万+,而自己文章阅读量却少的可怜,特别是那些坚持原创的小伙伴,较劲脑汁写了小半天的原创文章阅读量才是两位数,能不伤心吗? ...

  4. 查公众号文章阅读量接口,简单版本

    1.提供查公众号文章阅读量接口 2.核心技术 4.可根据业务需求定制化 本程序能够长时间进行实时查量,并且能够完成的返回阅读量信息,能够帮助公众号运营者更加方便的能够实时查看自己得流量,也能够为第三方 ...

  5. 某策略游戏公测期运营情况分析报告-基于python

    某策略游戏测试阶段运营情况分析报告-基于python 背景 了解数据 字段含义 加载必要的库 读取数据 查看数据类型和数据结构 统计缺失值 删除重复数据 游戏总体情况 注册人数变化 活跃用户数变化 活 ...

  6. 公众号文章阅读量数据导出

    年终总结.科研数据分析.公众号运营总离不开数据,如何导出公众号每篇文章的阅读量.点赞.评论数据呢?公众号后台一篇篇手动统计耗费大量人力和时间.如果想统计别人公众号文章数据更是难上加难. 现在次幂数据有 ...

  7. 有效提高公众号文章阅读量的方法

    对于运营微信公众号的朋友来说,提高公众号文章阅读量是很重要的,这甚至还会成为很多公司的KPI.那么如何才能有效的提升公众号文章阅读量呢?本文笔者就个大家分享几个有效提升公众号文章阅读量的方法. 增加粉 ...

  8. 百度百家号“漏洞”大曝光 一篇文章十几万阅读量 收入上万

    越来越发现自媒体的好处,就是现在太多的平台都提供入口,基本是四大门户还有三大巨头互联网公司,百度.腾讯 .阿里都提供!那么接下来我要分享的是中国最大的搜索引擎公司-百度!,相信最近很多人都知道百度百家 ...

  9. php 获取微信文章阅读量,获取微信公众号的文章的阅读数的实践(请求参数不支持文章 ID)...

    1.新的需求为:需要实现微信渠道的文章的阅读数的显示.如图1 图1 2.实则最为理想的情况,应该是能够基于文章 ID 获取此文章的阅读数,就像抖音.查看抖音开放平台文档 – 资源中心 – Open A ...

最新文章

  1. 疯子的算法总结(九) 图论中的矩阵应用 Part 2 矩阵树 基尔霍夫矩阵定理 生成树计数 Matrix-Tree
  2. python 创建文件_Python入学首次项目,新手必看,简单易操作
  3. linux中samba详解,详解linux系列之samba的安装及配置
  4. python数据类型取值范围_Python基本数据类型(一)
  5. php 月份查询生日_PHP----------php根据生日(时间戳)计算星座
  6. Android简易实战教程--第十四话《模仿金山助手创建桌面Widget小部件》
  7. 安卓毕业设计- Android计算器
  8. matlab中gen2par函数,R语言中的par()函数终于明白了
  9. python利用try_except打印错误信息,并继续执行
  10. 超市销售数据分析python_python实战案例:超市营业额数据分析
  11. 美团配送php,PHP对接美团配送接口遇到的坑
  12. 微信小程序使用swiper制作轮播图留白的解决方法
  13. PAT (Basic Level) Practice (中文)1027 打印沙漏 (20 分)(C++)
  14. 中国科学院计算机在职博士,2019中国科学院大学人工智能学院非全日制经验分享...
  15. 若依框架搜索框使用注解写动态SQL
  16. 201671030125 曾佳+《英文文本统计分析》结对项目报告
  17. 序列化与反序列化之 Protostuff
  18. 你是通过什么渠道获取一般人不知道的知识和信息的?
  19. ICP备案信息查询接口,根据单位名称、域名、备案号查询
  20. C/C++实习工作应该具备那些能力?才能拿更好的工作和薪资!

热门文章

  1. 8749(07072402)流氓软件解决方案
  2. 使用Python爬虫获取豆瓣影评,并用词云显示
  3. 【uniapp】H5扫码方案,解决uni.scanCode不支持H5的问题
  4. 国际汇款产品架构的演进
  5. 文献综述的写作技巧,掌握这些技巧,效率大大提高!
  6. 什么原因显示sim卡没服务器,苹果手机显示无sim卡是什么原因 苹果手机显示无sim卡解决方法...
  7. 雷达图文字被遮住的解决办法
  8. 500多款免费商用字体,让你的设计如虎添翼!
  9. 概率机器人:测距传感器的波束模型
  10. python定义一个triangle类_设计一个程序,程序中有三个类,Triangle,Lader,Circle。...