一、前言

两个月前,今日头条签约了300多名知乎大V,随后引发广大关注和讨论,具体可见:如何看待今日头条一口气签了 300 多个知乎大 V 的传闻?
现在虽然热度已消逝,但一些困惑依然存在,到底知乎有多少大V(此处以“10万关注为标准”),他们都是谁?彼此的关注情况如何?存不存在亲疏远近,乃至抱团的情况......
正所谓有人的地方就有江湖,挖掘下上述数据,或许能窥见到不一样的知乎大V生态圈。

二、爬虫思路

本回以知乎第一大V张佳玮为种子ID,爬取其关注的85名用户,再依次爬取各自的关注列表,几层下去,获得几十万用户ID及相互关注情况,其中10万以上关注数的共有374人,1万以上关注数的有4139人。下图便是张公子所关注的用户:
继续用RAWGraph 绘制成“跳棋”样:
两个月前也爬取过知乎数据:《爬取张佳玮138w+知乎关注者:数据可视化》,本回发现反爬变得严格多了,此处先不做展开。

三、Gephi绘制关注图谱

获取得到374名知乎大V和25090条关注的数据后,依旧选择用开源网络分析和可视化神器“Gephi”来绘制大V们的关注图谱。
由于此前已用过一次,操作过程基本与上回相同,不再赘述,可按照英文操作一步步进行:
《Gephi绘制微博转发图谱:以“@老婆孩子在天堂”为例》
GEPHI – Introduction to Network Analysis and Visualization
虽然本次研究从1万+小V的16万条关注情况,聚焦到10万+大V的2.5万条关注情况,但由于总共就374名大V,人均有67条关注,还是有点密集。
运行算法后网络图谱有所分离,但最后的成果图依旧和上次一样不算很满意。闲言少叙,多图预警。
先来个GIF动图,看看大V们在一开始是如何的如胶似漆、厮混作一团的:
运行老半天后,图形不再有明显变化:
看到最后成果是这么一团网络也是一口老血吐在上面:
所有的节点情况:
一小部分节点和边,轮子哥 @vczh 已经出现,求带逛:
一步步增加节点和边:
中心区域,关注情况(边的数量)逐渐加重:
一眼看到了在上面的程浩:伯爵在城堡。R.I.P.:
底部的还有:
最终的成果图差不多就是这样。由于关注和被关注混在了一起;网络也不够分散,后续可能需要继续筛选出更精华、更少的数据,来绘制更直观的图谱,本次先简单的放放图,具体的解读,可以大家自行进行。还是能看到平时互相点赞的大V确实在图谱里非常靠近的。
另外绘制了七种颜色的图谱,大概是又一次被Gephi搞得吐血,只能填几个色,安慰自己了。逃...就不放图坑流量了。

四、小结

没有分析,没有解读,没有小结,放完图就跑了。想要知乎数据、想要Gephi(薛定谔的官网下载)、想要图表的......

374名10万+知乎大V(一):相互关注情况相关推荐

  1. 我们看到一些知乎大V,开始拍视频了

    最近几个月,不少用户反映,越来越多自己关注的以图文为主要创作形式的大V都开始做视频了.图文作者增加视频内容正成为一种标配. TechWeb注意到,很早就在知乎进行图文创作的@大梦Power最近也开始创 ...

  2. Python数据分析练手:分析知乎大V

    知乎,可以说是国内目前最大的问答类社区.与微博.贴吧等产品不同,知乎上面的内容更多是用户针对特定的问题分享知识.经验和见解.咱们编程教室就有不少读者是从知乎上了解到我们的. 那么,知乎上都有哪些&qu ...

  3. 专访轮子哥:我在微软「造轮子」,一不小心成了知乎大V

    陈梓瀚Vczh,在网络上,大家可能熟悉他在知乎的外号--轮子哥.而在现实中,他的名字就印在久负盛名的C++经典教程<C++ Primer 第五版>的封面上,因为他是这本书的审校之一. 他常 ...

  4. 知乎大V点赞一个多少费用,知乎大V推广问答发布操作

    知乎大V在知乎中有着较大的话语权,很多企业品牌也喜欢和这些知乎大V合作,通过他们去提升品牌知名度,也会找他们对自己的回答点赞,那么知乎大V点赞一个多少费用,下面洛希网络科技为大家介绍知乎大V推广问答发 ...

  5. 16、爬取知乎大v张佳玮的文章“标题”、“摘要”、“链接”,并存储到本地文件...

    爬取知乎大v张佳玮的文章"标题"."摘要"."链接",并存储到本地文件 1 # 爬取知乎大v张佳玮的文章"标题".&qu ...

  6. 10万人的大场馆如何“画座位”?

    简介: 疫情之下,宅在家里就是对自己的保护.我们相信大家能够共度难关,早日迎来与亲友们现场看电影.看球赛的那天.今天,我们就来讲讲10万人的大场馆如何"画座位"?怀念过去的欢聚,期 ...

  7. 手把手教你用Scrapy爬取知乎大V粉丝列表

    导读:通过获取知乎某个大V的关注列表和被关注列表,查看该大V以及其关注用户和被关注用户的详细信息,然后通过层层递归调用,实现获取关注用户和被关注用户的关注列表和被关注列表,最终实现获取大量用户信息. ...

  8. 怎样成为知乎大V?爬取张佳玮138w+知乎关注者:数据可视化

    一.前言 作为简书上第一篇文章,先介绍下小背景,即为什么爬知乎第一大V张公子的138w+关注者信息? 其实之前也写过不少小爬虫,按照网上各种教程实例去练手,"不可避免"的爬过妹子图 ...

  9. python数据分析 知乎_Python数据分析揭秘知乎大V的小秘密

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 清风小筑 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...

最新文章

  1. NVIDIA GPU上的Tensor线性代数
  2. python datetime.datetime 当前_python之time和datetime的常用方法
  3. SVM分类的一个例子
  4. ABAP业务涉及到的相关数据库表 .
  5. 进入Linux救援(rescue)模式的四大法门
  6. 分类与监督学习,朴素贝叶斯分类算法
  7. OpenCV——素描
  8. 《计算机网络》读书笔记(一)--计算机网络体系结构
  9. Python技术知识清单(数据分析)
  10. 查看Linux下端口被哪个程序占用
  11. Visual Studio 单元测试之六---UI界面测试
  12. 基于Yolov5目标检测的物体分类识别及定位(一) -- 数据集原图获取与标注
  13. 分享免费下载论文的网站
  14. Unity为游戏添加背景音乐
  15. 记事本查看HTML源代码,查看源代码有时候用记事本打开有时候用浏览器打开
  16. 图像去模糊系列二 高斯白噪声
  17. mac 上格式化移动硬盘出现MediaKit报告设备上的空间不足以执行请求的解决办法
  18. 为什么Rust语言正在兴起
  19. 网上学python靠谱吗?
  20. 阿里云服务器迁移注意事项等问题

热门文章

  1. 如何用计算机cmd算数,计算命令:怎么在CMD的计算器命令是什么?
  2. http端口映射(80 port mapping)
  3. Python这么强?红包杀手、消息撤回也可以无视!
  4. 银汇通支付解析pos终端基础知识
  5. 关于minimize跟驰豫的问题
  6. C语言输入未知数目的若干个整数
  7. xorm reverse mysql_xorm 工具
  8. 2021年危险化学品经营单位安全管理人员考试及危险化学品经营单位安全管理人员考试试卷
  9. 访问学者初到加拿大需要怎么做?
  10. 浅析B2C电商产品中的“库存”概念