本文详细介绍了如何利用python实现微博评论的爬取,可以爬取指定微博下的评论。基于的策略是找到微博评论接口,先登录微博,获取cookies,使用requests库发送请求,并且将数据存储到mysql中。

首先微博的站点有四个,pc 端weibo.comweibo.cn 以及移动端 m.weibo.com(无法在电脑上浏览)、m.weibo.cn。在网上大致浏览了一下,普遍都认为移动端爬取比较容易,故选择移动端m.weibo.cn进行爬取。

登陆m.weibo.cn之后,找到指定微博,例如榜姐的微博如下图。

打开浏览器开发者模式,点击network,勾选XHR,刷新浏览器,发现出现下图中的一些请求。

点开红色方框中的链接,查看我们需要的信息,从可以找到请求链接,以及请求得到的数据,此页包含19条评论。

<

python爬取某人所有微博_用python写网络爬虫爬取新浪微博评论相关推荐

  1. python爬取微博恶评_详解用python写网络爬虫-爬取新浪微博评论

    新浪微博需要登录才能爬取,这里使用m.weibo.cn这个移动端网站即可实现简化操作,用这个访问可以直接得到的微博id. 分析新浪微博的评论获取方式得知,其采用动态加载.所以使用json模块解析jso ...

  2. 用python写网络爬虫-爬取新浪微博评论

    新浪微博需要登录才能爬取,这里使用m.weibo.cn这个移动端网站即可实现简化操作,用这个访问可以直接得到的微博id. 分析新浪微博的评论获取方式得知,其采用动态加载.所以使用json模块解析jso ...

  3. python微博评论爬虫_详解用python写网络爬虫-爬取新浪微博评论 基于Python的新浪微博爬虫研究...

    怎样爬取新浪微博的评论信息 针对八爪鱼在微博的应用上,除了用户信息之外还包括话题内容方面的采集,目前绝大多数企业均在微博设有官方微博,八爪鱼可以协助企业快速及时的抓取与企业产品相关联的话题信息,规则市 ...

  4. python朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)

    前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...

  5. python抓取朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)...

    原标题:如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下) 前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往 ...

  6. python爬虫能爬取微信密码吗_如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例...

    今天我们继续focus on微信,不过这次给大家带来的是利用Python网络爬虫抓取微信好友总数量和微信好友男女性别的分布情况.代码实现蛮简单的,具体的教程如下. 相信大家都知道,直接通过网页抓取微信 ...

  7. python网络爬虫_Python网络爬虫——爬取视频网站源视频!

    原标题:Python网络爬虫--爬取视频网站源视频! 学习前提 1.了解python基础语法 2.了解re.selenium.BeautifulSoup.os.requests等python第三方库 ...

  8. 如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)

    前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...

  9. python爬虫爬取新闻实战01:小白如何迅速学会爬虫爬取上千条新闻

    爬虫爬取新闻实战01:小白如何迅速学会爬虫爬取千条新闻 文章目录 爬虫爬取新闻实战01:小白如何迅速学会爬虫爬取千条新闻 1.前言 2 .爬虫原理介绍 2.1.图片爬虫 2.2 文字爬虫 3.用八爪鱼 ...

  10. python网络爬虫网易云音乐下载_python网络爬虫爬取网易云音乐

    #爬取网易云音乐 url="https://music.163.com/discover/toplist" #歌单连接地址 url2 = 'http://music.163.com ...

最新文章

  1. kafka异步推送设置重试_一篇文章了解 Kafka 幂等性的原理及实践
  2. Android序列化:Serializable Parcelable
  3. HDU 1729(石子)
  4. 机器学习(八)Apriori算法学习
  5. 2014-10-30NOIP复习题1
  6. FDA批准首个无需人类医生指导的AI,可独立诊断眼科疾病
  7. 行内元素与块状元素 行内替换元素与行内非替换元素的区别
  8. 同表复制一条数据,除主键外,其他值相同
  9. self-sizing cell的一个问题
  10. 栈的数据结构特点(小白基础)
  11. 【LeetCode】75. Sort Colors(颜色排序)-C++实现的两种方法及超详细图解
  12. 电脑声卡或者耳机接口坏了怎么办
  13. PHP算术题,阶乘相加
  14. python海龟图画皮卡丘_用python画一只皮卡丘
  15. 不要迷恋我,虽然我利用Python来耍植物大战僵尸,威力加强版
  16. 计算机房况控制功能是,从实际出发加强计算机房的管理和维护-文档资料.docx
  17. 判断浏览器是pc端还是手机端
  18. 【图像处理通道分离去除印章】
  19. SecureCRT多台服务器快速登录--VB脚本
  20. WBCE CMS安全漏洞(CVE-2022-25099)

热门文章

  1. 当你的才华还撑不起你的野心时,那你就应该静下心来学习,当你的能力还驾驭不了你的目标时,那就应该沉下心来历练
  2. VMware中访问外网配置
  3. 【论文笔记_注意力_2021】Augmenting Convolutional networks with attention-based aggregation
  4. 区域经济学(知识要点)
  5. canvas微信图片生成海报
  6. jin今天天气不错哦,适合出行
  7. linux怎么用命令设置日期,Linux系统教程_怎样用命令行更改Linux系统的日期和时间?...
  8. 2019年校招:漫道金服数据模型工程师校招笔试
  9. 机器学习-线性判别分析
  10. [Android]startActivityForResult启动singleTask的Activity,则onActivitResult()立即回调且resultCode为RESULT_CANCE