在前面我们玩了好多静态的 HTML

想必你应该知道怎么去爬这些数据了

但还有一些常见的动态数据

比如

商品的评论数据

实时的直播弹幕

岛国动作片的评分

等等

这些数据是会经常发生改变的

很多网站就会用到 Json 来传输这些数据

因为 Json 非常轻量

用 key-value 的形式封装成对象

就像 python 里的字典似的

那么遇到 Json 我们应该怎么玩呢?

这次

小帅b以「爬取微信好友列表」为例

告诉你怎么玩 Json 数据

那么接下来就是

学习python的正确姿势

微信有一个网页版

这个网页版的数据请求啥的

很多人都想拿来搞事情

所以现在市面上有很多微信机器人

当然

对于 Python 来说

少即是多

能封装就封装

所以有了一个叫做 itchat 模块

你不再需要去各种抓包

直接使用就得了

比方便面还方便呢

好像有点偏题了

今天是要说 Json 的是吧

打开微信网页版

https://wx2.qq.com/

我们使用 Chrome(←可以点击) 来看一下具体的返回数据

可以看到

微信的每一个好友

被封装成一个一个的 Json 对象

最后封装成一个 Json 数组

也就是 MemberList

我们来看看具体的一个好友的数据是怎么样的

{

在这个 Json 对象里面

包含了微信好友的很多信息

比如 昵称、头像、备注、性别等等

那么如何从这些数据中拿到我们想要的呢?

我们可以用到 json 模块了

python 的 json 模块有两个主要的函数

1

将 python 对象转化为 json是这样的

json.dumps()

2

将json数据转化为python对象是这样的

json.loads()

这也是我们用的比较多的方法

就拿我们刚刚获取到微信好友的数据来玩

import jsonjsondata = '''
{
"Uin":0,
"UserName":"@c482d142bc698bc3971d9f8c26335c5c",
"NickName":"小帅b",
"HeadImgUrl":"/cgi-bin/mmwebwx-bin/webwxgeticon?seq=500080&username=@c482d142bc698bc3971d9f8c26335c5c&skey=@crypt_b0f5e54e_b80a5e6dffebd14896dc9c72049712bf",...此处省略一些.."DisplayName":"",
"ChatRoomId":0,
"KeyWord":"che",
"EncryChatRoomId":"",
"IsOwner":0
}
'''myfriend = json.loads(jsondata) 

这样子我们就可以直接操作了

因为 myfriend 已经被转化为 python 可以使用的字典对象了

比如我们要获取他的昵称

那么可以这样

myfriend.get('NickName')

这就是我们拿到一个 Json 数据对象后对它的操作

当然

我们刚刚举的例子只是 Json 对象

常见的还有 Json 数组

也就是把多个对象组合起来

就像我们 Python 的 list

比如有这样的 Json 数组的数据

{
"MemberList":[
{
"UserName":"小帅b",
"sex":"男"
},
{
"UserName":"小帅b的1号女朋友",
"sex":"女"
},
{
"UserName":"小帅b的2号女朋友",
"sex":"女"
}
]
}

这个时候我们想要获取好友列表

myfriends = json.loads(jsondata)
memberList = myfriends.get('MemberList')

我们得到的 memberList 就是一个 Python 的 list 对象了

那么对于 list 里面的数据

我们用个 for 循环就能轻而易举的获取到啦

ok

下次小帅b还会在爬取项目中带你玩玩 Json

本篇完

近期文章

python爬虫09 | 上来,自己动 !这就是 selenium 的牛逼之处

python爬虫10 | 网站维护人员:真的求求你们了,不要再来爬取了!!

python爬虫11 | 这次,将带你爬取b站上的NBA形象大使蔡徐坤和他的球友们

扫一扫

学习 Python 没烦恼

点个赞~~~~

python爬虫怎么挣钱_python爬虫12 | 爸爸,他使坏,用动态的 Json 数据,我要怎么搞?...相关推荐

  1. python爬虫怎么挣钱_python爬虫19 | 爬虫遇到需要的登录的网站怎么办?用这3招轻松搞定!...

    你好 由于你是游客 无法查看本文 请你登录再进 谢谢合作 当你在爬某些网站的时候 需要你登录才可以获取数据 咋整? 莫慌 小帅b把这几招传授给你 让你以后从容应对 那么 接下来就是 学习 python ...

  2. python自媒体赚钱_Python爬虫怎么挣钱?解析Python爬虫赚钱方式

    爬虫怎么挣钱?解析爬虫赚钱方式,想过自己学到的专业技能赚钱,首先需要你能够数量掌握爬虫技术,专业能力强才能解决开发过程中出现的问题,爬虫可以通过爬虫外包项目.整合信息数据做产品.独立的自媒体三种方式挣 ...

  3. python动态爬虫头像_python爬虫12 | 爸爸,他使坏,用动态的 Json 数据,我要怎么搞?...

    在前面我们玩了好多静态的 HTML 想必你应该知道怎么去爬这些数据了 但还有一些常见的动态数据 比如 商品的评论数据 实时的直播弹幕 岛国动作片的评分 等等 这些数据是会经常发生改变的 很多网站就会用 ...

  4. python爬虫开发环境_python爬虫开发教程下载|Python爬虫开发与项目实战(范传辉 著)pdf 完整版_ - 极光下载站...

    Python爬虫开发与项目实战pdf扫描版下载.Python爬虫开发是一个Pthyon编程语言与HTML基础知识引领读者入门知识,重点讲述了云计算的相关内容及其在爬虫中的应用,进而介绍如何设计自己的爬 ...

  5. python爬虫面试问题_Python爬虫面试总结

    ## Python爬虫面试总结 1. 写一个邮箱地址的正则表达式? [A-Za-z0-9\u4e00-\u9fa5]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$ 2. 谈 ...

  6. python爬虫天气实例_Python爬虫实例扒取2345天气预报

    寒假里学习了一下python爬虫,使用最简单的方法扒取需要的天气数据,对,没听错,最简单的方法.甚至没有一个函数封装.. 网址:http://tianqi.2345.com/wea_history/5 ...

  7. python爬虫面试经验_Python爬虫面试简历 经验分析

    分享之前的爬虫简历,仅供参考,因为技术有限,简历技能点逼格不是很高,但提到的很多爬虫常用技术,都已经写入简历,靠这份简历之前找工作时候2天预约了8家面试,面的第二天,在第4家公司通过拿到offer,后 ...

  8. python爬虫面试简历_Python爬虫面试简历

    分享之前的爬虫简历,仅供参考,因为技术有限,简历技能点逼格不是很高,但提到的很多爬虫常用技术,都已经写入简历,靠这份简历之前找工作时候2天预约了8家面试,面的第二天,在第4家公司通过拿到offer,后 ...

  9. python爬虫实验报告_python爬虫实验

    原博文 2013-06-28 13:30 − 那天在新浪微博上看到北北出的题目,由于最近也在做类似的爬虫研究,所以就有了这个实验. 后来在QQ上和北北说了下,要求是啥都抓,就抓乌云的... 然后就开始 ...

最新文章

  1. Android系统的命令行操作及C程序编译
  2. 洛谷P1352 没有上司的舞会题解
  3. windows安装python2
  4. 网易云深度学习第二课NoteBook2
  5. Android单元测试 mock Context,mock静态类的静态方法,测试方法的顺序
  6. 【Spring学习笔记-MVC-1.3】消息转换器HttpMessageConverter
  7. 表单html遇到的问题及处理,Web前端开发中常见问题及解决方案
  8. 基于TCP的网络游戏黑白棋系列(二):数据传输
  9. python求解LeetCode习题Find the First Missing Positive Number
  10. hdu 6184 三元环数目
  11. B2C,B2B,c2c是什么?
  12. Xcode6 安装 IOS7.1 Simulator
  13. 高防服务器防御阈值买多大合适呢?
  14. 数据挖掘 (一)——ASC文件读写、时间戳转换、可执行文件打包
  15. python分词考研英语真题词频(附结果)——读取word、nltk、有道智云API
  16. 打印机无法确认设备和计算机之间的连接,打印机和电脑连接不上怎么办_电脑怎么连接不上打印机设备-win7之家...
  17. 秒的换算:皮秒、纳秒、微秒、毫秒
  18. 使用A*算法求迷宫最短路径问题
  19. 运营必备 - 400 电话
  20. 除权除息日为:2015年5月21日 股票一览

热门文章

  1. LeetCode 其他部分 简单 Python实现
  2. ARM Cortex-M0 原理与应用实践
  3. How to Easily Read a Linux Man Page
  4. 算命大仙的黄金时代?一年轻松赚5亿…..
  5. 阿里明确中国数字商业板块组织架构 全面聚焦客户体验
  6. 罗永浩将重返高科技行业创业 将涉足AR/VR/MR领域
  7. 支付宝、微信收款码明年3月1日起将禁止商用?系误读!
  8. AMOLED面板驱动芯片紧缺将持续至2022年
  9. 年轻人的钱包,被十一假期榨干了
  10. 谁给小鹏P5的勇气?