Python网络爬虫与文本数据分析(视频课)

之前分享过pandas也是可以作图的,今天复习一下pandas作图,并与seaborn做对比,熟悉下各自绘图的特点。

导入用到的库

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

%matplotlib inline

plt.style.use('fivethirtyeight')

plt.style.use('bmh')

读取数据

business = pd.read_csv('data/business.csv')

business.head()

评分分布

查看用户对yelp平台内店家评价的分布情况。使用pandas绘图

colors = sns.color_palette()

#stars是series数据类型

stars = business['stars'].value_counts().sort_index()

stars.plot(kind='bar',

figsize=(10, 5),

color=colors[:9],

rot=0,

title='Distribution of rating')

也可以用seaborn作图,代码如下

plt.figure(figsize=(10,5))

sns.countplot(business['stars'])

plt.title('Distribution of rating')

我们发现大多数用户店家评分都是4分及以上

最常见的店名和坐标

我们看看店铺的最常见的店名、最常见的坐标。使用pandas绘图

fig, ax = plt.subplots(1, 2, figsize=(14, 8))

business['name'].value_counts()[:20].plot(kind='barh',

ax=ax[0],

color=colors[:20],

title='Top 20 name of store in Yelp')

business['city'].value_counts()[:20].plot(kind='barh',

ax=ax[1],

color=colors[:20],

title='Top 20 of city in Yelp')

f,ax = plt.subplots(1,2, figsize=(14,8))

cnt = business['name'].value_counts()[:20].to_frame()

sns.barplot(cnt['name'], cnt.index, palette = 'RdBu', ax = ax[0])

ax[0].set_xlabel('')

ax[0].set_title('Top 20 name of store in Yelp')

cnt = business['city'].value_counts()[:20].to_frame()

sns.barplot(cnt['city'], cnt.index, palette = 'rainbow', ax =ax[1])

ax[1].set_xlabel('')

ax[1].set_title('Top 20 of city in Yelp')

plt.subplots_adjust(wspace=0.3)

从上面两个例子看,pandas和seaborn绘图各有千秋,有时候pandas简洁,有时候seaborn简洁。

-END-

假期无法出门不如在家学习

世界正在奖励坚持学习的人!

pandas绘图_pandas与seaborn可视化对比小案例相关推荐

  1. pandas绘图_Pandas内置绘图方法(线型图、柱状图、密度图)

    Series和DataFrame都有一个用于生成各类图表的plot方法. 线型图 默认情况下,它们所生成的是线型图 >>> import pandas as pd >>& ...

  2. python用pandas读取excel_Python使用pandas读取Excel文件数据和预处理小案例

    假设有Excel文件data.xlsx,其中内容为 现在需要将这个Excel文件中的数据读入pandas,并且在后续的处理中不关心ID列,还需要把sex列的female替换为1,把sex列的male替 ...

  3. Python使用pandas读取Excel文件数据和预处理小案例

    假设有Excel文件data.xlsx,其中内容为 现在需要将这个Excel文件中的数据读入pandas,并且在后续的处理中不关心ID列,还需要把sex列的female替换为1,把sex列的male替 ...

  4. python数据分析pandas画图_Pandas数据可视化基础绘图教程

    众所周知,Pandas是基于Python平台的大数据分析与处理的利器.在数据为王的时代,想要掌握数据分析能力,学会Pandas数据可视化工具是十分重要的.本文将带领大家一步一步学习Pandas数据可视 ...

  5. pandas数据预处理(字段筛选、query函数进行数据筛选、缺失值删除)、seaborn可视化分面图(facet)、seaborn使用Catplot可视化分面箱图(Faceted Boxplot)

    pandas数据预处理(字段筛选.query函数进行数据筛选.缺失值删除).seaborn可视化分面图(facet).seaborn使用Catplot可视化分面箱图(Faceted Boxplot) ...

  6. 使用Pandas的rolling函数计算滚动平均值(rolling average with Pandas rolling)、seaborn使用lineplot函数可视化时间序列数据、并添加滚动平均值

    使用Pandas的rolling函数计算滚动平均值(rolling average with Pandas rolling).seaborn使用lineplot函数可视化时间序列数据(time ser ...

  7. Seaborn可视化使用relplot函数可视化数据长度不同的时间序列实战:two Pandas Series of different lengths

    Seaborn可视化使用relplot函数可视化数据长度不同的时间序列实战:two Pandas Series of different lengths 目录

  8. Python使用pandas的crosstab函数计算混淆矩阵并使用Seaborn可视化混淆矩阵实战

    Python使用pandas的crosstab函数计算混淆矩阵并使用Seaborn可视化混淆矩阵实战 目录 Python使用pandas的crosstab函数计算混淆矩阵并使用Seaborn可视化混淆 ...

  9. Python - Seaborn可视化:图形个性化设置的几个小技巧

    1 概述 在可视化过程中,经常会对默认的制图效果不满意,希望能个性化进行各种设置. 本文通过一个简单的示例,来介绍seaborn可视化过程中的个性化设置.包括常用的设置,如: 设置图表显示颜色 设置图 ...

最新文章

  1. 折线图表动画(历史进程效果)
  2. 压缩跟踪Compressive Tracking
  3. 【AutoML】损失函数也可以进行自动搜索学习吗?
  4. 将数据库日志添加到JUnit3
  5. 域账号更改密码之后代理需要重新配置
  6. 10W+集群规模下,美团点评如何优化改造K8s?
  7. python写web自动化_jenkins+selenium+python实现web自动化测试
  8. java使用bks双向认证_客户端与服务器SSL双向认证(客户端:Android
  9. oracle用户权限管理
  10. python 防破解_Python 程序员如何防止数据被修改?
  11. 父子组件传值——静态传值、动态传值
  12. 谷歌浏览器任何页面都打不开连设置也不能打开
  13. 关于第一型曲面积分的再思考
  14. JDK版本对应其major.minor version,看这一篇就够啦(附java历史版本下载地址)
  15. 制作windows安装包
  16. 稻城亚丁6日游之第五天(新都桥-丹巴)
  17. 用计算机弹绿色谱子,小Z键盘钢琴(电脑键盘弹钢琴带曲谱)
  18. 風雷益 (易經大意 韓長庚)
  19. Redis 由浅入深 (2) - Redis哨兵和集群的介绍和部署方案(看完这篇redis部署再也不是问题)
  20. Nature:肠道微生物异常为何会导致肝病?

热门文章

  1. node.js详解Http服务器
  2. 数据结构实验:连通分量个数
  3. HugeGraph 配置参数
  4. c++ 解析xml文件
  5. 专访香侬科技:致力于让世界听到中文NLP的声音
  6. 三大场景,对象存储OSS带你快速上云
  7. 跑得好好的Java进程,怎么突然就瘫痪了?
  8. 基于OOS批量修改资源标签值
  9. 开发跨平台app推荐React Native还是flutter?
  10. 双11万亿流量下的分布式缓存