matplotlib可视化练习

%matplotlib inline

import matplotlib as mpl

from matplotlib import pyplot as plt

import seaborn as sns

import pandas as pd

import numpy as np

萼片(sepal)和花瓣(petal)的大小关系(散点图)

不同种类(species)鸢尾花萼片和花瓣的大小关系(分类散点子图)

不同种类鸢尾花萼片和花瓣大小的分布情况(柱状图或者箱式图)

data = sns.load_dataset("iris")

data.head()

# 萼片长度,萼片宽度,花瓣长度,花瓣宽度,种类

Paste_Image.png

萼片(sepal)和花瓣(petal)的大小关系(散点图)

data['sepal_size'] = data['sepal_length'] * data['sepal_width']

data['petal_size'] = data['petal_length'] * data['petal_width']

plt.scatter(data['sepal_size'],data['petal_size'])

output_14_1.png

不同种类(species)鸢尾花萼片和花瓣的大小关系(分类散点子图)

先来看下有多少种类

t = data.groupby(['species']).size()#3种

t.index

Index(['setosa', 'versicolor', 'virginica'], dtype='object', name='species')

data[data['species'].values == 'setosa']['sepal_size']

0 17.85

1 14.70

2 15.04

3 14.26

4 18.00

5 21.06

6 15.64

7 17.00

8 12.76

9 15.19

10 19.98

11 16.32

12 14.40

13 12.90

14 23.20

15 25.08

16 21.06

17 17.85

18 21.66

19 19.38

20 18.36

21 18.87

22 16.56

23 16.83

24 16.32

25 15.00

26 17.00

27 18.20

28 17.68

29 15.04

30 14.88

31 18.36

32 21.32

33 23.10

34 15.19

35 16.00

36 19.25

37 17.64

38 13.20

39 17.34

40 17.50

41 10.35

42 14.08

43 17.50

44 19.38

45 14.40

46 19.38

47 14.72

48 19.61

49 16.50

Name: sepal_size, dtype: float64

plt.figure()

flag = 1

for name in data.groupby(['species']).size().index:

sepal_size = data[data['species'].values == name]['sepal_size']

petal_size = data[data['species'].values == name]['petal_size']

plt.subplot(2,2,flag)

plt.scatter(sepal_size.values,petal_size.values)

flag += 1

plt.show()

output_19_0.png

不同种类鸢尾花萼片和花瓣大小的分布情况(柱状图或者箱式图)

柱状图

plt.figure(figsize=(20,20))

flag = 1

for name in data.groupby(['species']).size().index:

sepal_size = data[data['species'].values == name]['sepal_size']

petal_size = data[data['species'].values == name]['petal_size']

plt.subplot(2,2,flag)

plt.bar(sepal_size.values,petal_size.values)

plt.title(name)

flag += 1

plt.show()

output_22_0.png

箱式图

plt.figure(figsize=(20,20))

flag = 1

for name in data.groupby(['species']).size().index:

sepal_size = data[data['species'].values == name]['sepal_size']

petal_size = data[data['species'].values == name]['petal_size']

plt.subplot(3,3,flag)

plt.boxplot(sepal_size.values

,patch_artist = True

# 中位数线颜色

, medianprops = {'color': 'b'}

# 箱子颜色设置,color:边框颜色,facecolor:填充颜色

, boxprops = {'color': 'b', 'facecolor': 'r'}

# 猫须颜色whisker

, whiskerprops = {'color': 'r'}

# 猫须界限颜色whisker cap

, capprops = {'color': 'b'})

plt.title(name +'+sepal_size')

plt.subplot(3,3,flag * 2)

plt.boxplot(sepal_size.values,

patch_artist = True

# 中位数线颜色

, medianprops = {'color': 'b'}

# 箱子颜色设置,color:边框颜色,facecolor:填充颜色

, boxprops = {'color': 'b', 'facecolor': 'r'}

# 猫须颜色whisker

, whiskerprops = {'color': 'r'}

# 猫须界限颜色whisker cap

, capprops = {'color': 'b'})

plt.title(name +'+petal_size')

flag += 1

plt.show()

output_24_0.png

matlab鸢尾花的数据可视化,matplotlib可视化练习 -- 鸢尾花数据集相关推荐

  1. matlab矩阵转入tecplot,利用Tecplot导入MATLAB计算结果数据进行三维可视化

    前言 对于(坐标,物理量)这类数据的可视化(云图)一直在探索,二维数据选择用matlab处理,因为matlab的imagesc函数可以根据数据值的大小用不同颜色来显示.但是对应的三维数据(x,y,z, ...

  2. 利用Tecplot导入MATLAB计算结果数据进行三维可视化

    前言 对于(坐标,物理量)这类数据的可视化(云图)一直在探索,二维数据选择用matlab处理,因为matlab的imagesc函数可以根据数据值的大小用不同颜色来显示.但是对应的三维数据(x,y,z, ...

  3. 数据科学 IPython 笔记本 8.3 Matplotlib 可视化

    8.3 Matplotlib 可视化 原文:Visualization with Matplotlib 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册> ...

  4. 地质钻孔数据的三维可视化【Matlab】

    地下钻孔数据是通过钻孔和提取岩石或土壤芯来收集的,由分散在 3D 空间中的样本组成,这些样本测量不同的连续或分类变量.每个样本记录:(1) 由东.北和高程表示的 3D 空间坐标,(2) 连续变量,例如 ...

  5. KNN实现鸢尾花分类--数据可视化--根据花萼及花瓣分类--sklearn

    KNN实现鸢尾花分类 一.导入相关库 二.导入数据 1.关于鸢尾花的数据 2.删除Id(不需要的)数据 3.分别利用花萼和花瓣的特征 三.训练集及测试集 1.花瓣 2.花萼 四.KNN算法 1.花瓣 ...

  6. 每日一课 | Python数据可视化—Matplotlib初体验

    04. Matplotlib初体验 大家好,我是小C,上期给大家分享--Python数据可视化-如何做好启动准备(小白必读) 本期分享内容:Python数据可视化-Matplotlib初体验 本期小C ...

  7. Python使用matplotlib可视化发散棒棒糖图、发散棒棒糖图可以同时处理负值和正值、并按照大小排序区分数据、为发散棒棒糖图的特定数据点添加标签、自定义背景填充色、自定义数据点颜色

    Python使用matplotlib可视化发散棒棒糖图.发散棒棒糖图可以同时处理负值和正值.并按照大小排序区分数据.为发散棒棒糖图的特定数据点添加标签.自定义背景填充色.自定义数据点颜色(Diverg ...

  8. Python使用matplotlib可视化分布点图、自定义设置分布点图的中位数数据点的颜色(Distributed Dot Plot)

    Python使用matplotlib可视化分布点图.自定义设置分布点图的中位数数据点的颜色(Distributed Dot Plot) 目录

  9. Python使用matplotlib可视化多个时间序列数据、在同一个可视化图像中可视化多个时间序列数据(Multiple Time Series)

    Python使用matplotlib可视化多个时间序列数据.在同一个可视化图像中可视化多个时间序列数据(Multiple Time Series) 目录

最新文章

  1. [导入]XmlReader 读取器读取内存流 MemoryStream 的注意事项
  2. 推特千赞Demo袭来!简笔画变照片的GauGAN,编故事的GPT-2,浏览器皆可玩
  3. STC89C52单片机 定时器
  4. Python logging动态调整日志等级
  5. vectorobserver obs是做什么_带着色碳纤维主体的OBS雪佛兰皮卡
  6. 多个数字数组_1分钟彻底理解JavaScript的数组与函数
  7. 《设计模式系列》---克隆模式
  8. 各种排序算法的分析及javapython实现
  9. uva 11275 3D Triangles (3D-Geometry)
  10. 常见 Java 异常解释(恶搞版)
  11. 解决window.open被拦截问题
  12. enet分割_论文阅读 | CVPR 2016 | 语义分割论文: ENet
  13. genymotion-安卓模拟器-IMEI修改方法
  14. 遥感原理与应用读书笔记(遥感平台、遥感传感器)
  15. 教你如何在Mac上打开CAJ格式的文件
  16. AI教程:2.5D字体制作方法
  17. Python三个数字排列大小
  18. 马斯克:特朗普都快80了,我支持个年轻的!懂王回怼:忘了当初跪求补贴?...
  19. android深度睡眠对广播有什么影响吗,解析智能床垫真的有效提升23.3%的深度睡眠吗?...
  20. progisp编程下载器:芯片识别字不匹配 不能完成芯片擦除

热门文章

  1. 2020-08-23腾讯笔试 删除节点 数字拆分
  2. Android11 刷机教程
  3. mysql8.0如何授权_MySQL8.0 创建用户及授权
  4. Win下基于通用C运行库UCRT的部署 - 及 {C++/CLI封装的托管dll被C#工程调用时出现未加载(could not load file or assembly)错误排查}
  5. 中望CAD填充图形不显示
  6. 阿里云服务器远程连接及账户密码登录
  7. 网络图片版权保护的主要问题
  8. Java、JSP电子政务系统毕业设计
  9. python提取文件中特定字符串
  10. 戏说领域驱动设计(五)——子域