matlab鸢尾花的数据可视化,matplotlib可视化练习 -- 鸢尾花数据集
matplotlib可视化练习
%matplotlib inline
import matplotlib as mpl
from matplotlib import pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np
萼片(sepal)和花瓣(petal)的大小关系(散点图)
不同种类(species)鸢尾花萼片和花瓣的大小关系(分类散点子图)
不同种类鸢尾花萼片和花瓣大小的分布情况(柱状图或者箱式图)
data = sns.load_dataset("iris")
data.head()
# 萼片长度,萼片宽度,花瓣长度,花瓣宽度,种类
Paste_Image.png
萼片(sepal)和花瓣(petal)的大小关系(散点图)
data['sepal_size'] = data['sepal_length'] * data['sepal_width']
data['petal_size'] = data['petal_length'] * data['petal_width']
plt.scatter(data['sepal_size'],data['petal_size'])
output_14_1.png
不同种类(species)鸢尾花萼片和花瓣的大小关系(分类散点子图)
先来看下有多少种类
t = data.groupby(['species']).size()#3种
t.index
Index(['setosa', 'versicolor', 'virginica'], dtype='object', name='species')
data[data['species'].values == 'setosa']['sepal_size']
0 17.85
1 14.70
2 15.04
3 14.26
4 18.00
5 21.06
6 15.64
7 17.00
8 12.76
9 15.19
10 19.98
11 16.32
12 14.40
13 12.90
14 23.20
15 25.08
16 21.06
17 17.85
18 21.66
19 19.38
20 18.36
21 18.87
22 16.56
23 16.83
24 16.32
25 15.00
26 17.00
27 18.20
28 17.68
29 15.04
30 14.88
31 18.36
32 21.32
33 23.10
34 15.19
35 16.00
36 19.25
37 17.64
38 13.20
39 17.34
40 17.50
41 10.35
42 14.08
43 17.50
44 19.38
45 14.40
46 19.38
47 14.72
48 19.61
49 16.50
Name: sepal_size, dtype: float64
plt.figure()
flag = 1
for name in data.groupby(['species']).size().index:
sepal_size = data[data['species'].values == name]['sepal_size']
petal_size = data[data['species'].values == name]['petal_size']
plt.subplot(2,2,flag)
plt.scatter(sepal_size.values,petal_size.values)
flag += 1
plt.show()
output_19_0.png
不同种类鸢尾花萼片和花瓣大小的分布情况(柱状图或者箱式图)
柱状图
plt.figure(figsize=(20,20))
flag = 1
for name in data.groupby(['species']).size().index:
sepal_size = data[data['species'].values == name]['sepal_size']
petal_size = data[data['species'].values == name]['petal_size']
plt.subplot(2,2,flag)
plt.bar(sepal_size.values,petal_size.values)
plt.title(name)
flag += 1
plt.show()
output_22_0.png
箱式图
plt.figure(figsize=(20,20))
flag = 1
for name in data.groupby(['species']).size().index:
sepal_size = data[data['species'].values == name]['sepal_size']
petal_size = data[data['species'].values == name]['petal_size']
plt.subplot(3,3,flag)
plt.boxplot(sepal_size.values
,patch_artist = True
# 中位数线颜色
, medianprops = {'color': 'b'}
# 箱子颜色设置,color:边框颜色,facecolor:填充颜色
, boxprops = {'color': 'b', 'facecolor': 'r'}
# 猫须颜色whisker
, whiskerprops = {'color': 'r'}
# 猫须界限颜色whisker cap
, capprops = {'color': 'b'})
plt.title(name +'+sepal_size')
plt.subplot(3,3,flag * 2)
plt.boxplot(sepal_size.values,
patch_artist = True
# 中位数线颜色
, medianprops = {'color': 'b'}
# 箱子颜色设置,color:边框颜色,facecolor:填充颜色
, boxprops = {'color': 'b', 'facecolor': 'r'}
# 猫须颜色whisker
, whiskerprops = {'color': 'r'}
# 猫须界限颜色whisker cap
, capprops = {'color': 'b'})
plt.title(name +'+petal_size')
flag += 1
plt.show()
output_24_0.png
matlab鸢尾花的数据可视化,matplotlib可视化练习 -- 鸢尾花数据集相关推荐
- matlab矩阵转入tecplot,利用Tecplot导入MATLAB计算结果数据进行三维可视化
前言 对于(坐标,物理量)这类数据的可视化(云图)一直在探索,二维数据选择用matlab处理,因为matlab的imagesc函数可以根据数据值的大小用不同颜色来显示.但是对应的三维数据(x,y,z, ...
- 利用Tecplot导入MATLAB计算结果数据进行三维可视化
前言 对于(坐标,物理量)这类数据的可视化(云图)一直在探索,二维数据选择用matlab处理,因为matlab的imagesc函数可以根据数据值的大小用不同颜色来显示.但是对应的三维数据(x,y,z, ...
- 数据科学 IPython 笔记本 8.3 Matplotlib 可视化
8.3 Matplotlib 可视化 原文:Visualization with Matplotlib 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册> ...
- 地质钻孔数据的三维可视化【Matlab】
地下钻孔数据是通过钻孔和提取岩石或土壤芯来收集的,由分散在 3D 空间中的样本组成,这些样本测量不同的连续或分类变量.每个样本记录:(1) 由东.北和高程表示的 3D 空间坐标,(2) 连续变量,例如 ...
- KNN实现鸢尾花分类--数据可视化--根据花萼及花瓣分类--sklearn
KNN实现鸢尾花分类 一.导入相关库 二.导入数据 1.关于鸢尾花的数据 2.删除Id(不需要的)数据 3.分别利用花萼和花瓣的特征 三.训练集及测试集 1.花瓣 2.花萼 四.KNN算法 1.花瓣 ...
- 每日一课 | Python数据可视化—Matplotlib初体验
04. Matplotlib初体验 大家好,我是小C,上期给大家分享--Python数据可视化-如何做好启动准备(小白必读) 本期分享内容:Python数据可视化-Matplotlib初体验 本期小C ...
- Python使用matplotlib可视化发散棒棒糖图、发散棒棒糖图可以同时处理负值和正值、并按照大小排序区分数据、为发散棒棒糖图的特定数据点添加标签、自定义背景填充色、自定义数据点颜色
Python使用matplotlib可视化发散棒棒糖图.发散棒棒糖图可以同时处理负值和正值.并按照大小排序区分数据.为发散棒棒糖图的特定数据点添加标签.自定义背景填充色.自定义数据点颜色(Diverg ...
- Python使用matplotlib可视化分布点图、自定义设置分布点图的中位数数据点的颜色(Distributed Dot Plot)
Python使用matplotlib可视化分布点图.自定义设置分布点图的中位数数据点的颜色(Distributed Dot Plot) 目录
- Python使用matplotlib可视化多个时间序列数据、在同一个可视化图像中可视化多个时间序列数据(Multiple Time Series)
Python使用matplotlib可视化多个时间序列数据.在同一个可视化图像中可视化多个时间序列数据(Multiple Time Series) 目录
最新文章
- [导入]XmlReader 读取器读取内存流 MemoryStream 的注意事项
- 推特千赞Demo袭来!简笔画变照片的GauGAN,编故事的GPT-2,浏览器皆可玩
- STC89C52单片机 定时器
- Python logging动态调整日志等级
- vectorobserver obs是做什么_带着色碳纤维主体的OBS雪佛兰皮卡
- 多个数字数组_1分钟彻底理解JavaScript的数组与函数
- 《设计模式系列》---克隆模式
- 各种排序算法的分析及javapython实现
- uva 11275 3D Triangles (3D-Geometry)
- 常见 Java 异常解释(恶搞版)
- 解决window.open被拦截问题
- enet分割_论文阅读 | CVPR 2016 | 语义分割论文: ENet
- genymotion-安卓模拟器-IMEI修改方法
- 遥感原理与应用读书笔记(遥感平台、遥感传感器)
- 教你如何在Mac上打开CAJ格式的文件
- AI教程:2.5D字体制作方法
- Python三个数字排列大小
- 马斯克:特朗普都快80了,我支持个年轻的!懂王回怼:忘了当初跪求补贴?...
- android深度睡眠对广播有什么影响吗,解析智能床垫真的有效提升23.3%的深度睡眠吗?...
- progisp编程下载器:芯片识别字不匹配 不能完成芯片擦除
热门文章
- 2020-08-23腾讯笔试 删除节点 数字拆分
- Android11 刷机教程
- mysql8.0如何授权_MySQL8.0 创建用户及授权
- Win下基于通用C运行库UCRT的部署 - 及 {C++/CLI封装的托管dll被C#工程调用时出现未加载(could not load file or assembly)错误排查}
- 中望CAD填充图形不显示
- 阿里云服务器远程连接及账户密码登录
- 网络图片版权保护的主要问题
- Java、JSP电子政务系统毕业设计
- python提取文件中特定字符串
- 戏说领域驱动设计(五)——子域