python -pandas学习笔记
认识Pandas
- Pandas是数据分析三剑客之一,是python的核心数据分析库
- Pandas能够处理的数据类型
sql或者excel类似的数据
有序或无序的时间序列序列数据
带行或标签的矩阵数据
其它其它数据,统计数据,观测数据等
Pandas 的优势
强大,灵活,大小可变,处理浮点与非浮点数据的缺失数据,表示为NaN…
安装Pandas
第三方库安装
pip install pandas
在读写excel时还需要xlrd和xlwt
pip install xlrd
pip install xlwt
Series对象
类似于python的列表
它是由数据,以及数据所对应的索引组成
series中可以存储 整数,浮点数, 字符串,python对象等多中数据类型l.
Series对象:
panads.Series(data,index=index)
举例:
修改默认索引
import pandas as pddata = ['张三', '李四', '王五']
# index=[1, 2, 3] 默认索引从0开始 ,这里手动修改索引从1开始
s = pd.Series(data=data, index=[1, 2, 3])
print(s)
print("数据类型:", type(s))
手动添加索引:
import pandas as pddata2 = [90, 99, 88]
index = ["张三", "王五", "李四"]
s = pd.Series(data=data2, index=index)
print(s)
Series的索引和值
位置索引-索引范围[0,N-1]
标签索引[索引名称]-获取多个标签索引使用[[标签索引1,标签索引2,…]]
切片索引 [start:stop:step]
获取Series的索引和值
————获取索引 s.index
————获取值 是s.values
import pandas as pddata2 = [90, 99, 88]
index = ["张三", "王五", "李四"]
s = pd.Series(data=data2, index=index)
# 通过下标索引获取
print(s[0])
# 通过index 名称获取
print(s["张三"])
# 获取多个
print(s[["张三", "王五"]])
# 标签索引
print(s['张三':'李四'])
# 获取列表
print(s.index)
# 索引列表
print(list(s.index))
print(s.values)
DataFrame对象
Dataframe对象是Pandas库中的一种数据结构,类似于二维表,
由行和列组成
和Series一样支持多种数据类型
创建DataFrame对象
——pd.DataFrame(data,index,colums,dtype)
import pandas as pddata = [["lan lan", "bless", 520], ["牛啊", "no", 500], ["滑稽", "run", 480]]
columns = ['名称', '单价', '数量']
df = pd.DataFrame(data=data, columns=columns)
print(df)
print(type(df))
import pandas as pddata = {"名称": ['lan lan', '牛啊', '滑稽'],"单价": [320.9, 150.3, 1.5],"数量": [100, 50, 200]
}
df = pd.DataFrame(data=data)
print(df)
以上两个效果都一样,结果为:
名称 单价 数量
0 lan lan 320.9 100
1 牛啊 150.3 50
2 滑稽 1.5 200
然后我们把data改为
data = {"名称": ['lan lan', '牛啊', '滑稽'],"单价": [320.9, 150.3, 1.5],"数量": [100, 50, 200],"公司": "1123公司"
}
运行结果为:
名称 单价 数量 公司
0 lan lan 320.9 100 1123公司
1 牛啊 150.3 50 1123公司
2 滑稽 1.5 200 1123公司
序号 | 属性 | 描述 |
---|---|---|
1 | values | 查看所有元素的值 |
2 | dtypes | 查看所有元素的类型 |
3 | index | 查看所有行名,重命名行名 |
4 | columns | 查看所有列名,重命名列名 |
5 | T | 行列数据转换 |
6 | head | 查看前N条数据,默认五条 |
7 | tail | 查看后N条数据,默认五条 |
8 | shape | 查看行数和列数shape[0]表示行,shape[1]表示列 |
9 | info | 查看索引,数据类型和内存信息 |
例子:
import pandas as pddata = [["lan lan", "bless", 520], ["牛啊", "no", 500], ["滑稽", "run", 480]]
columns = ['名称', '单价', '数量']
df = pd.DataFrame(data=data, columns=columns)
print("查看所有元素的值:\n", df.values)
print("查看所有元素的类型:\n", df.dtypes)
print("查看所有的行名称:\n", list(df.index))
df.index = [1, 2, 3]
print("查看所有的行名称:\n", list(df.index))
print("查看列索引:\n", list(df.columns))
行列数据的转换
import pandas as pddata = [["lan lan", "bless", 520], ["牛啊", "no", 500], ["滑稽", "run", 480]]
columns = ['名称', '单价', '数量']
df = pd.DataFrame(data=data, columns=columns)
# 规整格式
pd.set_option("display.unicode.east_asian_width",True)
new_df = df.T
print("查看前N条数据\n", df.head(1))
print("查看后N条数据\n", df.tail(1))
print("行", df.shape[0], "列", df.shape[1])
print("查看索引,数据类型,内存信息", df.info)
DataFrame的重要函数
函数 | 描述 |
---|---|
describe() | 查看每列的统计汇总信息,DataFrame类似 |
count() | 返回每一列的非空值的个数 |
sum() | 返回每一列的和,无法计算返回空值 |
max() | 返回每一列的最大最大值 |
min() | 返回每一列的最小值 |
举例:
import pandas as pddata = [["lan lan", "bless", 520], ["牛啊", "no", 500], ["滑稽", "run", 480]]
columns = ['名称', '单价', '数量']
df = pd.DataFrame(data=data, columns=columns)
print(df.describe())
print(df.count())
print(df.sum())
print(df.max())
print(df.min())
python -pandas学习笔记相关推荐
- python数据挖掘学习笔记】十.Pandas、Matplotlib、PCA绘图实用代码补充
#2018-03-23 18:56:38 March Friday the 12 week, the 082 day SZ SSMR https://blog.csdn.net/eastmount/a ...
- python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析
#2018-04-05 16:57:26 April Thursday the 14 week, the 095 day SZ SSMR python数据挖掘学习笔记]十九.鸢尾花数据集可视化.线性回 ...
- python数据挖掘学习笔记】十四.Scipy调用curve_fit实现曲线拟合
#2018-03-28 10:02:08 March Wednesday the 13 week, the 087 day SZ SSMR python数据挖掘学习笔记]十四.Scipy调用curve ...
- Python数据挖掘学习笔记】九.回归模型LinearRegression简单分析氧化物数据
#2018-03-23 16:26:20 March Friday the 12 week, the 082 day SZ SSMR [Python数据挖掘学习笔记]九.回归模型LinearRegre ...
- 深度学习常用python库学习笔记
深度学习常用python库学习笔记 常用的4个库 一.Numpy库 1.数组的创建 (1)np.array() (2)np.zeros() (3)np.ones() (4)np.empty() (5) ...
- Machine Learning with Python Cookbook 学习笔记 第8章
Chapter 8. Handling Images 前言 本笔记是针对人工智能典型算法的课程中Machine Learning with Python Cookbook的学习笔记 学习的实战代码都放 ...
- 莫烦Python NumpyPandas 学习笔记
莫烦Python Numpy&Pandas 学习笔记 原文(视频)地址:https://www.bilibili.com/video/BV1Ex411L7oT 1. 安装 numpy官方网站: ...
- pandas学习笔记之DateFrame
pandas学习笔记之DateFrame 文章目录 pandas学习笔记之DateFrame 1.DateFrame的创建 1)认识DataFrame对象 2)由二维列表创建(默认index和colu ...
- [Pandas 学习笔记] - No.1 pandas学习笔记
pandas学习笔记 pandas是基于numpy开发出的数据分析包,用于高效地操作大型数据集.pandas的数据结构有三种 分别为 series,dataframe和panel,对应一维,二维,三维 ...
最新文章
- 记一次数组工具类 交集,去重
- ASP.NET Core Web 资源打包与压缩
- java8 util.time_Java8 java.util.Date转换为java.time.ZonedDateTime
- 基于JAVA+Servlet+JSP+MYSQL的校园门户信息管理系统
- Pytorch——DataLoader的学习笔记~
- 三星1万亿元重金下注,推动AI、5G、半导体等项目的研究
- 概率软逻辑(PSL,Probabilistic soft logic)通用(可处理中文)版本
- 如何将 Apple Watch 用作闹钟?
- 电脑硬盘坏道怎么检测,又如何修复图文教程
- android自定义sufaceview,Android自定义SurfaceView实现画板功能
- Spotfire 筛选器类型修改
- 七年切图仔如何面试大厂web前端?(沟通软技能总结) | 掘金技术征文
- python中sinxcosy_∫e^x[(1-cosy)dx-(y-siny)dy],其中c为区域 0≤x≤π,0≤y≤sinx的边界曲线取正向.求曲...
- puppet的使用:ERB模板
- 全景声制作软件 Spat Revolution 最新更新 v20.12
- OpenCV开发笔记(五十七):红胖子8分钟带你深入了解直方图反向投影(图文并茂+浅显易懂+程序源码)
- 合肥工业大学宣城校区计算机组成原理实验 单周期 CPU 设计与实现
- Java基于springboot+vue的眼镜销售购物商城系统 element 前后端分离
- SendFax过程分析
- 常说的OA系统、ERP系统、CRM系统是什么?