认识Pandas

  • Pandas是数据分析三剑客之一,是python的核心数据分析库
  • Pandas能够处理的数据类型

sql或者excel类似的数据
有序或无序的时间序列序列数据
带行或标签的矩阵数据
其它其它数据,统计数据,观测数据等

Pandas 的优势

强大,灵活,大小可变,处理浮点与非浮点数据的缺失数据,表示为NaN…

安装Pandas

第三方库安装

 pip install pandas

在读写excel时还需要xlrd和xlwt

pip install xlrd
pip install xlwt

Series对象

类似于python的列表
它是由数据,以及数据所对应的索引组成
series中可以存储 整数,浮点数, 字符串,python对象等多中数据类型l.
Series对象:

panads.Series(data,index=index)

举例:
修改默认索引

import pandas as pddata = ['张三', '李四', '王五']
# index=[1, 2, 3] 默认索引从0开始 ,这里手动修改索引从1开始
s = pd.Series(data=data, index=[1, 2, 3])
print(s)
print("数据类型:", type(s))

手动添加索引:

import pandas as pddata2 = [90, 99, 88]
index = ["张三", "王五", "李四"]
s = pd.Series(data=data2, index=index)
print(s)

Series的索引和值

位置索引-索引范围[0,N-1]
标签索引[索引名称]-获取多个标签索引使用[[标签索引1,标签索引2,…]]
切片索引 [start:stop:step]
获取Series的索引和值
————获取索引 s.index
————获取值 是s.values

import pandas as pddata2 = [90, 99, 88]
index = ["张三", "王五", "李四"]
s = pd.Series(data=data2, index=index)
# 通过下标索引获取
print(s[0])
# 通过index 名称获取
print(s["张三"])
# 获取多个
print(s[["张三", "王五"]])
# 标签索引
print(s['张三':'李四'])
# 获取列表
print(s.index)
# 索引列表
print(list(s.index))
print(s.values)

DataFrame对象

Dataframe对象是Pandas库中的一种数据结构,类似于二维表,
由行和列组成
和Series一样支持多种数据类型
创建DataFrame对象
——pd.DataFrame(data,index,colums,dtype)

import pandas as pddata = [["lan lan", "bless", 520], ["牛啊", "no", 500], ["滑稽", "run", 480]]
columns = ['名称', '单价', '数量']
df = pd.DataFrame(data=data, columns=columns)
print(df)
print(type(df))
import pandas as pddata = {"名称": ['lan lan', '牛啊', '滑稽'],"单价": [320.9, 150.3, 1.5],"数量": [100, 50, 200]
}
df = pd.DataFrame(data=data)
print(df)

以上两个效果都一样,结果为:

        名称     单价   数量
0  lan lan  320.9  100
1       牛啊  150.3   50
2       滑稽    1.5  200

然后我们把data改为

data = {"名称": ['lan lan', '牛啊', '滑稽'],"单价": [320.9, 150.3, 1.5],"数量": [100, 50, 200],"公司": "1123公司"
}

运行结果为:

        名称     单价   数量      公司
0  lan lan  320.9  100  1123公司
1       牛啊  150.3   50  1123公司
2       滑稽    1.5  200  1123公司
序号 属性 描述
1 values 查看所有元素的值
2 dtypes 查看所有元素的类型
3 index 查看所有行名,重命名行名
4 columns 查看所有列名,重命名列名
5 T 行列数据转换
6 head 查看前N条数据,默认五条
7 tail 查看后N条数据,默认五条
8 shape 查看行数和列数shape[0]表示行,shape[1]表示列
9 info 查看索引,数据类型和内存信息

例子:

import pandas as pddata = [["lan lan", "bless", 520], ["牛啊", "no", 500], ["滑稽", "run", 480]]
columns = ['名称', '单价', '数量']
df = pd.DataFrame(data=data, columns=columns)
print("查看所有元素的值:\n", df.values)
print("查看所有元素的类型:\n", df.dtypes)
print("查看所有的行名称:\n", list(df.index))
df.index = [1, 2, 3]
print("查看所有的行名称:\n", list(df.index))
print("查看列索引:\n", list(df.columns))

行列数据的转换

import pandas as pddata = [["lan lan", "bless", 520], ["牛啊", "no", 500], ["滑稽", "run", 480]]
columns = ['名称', '单价', '数量']
df = pd.DataFrame(data=data, columns=columns)
# 规整格式
pd.set_option("display.unicode.east_asian_width",True)
new_df = df.T
print("查看前N条数据\n", df.head(1))
print("查看后N条数据\n", df.tail(1))
print("行", df.shape[0], "列", df.shape[1])
print("查看索引,数据类型,内存信息", df.info)

DataFrame的重要函数

函数 描述
describe() 查看每列的统计汇总信息,DataFrame类似
count() 返回每一列的非空值的个数
sum() 返回每一列的和,无法计算返回空值
max() 返回每一列的最大最大值
min() 返回每一列的最小值

举例:

import pandas as pddata = [["lan lan", "bless", 520], ["牛啊", "no", 500], ["滑稽", "run", 480]]
columns = ['名称', '单价', '数量']
df = pd.DataFrame(data=data, columns=columns)
print(df.describe())
print(df.count())
print(df.sum())
print(df.max())
print(df.min())

python -pandas学习笔记相关推荐

  1. python数据挖掘学习笔记】十.Pandas、Matplotlib、PCA绘图实用代码补充

    #2018-03-23 18:56:38 March Friday the 12 week, the 082 day SZ SSMR https://blog.csdn.net/eastmount/a ...

  2. python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析

    #2018-04-05 16:57:26 April Thursday the 14 week, the 095 day SZ SSMR python数据挖掘学习笔记]十九.鸢尾花数据集可视化.线性回 ...

  3. python数据挖掘学习笔记】十四.Scipy调用curve_fit实现曲线拟合

    #2018-03-28 10:02:08 March Wednesday the 13 week, the 087 day SZ SSMR python数据挖掘学习笔记]十四.Scipy调用curve ...

  4. Python数据挖掘学习笔记】九.回归模型LinearRegression简单分析氧化物数据

    #2018-03-23 16:26:20 March Friday the 12 week, the 082 day SZ SSMR [Python数据挖掘学习笔记]九.回归模型LinearRegre ...

  5. 深度学习常用python库学习笔记

    深度学习常用python库学习笔记 常用的4个库 一.Numpy库 1.数组的创建 (1)np.array() (2)np.zeros() (3)np.ones() (4)np.empty() (5) ...

  6. Machine Learning with Python Cookbook 学习笔记 第8章

    Chapter 8. Handling Images 前言 本笔记是针对人工智能典型算法的课程中Machine Learning with Python Cookbook的学习笔记 学习的实战代码都放 ...

  7. 莫烦Python NumpyPandas 学习笔记

    莫烦Python Numpy&Pandas 学习笔记 原文(视频)地址:https://www.bilibili.com/video/BV1Ex411L7oT 1. 安装 numpy官方网站: ...

  8. pandas学习笔记之DateFrame

    pandas学习笔记之DateFrame 文章目录 pandas学习笔记之DateFrame 1.DateFrame的创建 1)认识DataFrame对象 2)由二维列表创建(默认index和colu ...

  9. [Pandas 学习笔记] - No.1 pandas学习笔记

    pandas学习笔记 pandas是基于numpy开发出的数据分析包,用于高效地操作大型数据集.pandas的数据结构有三种 分别为 series,dataframe和panel,对应一维,二维,三维 ...

最新文章

  1. 记一次数组工具类 交集,去重
  2. ASP.NET Core Web 资源打包与压缩
  3. java8 util.time_Java8 java.util.Date转换为java.time.ZonedDateTime
  4. 基于JAVA+Servlet+JSP+MYSQL的校园门户信息管理系统
  5. Pytorch——DataLoader的学习笔记~
  6. 三星1万亿元重金下注,推动AI、5G、半导体等项目的研究
  7. 概率软逻辑(PSL,Probabilistic soft logic)通用(可处理中文)版本
  8. 如何将 Apple Watch 用作闹钟?
  9. 电脑硬盘坏道怎么检测,又如何修复图文教程
  10. android自定义sufaceview,Android自定义SurfaceView实现画板功能
  11. Spotfire 筛选器类型修改
  12. 七年切图仔如何面试大厂web前端?(沟通软技能总结) | 掘金技术征文
  13. python中sinxcosy_∫e^x[(1-cosy)dx-(y-siny)dy],其中c为区域 0≤x≤π,0≤y≤sinx的边界曲线取正向.求曲...
  14. puppet的使用:ERB模板
  15. 全景声制作软件 Spat Revolution 最新更新 v20.12
  16. OpenCV开发笔记(五十七):红胖子8分钟带你深入了解直方图反向投影(图文并茂+浅显易懂+程序源码)
  17. 合肥工业大学宣城校区计算机组成原理实验 单周期 CPU 设计与实现
  18. Java基于springboot+vue的眼镜销售购物商城系统 element 前后端分离
  19. SendFax过程分析
  20. 常说的OA系统、ERP系统、CRM系统是什么?

热门文章

  1. 美丽的英文诗句【2】
  2. 2008年经典龌龊语录(超爆笑)
  3. ROBOTOUS电容式六维力传感器
  4. 伤感QQ空间日志:痛在你离别之后
  5. Log4j输出CBE( common base event)格式
  6. 六月底的flag,生活要有仪式感
  7. 阿里easyexcel导出图片 图片路径失效excel写出空白或默认图片 导出多图片解决
  8. 阿里云数据读取做桑基图
  9. pyecharts桑基图制作遇到的问题
  10. 微信小程序-励志语录、图片,事件记录