dataframe的head方法_pandas——Datafram的基本操作方法
DataFrame的单元格可以存放数值、字符串等,这和excel表很像。同时DataFrame可以设置列名columns与行名index,可以通过像matlab一样通过位置获取数据也可以通过列名和行名定位,比较像matlab里面的table格式。
下面将对DataFrame的基本操作进行梳理和介绍:(下文中用df代指DataFrame格式)
1 DataFrame的生成
方法1:直接生成df
df=pd.DataFrame([[1,2,3],[2,2,2],[3,3,3]],index=['a','b','c'], columns=['e','f','g'])
注意value录入要加上【value】
可以生成空的df,默认取值为nan
df=pd.DataFrame(value,index='',columns='')
方法2:字典转化为df
dic1={'name':['小明','小红','幽鬼','敌法'],'age':[17,20,5,40],'gender':['男','女','女','男']}
df=pd.DataFrame(dic1)
方法3:读取txt/excel文件时,输出的就是df格式
df = pd.read_excel(“file_name.xlsx”)
方法4:从矩阵A转化为df
df= pd.DataFrame.from_records(A,columns=name)
注:pd.DataFrame和pd.Series是两个不同的函数
2 获取行列名称、行高、列高
df.index 行名称
df.columns 列名称
df._info_axis_ 列名称
(bike1,bike2)=df.shape 行、列高度
len(df) 输出的是行高
df.index.size 行高
df.columns.size 列高
3 取行、列,切片操作
取单行后是一个Series,Series有index而无columns
'Series' object has no attribute 'columns'
df['x'] 取列名为'x'的列,格式为series
df[['x']] 取列名为'x'的列,格式为Dataframe
df[['w','z']] 取多列时需要用Dataframe的格式
df[df.columns[0:3]] 按照索引位置来取列,其实是分两步,先用索引取列名,再用列名取列
df.loc['A'] 取行名为'A'的行
df[0:2] 取索引对应的行
df.loc[:,['x','z'] ] #表示选取所有的行以及columns为x,z的列
df['name'].values 取列名为'name'的列的值(取出来的是array而不是series)取单行后是一个Series,Series有index而无columns,可以用name来获取单列的索引
df.head(4) 取头四行
df.tail(3) 取尾三行
df.iloc[1,1] 根据绝对索引来取值,所谓绝对索引即按照0,1,2这样的人眼顺序来进行排列的原始索引
df.iloc[0:3, [0,1]]
df.iloc[1] 绝对索引第一行
4 替换与删除
point_table.rename(columns={0:'point_key', 1:'point', 2:'count1', 3:'count2'}) #索引改名称
df[i]=x #x为常数,全替换;x为向量则要求与替换行/列长度一样
bus=np.where(x2 < 1.5) #np里相当于matlab里的find
df.values[bus]=1.66 * df.values[bus] #根据绝对位置进行部分值的替换
去除nan值:
df4 = pd.read_csv('4.csv', encoding='utf-8')
df4 = df4.dropna() #去除含有nan的行
# 可以通过axis参数来删除含有空数据的全部列
df4 = df4.dropna(axis=1)
df4 = df4 .drop(['工作饱和度'], axis=1) # 删除指定column的列
5 拼接与拆分
注意:
df.append 生成了新的对象
list.append 直接修改原对象
df.append()
纵向(上下)拼接和横向(左右)拼接:
axis=0为纵向拼接
concat([df1,df2]) 等价于 df1.append(df2)
在axis=1 时为横向拼接 ,此时有
concat([df1,df2],axis=1) 等价于 merge(df1,df2,left_index=True,right_index=True,how='outer')
如果要合并多个Dataframe,可以用list把几个Dataframe装起来,然后使用concat转化为一个新的Dataframe
df=pd.concat([train1, train2, train3, train4],axis=1,ignore_index=False)
拆分
df.groupby['columns_name']
6 计算
使用sum默认对每列求和,sum(1)为对每行求和
两个series可以直接进行加减乘除计算
7 排序
8 DataFrame在IDLE里的查看
pd.set_option('display.width', 200) # 横向最多显示多少个字符, 一般80不适合横向的屏幕,平时多用200.
pd.set_option('display.max_columns', 12)
pd.set_option('display.max_rows', 10) # 显示的最大行数和列数
pd.set_option('colheader_justify', 'left') 显示的单元格内容靠左边还是右边
9 多重索引
temp_df = temp_df.reset_index() 取消多重索引
10 插入行/列
train['工作饱和度'] = saturation_str # 增加一列
train.insert(4, '工作饱和度', saturation_str) # 插入一列
dataframe的head方法_pandas——Datafram的基本操作方法相关推荐
- dataframe 众数的方法_pandas 第11篇:DataFrame-数据处理(分组、聚合、窗口、相关、统计)...
数据处理的目的是为了数据分析,下面分享常用的数据分析中会用到的函数. 一,分组和聚合 groupby用于对数据分组,分组之后可以直接调用聚合函数求值:agg()函数把分组和调用聚合函数集成到一个函数来 ...
- pandas 批量修改列名_pandas修改DataFrame列名的方法
在做数据挖掘的时候,想改一个DataFrame的column名称,所以就查了一下,总结如下: 数据如下: >>>import pandas as pd >>>a = ...
- pythonpandas设置索引_pandas DataFrame的修改方法(值、列、索引)
对于DataFrame的修改操作其实有很多,不单单是某个部分的值的修改,还有一些索引的修改.列名的修改,类型修改等等.我们仅选取部分进行介绍. 一.值的修改 DataFrame的修改方法,其实前面介绍 ...
- 用pandas.dataframe 的append()方法时候,合成的整个数据的索引是分块的
当用pandas.dataframe 的append()方法时候,合成的整个数据的索引是分块的,比如all = A.append(B).append(c) 当all['type'][i]的时候,会得到 ...
- python print rdd_spark: RDD与DataFrame之间的相互转换方法
DataFrame是一个组织成命名列的数据集.它在概念上等同于关系数据库中的表或R/Python中的数据框架,但其经过了优化.DataFrames可以从各种各样的源构建,例如:结构化数据文件,Hive ...
- Python pandas.DataFrame.combine_first函数方法的使用
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.Pandas提供了大量能使我们快速 ...
- Python pandas.DataFrame.tz_localize函数方法的使用
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.Pandas提供了大量能使我们快速 ...
- Python pandas.DataFrame.expanding函数方法的使用
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.Pandas提供了大量能使我们快速 ...
- 这或许是全网最全 Python dataframe 数据合并方法汇总
有位朋友面试阿里的数据岗位,面试官问关于Python的5种数据合并的函数,结果他蒙蔽了'... 那么,究竟是哪五个呢?今天,我们就来带大家了解一下,喜欢记得收藏.关注.点赞. 注意:完整代码.资料.技 ...
最新文章
- 模式的秘密-观察者模式(四)
- 【Based Android】Android Sensor感应器介绍(二)线程中刷新UI 创建一个android测力计...
- Java中类、方法声明为静态的含义
- 第三方登录如何给前台返回token_如何设计优雅的第三方账号登录?
- php js 复选框选中,为每个选中的复选框显示相同的一组问题。 (PHP和JS / Jquery)...
- 【学习笔记】单例模式(枚举、校验锁、volatile、反射破坏)
- python程序结构框架_Python——Flask框架——程序的基本结构
- MySQL 优化 —— SQL优化概述(优化专题开篇词)
- win10 uwp 使用 msbuild 命令行编译 UWP 程序
- 8.在第7步的基础上为我们的程序添加负载均衡支持
- 手把手带你深入解析静态分派 动态分派原理 | 原力计划
- 学习日志---hbase学习(最大版本查询)
- Python 爬虫入门(二)—— IP代理使用
- num =10在c语言中是什么意思,num是什么词性
- Problem A: 小勇学分数
- 如何才能将企业现有的组织关系集成到jbpm中?
- OpenGL之建立三维坐标网格
- 使用计算机设备管理办法,计算机设备管理实施办法
- JavaScript 实例:当当网 点击展开效果
- 学习笔记:INA219电流采集方案实现