DataFrame的单元格可以存放数值、字符串等,这和excel表很像。同时DataFrame可以设置列名columns与行名index,可以通过像matlab一样通过位置获取数据也可以通过列名和行名定位,比较像matlab里面的table格式。

下面将对DataFrame的基本操作进行梳理和介绍:(下文中用df代指DataFrame格式)

1 DataFrame的生成

方法1:直接生成df

df=pd.DataFrame([[1,2,3],[2,2,2],[3,3,3]],index=['a','b','c'], columns=['e','f','g'])

注意value录入要加上【value】

可以生成空的df,默认取值为nan

df=pd.DataFrame(value,index='',columns='')

方法2:字典转化为df

dic1={'name':['小明','小红','幽鬼','敌法'],'age':[17,20,5,40],'gender':['男','女','女','男']}

df=pd.DataFrame(dic1)

方法3:读取txt/excel文件时,输出的就是df格式

df = pd.read_excel(“file_name.xlsx”)

方法4:从矩阵A转化为df

df= pd.DataFrame.from_records(A,columns=name)

注:pd.DataFrame和pd.Series是两个不同的函数

2 获取行列名称、行高、列高

df.index 行名称

df.columns 列名称

df._info_axis_ 列名称

(bike1,bike2)=df.shape 行、列高度

len(df) 输出的是行高

df.index.size 行高

df.columns.size 列高

3 取行、列,切片操作

取单行后是一个Series,Series有index而无columns

'Series' object has no attribute 'columns'

df['x'] 取列名为'x'的列,格式为series

df[['x']] 取列名为'x'的列,格式为Dataframe

df[['w','z']] 取多列时需要用Dataframe的格式

df[df.columns[0:3]] 按照索引位置来取列,其实是分两步,先用索引取列名,再用列名取列

df.loc['A'] 取行名为'A'的行

df[0:2] 取索引对应的行

df.loc[:,['x','z'] ] #表示选取所有的行以及columns为x,z的列

df['name'].values 取列名为'name'的列的值(取出来的是array而不是series)取单行后是一个Series,Series有index而无columns,可以用name来获取单列的索引

df.head(4) 取头四行

df.tail(3) 取尾三行

df.iloc[1,1] 根据绝对索引来取值,所谓绝对索引即按照0,1,2这样的人眼顺序来进行排列的原始索引

df.iloc[0:3, [0,1]]

df.iloc[1] 绝对索引第一行

4 替换与删除

point_table.rename(columns={0:'point_key', 1:'point', 2:'count1', 3:'count2'}) #索引改名称

df[i]=x #x为常数,全替换;x为向量则要求与替换行/列长度一样

bus=np.where(x2 < 1.5) #np里相当于matlab里的find

df.values[bus]=1.66 * df.values[bus] #根据绝对位置进行部分值的替换

去除nan值:

df4 = pd.read_csv('4.csv', encoding='utf-8')

df4 = df4.dropna() #去除含有nan的行

# 可以通过axis参数来删除含有空数据的全部列

df4 = df4.dropna(axis=1)

df4 = df4 .drop(['工作饱和度'], axis=1) # 删除指定column的列

5 拼接与拆分

注意:

df.append 生成了新的对象

list.append 直接修改原对象

df.append()

纵向(上下)拼接和横向(左右)拼接:

axis=0为纵向拼接

concat([df1,df2]) 等价于 df1.append(df2)

在axis=1 时为横向拼接 ,此时有

concat([df1,df2],axis=1) 等价于 merge(df1,df2,left_index=True,right_index=True,how='outer')

如果要合并多个Dataframe,可以用list把几个Dataframe装起来,然后使用concat转化为一个新的Dataframe

df=pd.concat([train1, train2, train3, train4],axis=1,ignore_index=False)

拆分

df.groupby['columns_name']

6 计算

使用sum默认对每列求和,sum(1)为对每行求和

两个series可以直接进行加减乘除计算

7 排序

8 DataFrame在IDLE里的查看

pd.set_option('display.width', 200) # 横向最多显示多少个字符, 一般80不适合横向的屏幕,平时多用200.

pd.set_option('display.max_columns', 12)

pd.set_option('display.max_rows', 10) # 显示的最大行数和列数

pd.set_option('colheader_justify', 'left') 显示的单元格内容靠左边还是右边

9 多重索引

temp_df = temp_df.reset_index() 取消多重索引

10 插入行/列

train['工作饱和度'] = saturation_str # 增加一列

train.insert(4, '工作饱和度', saturation_str) # 插入一列

dataframe的head方法_pandas——Datafram的基本操作方法相关推荐

  1. dataframe 众数的方法_pandas 第11篇:DataFrame-数据处理(分组、聚合、窗口、相关、统计)...

    数据处理的目的是为了数据分析,下面分享常用的数据分析中会用到的函数. 一,分组和聚合 groupby用于对数据分组,分组之后可以直接调用聚合函数求值:agg()函数把分组和调用聚合函数集成到一个函数来 ...

  2. pandas 批量修改列名_pandas修改DataFrame列名的方法

    在做数据挖掘的时候,想改一个DataFrame的column名称,所以就查了一下,总结如下: 数据如下: >>>import pandas as pd >>>a = ...

  3. pythonpandas设置索引_pandas DataFrame的修改方法(值、列、索引)

    对于DataFrame的修改操作其实有很多,不单单是某个部分的值的修改,还有一些索引的修改.列名的修改,类型修改等等.我们仅选取部分进行介绍. 一.值的修改 DataFrame的修改方法,其实前面介绍 ...

  4. 用pandas.dataframe 的append()方法时候,合成的整个数据的索引是分块的

    当用pandas.dataframe 的append()方法时候,合成的整个数据的索引是分块的,比如all = A.append(B).append(c) 当all['type'][i]的时候,会得到 ...

  5. python print rdd_spark: RDD与DataFrame之间的相互转换方法

    DataFrame是一个组织成命名列的数据集.它在概念上等同于关系数据库中的表或R/Python中的数据框架,但其经过了优化.DataFrames可以从各种各样的源构建,例如:结构化数据文件,Hive ...

  6. Python pandas.DataFrame.combine_first函数方法的使用

    Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.Pandas提供了大量能使我们快速 ...

  7. Python pandas.DataFrame.tz_localize函数方法的使用

    Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.Pandas提供了大量能使我们快速 ...

  8. Python pandas.DataFrame.expanding函数方法的使用

    Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.Pandas提供了大量能使我们快速 ...

  9. 这或许是全网最全 Python dataframe 数据合并方法汇总

    有位朋友面试阿里的数据岗位,面试官问关于Python的5种数据合并的函数,结果他蒙蔽了'... 那么,究竟是哪五个呢?今天,我们就来带大家了解一下,喜欢记得收藏.关注.点赞. 注意:完整代码.资料.技 ...

最新文章

  1. 模式的秘密-观察者模式(四)
  2. 【Based Android】Android Sensor感应器介绍(二)线程中刷新UI 创建一个android测力计...
  3. Java中类、方法声明为静态的含义
  4. 第三方登录如何给前台返回token_如何设计优雅的第三方账号登录?
  5. php js 复选框选中,为每个选中的复选框显示相同的一组问题。 (PHP和JS / Jquery)...
  6. 【学习笔记】单例模式(枚举、校验锁、volatile、反射破坏)
  7. python程序结构框架_Python——Flask框架——程序的基本结构
  8. MySQL 优化 —— SQL优化概述(优化专题开篇词)
  9. win10 uwp 使用 msbuild 命令行编译 UWP 程序
  10. 8.在第7步的基础上为我们的程序添加负载均衡支持
  11. 手把手带你深入解析静态分派 动态分派原理 | 原力计划
  12. 学习日志---hbase学习(最大版本查询)
  13. Python 爬虫入门(二)—— IP代理使用
  14. num =10在c语言中是什么意思,num是什么词性
  15. Problem A: 小勇学分数
  16. 如何才能将企业现有的组织关系集成到jbpm中?
  17. OpenGL之建立三维坐标网格
  18. 使用计算机设备管理办法,计算机设备管理实施办法
  19. JavaScript 实例:当当网 点击展开效果
  20. 学习笔记:INA219电流采集方案实现

热门文章

  1. ThinkSNS电商版,电子商务社交的的福音
  2. 微信小程序string字符串转UTF-16,UTF-16转string字符转
  3. Python - 字符串编解码
  4. Excel中VLOOKUP函数单,多条件查找index与match
  5. C++ 文件读写相关函数
  6. 鸿蒙系统首批机型,首批支持鸿蒙系统的手机有哪些-华为鸿蒙系统支持机型全一览...
  7. 阿里巴巴推出企业诚信查询平台
  8. 你应该知道 装备克制!学会通过出装针对对面!
  9. Redis-使用Java代码操作Redis
  10. OV同门兄弟代表高通与联发科之争