本文概述

如果你的数据集包含空值, 则可以使用dropna()函数分析并删除数据集中的行/列。

句法

DataFrameName.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

参数

轴:{0或’index’, 1或’columns’}, 默认值0

它采用int或字符串值作为行/列。输入可以是0和1(整数和索引), 也可以是列(字符串)。

0或”索引”:删除包含缺失值的行。

1或”列”:删除包含缺失值的列。

怎么样 :

当我们有至少一个不适用或所有不适用时, 它确定是否从DataFrame中删除行或列。

它只接受两种字符串值(” any”或” all”)。

any:如果任何值为null, 则删除行/列。

all:仅在所有值均为null时丢弃。

脱粒:

它采用整数值, 该值定义要减少的最小NA值量。

子集:

它是一个数组, 将删除过程限制为通过列表传递的行/列。

到位:

它返回一个布尔值, 如果它为True, 则会在数据帧本身中进行更改。

Return

它返回删除了NA条目的DataFrame。

对于演示, 首先, 我们获取一个csv文件, 该文件将从数据集中删除任何列。

import pandas as pd

aa = pd.read_csv("aa.csv")

aa.head()

输出

Name

Hire Date

Salary

Leaves Remaining

0 John Idle03/15/14

50000.0

10

1 Smith Gilliam

06/01/15

65000.0

8

2 Parker Chapman

05/12/14

45000.0

10

3 Jones Palin

11/01/13

70000.0

3

4 Terry Gilliam

08/12/14

48000.0

7

5 Michael Palin

05/23/13

66000.0

8

代码

# importing pandas module

import pandas as pd

# making data frame from csv file

info = pd.read_csv("aa.csv")

# making a copy of old data frame

copy = pd.read_csv("aa.csv")

# creating value with all null values in new data frame

copy["Null Column"]= None

# checking if column is inserted properly

print(info.columns.values, "\n", copy.columns.values)

# comparing values before dropping null column

print("\nColumn number before dropping Null column\n", len(info.dtypes), len(copy.dtypes))

# dropping column with all null values

copy.dropna(axis = 1, how ='all', inplace = True)

# comparing values after dropping null column

print("\nColumn number after dropping Null column\n", len(info.dtypes), len(info.dtypes))

输出

['NameHire DateSalaryLeaves Remaining']

['NameHire DateSalaryLeaves Remaining'

'Null Column']

Column number before dropping Null column

1 2

Column number after dropping Null column

1 1

上面的代码从数据集中删除了null列, 并返回了一个新的DataFrame。

python的dropna函数_Pandas DataFrame.dropna()用法相关推荐

  1. python replace函数_Pandas DataFrame.replace()用法

    本文概述 Pandas replace()是一个非常丰富的函数, 用于从DataFrame替换字符串, 正则表达式, 字典, 列表和序列. DataFrame的值可以动态替换为其他值.它能够使用Pyt ...

  2. python cut函数_Pandas DataFrame.cut()用法例子

    本文概述 当需要将数据值分段并将其分类到bin中时, 将调用cut()方法.它用于将连续变量转换为分类变量.它还可以将元素数组分离到单独的容器中.该方法仅适用于一维数组状对象. 如果我们有大量标量数据 ...

  3. python中fillna函数_Pandas DataFrame.fillna()例子

    本文概述 我们可以使用fillna()函数填充数据集中的空值. 句法 DataFrame.fillna(value=None, method=None, axis=None, inplace=Fals ...

  4. python中shift函数_pandas DataFrame.shift()函数

    pandas DataFrame.shift()函数可以把数据移动指定的位数 period参数指定移动的步幅,可以为正为负.axis指定移动的轴,1为行,0为列. eg: 有这样一个DataFrame ...

  5. pandas使用dropna函数删除dataframe中全是缺失值的数据列(drop columns with all missing values in dataframe)

    pandas使用dropna函数删除dataframe中全是缺失值的数据列(drop columns with all missing values in dataframe) 目录

  6. pandas使用dropna函数删除dataframe中列非缺失值的个数小于某一阈值的数据列

    pandas使用dropna函数删除dataframe中列非缺失值的个数小于某一阈值的数据列(drop columns with non missing values less than a thre ...

  7. pandas使用dropna函数删除dataframe中所有包含缺失值的数据行(drop rows which contain missing vlaues in dataframe)

    pandas使用dropna函数删除dataframe中所有包含缺失值的数据行(drop rows which contain missing vlaues in dataframe) 目录

  8. pandas使用dropna函数删除dataframe中列非缺失值的个数小于某一比例阈值的数据列

    pandas使用dropna函数删除dataframe中列非缺失值的个数小于某一比例阈值的数据列(drop columns with non missing values less than a pr ...

  9. pandas使用dropna函数删除dataframe数据中指定数据列的内容为缺失值的数据行(使用subset参数指定数据列)

    pandas使用dropna函数删除dataframe数据中指定数据列的内容为缺失值的数据行(使用subset参数指定数据列) 目录

最新文章

  1. dedecms首页搜索 添加仿百度下拉框
  2. WPF DatePicker默认显示当前日期,格式化为年月日(转)
  3. python(numpy,pandas1)——numpy(ndim,shape,size,zero, empty, arange, linspace)
  4. java zip malformed_关于Java解压文件的一些坑及经验分享(MALFORMED异常)
  5. VTK:几何对象之QuadraticTetra
  6. hdu4565之矩阵快速幂
  7. ADO得到字段名的代码
  8. 如何设置tomcat的默认应用。
  9. Linux下Socket编程的端口问题( Bind error: Address already in use )
  10. 技术出身要创业,容易吗?
  11. 腾讯QQ浏览器 10.0.932.400 正式版
  12. Java实战之管家婆记账系统(19)——报告界面及功能实现
  13. 前端预览pdf文件流
  14. 2019上半年软件设计师考试体会
  15. 2017283421俞烨炜
  16. AHC(AsyncHttpClient)文件描述符泄漏
  17. 推荐一位大神,手握 GitHub 16000 star
  18. Win10深色模式和白天模式设置
  19. 不会PS图片怎么批量调色
  20. 【单片机】心形流水灯の制作指南(保姆级)

热门文章

  1. [notice] child pid 13990 exit signalSegmentation fault (11) 解决办法
  2. Java学习笔记之键盘输入数组
  3. 网络攻击损失不容小觑
  4. 操作系统_多级反馈队列调度算法
  5. mysql期末考试试卷_MySQL数据库测试题
  6. Swagger UI汉化
  7. 开源 LLM (大语言模型)整理(一)
  8. 7-外部中断事件控制器(EXTI)
  9. 「预约挂号小程序」为什么预约支付存在6‰的手续费?
  10. 海量视频监控数据存储和管理是大数据最重要的命题