pandas填补缺失值的方法

在处理数据的过程中,经常会遇到原数据部分内容的缺失,为了保证我们最终数据统计结果的正确性,通常我们有两种处理方式,第一种就是删除掉这些部分缺失的数据;第二种就是填补这些缺失的数据。接下来,我们主要介绍填补缺失值的方法。

填充法

咱们所用到的数据:

import pandas as pd
import numpy as npplanets = pd.read_csv('planets.csv')
print(planets.head(10))
print(planets.notnull().nunique())#这里用来判断数据中是否存在为空,并且那些列存在为空的值
planets.fillna(value={'distance':planets['distance'].mean(),'mass':0,'orbital_period':0},inplace=True)
print("===============填充完毕=================")
print(planets.notnull().nunique())

好了,咱们先看一下运行结果:

接下来具体解释一下代码:

  1. 首先我们读取数据,然后使用head(10)获取数据的前十行数据
  2. notnull()方法是用来判断数据是否为空的,如果为空,返回False
  3. 接着跟着一个nunique() 这个方法是判断有多少不同的值。我的思路就是先通过notnull方法将空值和非空值分别使用False和True来表示,再使用nunique方法判断存在几种值。若该数为2,则代表该列中存在空值。反之若为1,则不存在空值。
  4. fillna(value={‘columns’:value},inplace=True) 这个方法是用来填充空值的。value这个参数需要传入字典型数据。若数据中有两列需要填补空值的,则需要写上两列的列名和需要填补的值。通常情况我们会使用mean()方法填入均值。
  5. 接着我们再使用3中的两个方法进行判断我们是否填值成功。

使用的planets数据链接:

planets数据下载链接

pandas填补缺失值的方法相关推荐

  1. pandas之离散化数据处理get_dummies以及填补缺失值的方法

    文章目录 介绍 实例 用途 拓展 正态分布拟合 随机森林 介绍 pandas.get_dummies(data,prefix=None, prefix_sep='_', dummy_na=False, ...

  2. 利用随机森林填补缺失值

    利用随机森林填补缺失值 介绍 利用随机森林填补缺失值 介绍 说到缺失值,我想各位在进行数据分析之前或多或少都是会遇到的.在做有关机器学习的项目的时候,出题人都是会给你一个好几万好几十万的数据,可能会出 ...

  3. pandas dataframe缺失值(np.nan)处理:识别缺失情况、删除、0值填补、均值填补、中位数填补、加缺失标签、插值填充详解及实例

    pandas dataframe缺失值(np.nan)处理:识别缺失情况.删除.0值填补.均值填补.中位数填补.加缺失标签.插值填充详解及实例 isnull().natna().isna().fill ...

  4. 数据预处理+缺失值处理方案+Missing Value+pandas+缺失值填充方法、方案

    数据预处理+缺失值处理方案+Missing Value+pandas+缺失值填充方法.方案 缺失值+sklearn from sklearn.preprocessing import Imputer ...

  5. python查询缺失值所在位置_Python Pandas找到缺失值的位置方法

    问题描述: python pandas判断缺失值一般采用 isnull(),然而生成的却是所有数据的true/false矩阵,对于庞大的数据dataframe,很难一眼看出来哪个数据缺失,一共有多少个 ...

  6. pandas用众数填充缺失值_缺而不失——pandas中常见缺失值处理方法

    缺失值的处理是一件艺术活,最高的境界应该是缺而不失.pandas中提供了非常丰富的工具来对缺失值进行处理.这里主要是对常用方法的简要介绍. 注:不同地区和软件对缺失值的表示方法不同,在用pandas读 ...

  7. em模型补缺失值_如何填补缺失值?看SPSS提供的简单方法

    数据有缺失是常见的问题,如果是大数据集,在缺失比例较小(如10%以下)的情况下,可以考虑直接剔除,但如果本身是个小数据集,就不能轻易地做删除处理. 建议采用缺失值填补技术来解决. 在SPSS中,有两个 ...

  8. 【机器学习】机器学习中缺失值处理方法大全(附代码)

    今天我们来看看数据预处理中一个有趣的问题:数据清理中,如何处理缺失值.在我们探讨问题之前,我们一起回顾一些基本术语,帮助我们了解为什么需要关注缺失值. 目录 数据清洗简介 填补缺失值的重要性 缺失值导 ...

  9. 五、实例:在波士顿房价数据集上用随机森林回归填补缺失值

    在波士顿房价数据集上用随机森林回归填补缺失值 点击标题即可获取源代码和笔记 一.引入 我们从现实中收集的数据,几乎不可能是完美无缺的,往往都会有一些缺失值.面对缺失值,很多人选择的方式是直接将含有缺失 ...

最新文章

  1. vue从后台获取新数据后刷新_vue项目中实现定时刷新页面(重新渲染数据实时更新)...
  2. fiddler使用_fiddler基础使用
  3. Android之自定义一个环形进度控件
  4. 2006关注IT技术
  5. 基于OpenCV平滑图像
  6. 房地产萧条的两个标志
  7. annotation java log_使用java注释来注入logger依赖关系
  8. python位置参数ppt_如何在Python中使用一个或多个相同的位置参数?
  9. “CV_RGB2BGR”: 未声明的标识符
  10. MSComm写串口通信驱动步骤
  11. java随机姓名_Java随机产生中文昵称
  12. 基于JAVA+SpringBoot+Mybatis+MYSQL的中小型超市进销存管理系统
  13. 多按键多界面二维数组表驱动设计
  14. html实现视频录制,保存和回放
  15. 用*打印一个长方形.
  16. Html设置超链接文字颜色
  17. html网页右侧悬浮代码,html悬浮窗口代码
  18. Idea gitflow使用中常见问题及解决方法
  19. Android实现SSH Client
  20. java多线程与并发原理

热门文章

  1. java getdocument_Java Element.getDocument方法代码示例
  2. excel 筛选 Visio如何锁定形状 取消虚线
  3. 记一次安卓app上线应用宝
  4. Mac OS安装 apktool工具包
  5. Linux生态之深度学习环境
  6. 击鼓传花击鼓次数相同c语言,击鼓传花游戏规则以及惩罚方法大全-七维卓越拓展...
  7. 卓豪ITOM产品2021年回顾:网络管理功能的迭代进化之路
  8. python中[x是什么意思_python中x[::]什么意思
  9. python爬取考研成绩什么时候出来_用Python爬取了考研吧1000条帖子,原来他们都在讨论这些...
  10. 几款市面上的网管软件比较