pandas填补缺失值的方法
pandas填补缺失值的方法
在处理数据的过程中,经常会遇到原数据部分内容的缺失,为了保证我们最终数据统计结果的正确性,通常我们有两种处理方式,第一种就是删除掉这些部分缺失的数据;第二种就是填补这些缺失的数据。接下来,我们主要介绍填补缺失值的方法。
填充法
咱们所用到的数据:
import pandas as pd
import numpy as npplanets = pd.read_csv('planets.csv')
print(planets.head(10))
print(planets.notnull().nunique())#这里用来判断数据中是否存在为空,并且那些列存在为空的值
planets.fillna(value={'distance':planets['distance'].mean(),'mass':0,'orbital_period':0},inplace=True)
print("===============填充完毕=================")
print(planets.notnull().nunique())
好了,咱们先看一下运行结果:
接下来具体解释一下代码:
- 首先我们读取数据,然后使用head(10)获取数据的前十行数据
- notnull()方法是用来判断数据是否为空的,如果为空,返回False
- 接着跟着一个nunique() 这个方法是判断有多少不同的值。我的思路就是先通过notnull方法将空值和非空值分别使用False和True来表示,再使用nunique方法判断存在几种值。若该数为2,则代表该列中存在空值。反之若为1,则不存在空值。
- fillna(value={‘columns’:value},inplace=True) 这个方法是用来填充空值的。value这个参数需要传入字典型数据。若数据中有两列需要填补空值的,则需要写上两列的列名和需要填补的值。通常情况我们会使用mean()方法填入均值。
- 接着我们再使用3中的两个方法进行判断我们是否填值成功。
使用的planets数据链接:
planets数据下载链接
pandas填补缺失值的方法相关推荐
- pandas之离散化数据处理get_dummies以及填补缺失值的方法
文章目录 介绍 实例 用途 拓展 正态分布拟合 随机森林 介绍 pandas.get_dummies(data,prefix=None, prefix_sep='_', dummy_na=False, ...
- 利用随机森林填补缺失值
利用随机森林填补缺失值 介绍 利用随机森林填补缺失值 介绍 说到缺失值,我想各位在进行数据分析之前或多或少都是会遇到的.在做有关机器学习的项目的时候,出题人都是会给你一个好几万好几十万的数据,可能会出 ...
- pandas dataframe缺失值(np.nan)处理:识别缺失情况、删除、0值填补、均值填补、中位数填补、加缺失标签、插值填充详解及实例
pandas dataframe缺失值(np.nan)处理:识别缺失情况.删除.0值填补.均值填补.中位数填补.加缺失标签.插值填充详解及实例 isnull().natna().isna().fill ...
- 数据预处理+缺失值处理方案+Missing Value+pandas+缺失值填充方法、方案
数据预处理+缺失值处理方案+Missing Value+pandas+缺失值填充方法.方案 缺失值+sklearn from sklearn.preprocessing import Imputer ...
- python查询缺失值所在位置_Python Pandas找到缺失值的位置方法
问题描述: python pandas判断缺失值一般采用 isnull(),然而生成的却是所有数据的true/false矩阵,对于庞大的数据dataframe,很难一眼看出来哪个数据缺失,一共有多少个 ...
- pandas用众数填充缺失值_缺而不失——pandas中常见缺失值处理方法
缺失值的处理是一件艺术活,最高的境界应该是缺而不失.pandas中提供了非常丰富的工具来对缺失值进行处理.这里主要是对常用方法的简要介绍. 注:不同地区和软件对缺失值的表示方法不同,在用pandas读 ...
- em模型补缺失值_如何填补缺失值?看SPSS提供的简单方法
数据有缺失是常见的问题,如果是大数据集,在缺失比例较小(如10%以下)的情况下,可以考虑直接剔除,但如果本身是个小数据集,就不能轻易地做删除处理. 建议采用缺失值填补技术来解决. 在SPSS中,有两个 ...
- 【机器学习】机器学习中缺失值处理方法大全(附代码)
今天我们来看看数据预处理中一个有趣的问题:数据清理中,如何处理缺失值.在我们探讨问题之前,我们一起回顾一些基本术语,帮助我们了解为什么需要关注缺失值. 目录 数据清洗简介 填补缺失值的重要性 缺失值导 ...
- 五、实例:在波士顿房价数据集上用随机森林回归填补缺失值
在波士顿房价数据集上用随机森林回归填补缺失值 点击标题即可获取源代码和笔记 一.引入 我们从现实中收集的数据,几乎不可能是完美无缺的,往往都会有一些缺失值.面对缺失值,很多人选择的方式是直接将含有缺失 ...
最新文章
- vue从后台获取新数据后刷新_vue项目中实现定时刷新页面(重新渲染数据实时更新)...
- fiddler使用_fiddler基础使用
- Android之自定义一个环形进度控件
- 2006关注IT技术
- 基于OpenCV平滑图像
- 房地产萧条的两个标志
- annotation java log_使用java注释来注入logger依赖关系
- python位置参数ppt_如何在Python中使用一个或多个相同的位置参数?
- “CV_RGB2BGR”: 未声明的标识符
- MSComm写串口通信驱动步骤
- java随机姓名_Java随机产生中文昵称
- 基于JAVA+SpringBoot+Mybatis+MYSQL的中小型超市进销存管理系统
- 多按键多界面二维数组表驱动设计
- html实现视频录制,保存和回放
- 用*打印一个长方形.
- Html设置超链接文字颜色
- html网页右侧悬浮代码,html悬浮窗口代码
- Idea gitflow使用中常见问题及解决方法
- Android实现SSH Client
- java多线程与并发原理
热门文章
- java getdocument_Java Element.getDocument方法代码示例
- excel 筛选 Visio如何锁定形状 取消虚线
- 记一次安卓app上线应用宝
- Mac OS安装 apktool工具包
- Linux生态之深度学习环境
- 击鼓传花击鼓次数相同c语言,击鼓传花游戏规则以及惩罚方法大全-七维卓越拓展...
- 卓豪ITOM产品2021年回顾:网络管理功能的迭代进化之路
- python中[x是什么意思_python中x[::]什么意思
- python爬取考研成绩什么时候出来_用Python爬取了考研吧1000条帖子,原来他们都在讨论这些...
- 几款市面上的网管软件比较