目录

  • SimpleImputer
  • 参数
    • missing_values
    • strategy
    • fill_value
    • copy
  • 属性
    • statistics_
    • indicator_
    • n_features_in_
    • feature_names_in_
  • 方法
    • fit(X[, y])
    • fit_transform(X[, y])
    • get_feature_names_out([input_features])
    • get_params([deep])
    • inverse_transform(X)
    • set_params(**params)
    • transform(X)

SimpleImputer

sklearn.impute.SimpleImputer(*, missing_values=nan, strategy='mean', fill_value=None, verbose='deprecated', copy=True, add_indicator=False)

通过简单的方法对缺失值进行补充

沿着每一列通过给定的策略(均值、中位数、众数)或定值对缺失值进行补充

参数

missing_values

int, float, str, np.nan, None or pandas.NA, default=np.nan
缺失值的占位符,数据中所有的值为missing_values的空缺值将会被填充

strategy

str, default=’mean’

缺失值填补策略 填补缺失值的数值
mean 每一列的均值
median 每一列的中位数(只能用于数值型数据)
most_frequent 每一列的众数(可用于数值型或字符串型数据)
constant 给定值fill_value

fill_value

str or numerical value, default=None
当参数strategy='constant'时,将使用fill_value替换所有缺失值
当该参数为default时,填补缺失值的时候,对于数值型数据将填补为0,对于字符串型或对象型数据将被填补为‘missing_value’

copy

bool, default=True

属性

statistics_

array of shape (n_features,)
每个特征的缺失填补值

The imputation fill value for each feature

indicator_

MissingIndicator
为缺失数值添加二元指标使用到的指标

Indicator used to add binary indicators for missing values.

n_features_in_

int
拟合过程中的特征数量

feature_names_in_

ndarray of shape (n_features_in_,)
拟合过程中的特征名称

方法

fit(X[, y])

拟合数据

Fit the imputer on X.

fit_transform(X[, y])

拟合数据并将其进行转换

Fit to data, then transform it.

get_feature_names_out([input_features])

返回输出特征名称

Get output feature names for transformation.

get_params([deep])

返回模型参数

Get parameters for this estimator.

inverse_transform(X)

还原数据

Convert the data back to the original representation.

set_params(**params)

设置模型参数

Set the parameters of this estimator.

transform(X)

填补缺失值

Impute all missing values in X

缺失值补充--SimpleImputer相关推荐

  1. pandas数据清洗(缺失值、异常值和重复值处理)

    1. 缺失值处理 处理方式: 直接删除 填充缺失值 真值转换法 不处理  ( 数据分析和建模应用中很多模型对于缺失值有容忍度或灵活的处理方法,因此在预处理阶段可以不做处理.常见的能够自动处理缺失值的模 ...

  2. sklearn与pandas的缺失值处理

    housing数据集中的total_bedrooms有部分缺失,对于缺失值,通常我们有以下几种方式处理: 放弃有缺失值的样本 放弃整个特征 将缺失值设置为某个默认值:0.平均值.中位数等. panda ...

  3. 特征工程-使用随机森林进行缺失值填补

    特征工程-使用随机森林进行缺失值填补 一.前言 特征工程在传统的机器学习中是非常重要的一个步骤,我们对机器学习算法的优化通常是有限的.如果在完成任务时发现不管怎么优化算法得到的结果都不满意,这个时候就 ...

  4. 精心整理出来的几种缺失值处理方法

    缺失值补充 造成属性值缺失的原因有很多,比如信息暂时无法获取,信息被遗漏(有机械原因也有人为原因),有些对象的某个或者某些属性是不可用的,有些信息被认为是不重要的,获取这些信息的代价太大,系统实时性能 ...

  5. 机器学习系列(3)_特征工程01数据预处理

    参考链接: 1.scikit-learn官网 2.sklearn提供的自带的数据集 3.Kaggle官网 4.数据挖掘--无量纲化 文章目录 一.数据中台 二.sklearn中的数据预处理与特征工程 ...

  6. 带你入门Python数据挖掘与机器学习(附代码、实例)

    作者:韦玮 来源:Python爱好者社区 本文共7800字,建议阅读10+分钟. 本文结合代码实例待你上手python数据挖掘和机器学习技术. 本文包含了五个知识点: 1. 数据挖掘与机器学习技术简介 ...

  7. XGBoost参数调优完全指南(附Python代码)——转载

    转载自https://www.cnblogs.com/mfryf/p/6293814.html 译注:文内提供的代码和运行结果有一定差异,可以从这里下载完整代码对照参考.另外,我自己跟着教程做的时候, ...

  8. python xgboost参数_如何对XGBoost模型进行参数调优

    匿名用户 1级 2017-01-19 回答 XGBoost参数调优完全指南(附Python代码) 译注:文内提供的代码和运行结果有一定差异,可以从这里下载完整代码对照参考.另外,我自己跟着教程做的时候 ...

  9. svm多分类代码_跟我一起机器学习系列文章知识点与代码索引目录,持续更新…...

    <跟我一起机器学习> 系列文章知识点与代码索引目录 0 环境配置 如何才能入门机器学习? 优雅的安装和使用Anaconda 使用Conda来进行环境的创建与管理 Pycharm安装与使用 ...

最新文章

  1. 什么是第三方物流管理?如何套用模板进行绘制
  2. android自定义布局的使用!
  3. Java 技术篇-java连接并操作数据库实例演示,执行查询、插入、更新和删除操作
  4. ubuntu下查看caj文件
  5. linux 无密码登录另一台服务器,ECS Linux服务器ssh免密码登录另外一台服务器的具体设置...
  6. c语言可循环计算器代码,可编程简易计算器(代码)
  7. 曾国藩36字诀,改变你的人生
  8. 面试题(用栈代替队列的操作和原生map实现)
  9. iis属于中间件吗_今天设计一套高可用高并发、海量存储可伸缩的消息中间件生产架构...
  10. STRUTS学习笔记
  11. Matlab关键规则挖掘尿片啤酒,电商数据挖掘之关联算法(一):“啤酒+尿布”的关联规则是怎么来的...
  12. .NET-3.Xamarin学习与总结
  13. 矩阵Jordan标准型过渡矩阵的求解
  14. jquery实现div的隐藏和显示和点击空白显示隐藏
  15. Java实现生成数据库表结构文档(生成工具screw的使用)
  16. pytorch 数据加载和处理
  17. WPF发布程序后未授予信任的解决办法
  18. [李景山php]每天TP5-20170203|thinkphp5-Request.php-6
  19. but GITEE.COM does not provide shell access
  20. 完美主义导致的性格问题简述以及解决办法

热门文章

  1. pointnet 结果可视化_pointNet代码
  2. 华为首发鸿蒙手机,华为首发鸿蒙手机亮相,麒麟9000+55W快充+120Hz,依旧一机难求...
  3. react--模板字符串的应用
  4. Android 打开手机QQ,实现类似于客服功能
  5. 100句关于生命的名人名言
  6. ESP8266 Deep-Sleep 模式下的唤醒方式
  7. 愿来到我博客的朋友一生温暖纯良,不舍爱与自由。
  8. codevs 3290 华容道
  9. 【项目三、车牌检测+识别项目】一、CCPD车牌数据集转为YOLOv5格式和LPRNet格式
  10. PRML 02 Introduction:贝叶斯概率