归一化处理

特点:通过对原始数据进行变换把数据映射到(默认为[0,1])之间

from sklearn.preprocessing import MinMaxScaler
def mm():"""归一化处理:return: NOne"""mm = MinMaxScaler(feature_range=(2,3))data = mm.fit_transform([[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 13, 46]])print(data)return None
if __name__ == "__main__":mm()

运行结果:

D:\softwares\anaconda3\python.exe D:/PycharmProjects/MyTest/Day_0707/__init__.py
[[3.         2.         2.         2.        ][2.         3.         3.         2.83333333][2.5        2.5        2.6        3.        ]]Process finished with exit code 0

归一化目的:使得一个特征对结果不会造成更大的影响。
归一化缺点:注意在特定场景下最大最小值是变化的,最大最小值容易受异常点影响,鲁棒性差,只适合传统精确小数据场景。

标准化

1、特点:通过对原始数据进行变换把数据变换到均值为0,方差为1范围内

对于归一化来说:如果出现异常点,影响了最大值和最小值,那么结果显然
会发生改变

对于标准化来说:如果出现异常点,由于具有一定数据量,少量的异常点对
于平均值的影响并不大,从而方差改变较小。

from sklearn.preprocessing import StandardScaler
def stand():"""标准化缩放:return:"""std = StandardScaler()data = std.fit_transform([[ 1., -1., 3.],[ 2., 4., 2.],[ 4., 6., -1.]])print(data)return None
if __name__ == "__main__":stand()

运行结果

D:\softwares\anaconda3\python.exe D:/PycharmProjects/MyTest/Day_0707/__init__.py
[[-1.06904497 -1.35873244  0.98058068][-0.26726124  0.33968311  0.39223227][ 1.33630621  1.01904933 -1.37281295]]Process finished with exit code 0

【机器学习】sklearn数据特征预处理:归一化和标准化相关推荐

  1. 特征工程特征预处理归一化与标准化、鸢尾花种类预测代码实现

    一.特征预处理 特征工程目的:把数据转换成机器更容易识别的数据 scikit-learn:提供几个常见的实用程序函数和转换器类,以将原始特征向量更改为更适合下游估计器的表示形式.即通过一些转换函数将特 ...

  2. 机器学习-3.数据特征预处理与数据降维

    特征预处理定义:通过特定的统计方法(数学方法)将数据转换成算法要求的数据. 处理方法 数值型数据:标准缩放(1.归一化,2.标准化):缺失值. 类别型数据:one-hot编码. 时间类型:时间的切分. ...

  3. 机器学习之数据预处理——归一化,标准化

    机器学习之数据预处理--归一化,标准化 基础知识 1.什么是特征预处理 2.预处理方法 : 3.预处理API: 数据的标准化(normalization)和归一化 数据的标准化 数据归一化 1 把数变 ...

  4. 机器学习算法基础——数据特征预处理

    08.特征预处理-归一化 特征处理 通过特定的统计方法(数学方法)将数据转换成算法要求的数据 数值型数据:标准缩放: 归一化 标准化 缺失值 类别型数据:one-hot编码            时间 ...

  5. matlab数据无量纲化_MATLAB数据预处理——归一化和标准化

    输入/输出数据的预处理 尺度变换 尺度变换也称归一化或标准化,是指通过变换处理将网络的输入/输出数据限制在[0,1]或[-1,1]区间内.进行尺度变换的原因有: (1)网络的各个输入数据常常具有不同的 ...

  6. [机器学习-sklearn]数据预处理要点总结

    数据预处理要点总结 1. 为什么要数据预处理 2. 数据中存在缺失值 2.1 查看数据的完整性(missingno) 2.2 简单删除法 2.3 人工填写(filling manually) 2.4 ...

  7. 统计学、数据分析、机器学习常用数据特征汇总

    1.bias:偏差,反映的是数据和真实值之间的差异,体现数据的准确度. 2.variance:方差,反映的是数据与平均值之间的变异,体现数据的精确度. 3.error的意思与bias接近. 4.std ...

  8. Pytorch图像预处理——归一化、标准化

    在深度学习图像分类.物体检测等过程中,首先要对图像进行归一化和标准化. 原理: 归一化: 式中,input表示输入的图像像素值:max().min()分别表示输入像素的最大值和最小值.output为输 ...

  9. 机器学习sklearn之特征工程

    特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性.文章源码,仅供学习 1.字典特征提取 作用:对字典数据进行特征值化 类:sklearn.featu ...

最新文章

  1. 聊聊Service Mesh:linkerd
  2. InfluxData【环境搭建 01】时序数据库 InfluxDB 最新版本安装启动验证(在线安装+离线安装及各版本下载地址)
  3. 非对称加密算法 - Java加密与安全
  4. node-mysql中的连接池代码学习
  5. 使用/proc/meminfo文件查看内存状态信息
  6. 深度学习 免费课程_2020年排名前三的免费深度学习课程
  7. oracle表空间 设置,Oracle表空间怎么设置和管理
  8. 视觉SLAM十四讲学习笔记——ch5 相机与图像
  9. 恩施软件开发人员每月多少钱_软件开发人员外包报价表
  10. 基于Web的爬虫系统设计与实现
  11. Python中的字符串详解
  12. “真正的”欧洲杯,鸡冻不鸡冻?
  13. linux的一页是多大
  14. 外星人大战---------------游戏开发(二)
  15. 从源数据库抽取数据到中间库
  16. 屏幕录制和编辑神器ScreenFlow轻松上手
  17. 使用tesseract识别图片中的文字
  18. android 三星打印机,安卓逆袭传统 三星X4300LX复合机首测
  19. ECCV 2020 论文大盘点-手势估计篇
  20. 郭德纲新宠香奈儿 大牌造型盘点

热门文章

  1. Python中 sys.argv[]的用法
  2. 将枚举的键值绑定到下拉列表框
  3. 注册tomcat为服务
  4. [转载] linux cgroup
  5. 读书笔记2013第18本:《像外行一样思考,像专家一样实践》
  6. 个人编程思想理解的片段(主要是面向对象的,参考了许多人的观点,还不成熟,没形成系统,请大家多指点)...
  7. Android开发实践:常用NDK命令行参数
  8. Mysql数据库存储原理
  9. C语言判断计算机存储是大端还是小端
  10. 这5个bug我不信你没有写过