令A是数值属性,具有n个观测值  。

    1、  最小—最大规范化
    最小—最大规范化对原始数据进行线性变换。假设和分别为属性A的最大值 和最小值 。最小—最大规范化通过计算:

把A的值 映射到 区间中 。
    最小—最大规范化保持原始数据值之间的联系,但是如果今后的输入实例落在A的原数据值域之外,则该方法将面临“越界”错误。
 
    2、  z分数(z-score)规范化(或零均值规范化)
    在z分数规范化中,属性A的值基于A的均值和标准差规范化。A的值 被规范化为 ,由以下公式计算:

其中 分别为属性A的平均值和标准差。
    当属性A的实际最小值和最大值未知,或者离群点左右了最小—最大规范化时,该方法是有效的。
 
    3、小数定标规范化
    小数定标规范化通过移动属性A的值的小数点位置进行规范化。小数点的移动位数依赖于A的最大绝对值。A的值 被规范化为 ,由下式计算:

其中,j是使得 的最小整数。

规范化(标准化)数据的方法相关推荐

  1. 数据挖掘之3种数据归一化方法及代码实现

    学习数据挖掘.机器学习的同学们应该经常碰到数据归一化(也称标准化),数据的不同特征种类(评价指标)的取值范围差别可能很大,如果不做处理会影响数据分析的结果.因此需要把数据进行标准化处理,将数据进行比例 ...

  2. python常用的数据预处理方法

    2019独角兽企业重金招聘Python工程师标准>>> 转载自:http://2hwp.com/2016/02/03/data-preprocessing/ 常见的数据预处理方法,以 ...

  3. sklearn中常用的数据预处理方法

    常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(Standardization or Mean Removal and Variance Scali ...

  4. python必备基础代码-【Python基础系列】常见的数据预处理方法(附代码)

    本文简单介绍python中一些常见的数据预处理,包括数据加载.缺失值处理.异常值处理.描述性变量转换为数值型.训练集测试集划分.数据规范化. 1. 加载数据 1.1 数据读取 数据格式有很多,介绍常见 ...

  5. 几种数据预处理方法汇总(标准/中心化、归一化、正则化)+Python代码

    1. 数据的标准化(规范化/归一化) 数据标准化是将样本的属性缩放到某个指定的范围. 数据标准化的原因: 某些算法要求样本具有零均值和单位方差: 需要消除样本不同属性具有不同量级时的影响:①数量级的差 ...

  6. 数据规范化与数据离散化

    文章目录 一.数据规范化 1.小数定标规范化 2.最小-最大规范化 3.零-均值规范化(z-score规范化) 二.数据离散化 一.数据规范化 数据规范化(归一化)处理是数据挖掘的一项基础工作.不同评 ...

  7. 基于图像的数据增强方法发展现状综述

    基于图像的数据增强方法发展现状综述 人工智能技术与咨询 2022-03-22 20:57 点击蓝字 · 关注我们 来源:< 计算机科学与应用> ,作者冯晓硕等 关键词: 数据增强:图像数据 ...

  8. 数据挖掘导论 复习一(介绍+数据预处理方法+定性归纳)

    数据挖掘=数据库+机器学习 算法 经验 模型 机器学习任务:分类.回归.聚类(KMeans.DCSAN.层次聚类).数据降维.数据预处理 常用分类器:KNN.贝叶斯. 逻辑回归 .决策树.随机森林 本 ...

  9. 数据治理-数据质量-数据质量管理方法和工具

    常用质量管理工具 目前,在质量管理领域,有一系列常用的数据质量管理工具,主要分为传统的质量管理工具.新的质量管理工具和其他质量管理工具. 传统的质量管理七大工具 传统的七种工具包含分层法.检查表.帕累 ...

最新文章

  1. 如何在Windows7上安装Hyper-v manager
  2. linux 11G R2 RAC 配置NTP服务器
  3. 学python需要安装什么-初学 Python 需要安装哪些软件?
  4. java学习与总结:MySQL和数据库基础知识
  5. 学生管理系统(C++)
  6. Java 中类的静态成员与类的实例对象回收
  7. [AX]AX2012 SSRS报表使用Report Data Method
  8. ACwing 3. 完全背包问题(DP)
  9. 网页中嵌入JavaScript+事件触发程序
  10. 笔记 备考2022华师大 教育专硕
  11. 对于Force.com平台的一些批评 - 持续更新中
  12. ansi c标准_C语言为什么需要有标准库
  13. 20172307 2017-2018-2 《程序设计与数据结构》第7周学习总结
  14. iOS 新浪微博-1.1框架升级
  15. 获取本地视频文件的缩略图
  16. IOS项目接入微信SDK
  17. 中了一篇ccf的b类会议sdm'15,要去温哥华参会。很高兴啊!!!!
  18. 安排几款实用的内网穿透工具+教程
  19. Lab5: xv6 lazy page allocation
  20. 黑魂复刻游戏的碰撞摩擦问题——Unity随手记(2021.4.27)

热门文章

  1. 传统分布式架构部署(apache+tomcat集群)
  2. CLOUD 云计算进阶(一)-云平台搭建与虚拟化服务
  3. 博士win7风格包_酒店测评:30年仅开2家,褒奖无数,风格简洁却暗藏玄机!
  4. Hudson之——持续集成服务器的安装与配置
  5. window10下安装Elasticsearch(es)和IK分词器
  6. windows10安装更新很慢ndows,Windows10下载更新一直不动,进度为0怎么办?
  7. 「Shell」- 使用环境变量,替换在文件中的变量(envsubst) @20210401
  8. reSIProcate实现GB28181服务——注册、心跳、已注册用户存储、catalog、invite、info、subscribe
  9. 有一个属于自己的网站是不是很酷呢,超详细的建站流程,我都给你总结好了
  10. 高斯判别分析GDA(公式推导)