规范化(标准化)数据的方法
令A是数值属性,具有n个观测值 。
1、 最小—最大规范化
最小—最大规范化对原始数据进行线性变换。假设和分别为属性A的最大值 和最小值
。最小—最大规范化通过计算:
把A的值 映射到
区间中 。
最小—最大规范化保持原始数据值之间的联系,但是如果今后的输入实例落在A的原数据值域之外,则该方法将面临“越界”错误。
2、 z分数(z-score)规范化(或零均值规范化)
在z分数规范化中,属性A的值基于A的均值和标准差规范化。A的值 被规范化为
,由以下公式计算:
其中 和
分别为属性A的平均值和标准差。
当属性A的实际最小值和最大值未知,或者离群点左右了最小—最大规范化时,该方法是有效的。
3、小数定标规范化
小数定标规范化通过移动属性A的值的小数点位置进行规范化。小数点的移动位数依赖于A的最大绝对值。A的值 被规范化为
,由下式计算:
其中,j是使得 的最小整数。
规范化(标准化)数据的方法相关推荐
- 数据挖掘之3种数据归一化方法及代码实现
学习数据挖掘.机器学习的同学们应该经常碰到数据归一化(也称标准化),数据的不同特征种类(评价指标)的取值范围差别可能很大,如果不做处理会影响数据分析的结果.因此需要把数据进行标准化处理,将数据进行比例 ...
- python常用的数据预处理方法
2019独角兽企业重金招聘Python工程师标准>>> 转载自:http://2hwp.com/2016/02/03/data-preprocessing/ 常见的数据预处理方法,以 ...
- sklearn中常用的数据预处理方法
常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(Standardization or Mean Removal and Variance Scali ...
- python必备基础代码-【Python基础系列】常见的数据预处理方法(附代码)
本文简单介绍python中一些常见的数据预处理,包括数据加载.缺失值处理.异常值处理.描述性变量转换为数值型.训练集测试集划分.数据规范化. 1. 加载数据 1.1 数据读取 数据格式有很多,介绍常见 ...
- 几种数据预处理方法汇总(标准/中心化、归一化、正则化)+Python代码
1. 数据的标准化(规范化/归一化) 数据标准化是将样本的属性缩放到某个指定的范围. 数据标准化的原因: 某些算法要求样本具有零均值和单位方差: 需要消除样本不同属性具有不同量级时的影响:①数量级的差 ...
- 数据规范化与数据离散化
文章目录 一.数据规范化 1.小数定标规范化 2.最小-最大规范化 3.零-均值规范化(z-score规范化) 二.数据离散化 一.数据规范化 数据规范化(归一化)处理是数据挖掘的一项基础工作.不同评 ...
- 基于图像的数据增强方法发展现状综述
基于图像的数据增强方法发展现状综述 人工智能技术与咨询 2022-03-22 20:57 点击蓝字 · 关注我们 来源:< 计算机科学与应用> ,作者冯晓硕等 关键词: 数据增强:图像数据 ...
- 数据挖掘导论 复习一(介绍+数据预处理方法+定性归纳)
数据挖掘=数据库+机器学习 算法 经验 模型 机器学习任务:分类.回归.聚类(KMeans.DCSAN.层次聚类).数据降维.数据预处理 常用分类器:KNN.贝叶斯. 逻辑回归 .决策树.随机森林 本 ...
- 数据治理-数据质量-数据质量管理方法和工具
常用质量管理工具 目前,在质量管理领域,有一系列常用的数据质量管理工具,主要分为传统的质量管理工具.新的质量管理工具和其他质量管理工具. 传统的质量管理七大工具 传统的七种工具包含分层法.检查表.帕累 ...
最新文章
- 如何在Windows7上安装Hyper-v manager
- linux 11G R2 RAC 配置NTP服务器
- 学python需要安装什么-初学 Python 需要安装哪些软件?
- java学习与总结:MySQL和数据库基础知识
- 学生管理系统(C++)
- Java 中类的静态成员与类的实例对象回收
- [AX]AX2012 SSRS报表使用Report Data Method
- ACwing 3. 完全背包问题(DP)
- 网页中嵌入JavaScript+事件触发程序
- 笔记 备考2022华师大 教育专硕
- 对于Force.com平台的一些批评 - 持续更新中
- ansi c标准_C语言为什么需要有标准库
- 20172307 2017-2018-2 《程序设计与数据结构》第7周学习总结
- iOS 新浪微博-1.1框架升级
- 获取本地视频文件的缩略图
- IOS项目接入微信SDK
- 中了一篇ccf的b类会议sdm'15,要去温哥华参会。很高兴啊!!!!
- 安排几款实用的内网穿透工具+教程
- Lab5: xv6 lazy page allocation
- 黑魂复刻游戏的碰撞摩擦问题——Unity随手记(2021.4.27)
热门文章
- 传统分布式架构部署(apache+tomcat集群)
- CLOUD 云计算进阶(一)-云平台搭建与虚拟化服务
- 博士win7风格包_酒店测评:30年仅开2家,褒奖无数,风格简洁却暗藏玄机!
- Hudson之——持续集成服务器的安装与配置
- window10下安装Elasticsearch(es)和IK分词器
- windows10安装更新很慢ndows,Windows10下载更新一直不动,进度为0怎么办?
- 「Shell」- 使用环境变量,替换在文件中的变量(envsubst) @20210401
- reSIProcate实现GB28181服务——注册、心跳、已注册用户存储、catalog、invite、info、subscribe
- 有一个属于自己的网站是不是很酷呢,超详细的建站流程,我都给你总结好了
- 高斯判别分析GDA(公式推导)