数据归一化:两种常用的归一化方法
数据归一化:不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据归一化处理,以解决数据指标之间的可比性。原始数据经过数据归一化处理后,各指标处于同一数量级,适合进行综合对比评价。两种常用的归一化方法如下:
一、Min-Max标准化(Min-Max Normalization)
原始数据的线性变换,使结果值映射到[0 - 1]之间。转换函数如下:
x∗=x−minmax−minx^*=\frac{x-min}{max-min} x∗=max−minx−min
其中,maxmaxmax为样本数据的最大值,minminmin为样本数据的最小值。这种方法的缺陷就是当有新数据加入时,可能导致maxmaxmax和minminmin的变化,需要重新定义;
二、Z-score标准化方法
这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,转化函数为:
x∗=x−uσx^*=\frac{x-u}{\sigma} x∗=σx−u
其中uuu为所有样本数据的均值,σ\sigmaσ为所有样本数据的标准差。
参考文献
数据归一化:两种常用的归一化方法相关推荐
- 归一化mysql函数_数据归一化和两种常用的归一化方法
数据归一化和两种常用的归一化方法 一.总结 一句话总结: min-max标准化:x* =(x-min)/(max-min):新数据加入,需重新计算max和min Z-score标准化:x* =(x-μ ...
- 数据归一化和两种常用的归一化方法
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...
- 数据中心两种常用流量模型运用mininet的实现
为什么80%的码农都做不了架构师?>>> 编者按:在网络性能评估中一个巨大的挑战就是如何生成真实的网络流量,还好可以通过程序来创造人工的网络流量,通过建立测试环境来模拟真实的状 ...
- 关于两种常用特殊字符判断方法
1.将所有特殊字符都列出来,判断目标字符串包含特殊字符. public bool IsSpecialChar(string str){ Regex regExp = new Regex(&qu ...
- 数据归一化及两种常用归一化方法
数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...
- 异常数据4种剔除方法_数据分析系列 22/32 | 9种常用的数据分析方法
要使各种结构化的.非结构化的.海量的数据实现标准化.信息化,能够提供业务绩效评估.业务决策支持等要求,我们首先需要进行数据分析. 同时,围绕业务问题,采用合适的分析方法,分析模型,以及分析工具,这是数 ...
- 获得GPS数据的两种方法 1读串口
获得GPS数据的两种方法 1读串口 - [技术] 版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明 http://memset.blogbus.com/logs/17801310.ht ...
- java构造和解析json_Java构造和解析Json数据的两种方法详解一
在www.json.org上公布了很多JAVA下的json构造和解析工具,其中org.json和json-lib比较简单,两者使用上差不多但还是有些区别.下面首先介绍用json-lib构造和解析Jso ...
- java json解析 代码_Java构造和解析Json数据的两种方法详解一
在www.json.org上公布了很多JAVA下的json构造和解析工具,其中org.json和json-lib比较简单,两者使用上差不多但还是有些区别.下面首先介绍用json-lib构造和解析Jso ...
最新文章
- c语言中的for循环怎么提前终止,[新人求指教]51C语言编程可否用中断令循环结束提早结束...
- html5 制作会转的风扇,HTML5学习第5天[乱撞的球]可以听到风扇声的哟
- 浏览器通知,可配合socket
- 封装axios统一请求
- 假如 AI 时代少了软件可信,我们将面临什么?
- vue-cli3的安装使用
- pandas将数组写入csv新增一列
- 196.删除重复的电子邮箱
- h3c交换机配置教程命令(新手配置交换机详细教程)
- 上海计算机二级vb题目,上海计算机二级VB试题(卷).doc
- 简历太空白怎么办?如何写简历
- 3dmax和VRay灯光
- 机房火灾自动报警系统常见问题及解决方案
- WordPress站点被挂马,如何预防、检测和应对?
- 深度学习/自动驾驶数据集大集合(目标检测/图像分割/语义分割/图像分类/)
- Mac ssh远程登录腾讯云的解决方案
- 磁盘配额和raid配置
- 软件测试基础知识(大全)
- 性能测试之cpu监控的结论
- Python:生成随机偏态分布
热门文章
- 常用计算机设备课件,课件计算机常用外存设备.ppt
- 教程篇(7.2) 13. 虚拟域 VDOM FortiGate基础设施 ❀ Fortinet网络安全专家 NSE4
- 前端程序员进阶到大神必备的7本前端书籍
- PS图像合成之人物裂痕效果
- MTD设备驱动--NAND flash
- 2012年《Satellite Image Time Series Analysis Under Time Warping》:动态时间规整(DTW)在遥感中的应用
- 多链路聚合设备疫情检查站视频传输应用解决方案
- php判断质数,php如何判断是否为素数?判断素数的三种方法(代码示例)
- Cocos学习日记7
- vue/cli是什么?vue/cli如何使用? 入门篇(安装创建,组件使用,定义路由,项目导出) ∠( °ω°)/ 前端知识