数据归一化:不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据归一化处理,以解决数据指标之间的可比性。原始数据经过数据归一化处理后,各指标处于同一数量级,适合进行综合对比评价。两种常用的归一化方法如下:

一、Min-Max标准化(Min-Max Normalization)

原始数据的线性变换,使结果值映射到[0 - 1]之间。转换函数如下:

x∗=x−minmax−minx^*=\frac{x-min}{max-min} x∗=max−minx−min​

其中,maxmaxmax为样本数据的最大值,minminmin为样本数据的最小值。这种方法的缺陷就是当有新数据加入时,可能导致maxmaxmax和minminmin的变化,需要重新定义;

二、Z-score标准化方法

这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,转化函数为:

x∗=x−uσx^*=\frac{x-u}{\sigma} x∗=σx−u​
其中uuu为所有样本数据的均值,σ\sigmaσ为所有样本数据的标准差。

参考文献

数据归一化:两种常用的归一化方法相关推荐

  1. 归一化mysql函数_数据归一化和两种常用的归一化方法

    数据归一化和两种常用的归一化方法 一.总结 一句话总结: min-max标准化:x* =(x-min)/(max-min):新数据加入,需重新计算max和min Z-score标准化:x* =(x-μ ...

  2. 数据归一化和两种常用的归一化方法

    数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...

  3. 数据中心两种常用流量模型运用mininet的实现

    为什么80%的码农都做不了架构师?>>>    编者按:在网络性能评估中一个巨大的挑战就是如何生成真实的网络流量,还好可以通过程序来创造人工的网络流量,通过建立测试环境来模拟真实的状 ...

  4. 关于两种常用特殊字符判断方法

    1.将所有特殊字符都列出来,判断目标字符串包含特殊字符. public bool IsSpecialChar(string str){     Regex regExp = new Regex(&qu ...

  5. 数据归一化及两种常用归一化方法

    数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可 ...

  6. 异常数据4种剔除方法_数据分析系列 22/32 | 9种常用的数据分析方法

    要使各种结构化的.非结构化的.海量的数据实现标准化.信息化,能够提供业务绩效评估.业务决策支持等要求,我们首先需要进行数据分析. 同时,围绕业务问题,采用合适的分析方法,分析模型,以及分析工具,这是数 ...

  7. 获得GPS数据的两种方法 1读串口

    获得GPS数据的两种方法 1读串口 - [技术] 版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明 http://memset.blogbus.com/logs/17801310.ht ...

  8. java构造和解析json_Java构造和解析Json数据的两种方法详解一

    在www.json.org上公布了很多JAVA下的json构造和解析工具,其中org.json和json-lib比较简单,两者使用上差不多但还是有些区别.下面首先介绍用json-lib构造和解析Jso ...

  9. java json解析 代码_Java构造和解析Json数据的两种方法详解一

    在www.json.org上公布了很多JAVA下的json构造和解析工具,其中org.json和json-lib比较简单,两者使用上差不多但还是有些区别.下面首先介绍用json-lib构造和解析Jso ...

最新文章

  1. c语言中的for循环怎么提前终止,[新人求指教]51C语言编程可否用中断令循环结束提早结束...
  2. html5 制作会转的风扇,HTML5学习第5天[乱撞的球]可以听到风扇声的哟
  3. 浏览器通知,可配合socket
  4. 封装axios统一请求
  5. 假如 AI 时代少了软件可信,我们将面临什么?
  6. vue-cli3的安装使用
  7. pandas将数组写入csv新增一列
  8. 196.删除重复的电子邮箱
  9. h3c交换机配置教程命令(新手配置交换机详细教程)
  10. 上海计算机二级vb题目,上海计算机二级VB试题(卷).doc
  11. 简历太空白怎么办?如何写简历
  12. 3dmax和VRay灯光
  13. 机房火灾自动报警系统常见问题及解决方案
  14. WordPress站点被挂马,如何预防、检测和应对?
  15. 深度学习/自动驾驶数据集大集合(目标检测/图像分割/语义分割/图像分类/)
  16. Mac ssh远程登录腾讯云的解决方案
  17. 磁盘配额和raid配置
  18. 软件测试基础知识(大全)
  19. 性能测试之cpu监控的结论
  20. Python:生成随机偏态分布

热门文章

  1. 常用计算机设备课件,课件计算机常用外存设备.ppt
  2. 教程篇(7.2) 13. 虚拟域 VDOM FortiGate基础设施 ❀ Fortinet网络安全专家 NSE4
  3. 前端程序员进阶到大神必备的7本前端书籍
  4. PS图像合成之人物裂痕效果
  5. MTD设备驱动--NAND flash
  6. 2012年《Satellite Image Time Series Analysis Under Time Warping》:动态时间规整(DTW)在遥感中的应用
  7. 多链路聚合设备疫情检查站视频传输应用解决方案
  8. php判断质数,php如何判断是否为素数?判断素数的三种方法(代码示例)
  9. Cocos学习日记7
  10. vue/cli是什么?vue/cli如何使用? 入门篇(安装创建,组件使用,定义路由,项目导出) ∠( °ω°)/ 前端知识