笔者寄语:规范化主要是因为数据受着单位的影响较大,需要进行量纲化。大致有:最小-最大规范化、均值标准化、小数定标规范化

1、最小-最大规范化

也叫离差标准化,是对原始数据的线性变换,将数据映射到[0,1]之间,与功效系数法相同。

#最小-最大规范化

b1=(data[,1]-min(data[,1]))/(max(data[,1])-min(data[,1]))

b2=(data[,2]-min(data[,2]))/(max(data[,2])-min(data[,2]))

b3=(data[,3]-min(data[,3]))/(max(data[,3])-min(data[,3]))

b4=(data[,4]-min(data[,4]))/(max(data[,4])-min(data[,4]))

data_scatter=cbind(b1,b2,b3,b4)

2、均值标准化法

标准差标准化、零均值规范化等方法,经过处理的数据均值为0,标准差为1。公式为:

x*=(x-均值)/标准差

因为均值受离群值影响较大,也可以将均值替换成变量的中位数。

#零-均值规范化

data_zscore=scale(data)

3、小数定标规范化

移动变量的小数点位置来将变量映射到[-1,1]

#小数定标规范化

i1=ceiling(log(max(abs(data[,1])),10))#小数定标的指数

c1=data[,1]/10^i1

i2=ceiling(log(max(abs(data[,2])),10))

c2=data[,2]/10^i2

r语言归一化_R语言︱数据规范化、归一化相关推荐

  1. pvrect r语言 聚类_R语言常用统计方法包+机器学习包(名称、简介)

    上期帮大家盘点了一下R中常用的可视化包,这期将简要盘点一下关于统计分析与机器学习的R包,并通过简要介绍包的特点来帮助读者深入理解可视化包. 本文作者为"食物链顶端"学习群中的小伙伴 ...

  2. r语言归一化_R语言scale()标准化

    R语言中scale函数,可以对数据进行处理,标准化(归一化)在一定的范围,比较适合大范围变化数据归一化处理从而观察数据变化趋势 scale()函数 scale(x, center = TRUE, sc ...

  3. r语言 中断r的输入_R语言_004数据输入

    现实的情况是,我们大部分遇到的都是表格数据,在R语言里面叫数据框,数据来源一般不可能我们自己在程序开始前手动录入,正常的逻辑是从外面读取现成的数据,再预处理.建模什么的.根据经验,现在的数据来源主要是 ...

  4. r ridge回归_R语言区间数据回归分析

    原文链接:http://tecdat.cn/?p=14874 通常,GLM的连接函数可能比分布更重要.为了说明,考虑以下数据集,其中包含5个观察值 x = c(1,2,3,4,5)y = c(1,2, ...

  5. pvrect r语言 聚类_R语言一条命令实现基于样本和距离的聚类分析

    上一篇文章给大家介绍了利用 R语言的 hclust()进行聚类分析的步骤,已经很简单了,但是依然有不少小伙伴来问 "老师,还有更简单的方法吗,最好是一条命令那种",为了满足的大家的 ...

  6. 找不到r低版本_R 语言与数据挖掘直播班开始招生,生信分析帮你发高分文章

    数据单薄很难支撑文章内容?数据有了不知道怎么处理作出高级的图片?这个时候需要的是生信分析--深度的数据挖掘和分析处理,可以帮助临床医生通过数据处理得到自己想要的信息,更快速地发文章. 学习哪种生信分析 ...

  7. r语言散点图_R语言 | 散点图入门:以声学元音图为例

    R语言 语言学与R语言的碰撞 Xu & Yang PhoneticSan 学习参考 Discovering Statistics Using R Statistics for Linguist ...

  8. mcem r语言代码_R语言阈值自回归模型(TAR)代码示例

    原文链接: R语言时间序列TAR阈值模型分析​tecdat.cn 阈值模型用于统计的几个不同区域,而不仅仅是时间序列.一般的想法是,当变量的值超过某个阈值时,过程可能表现不同.也就是说,当值大于阈值时 ...

  9. r语言简介_R语言简介

    r语言简介 R is a language and environment for statistical computing and graphics that is supported by th ...

最新文章

  1. 利用OpenCV+ConvNets检测几何图形
  2. 可恶的爬虫直接把生产6台机器爬挂了!
  3. vmware中修改ubuntu的分辨率
  4. 初等数论--同余--Fermat素性检测算法(为什么每次概率改变1/2)
  5. oracle怎样开启服务,Oracle 11g必须开启的服务及服务详细介绍
  6. plsql tables 没有表_天长视唱练耳辅导班收费表,安徽高考音乐培训学校,你知道吗...
  7. Python 网络爬虫笔记6 -- 正则表达式
  8. 如何迁移 Flink 任务到实时计算
  9. 纵有倚天剑还要屠龙刀,实现Power BI报表服务器自定义认证
  10. 【Logstash】Logstash:把MySQL数据导入到Elasticsearch中
  11. 设置div的高度_html中如何让div居中
  12. 机器学习-代价函数(单变量线性回归)
  13. 关于Java的this关键字
  14. 2020-11-30 03_空域图像处理 笔记
  15. Java核心编程总结(九、File文件类),王道训练营Java百度云盘
  16. HTML生成Word文档,可自定义Word文档页眉、页脚、分页。
  17. windows2016小文件服务器,Windows Server 2016 搭建 SMB 共享文件
  18. div怎么在css中设置字体大小,根据div大小调整字体大小
  19. 池化层(汇聚层)的通道变化
  20. 抓虾的告别信RSS即将退出舞台

热门文章

  1. determined(determined是什么意思英语)
  2. matlab 爱,matlab
  3. DevExpress皮肤样式
  4. Maxwell安装与入门
  5. 深度linux qq下载,Deepin内置的软件商店里收录QQ for Linux版,方便用户安装
  6. DApp是什么?和App有什么区别?
  7. 新浪Blog支持手机Wap浏览了
  8. 使用http访问页面时,将其跳转成https
  9. 黑作坊磨皮大师完美破解版
  10. (精品)运用PS的液化滤镜制作逼真的石头效果-PS滤镜教程