r语言归一化_R语言︱数据规范化、归一化
笔者寄语:规范化主要是因为数据受着单位的影响较大,需要进行量纲化。大致有:最小-最大规范化、均值标准化、小数定标规范化
1、最小-最大规范化
也叫离差标准化,是对原始数据的线性变换,将数据映射到[0,1]之间,与功效系数法相同。
#最小-最大规范化
b1=(data[,1]-min(data[,1]))/(max(data[,1])-min(data[,1]))
b2=(data[,2]-min(data[,2]))/(max(data[,2])-min(data[,2]))
b3=(data[,3]-min(data[,3]))/(max(data[,3])-min(data[,3]))
b4=(data[,4]-min(data[,4]))/(max(data[,4])-min(data[,4]))
data_scatter=cbind(b1,b2,b3,b4)
2、均值标准化法
标准差标准化、零均值规范化等方法,经过处理的数据均值为0,标准差为1。公式为:
x*=(x-均值)/标准差
因为均值受离群值影响较大,也可以将均值替换成变量的中位数。
#零-均值规范化
data_zscore=scale(data)
3、小数定标规范化
移动变量的小数点位置来将变量映射到[-1,1]
#小数定标规范化
i1=ceiling(log(max(abs(data[,1])),10))#小数定标的指数
c1=data[,1]/10^i1
i2=ceiling(log(max(abs(data[,2])),10))
c2=data[,2]/10^i2
r语言归一化_R语言︱数据规范化、归一化相关推荐
- pvrect r语言 聚类_R语言常用统计方法包+机器学习包(名称、简介)
上期帮大家盘点了一下R中常用的可视化包,这期将简要盘点一下关于统计分析与机器学习的R包,并通过简要介绍包的特点来帮助读者深入理解可视化包. 本文作者为"食物链顶端"学习群中的小伙伴 ...
- r语言归一化_R语言scale()标准化
R语言中scale函数,可以对数据进行处理,标准化(归一化)在一定的范围,比较适合大范围变化数据归一化处理从而观察数据变化趋势 scale()函数 scale(x, center = TRUE, sc ...
- r语言 中断r的输入_R语言_004数据输入
现实的情况是,我们大部分遇到的都是表格数据,在R语言里面叫数据框,数据来源一般不可能我们自己在程序开始前手动录入,正常的逻辑是从外面读取现成的数据,再预处理.建模什么的.根据经验,现在的数据来源主要是 ...
- r ridge回归_R语言区间数据回归分析
原文链接:http://tecdat.cn/?p=14874 通常,GLM的连接函数可能比分布更重要.为了说明,考虑以下数据集,其中包含5个观察值 x = c(1,2,3,4,5)y = c(1,2, ...
- pvrect r语言 聚类_R语言一条命令实现基于样本和距离的聚类分析
上一篇文章给大家介绍了利用 R语言的 hclust()进行聚类分析的步骤,已经很简单了,但是依然有不少小伙伴来问 "老师,还有更简单的方法吗,最好是一条命令那种",为了满足的大家的 ...
- 找不到r低版本_R 语言与数据挖掘直播班开始招生,生信分析帮你发高分文章
数据单薄很难支撑文章内容?数据有了不知道怎么处理作出高级的图片?这个时候需要的是生信分析--深度的数据挖掘和分析处理,可以帮助临床医生通过数据处理得到自己想要的信息,更快速地发文章. 学习哪种生信分析 ...
- r语言散点图_R语言 | 散点图入门:以声学元音图为例
R语言 语言学与R语言的碰撞 Xu & Yang PhoneticSan 学习参考 Discovering Statistics Using R Statistics for Linguist ...
- mcem r语言代码_R语言阈值自回归模型(TAR)代码示例
原文链接: R语言时间序列TAR阈值模型分析tecdat.cn 阈值模型用于统计的几个不同区域,而不仅仅是时间序列.一般的想法是,当变量的值超过某个阈值时,过程可能表现不同.也就是说,当值大于阈值时 ...
- r语言简介_R语言简介
r语言简介 R is a language and environment for statistical computing and graphics that is supported by th ...
最新文章
- 利用OpenCV+ConvNets检测几何图形
- 可恶的爬虫直接把生产6台机器爬挂了!
- vmware中修改ubuntu的分辨率
- 初等数论--同余--Fermat素性检测算法(为什么每次概率改变1/2)
- oracle怎样开启服务,Oracle 11g必须开启的服务及服务详细介绍
- plsql tables 没有表_天长视唱练耳辅导班收费表,安徽高考音乐培训学校,你知道吗...
- Python 网络爬虫笔记6 -- 正则表达式
- 如何迁移 Flink 任务到实时计算
- 纵有倚天剑还要屠龙刀,实现Power BI报表服务器自定义认证
- 【Logstash】Logstash:把MySQL数据导入到Elasticsearch中
- 设置div的高度_html中如何让div居中
- 机器学习-代价函数(单变量线性回归)
- 关于Java的this关键字
- 2020-11-30 03_空域图像处理 笔记
- Java核心编程总结(九、File文件类),王道训练营Java百度云盘
- HTML生成Word文档,可自定义Word文档页眉、页脚、分页。
- windows2016小文件服务器,Windows Server 2016 搭建 SMB 共享文件
- div怎么在css中设置字体大小,根据div大小调整字体大小
- 池化层(汇聚层)的通道变化
- 抓虾的告别信RSS即将退出舞台