准备工作

加载需要使用的库

library(pastecs)
library(psych)
library(ggm)

读取数据，使用H1N1流感数据集和波士顿房价数据集。

flu <- read.table("./datasets/h1n1_flu.csv", header = TRUE, sep = ",")
housing <- read.csv("./datasets/BostonHousing.csv", header = TRUE)

多种方法获取描述性统计量

基础方法

通过summary计算数值型变量的最大值、最小值、分位数以及均值，类别变量计算频数统计。

summary(flu[c("household_children", "sex")])

summary(flu[c("h1n1_concern", "h1n1_knowledge")])

通过 sapply() 计算描述性统计量，先定义统计函数，在进行聚合计算。

mystats <- function(x, na.omit = TRUE) {if (na.omit) {x <- x[!is.na(x)]}m <- mean(x)n <- length(x)s <- sd(x)skew <- sum((x - m)^3 / s^3) / nkurt <- sum((x - m)^4 / s^4) / n - 3return(c(n = n, mean = m, stdev = s, skew = skew, kurtosis = kurt))
}
sapply(flu[c("h1n1_concern", "h1n1_knowledge")], mystats)

拓展包方法

通过pastecs包中的 stat.desc()函数计算描述性统计量，可以得到中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。

stat.desc(flu[c("household_children", "sex")])

通过psych包中的describe()计算描述性统计量。

describe(flu[c("household_children", "sex")])

分组计算描述性统计

基础方法

使用aggregate()分组获取描述性统计

分组计算不同性别收入贫困计数。
是否属于查尔斯河的房价中位数平均值。

aggregate(flu[c("income_poverty")], by = list(sex = flu$sex), length)
aggregate(housing$medv, by = list(medv = housing$chas), FUN = mean)

使用 by() 分组计算描述性统计量

by(flu[c("income_poverty", "sex")], flu$sex, length)

频数表和列联表

table(flu$sex)

当当网 R 语言学习资料统计分析
当当网 R 语言学习资料统计分析一.网络数据的抓取二.数据清洗与保存 (一)工作目录的修改 (二)导入数据并修改列名 1. 交互式编辑器 2. names()函数 3. rename()函数 (三 ...
R语言的基本统计分析
通过综合案例,使用R语言掌握基本统计分析的各种指标的并掌握统计分析结果的可视化方法. 1.背景介绍 Consolidated食品公司在新墨西哥州.亚利桑那州和加利福尼亚州经营连锁超市.它举办了一个促销 ...
R语言生物群落数据统计分析
R 语言作的开源.自由.免费等特点使其广泛应用于生物群落数据统计分析.生物群落数据多样而复杂,涉及众多统计分析方法.本文以生物群落数据分析中的最常用的统计方法回归和混合效应模型.多元统计分析技术及结构 ...
R语言_基本统计分析
#基本统计分析#整体描述性统计分析,针对数值变量 attach(mtcars) opar = par(no.readnoly=TRUE) d = mtcars[c("mpg",&q ...
r语言plotmds_多元统计分析R语言建模| 11 多维标度法MDS
定义:利用客体间相似性数据去解释它们之间的空间关系的统计分析方法多维变量--二维三维空间表示,标度到低维空间上种类: 度量化模型:相似性数据游距离.比例尺度测得非度量化模型:顺序量表(有序)水平 ...
R语言实战（统计分析1）
基本内容描述型统计分析频数表和列联表卡方检验相关系数和协方差 t检验描述型统计量首先我们以mtcars数据集为例,先看一下这个数据集前几行的内容 ,主要有英里数(mpg),马力(hp),车 ...
R语言与生物统计分析试题
1.空文件夹"WCPFC"(用于存放最终输出的文件): 2.csv 文件"WCPFC 目标渔船名单",包含船名.国籍.IMO 号及 MMSI 号: 3.文件夹& ...
用R语言进行基本统计分析
1. 描述性统计分析使用自带的summary()函数 > myvars <- c("mpg","hp","wt") > ...
R语言实战 - 基本统计分析（2）- 频数表和列联表
数据: > library(vcd) > head(Arthritis)ID Treatment Sex Age Improved 1 57 Treated Male 27 Some 2 ...

R语言之基本统计分析

准备工作

多种方法获取描述性统计量

基础方法

拓展包方法

分组计算描述性统计

基础方法

使用aggregate()分组获取描述性统计

使用 by() 分组计算描述性统计量

频数表和列联表

相关

相关的类型

Pearson、Spearman和Kendall相关

相关性的显著性检验

方差分析

单因素方差分析

多因素方差分析

参考资料

感谢Datawhale对开源学习的贡献！

R语言之基本统计分析相关推荐

最新文章

热门文章