《R语言与统计分析》-学习笔记4
探索性数据分析
常用分布的概率函数图
二项分布
n <- 20
p <- 0.2
k <- seq(0,n)
plot(k,dbinom(k,n,p),type = "h",main = "Binomial distribution,n=20,p=0.2",xlab = "k")
泊松分布
lambda <- 4.0
k <- seq(0,20)
plot(k,dpois(k,lambda),type = "h",main = "Poisson distribution,lambda=5.5",xlab = "k")
几何分布
p <- 0.5
k <- seq(0,10)
plot(k,dgeom(k,p),type = "h",main = "Geometric distribution,p=0.5",xlab = "k")
超几何分布
N <- 30
M <- 10
n <- 10
k <- seq(0,10)
plot(k,dhyper(k,N,M,n),type = "h",main = "Hypergeometric distribution,N=30,M=10,n=10",xlab="k")
负二项分布
n <- 10
p <- 0.5
k <- seq(0,40)
plot(k,dnbinom(k,n,p),type = "h",main = "Negative Binomial distribution,n=10,p=0.5",xlab="k")
正态分布
curve(dnorm(x,0,1),xlim = c(-5,5),ylim=c(0,0.8),col="red",lwd=2,lty=3)
curve(dnorm(x,0,2),add = T,col ="blue",lwd=2,lty=2)
curve(dnorm(x,0,1/2),add = T,lwd=2,lty=1)
title(main="Gaussian distributions")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("sigma=1","sigma=2","sigma=1/2"),lwd = c(2,2,2),lty = c(3,2,1),col = c("red","blue",par("fg")))
t分布
curve(dt(x,1),xlim=c(-3,3),ylim=c(0,0.4),col="red",lwd=2,lty=1)
curve(dt(x,2),add = T,col="green",lwd=2,lty=2)
curve(dt(x,10),add = T,col="orange",lwd=2,lty=3)
curve(dnorm(x),add = T,lwd=3,lty=4)
title(main = "Student T distributions")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("df=1","df=2","df=10","Gaussian distribution"),lwd = c(2,2,2,2),lty = c(1,2,3,4),col = c("red","blue","green",par("fg")))
卡方分布
curve(dchisq(x,1),xlim = c(0,10),ylim=c(0,0.6),col="red",lwd=2)
curve(dchisq(x,2),add = T,col="green",lwd=2)
curve(dchisq(x,3),add = T,col = "blue", lwd = 2)
curve(dchisq(x,5),add = T,col = "orange",lwd = 2)
abline(h=0,lty=3)
abline(v=0,lty=3)
title(main = "Chi square Distributions")
legend(par("usr")[2],par("usr")[4],xjust=1,c("df=1","df=2","df=3","df=5"),lwd=3,lty=1,col=c("red","green","blue","orange"))
F分布
curve(df(x,1,1), xlim = c(0,2),ylim=c(0,0.8),lty=1)
curve(df(x,3,1), add = T, lwd=2, lty=2)
curve(df(x,6,1), add = T, lwd=2, lty=3)
curve(df(x,3,3), add = T, col = "red", lwd=3,lty=4)
curve(df(x,3,6), add = T, col = "blue", lwd =3,lty=5)
title(main = "Fisher's F")
legend(par("usr")[2],par("usr")[4],xjust=1,c("df=(1,1)","df=(3,1)","df=(6,1)","df=(3,3)","df=(3,6)"),lwd = c(1,2,2,3,3),lty = c(1,2,3,4,5),col = c(par("fg"),par("fg"),par("fg"),"red","blue"))
对数正态分布
curve(dlnorm(x),xlim = c(-.2,5),ylim=c(0,1.0),lwd=2)
curve(dlnorm(x,0,3/2),add = T, col = "blue", lwd = 2,lty = 2)
curve(dlnorm(x,0,1/2), add = T, col = "orange", lwd = 2,lty = 3)
title(main = "Log normal distributions")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("sigma = 1","sigma = 2","sigma = 1/2"),lwd = c(2,2,2),lty = c(1,2,3),col = c(par("fg"),"blue","orange"))
柯西分布
curve(dcauchy(x),xlim = c(-5,5),ylim=c(0,.5),lwd=3)
curve(dnorm(x),add = T, col = "red", lty = 2)
title(main = "Cauchy distribution")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("Cauchy distribution","Gaussian distribution"),lwd = c(3,1),lty = c(1,2),col = c(par("fg"),"red"))
威布尔分布
curve(dexp(x),xlim = c(0,3),ylim=c(0,2))
curve(dweibull(x,1),lty=3,lwd=3,add = T)
curve(dweibull(x,2),col="red",add = T)
curve(dweibull(x,.8),col="blue",add = T)
title(main = "Weibull Probability Distribution Function")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("Exponential","Weibull,shape=1","Weibull,shape=2","Weibull,shape=0.8"),lwd = c(1,3,1,1),lty = c(1,3,1,1),col = c(par("fg"),par("fg"),"red","blue"))
伽马分布
curve(dgamma(x,1,1),xlim = c(0,5),lwd=2,lty=1)
curve(dgamma(x,2,1),add = T,col="red",lwd=2,lty=2)
curve(dgamma(x,3,1),add = T,col="green",lwd=2,lty=3)
curve(dgamma(x,4,1),add = T,col ="blue",lwd=2,lty=4)
curve(dgamma(x,5,1),add = T,col ="orange",lwd=2,lty=5)
title(main = "Gamma distributions")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("k=1 (Exponential distribution)","k=2","k=3","k=4","k=5"),lwd = c(2,2,2,2,2),lty = c(1,2,3,4,5),col = c(par("fg"),"red","green","blue","orange"))
贝塔分布
curve(dbeta(x,1,1),xlim = c(0,1),ylim=c(0,4))
curve(dbeta(x,3,1),add = T, col ="green")
curve(dbeta(x,3,2),add = T,lty=2,lwd=2)
curve(dbeta(x,4,2),add = T,lty=2,lwd=2,col="blue")
curve(dbeta(x,2,3),add = T,lty=3,lwd=3,col="red")
curve(dbeta(x,4,3),add = T,lty=3,lwd=3,col="orange")
title(main="Beta distributions")
legend(par("usr")[1],par("usr")[4],xjust = 0,c("1,1","3,1","3,2","(4,2)","(2,3)","4,3"),lwd = c(1,1,2,2,3,3),lty = c(1,1,2,2,3,3),col = c(par("fg"),"green",par("fg"),"blue","red","orange"))
直方图与密度函数的估计
直方图
它给出了数据的频率分布图形。
hist( )
的调用格式
hist(x, breaks = “Sturges”, freq = NULL, probability = !freq,
col = NULL,
main = paste(“Histogram of” , xname),
xlim = range(breaks), ylim = NULL,
xlab = xname, ylab,
axes = TRUE, nclass = NULL)
说明: 若选项breaks取向量,则用于指明直方图区间的分割位置; 若取正整数,则用于指定直方图的小区间数. freq取T表示使用频数画直方图, 取F则使用频率画直方图. probability与freq恰好相反. col用于指明小矩形的颜色.
核密度估计
样本的直方图粗略地描述了样本的分布, 我们还可以用函数density()
得到样本的核密度估计值, 并用lines( )
得到密度估计的曲线.
density( )的调用格式
density(x, bw = “nrd0”,
kernel = c(“gaussian”, “epanechnikov”, “rectangular”,
“triangular”, “biweight”, “cosine”, “optcosine”),
n = 512, from, to)
说明: 选项bw指定核密度估计的窗宽, 也用字符串表示窗宽选择规则, 具体可参考函数bw.nrd( ). kernel为核密度估计所使用的光滑化函数, 缺省为正态核函数. n给出等间隔的核密度估计点。from与to分别给出需要计算核密度估计的左右端点。
例4.2.1从二项分布binom(100,0.9)中抽取容量为N=100000的样本.试作出它的直方图及核密度估计曲线.
N <- 100000 #重复N组
n <- 100 #每组100次试验
p <- .9 #每次试验的成功概率
x <- rbinom(N,n,p) #每组成功的次数
hist(x,xlim = c(min(x),max(x)),probability = T,nclass = max(x)-min(x) +1,col = "lightblue",main="Binomial distribution,n=100,p=0.9")
lines(density(x,bw=1),col="red",lwd=3)
例4.2.2从负二项分布nbinom(10,0.25)中抽取容量为N=100000的样本. 试作出它的直方图及核密度估计曲线.
N <- 100000 #重复N组
n <- 10 #每组需要成功10次
p <- 0.25 #每次成功的概率是0.25
x <- rnbinom(N,n,p) #在成功10次前,要失败多少次
hist(x,xlim = c(min(x),max(x)),probability = T,nclass = max(x)-min(x) +1,col = "lightblue",main="Nbinomial distribution,n=10,p=0.25")
lines(density(x,bw=1),col="red",lwd=3)
单组数据的描述性统计分析
单组数据的图形描述
** 例4.3.1** 程序包DAAG中有内嵌数据集“possum”,它包括了从维多利亚南部到皇后区的七个地区的104只负鼠(possum)的年龄、尾巴的长度、总长度等9个特征值,我们仅考虑43只雌性负鼠的特征值,我们建立子集fpossum,考查雌性负鼠(fpossum)的总长度的频率分布.
《R语言与统计分析》-学习笔记4相关推荐
- python web开发入门_python大佬整理的python web开发从入门到精通学习笔记
原标题:python大佬整理的python web开发从入门到精通学习笔记 Python(发音:英[?pa?θ?n],美[?pa?θɑ:n]),是一种面向对象.直译式电脑编程语言,也是一种功能强大的通 ...
- MySQL8从入门到精通学习笔记
MySQL8学习笔记 MySQL8从入门到精通 1.数据库操作 1.1 创建数据库 1.2 查看数据库 1.3 删除数据库 1.4 选择数据库 2.数据表操作 2.1 创建数据表 2.2 查看表 2. ...
- 基金投资好简单,从入门到精通 -学习笔记day1
本系列笔记是我通过在喜马拉雅平台,跟随"威尼斯摆渡人"出品的"基金投资好简单,入门到精通"系列时学习记录的笔记,如果大家对基金投资感兴趣,并不知道怎么入手的话, ...
- mysql数据库应用_MySQL数据库应用 从入门到精通 学习笔记
以下内容是学习<MySQL数据库应用 从入门到精通>过程中总结的一些内容提要,供以后自己复现使用. 一:数据库 查看所有数据库:SHOW DATABASES 创建数据库:CREATE DA ...
- 《ASP.NET4 从入门到精通》学习笔记4
第4部分诊断与插件 刚開始看这章的时候,真实一头雾水.不知道在讲什么.只是看了关于http pipeline之后.才了解相关说明. 因此对于这一章的学习,建议各位首先看看http pipeline然后 ...
- lt;ASP.NET4 从入门到精通gt;学习笔记3
第三部分,状态管理与缓存 何为状态管理.起始对于web而言.经过前面章节的解说.已经理解,对于web程序,就是一个无状态的程序.每次的请求与每次的响应,两者之间本身就是独立存在的,这一点对于早期的静态 ...
- 黑马程序员新版Linux零基础快速入门到精通——学习笔记
01初识Linux 1.1.操作系统概述 1.1.1.硬件和软件 我们所熟知的计算机是由硬件和软件组成的. 硬件: 计算机系统中由电子.机械和光电元件等组成的各种物理装置的总称. (看的见.摸得着 ...
- Kafka从入门到精通学习笔记
前言: 新公司消息队列用选用卡夫卡,刚好之前没有用这个消息队列过借此机会学习一波.发现大公司都喜欢用这款消息队列. 消息队列中间件的使用并不复杂,但消息队列的选型一直是个难点.比如: 不同业务场景下该 ...
- 基金投资好简单,从入门到精通 -学习笔记day3
第九集:国际的主流指数介绍 美国: 标普500指数:全名叫做标准普尔500指数,它是由标准普尔公司所编制并发布的一个指数,它基本上囊括了在美国市场上面市值最大.流动性最好的500家公司,应该说代表了美 ...
- 尚硅谷Vue2.0+Vue3.0全套教程丨vuejs从入门到精通 学习笔记
已经将课程刷完,但是后来发现网上有很多总结特别好的网站,现在汇总如下 https://www.yuque.com/cessstudy/kak11d 大家好,老师的笔记拿到了,给大家快速拿到 阿里云-- ...
最新文章
- ZooKeeper场景实践:(6)集群监控和Master选举
- 利用被入侵的路由器迈入内网——抓包,利用路由器漏洞入侵,进行流量劫持...
- ubantu 16.04 mysql_Ubuntu 16.04下安装MySQL
- 关闭本机的代理服务(Proxy)
- 在Spring Rest模板中跳过SSL证书验证
- 重命名数据库解决“无法用排他锁锁定该数据库”
- 华为交换机配置syslog发送_配置华为交换机把日志发送到远程centos syslog服务器上...
- BayaiM__ oracle函数_01
- 阶段1 语言基础+高级_1-3-Java语言高级_08-JDK8新特性_第1节 常用函数接口_3_性能浪费的日志案例...
- Java并发包实际应用_Java并发包之核心AQS
- 南京师范大学2021年硕士研究生入学考试高等代数试卷及参考答案
- c语言partition头文件,c – dxvahd.h中的#if WINAPI_FAMILY_PARTITION(WINAPI_PARTITION_DESKTOP)何时成为true头文件...
- 数据结构系列-队列的基本操作
- arcGis for js 3D marker
- Google Earth Engine——美国人口数据可视化分析
- ajax + laypage实现分页
- python数据分析入门【二】 --- 数据处理
- 《时间从来不语,却回答了所有问题》读后感
- Spring Data ElasticSearch 3.2版本发布,相关新特性说明
- Html5通过js进行页面内搜索
热门文章
- java计算机毕业设计网上鲜花店网站源代码+数据库+系统+lw文档
- 【转】The Android boot process from power on
- 一文读懂WebSocket
- Student teachers是啥:千万别轻易怀疑原文有误
- java8新特性 stream Optional
- java-php-python-基于vue技术的汽车维修检测系统设计与实现计算机毕业设计
- 普通人做自媒体视频剪辑会有出路吗?
- 案例分享:使用 Python 批量处理统计年鉴数据(上)
- 推荐10个值得一去的国外神器网站!登录无需任何手段,实用又有趣!
- 忘记php数据库密码咋办,mysql密码遗忘怎么办