探索性数据分析

常用分布的概率函数图

二项分布

n <- 20
p <- 0.2
k <- seq(0,n)
plot(k,dbinom(k,n,p),type = "h",main = "Binomial distribution,n=20,p=0.2",xlab = "k")

泊松分布

lambda <- 4.0
k <- seq(0,20)
plot(k,dpois(k,lambda),type = "h",main = "Poisson distribution,lambda=5.5",xlab = "k")

几何分布

p <- 0.5
k <- seq(0,10)
plot(k,dgeom(k,p),type = "h",main = "Geometric distribution,p=0.5",xlab = "k")

超几何分布

N <- 30
M <- 10
n <- 10
k <- seq(0,10)
plot(k,dhyper(k,N,M,n),type = "h",main = "Hypergeometric distribution,N=30,M=10,n=10",xlab="k")

负二项分布

n <- 10
p <- 0.5
k <- seq(0,40)
plot(k,dnbinom(k,n,p),type = "h",main = "Negative Binomial distribution,n=10,p=0.5",xlab="k")

正态分布

curve(dnorm(x,0,1),xlim = c(-5,5),ylim=c(0,0.8),col="red",lwd=2,lty=3)
curve(dnorm(x,0,2),add = T,col ="blue",lwd=2,lty=2)
curve(dnorm(x,0,1/2),add = T,lwd=2,lty=1)
title(main="Gaussian distributions")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("sigma=1","sigma=2","sigma=1/2"),lwd = c(2,2,2),lty = c(3,2,1),col = c("red","blue",par("fg")))

t分布

curve(dt(x,1),xlim=c(-3,3),ylim=c(0,0.4),col="red",lwd=2,lty=1)
curve(dt(x,2),add = T,col="green",lwd=2,lty=2)
curve(dt(x,10),add = T,col="orange",lwd=2,lty=3)
curve(dnorm(x),add = T,lwd=3,lty=4)
title(main = "Student T distributions")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("df=1","df=2","df=10","Gaussian distribution"),lwd = c(2,2,2,2),lty = c(1,2,3,4),col = c("red","blue","green",par("fg")))

卡方分布

curve(dchisq(x,1),xlim = c(0,10),ylim=c(0,0.6),col="red",lwd=2)
curve(dchisq(x,2),add = T,col="green",lwd=2)
curve(dchisq(x,3),add = T,col = "blue", lwd = 2)
curve(dchisq(x,5),add = T,col = "orange",lwd = 2)
abline(h=0,lty=3)
abline(v=0,lty=3)
title(main = "Chi square Distributions")
legend(par("usr")[2],par("usr")[4],xjust=1,c("df=1","df=2","df=3","df=5"),lwd=3,lty=1,col=c("red","green","blue","orange"))


F分布

curve(df(x,1,1), xlim = c(0,2),ylim=c(0,0.8),lty=1)
curve(df(x,3,1), add = T, lwd=2, lty=2)
curve(df(x,6,1), add = T, lwd=2, lty=3)
curve(df(x,3,3), add = T, col = "red", lwd=3,lty=4)
curve(df(x,3,6), add = T, col = "blue", lwd =3,lty=5)
title(main = "Fisher's F")
legend(par("usr")[2],par("usr")[4],xjust=1,c("df=(1,1)","df=(3,1)","df=(6,1)","df=(3,3)","df=(3,6)"),lwd = c(1,2,2,3,3),lty = c(1,2,3,4,5),col = c(par("fg"),par("fg"),par("fg"),"red","blue"))


对数正态分布

curve(dlnorm(x),xlim = c(-.2,5),ylim=c(0,1.0),lwd=2)
curve(dlnorm(x,0,3/2),add = T, col = "blue", lwd = 2,lty = 2)
curve(dlnorm(x,0,1/2), add = T, col = "orange", lwd = 2,lty = 3)
title(main = "Log normal distributions")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("sigma = 1","sigma = 2","sigma = 1/2"),lwd = c(2,2,2),lty = c(1,2,3),col = c(par("fg"),"blue","orange"))

柯西分布

curve(dcauchy(x),xlim = c(-5,5),ylim=c(0,.5),lwd=3)
curve(dnorm(x),add = T, col = "red", lty = 2)
title(main = "Cauchy distribution")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("Cauchy distribution","Gaussian distribution"),lwd = c(3,1),lty = c(1,2),col = c(par("fg"),"red"))


威布尔分布

curve(dexp(x),xlim = c(0,3),ylim=c(0,2))
curve(dweibull(x,1),lty=3,lwd=3,add = T)
curve(dweibull(x,2),col="red",add = T)
curve(dweibull(x,.8),col="blue",add = T)
title(main = "Weibull Probability Distribution Function")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("Exponential","Weibull,shape=1","Weibull,shape=2","Weibull,shape=0.8"),lwd = c(1,3,1,1),lty = c(1,3,1,1),col = c(par("fg"),par("fg"),"red","blue"))


伽马分布

curve(dgamma(x,1,1),xlim = c(0,5),lwd=2,lty=1)
curve(dgamma(x,2,1),add = T,col="red",lwd=2,lty=2)
curve(dgamma(x,3,1),add = T,col="green",lwd=2,lty=3)
curve(dgamma(x,4,1),add = T,col ="blue",lwd=2,lty=4)
curve(dgamma(x,5,1),add = T,col ="orange",lwd=2,lty=5)
title(main = "Gamma distributions")
legend(par("usr")[2],par("usr")[4],xjust = 1,c("k=1 (Exponential distribution)","k=2","k=3","k=4","k=5"),lwd = c(2,2,2,2,2),lty = c(1,2,3,4,5),col = c(par("fg"),"red","green","blue","orange"))


贝塔分布

curve(dbeta(x,1,1),xlim = c(0,1),ylim=c(0,4))
curve(dbeta(x,3,1),add = T, col ="green")
curve(dbeta(x,3,2),add = T,lty=2,lwd=2)
curve(dbeta(x,4,2),add = T,lty=2,lwd=2,col="blue")
curve(dbeta(x,2,3),add = T,lty=3,lwd=3,col="red")
curve(dbeta(x,4,3),add = T,lty=3,lwd=3,col="orange")
title(main="Beta distributions")
legend(par("usr")[1],par("usr")[4],xjust = 0,c("1,1","3,1","3,2","(4,2)","(2,3)","4,3"),lwd = c(1,1,2,2,3,3),lty = c(1,1,2,2,3,3),col = c(par("fg"),"green",par("fg"),"blue","red","orange"))

直方图与密度函数的估计

直方图

它给出了数据的频率分布图形。
hist( )的调用格式

hist(x, breaks = “Sturges”, freq = NULL, probability = !freq,
col = NULL,
main = paste(“Histogram of” , xname),
xlim = range(breaks), ylim = NULL,
xlab = xname, ylab,
axes = TRUE, nclass = NULL)

说明: 若选项breaks取向量,则用于指明直方图区间的分割位置; 若取正整数,则用于指定直方图的小区间数. freq取T表示使用频数画直方图, 取F则使用频率画直方图. probability与freq恰好相反. col用于指明小矩形的颜色.

核密度估计

样本的直方图粗略地描述了样本的分布, 我们还可以用函数density()得到样本的核密度估计值, 并用lines( )得到密度估计的曲线.
density( )的调用格式

density(x, bw = “nrd0”,
kernel = c(“gaussian”, “epanechnikov”, “rectangular”,
“triangular”, “biweight”, “cosine”, “optcosine”),
n = 512, from, to)

说明: 选项bw指定核密度估计的窗宽, 也用字符串表示窗宽选择规则, 具体可参考函数bw.nrd( ). kernel为核密度估计所使用的光滑化函数, 缺省为正态核函数. n给出等间隔的核密度估计点。from与to分别给出需要计算核密度估计的左右端点。

例4.2.1从二项分布binom(100,0.9)中抽取容量为N=100000的样本.试作出它的直方图及核密度估计曲线.

N <- 100000 #重复N组
n <- 100    #每组100次试验
p <- .9     #每次试验的成功概率
x <- rbinom(N,n,p)  #每组成功的次数
hist(x,xlim = c(min(x),max(x)),probability = T,nclass = max(x)-min(x) +1,col = "lightblue",main="Binomial distribution,n=100,p=0.9")
lines(density(x,bw=1),col="red",lwd=3)


例4.2.2从负二项分布nbinom(10,0.25)中抽取容量为N=100000的样本. 试作出它的直方图及核密度估计曲线.

N <- 100000 #重复N组
n <- 10     #每组需要成功10次
p <- 0.25   #每次成功的概率是0.25
x <- rnbinom(N,n,p) #在成功10次前,要失败多少次
hist(x,xlim = c(min(x),max(x)),probability = T,nclass = max(x)-min(x) +1,col = "lightblue",main="Nbinomial distribution,n=10,p=0.25")
lines(density(x,bw=1),col="red",lwd=3)

单组数据的描述性统计分析

单组数据的图形描述

** 例4.3.1** 程序包DAAG中有内嵌数据集“possum”,它包括了从维多利亚南部到皇后区的七个地区的104只负鼠(possum)的年龄、尾巴的长度、总长度等9个特征值,我们仅考虑43只雌性负鼠的特征值,我们建立子集fpossum,考查雌性负鼠(fpossum)的总长度的频率分布.

《R语言与统计分析》-学习笔记4相关推荐

  1. python web开发入门_python大佬整理的python web开发从入门到精通学习笔记

    原标题:python大佬整理的python web开发从入门到精通学习笔记 Python(发音:英[?pa?θ?n],美[?pa?θɑ:n]),是一种面向对象.直译式电脑编程语言,也是一种功能强大的通 ...

  2. MySQL8从入门到精通学习笔记

    MySQL8学习笔记 MySQL8从入门到精通 1.数据库操作 1.1 创建数据库 1.2 查看数据库 1.3 删除数据库 1.4 选择数据库 2.数据表操作 2.1 创建数据表 2.2 查看表 2. ...

  3. 基金投资好简单,从入门到精通 -学习笔记day1

    本系列笔记是我通过在喜马拉雅平台,跟随"威尼斯摆渡人"出品的"基金投资好简单,入门到精通"系列时学习记录的笔记,如果大家对基金投资感兴趣,并不知道怎么入手的话, ...

  4. mysql数据库应用_MySQL数据库应用 从入门到精通 学习笔记

    以下内容是学习<MySQL数据库应用 从入门到精通>过程中总结的一些内容提要,供以后自己复现使用. 一:数据库 查看所有数据库:SHOW DATABASES 创建数据库:CREATE DA ...

  5. 《ASP.NET4 从入门到精通》学习笔记4

    第4部分诊断与插件 刚開始看这章的时候,真实一头雾水.不知道在讲什么.只是看了关于http pipeline之后.才了解相关说明. 因此对于这一章的学习,建议各位首先看看http pipeline然后 ...

  6. lt;ASP.NET4 从入门到精通gt;学习笔记3

    第三部分,状态管理与缓存 何为状态管理.起始对于web而言.经过前面章节的解说.已经理解,对于web程序,就是一个无状态的程序.每次的请求与每次的响应,两者之间本身就是独立存在的,这一点对于早期的静态 ...

  7. 黑马程序员新版Linux零基础快速入门到精通——学习笔记

    01初识Linux 1.1.操作系统概述 1.1.1.硬件和软件 我们所熟知的计算机是由硬件和软件组成的. 硬件: 计算机系统中由电子.机械和光电元件等组成的各种物理装置的总称. ​ (看的见.摸得着 ...

  8. Kafka从入门到精通学习笔记

    前言: 新公司消息队列用选用卡夫卡,刚好之前没有用这个消息队列过借此机会学习一波.发现大公司都喜欢用这款消息队列. 消息队列中间件的使用并不复杂,但消息队列的选型一直是个难点.比如: 不同业务场景下该 ...

  9. 基金投资好简单,从入门到精通 -学习笔记day3

    第九集:国际的主流指数介绍 美国: 标普500指数:全名叫做标准普尔500指数,它是由标准普尔公司所编制并发布的一个指数,它基本上囊括了在美国市场上面市值最大.流动性最好的500家公司,应该说代表了美 ...

  10. 尚硅谷Vue2.0+Vue3.0全套教程丨vuejs从入门到精通 学习笔记

    已经将课程刷完,但是后来发现网上有很多总结特别好的网站,现在汇总如下 https://www.yuque.com/cessstudy/kak11d 大家好,老师的笔记拿到了,给大家快速拿到 阿里云-- ...

最新文章

  1. ZooKeeper场景实践:(6)集群监控和Master选举
  2. 利用被入侵的路由器迈入内网——抓包,利用路由器漏洞入侵,进行流量劫持...
  3. ubantu 16.04 mysql_Ubuntu 16.04下安装MySQL
  4. 关闭本机的代理服务(Proxy)
  5. 在Spring Rest模板中跳过SSL证书验证
  6. 重命名数据库解决“无法用排他锁锁定该数据库”
  7. 华为交换机配置syslog发送_配置华为交换机把日志发送到远程centos syslog服务器上...
  8. BayaiM__ oracle函数_01
  9. 阶段1 语言基础+高级_1-3-Java语言高级_08-JDK8新特性_第1节 常用函数接口_3_性能浪费的日志案例...
  10. Java并发包实际应用_Java并发包之核心AQS
  11. 南京师范大学2021年硕士研究生入学考试高等代数试卷及参考答案
  12. c语言partition头文件,c – dxvahd.h中的#if WINAPI_FAMILY_PARTITION(WINAPI_PARTITION_DESKTOP)何时成为true头文件...
  13. 数据结构系列-队列的基本操作
  14. arcGis for js 3D marker
  15. Google Earth Engine——美国人口数据可视化分析
  16. ajax + laypage实现分页
  17. python数据分析入门【二】 --- 数据处理
  18. 《时间从来不语,却回答了所有问题》读后感
  19. Spring Data ElasticSearch 3.2版本发布,相关新特性说明
  20. Html5通过js进行页面内搜索

热门文章

  1. java计算机毕业设计网上鲜花店网站源代码+数据库+系统+lw文档
  2. 【转】The Android boot process from power on
  3. 一文读懂WebSocket
  4. Student teachers是啥:千万别轻易怀疑原文有误
  5. java8新特性 stream Optional
  6. java-php-python-基于vue技术的汽车维修检测系统设计与实现计算机毕业设计
  7. 普通人做自媒体视频剪辑会有出路吗?
  8. 案例分享:使用 Python 批量处理统计年鉴数据(上)
  9. 推荐10个值得一去的国外神器网站!登录无需任何手段,实用又有趣!
  10. 忘记php数据库密码咋办,mysql密码遗忘怎么办