数理统计(python)
一般认为,统计学是收集、分析、表述和解释数据的科学,统计学是一门处理数据的方法和技术的学科。
1.总体和样本
研究对象的全体称为总体, 构成总体的每个成员称为个体 ,
总体就是一个概率分布,总体的数量指标就是服从该概率分布的一个随机变量。
一般来说,总体分为:有限总体和无限总体, 大多数我们说的总体是无限总体。
为了了解总体的分布, 我们从总体中随机地抽取 n个个体, 记其指标值为 x1,x2,⋯, xn, 则 x1,x2,⋯,xn称为总体的一个样本,n 称为样本容量,或简称样本量,样本中的个体称为样品。
样本的二重性
一方面, 由于样本是从总体中随机抽取的, 抽取前无法预知它们的数值, 因此, 样本是一个随机变量, 用大写字母 X1,X2,⋯,Xn表示
另一方面, 样本在抽取以后经观测就有确定的观测值, 因此, 样本又是一组数值, 此时用小写字母 x1,x2,⋯,xn表示是合适的。
为了描述的简单,我们只用小写字母表示样本x1,x2,⋯,xn,不管样本是随机变量还是具体的数值,都用小写字母表示。
简单随机抽样的需求
从总体中抽取的样本具有代表性:具有代表性要求总体中每一个个体都有同等机会被选入样本中,也就意味着样本中的每一个样品xi与总体X有相同的分布,简称“同分布”。
从总体中抽取的样本具有独立性:具有独立性即要求样本中每一样品的取值不影响其他样品的取值, 也就意味着 x1,x2,⋯,xn之间相互独立。
总结起来:在简单随机抽样这种抽样方法下,样本中的每一个样品x1,x2,⋯,xn之间独立同分布,同分布于总体分布,简称:iid。用简单随机抽样方法得到的样本称为简单随机样本,也简称样本。
设总体 X 具有分布函数 F(x),x1,x2,⋯,xn 为取自该总体的容量为 n 的样本,则样本联合分布函数为
2.经验分布函数与直方图
(1)经验分布函数:
经验分布函数就是使用样本信息构造的分布函数近似未知的总体分布函数
设 x1,x2,⋯,xn是取自总体分布函数为 F(x) 的样本, 若将样本观测值由小到大进行排列, 记为 x(1),x(2),⋯,x(n), 则 x(1),x(2),⋯,x(n) 称为有序样本, 用有序样本定义如下函数
则 Fn(x)是一非减右连续函数, 且满足
由此可见, Fn(x)是一个分布函数, 称 Fn(x)为该样本的经验分布函数。
(2)直方图:频数直方图和频率直方图
直方图是数值数据分布的精确图形表示, 这是一个连续变量(定量变量)的概率分布的估计
# 频数直方图
x_samples = np.random.randn(1000)
plt.hist(x_samples, bins=10,color='blue',alpha=0.6) # bins=10代表10根柱子
plt.xlabel("x")
plt.ylabel("频数 n")
plt.title("频数直方图")
plt.show()
# 频率直方图
x_samples = np.random.randn(1000)
plt.hist(x_samples, bins=10,color='blue',alpha=0.6,density=True) # bins=10代表10根柱子
plt.xlabel("x")
plt.ylabel("频率 p")
plt.title("频率直方图")
plt.show()
3.统计量与三大抽样分布
设 x1,x2,⋯,xn 为取自某总体的样本, 若样本函数 T=T(x1,x2,⋯,xn) 中不含有任何末知参数, 则称 T 为统计量。统计量的分布称为抽样分布。
值得注意的是:统计量由样本决定,从而统计量因样本而异,对于同一总体,由于抽取样本是具有随机性的,因此抽取不同的样本,统计量就不同,从而统计量也是一个随机变量。统计量的分布称为抽样分布。虽然统计量不依赖于任何参数,但统计量的分布一般依赖于未知参数。
数理统计(python)相关推荐
- 开宝箱-抽装备-求期望(概率论与数理统计 python)
问题描述 玩家在游戏中开宝箱有概率获得装备A和B,开一次宝箱需要100游戏币,每次只能获得一个道具,其中获得装备A的概率5%,获得装备B的概率为15%.请问,玩家在放回随机的条件下获得一套A和B,需要 ...
- matlab最小二乘法_基于最小二乘法的线性回归拟合
阅读本文需要的知识储备: 高等数学 概率论与数理统计 Python基础 线性回归,其实生活中有很多这样的例子,比如:票价与行车距离.服务质量之间的关系,买房时房价与面积.地域等的关系.给我们一组这样的 ...
- 基于最小二乘法的——线性回归拟合(一)
http://www.ikeguang.com/ 阅读本文需要的知识储备: 高等数学 概率论与数理统计 Python基础 最近对线性回归很感兴趣,就研究了一下.其实生活中有很多这样的例子,比如:票价与 ...
- excel透视表计数去重_Excel数据透视表中的唯一计数
excel透视表计数去重 In a previous article, Roger Govier showed us a couple of different ways to get a Uniq ...
- excel透视表计数去重_在工作表上对Excel自动筛选进行计数
excel透视表计数去重 It seemed simple enough, but counting the AutoFilters on an Excel sheet is a tough job! ...
- 黑猴子的家:下载svn客户端
1.官网 https://tortoisesvn.net/ (客户端) https://www.visualsvn.com/(服务端+客户端) 2.Downloads 3.TortoiseSVN 64 ...
- 黑猴子的家:下载SVN服务端
https://www.visualsvn.com/(服务端+客户端) 1.download 2.64-bit 3.下载 查看全文 http://www.taodudu.cc/news/show-70 ...
- 黑猴子的家:TortoiseSVN 客户端安装
1.双击运行 2.Next 3.Next 4.Next 5.Install 6.Finish 查看全文 http://www.taodudu.cc/news/show-7033935.html 相关文 ...
- python在概率论与数理统计中的作用
概率论与数理统计 一.描述性统计和统计图 1.用Pandas来计算统计量 使用 pandas的describe方法计算相关统计量,并计算身高和体重的偏度,峰度,样本的25%,50%,90%分位数 数据 ...
- python 方差分析_数理统计(一)——用Python进行方差分析
方差分析可以用来推断一个或多个因素在其状态变化时,其因素水平或交互作用是否会对实验指标产生显著影响.主要分为单因素方差分析.多因素无重复方差分析和多因素重复方差分析. 做数理统计课后题,发现方差分析计 ...
最新文章
- pandas新字段(数据列)生成、使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战
- 【笔记】SFTP、ssh密钥连接远程服务器,putty工具生成密钥,详细图文教程
- Python的冷技巧小技巧
- springboot-springmvc响应json与xml原理-详解数据响应与内容协商(长文预警,收藏慢啃)
- linux查询所有目录的txt文件,Linux 在指定目录下的所有文件中查找text文本的方法...
- 张景中:把数学变容易大有可为
- 基本类型与字符串的相互转换
- 互联网“高薪榜”曝光,物联网将接棒?
- 应用层协议:HTTP
- git rebase --onto
- 做新媒体短视频运营需要什么技能
- Django Setting的时区设置
- Gulp老矣 尚能饭否
- 技术员 Ghost Win10 x64 装机版/纯净版 201710
- mysql中locate的用法
- 蓝队应急响应之Linux篇
- Web中的EasyExcel导出Excel(不创建对象且自定义合并单元格策略)
- EOS系列 - EOSIO 2.1
- Oracle 日期时间范围查询
- Au cc插入多轨会话的图文教程