1.3 统计学的几个基本概念
统计学的几个基本概念
- 总体与样本
- 变量与资料
- 误差
- 频率与概率
总体与样本
总体(population):根据研究目的而确定的同质观察单位的全体,更确切的说,是同质的所有观察单位某种观察值的集合。
样本:从总体中随机抽得的部分观察单位实测值的集合。
抽样(sampling):从总体中抽取部分观察单位的过程。
注意:获取样本仅仅是手段,而通过样本信息来推断总体特征才是研究目的。
变量与资料
变量(variable):每个观察单位的某项特征,比如身高体重。
变异(variation):个体间的差异。
离散变量(discrete variable):数轴上任意不同两点之间可取值是有限的。
连续变量(continuous):数轴上任意不同两点之间可取值是无限的。
1.计量资料(measurement data/quantitative data/numerical variable):指观测每个观察单位某项指标的大小而获得的资料,变量值是定量的,可分为连续型和离散型。
2.计数资料(enumeration data/qualitative data/unordered categorical variable/nominal variable):是指将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。变量值是定性的,变现为互不相容的属性或类别,分为二分类/多分类。
3.等级资料(ranked data/semi-quantitative data/ordinal categorical variable):是指将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。变量值具有半定量性质。
注意:各类资料可互相转化,一般来说,定量可转化为定性,若要把计数资料转化为计量资料,称指标的数量化,这部分将在第十三章第一节“一般线性模型”中介绍。
误差
频率与概率
1.频率(relative frequency):设在相同条件下,独立的重复n次实验,随机事件A出现f次,则f/n为随机事件A的频率。
2.概率(probability):当n逐渐增大时,频率趋向于一个常数,该常数为随机事件A的概率,可记为P(A),简称P。概率是度量随机事件发生可能性大小的一个数值。在实际工作中,只要观察次数足够多,可将频率作为概率的估计值。
习惯上将P<=0.5称为小概率事件。
有关概率推断及其在统计分析中的应用将在后续章节进一步深入讨论。
1.3 统计学的几个基本概念相关推荐
- 【医学统计学—第四版-孙/人民卫生出版社】——绪论:01 统计学的几个基本概念
第一章:绪论 一. 统计学的几个基本概念 总体与样本 变量与资料 统计分类方法的选用,与资料类型密切联系. 误差 频率与概率 二. 医学统计工作的基本步骤 1.设计 2.收集资料 3.整理资料 4.分 ...
- 统计学基础一:基础概念
统计学是搜索.分析.表述.解释数据的一门综合性科学.可达到推断所测对象的本质,甚至预测对象未来的目的. 数据:是为了描述和解释所搜集.分析.汇总的事实和数字. 数据集:用于特定研究而搜集的所有数据. ...
- 方差,协方差 、统计学的基本概念
一.统计学的基本概念 统计学里最基本的概念就是样本的均值.方差.标准差.首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述: 均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告 ...
- NumPy 快速入门系列:应用统计学基础概念、相关统计指标与NumPy的实现
NumPy 快速入门系列:应用统计学基础概念.相关统计指标与NumPy的实现 前言: 统计学导论: 统计学定义: 统计学分类: 统计学基本概念: 统计过程: 统计指标与NumPy: 用 Python ...
- 《数据科学家养成手册》第八章---统计学
数理统计的鼻祖------阿道夫.凯特勒 1.凯特勒的"平均人"思想 凯特勒运用概率论的方法进一步的研究了社会道德领域的大量统计资料,发现"在我们对大多数人进行观察的时候 ...
- 统计学:统计学概述(一)
统计学:统计学概述(一) 雪柯 大工生物信息 提笔为写给奋进之人 已关注 陈灯 等 66 人赞同了该文章 文章的一开始我打算放一张图,让大家理解一下统计到底是在干什么,统计的基本流程是什么,本文旨在抛 ...
- 独家 | 一文解析统计学在机器学习中的重要性(附学习资源)
作者:Jason Brownlee 翻译:陈之炎 校对:万文青 本文共2400字,建议阅读10分钟. 本文介绍为什么统计对于通用应用和机器学习如此重要,并大致了解各种可用的方法. 统计是一组工具,您可 ...
- 统计学中的协方差矩阵(阵列信号基础)
在处理阵列信号的时候,为了获得空间信号维度的相关性,以估计目标的信息.故使用协方差矩阵能够获得这些,因为协方差矩阵是每一维度下(也就是阵元)信号的相关性.当两个维度相关时,信号的协方差也是最大的. 一 ...
- 统计学怎么求加权指数_我要自学生信之统计学:统计学概述(一)
文章的一开始我打算放一张图,让大家理解一下统计到底是在干什么,统计的基本流程是什么,本文旨在抛砖引玉,是我要学习生物信息学之统计学的第一篇文章.旨在帮助大家建立起一个初步概念. 数据的统计分析主要包括 ...
最新文章
- 一文看懂人脸识别(4个特点+4个实现步骤+5个难点+算法发展轨迹)
- 在Linux和Windows操作系统中socket program的兼容问题
- MyBatis 之 动态SQL
- 理解分布式一致性:Raft协议
- LeetCode面试题03. 数组中重复的数字
- python通配符搜索文件_Python 如何查找特定类型文件
- 分层目标规划matlab,多目标规划问题Matlab示例_fgoalattain.doc
- python压缩视频_如何压缩视频大小?
- 夜谈TCP/IP的起源和胜利
- 二次开发—Ribbon界面
- Android布局小案例——安卓版计算器
- chrome浏览器小恐龙自动跑
- neon浮点运算_ARM 浮点计算测试与分析
- 粥 淡薄之中滋味长
- STM32实现LED流水灯
- 我的世界服务器方块高度修改,我的世界:Mojang解除建筑高度限制,最高可达2032格,玩家狂喜!...
- Kotlin基础第4章—类型同步
- opencv检测乒乓球
- 蓝桥杯备赛(网站推荐和一些资料)
- 【问底】王帅:深入PHP内核(二)——SAPI探究