大学的时候,我的《概率论和数理统计》这门课一共挂过3次,而且我记得最后一次考过的时候刚刚及格,只有60分。你可以想象我的《概率论》这门课学的是有多差了。后来,我工作以后,在学习数据分析技能时,又重新把《概率论》这本书学了一遍。原来之前一直没学好这门课的很重要一个原因就是,这门课涉及很多基础的概念,而我当初就是对这些概念非常不理解。

今天我就讲讲应该如何理解概率分布函数和概率密度函数的问题。是不是乍一看特别像,容易迷糊。如果你感到迷糊,恭喜你找到我当年的感觉了。

先从离散型随机变量和连续性随机变量说起

对于如何分辨离散型随机变量和连续性随机变量,我这里先给大家举几个例子:

1、一批电子元件的次品数目。

2、同样是一批电子元件,他们的寿命情况。

在第一个例子中,电子元件的次数是一个在现实中可以区分的值,我们用肉眼就能看出,这一堆元件里,次品的个数。但是在第二个例子中,这个寿命它是一个你无法用肉眼数的过来的数字,它需要你用笔记下来,变成一个数字你才能感受它。在这两个例子中,第一例子涉及的随机变量就是离散型随机变量,第二个涉及的变量就是连续型随机变量。

在贾俊平老师的《统计学》教材中,给出了这样的区分:

如果随机变量的值可以都可以逐个列举出来,则为离散型随机变量。如果随机变量X的取值无法逐个列举则为连续型变量。

我始终觉得,贾老师这么说,对于我们这些脑子笨又爱钻牛角尖的学生来说,还是不太好理解。所以我就告诉大家一个不一定非常严谨,但是绝对好区分的办法。

只要是能够用我们日常使用的量词可以度量的取值,比如次数,个数,块数等都是离散型随机变量。只要无法用这些量词度量,且取值可以取到小数点2位,3位甚至无限多位的时候,那么这个变量就是连续型随机变量!

对了,如果你连随机变量这个概念还不理解的话,我送你一句贾俊平老师的话:

如果微积分是研究变量的数学,那么概率论与数理统计是研究随机变量的数学。

再来理解离散型随机变量的概率分布,概率函数和分布函数

在理解概率分布函数和概率密度函数之前,我们先来看看概率分布和概率函数是咋回事。一下子又冒出来两个长得差不多的概念!没事,他们长得差不多,实际代表的含义其实也差不多!

在讲概率函数和概率分布之前,我想先讲讲为什么我们花这么大的力气去研究这个概念。因为它实在太重要了,为什么呢?在这里,我直接引用陈希孺老师在他所著的《概率论与数理统计》这本书中说的:

研究一个随机变量,不只是要看它能取哪些值,更重要的是它取各种值的概率如何!

这句是本文的核心内容,你要牢牢记得,我们这篇文章里的所有概念都在是描述一件东西,那就是概率!概率!概率!什么概率密度啦,概率分布啦,概率函数啦,都是在描述概率!

概率分布和概率函数这两个概念,我想先从概率函数开始讲。概率函数,就是用函数的形式来表达概率。

pi=P(X=ai)(i=1,2,3,4,5,6)

在这个函数里,自变量(X)是随机变量的取值,因变量(pi)是取值的概率。这就叫啥,这叫用数学语言来表示自然现象!它就代表了每个取值的概率,所以顺理成章的它就叫做了X的概率函数。从公式上来看,概率函数一次只能表示一个取值的概率。比如P(X=1)=1/6,这代表用概率函数的形式来表示,当随机变量取值为1的概率为1/6,一次只能代表一个随机变量的取值。

接下来讲概率分布,顾名思义就是概率的分布,这个概率分布还是讲概率的。我认为在理解这个概念时,关键不在于“概率”两个字,而在于“分布”这两个字。为了理解“分布”这个词,我们来看一张图。

离散型随机变量的值和概率的分布列表

在很多教材中,这样的列表都被叫做离散型随机变量的“概率分布”。其实严格来说,它应该叫“离散型随机变量的值分布和值的概率分布列表”,这个名字虽然比“概率分布”长了点,但是对于我们这些笨学生来说,肯定好理解了很多。因为这个列表,上面是值,下面是这个取值相应取到的概率,而且这个列表把所有可能出现的情况全部都列出来了!

举个例子吧,一颗6面的骰子,有1,2,3,4,5,6这6个取值,每个取值取到的概率都为1/6。那么你说这个列表是不是这个骰子取值的”概率分布“?

长得挺像的,上面是取值,下面是概率,这应该就是骰子取值的“概率分布”了吧!大错特错!少了一个最重要的条件!对于一颗骰子的取值来说,它列出的不是全部的取值,把6漏掉了!

这么一说你就应该明白概率分布是个什么鬼了吧。说完概率分布,就该说说分布函数了。这个分布函数又是个简化版的东西!我真的很讨厌我们的教材中老是故弄玄虚,卖弄概念!你就老老实实的写成”概率分布函数“,让我们这些笨学生好理解一些不行吗?

看看下图中的分布律!这又是一个不统一叫法的丑恶典型!这里的分布律明明就是我们刚刚讲的“概率函数”,完全就是一个东西嘛!但是我知道很多教材就是叫分布律的。

概率分布函数就是把概率函数累加

我们来看看图上的公式,其中的F(x)就代表概率分布函数啦。这个符号的右边是一个长的很像概率函数的公式,但是其中的等号变成了大于等于号的公式。你再往右看看,这是一个一个的概率函数的累加!发现概率分布函数的秘密了吗?它其实根本不是个新事物,它就是概率函数取值的累加结果!所以它又叫累积概率函数!其实,我觉得叫它累积概率函数还更好理解!!

概率函数和概率分布函数就像是一个硬币的两面,它们都只是描述概率的不同手段!

连续型随机变量也有“概率函数”和“概率分布函数”吗?

有!连续型随机变量也有它的“概率函数”和“概率分布函数”,但是连续型随机变量的“概率函数”换了一个名字,叫做“概率密度函数”!为啥要这么叫呢?我们还是借用大师的话来告诉你,在陈希孺老师所著的《概率论与数理统计》这本书中,

如果这么解析你还是不太懂的话,看看下面的这个公式:

概率密度函数用数学公式表示就是一个定积分的函数,定积分在数学中是用来求面积的,而在这里,你就把概率表示为面积即可!

左边是F(x)连续型随机变量分布函数画出的图形,右边是f(x)连续型随机变量的概率密度函数画出的图像,它们之间的关系就是,概率密度函数是分布函数的导函数。

两张图一对比,你就会发现,如果用右图中的面积来表示概率,利用图形就能很清楚的看出,哪些取值的概率更大!这样看起来是不是特别直观,特别爽!!所以,我们在表示连续型随机变量的概率时,用f(x)概率密度函数来表示,是非常好的!

这篇文章只是我个人对于这些概念的一些比较取巧的理解,如果你想更加深刻,精确的理解这些概念,我推荐大家读一下陈希孺老师的《概率论与数理统计》这本书,这本书对于这些概念的理解非常有帮助!

作者:产品经理马忠信
链接:https://www.jianshu.com/p/b570b1ba92bb
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

模式识别学习笔记(1)概率论基础知识相关推荐

  1. 现代信号处理笔记 1 概率论基础知识(Review of Probability)

    文章目录​ 一.什么是事件.概率.统计? 二.一些前提 1.Bertrand Paradox(悖论) 2.随机变量(Random Variables) 3.分布​ 4.一些性质 三.典型分布 1.伯努 ...

  2. LTE-V2X笔记:一些基础知识

    原文转载地址:LTE-V2X笔记:一些基础知识 (1)LTE-V2X技术 频段:5905~5925MHZ(试验频段) 调制方式:QPSK 正交相移键控 功率:23dBm (2)LTE-V2X通信模式 ...

  3. 《Java并发编程实践》学习笔记之一:基础知识

    <Java并发编程实践>学习笔记之一:基础知识 1.程序与进程 1.1 程序与进程的概念 (1)程序:一组有序的静态指令,是一种静态概念:  (2)进程:是一种活动,它是由一个动作序列组成 ...

  4. 概率论基础知识(三) 参数估计

    概率论基础知识(三) 参数估计 1.矩 矩是用来描述随机变量的某些特征的数字,即求平均值,用大写字母E表示. 矩是更具有一般意义的数字特征. 设有随机变量X,若 E ( ∣ X ∣ k ) < ...

  5. 概率论基础知识(二) 随机变量及其分布

    概率论基础知识(二) 随机变量及其分布 1.随机变量 定义:设随机试验的样本空间为S={e}, X=X(e)是定义在样本空间S上的实值单值函数.称X=X(e)为随机变量. 这样一来,样本空间可以很好的 ...

  6. 前端学习笔记(js基础知识)

    前端学习笔记(js基础知识) JavaScript 输出 JavaScript 数据类型 常见的HTML事件 DOM 冒泡与捕获 流程控制语句 for..in 计时器 let,var,const的区别 ...

  7. 模式识别学习笔记(1)——基本概念

    模式识别学习笔记--绪论 一.从数据集D中产生训练集S和测试集T,主要有以下方法: --hold-out(留出法) --cross-validation(交叉验证法) --bootstrapping( ...

  8. 【学习笔记】网络安全基础知识总结

    网络安全基础知识总结 前言 一.网络安全概述 1.1 引言 1.2 密码学的发展 1.3 密码学基础 1.4 对称密码 1.4.1 数据加密标准DES 二.数论知识 2.1 数论基础 2.2 有限域 ...

  9. JAVA学习笔记(1)【基础知识】

    JAVA学习笔记DAY_1 提示:关于java系列的内容只是本人在老师的指导下和自学过程中的一些学习笔记,如果存在错误敬请批评指正! 文章目录 JAVA学习笔记DAY_1 前言 一.Java语言未来的 ...

  10. 机器学习中用到的概率知识_学习机器学习前,你首先要掌握这些概率论基础知识...

    编者按:本文来自微信公众号"将门创投"(ID:thejiangmen),编译:Tom R,36氪经授权转发. 机器学习中有很多十分重要的核心基础概念,掌握这些概念对我们进行机器学习 ...

最新文章

  1. Oracle数据库一些操作信息
  2. 近朱者赤,近墨者还是赤
  3. [codeforces] 527A Playing with Paper
  4. TCM与Cache介绍
  5. 分析启动耗时 android,Android app启动耗时分析
  6. 智算中心新基建 浪潮首发智算中心操作系统
  7. lucene造成磁盘空间不足的问题
  8. html5证书,免费获得微软MCSD证书赶快行动吧!_html5教程技巧
  9. 数据的更新(update的用法)笔记
  10. 安全测试(五)Android APK软件安全 APP应用安全 手机软件安全 apk安全 apk反编译 应用日志窃取 apk漏洞 应用软件本身功能漏洞 高危权限泄密风险等 移动应用常规安全讲解
  11. vue3自定义指令(directive)
  12. 课代表:ChatGPT及大模型专题研讨会
  13. FBI如何费尽心力破解了苹果,以及,iOS系统究竟有多安全? | 硬创公开课
  14. 云计算的优势和存在的问题
  15. Android程序员面试必备的知识点,Android程序员
  16. 山东科技大学OJ题库 1013-多少张钞票
  17. 利用matlab实现硬币分类,一种硬币计数分类整理机的制作方法
  18. 创建一个非循环单链表并对其进行操作
  19. 关于“灵魂”和“躯体”,上汽的回复其实是行业“标准答案”
  20. 项目管理探究之挣值管理常见计算

热门文章

  1. 260+木刻版画交叉阴影线AI笔刷
  2. 树屋项目--软件概要设计说明书
  3. C语言——递归函数(求斐波那契数列第n项的值)
  4. C++中静态数据成员
  5. STM32驱动AD7190
  6. 基于 Linux 和 MiniGUI 的嵌入式系统软件开发指南题八——MiniGUI 和其他嵌入式 Linux 上的图形及图形用户界面系统
  7. loadrunner没有告诉你的
  8. aurelia中文开发手记(一):写在前面
  9. 又抽抽了,开始胡思乱想
  10. Kafka Rebalance详解