1、什么是联合概率分布?

        双向频率表是显示两个分类变量的频率(或“计数”)的表。

例如,下面的双向表显示了一项调查的结果,该调查询问了 100 人他们最喜欢哪种运动:棒球、篮球或足球。

行显示受访者的性别,列显示他们选择的运动:

在此示例中,有两个变量:Sports 和 Gender。

        联合概率分布简单地描述了给定个体对变量取两个特定值的概率。联合概率分布的重点是寻找两个变量之间的关系。

“联合”这个词来自于我们对两件事同时发生的概率感兴趣的事实。

例如,在这 100 个人中,有 13 个人是男性 他们选择棒球作为他们最喜欢的运动。

因此,我们可以说给定个人是男性选择棒球作为他们最喜欢的运动的联合概率是 13/100 = 0.13或 13%

用数学符号写成:

P(性别=男性,运动=棒球)= 13/100 =  0.13

我们可以使用这个过程来计算整个联合概率分布:

  • P(性别=男性,运动=棒球)= 13/100 =  0.13
  • P(性别=男性,运动=篮球)= 15/100 = 0.15
  • P(性别=男性,运动=足球)= 20/100 = 0.20
  • P(性别=女性,运动=棒球)= 23/100 = 0.23
  • P(性别=女性,运动=篮球)= 16/100 = 0.16
  • P(性别=女性,运动=足球)= 13/100 = 0.13

请注意,概率之和等于 1或 100%

2、为什么使用联合概率分布?

联合概率分布很有用,因为我们经常收集两个变量(如运动和性别)的数据,并且我们有兴趣回答与这两个变量相关的问题。

例如,我们可能想了解人口中特定个体是男性并且更喜欢棒球作为他们最喜欢的运动的可能性有多大。

或者我们可能有兴趣了解特定个人是女性并且更喜欢足球作为他们最喜欢的运动的可能性有多大。

联合概率分布可以帮助我们回答这些问题。

使用以下示例作为练习,以更好地理解联合概率分布。

示例 1

以下双向表显示了一项调查的结果,该调查询问了 238 人他们最喜欢哪种电影类型:

问题:给定个人是女性并且更喜欢戏剧作为他们最喜欢的电影类型的概率是多少?

        答案: P(性别 = 女性,类型 = 戏剧)= 58/238 =  0.244 =  24.4%

        示例 2

下面的双向表显示了一个班级中 64 名学生的考试成绩,根据他们花费了多少小时来计算:

问题:给定个人学习 2 小时并获得 91 到 100 分的概率是多少?

        答案: P(学习 = 2 小时,分数 = 91-100)= 3/64 = 0.047 = 4.7%

3、联合概率分布和监督学习

监督学习假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y)。P(X,Y)表示分布函数,或分布密度函数。注意在学习过程中,假定这一联合概率分布存在,但对学习系统来说,联合概率分布的具体定义是未知的。训练数据与测试数据被看作是依联合概率分布P(X,Y)独立同分布产生的。统计学习假设数据存在一定的统计规律,X和Y具有联合概率分布就是监督学习关于数据的基本假设。

机器学习笔记 - 什么是联合概率分布?相关推荐

  1. 联合概率分布的学习笔记

    1 致谢 感谢百度百科的帮助,原文链接如下: https://baike.baidu.com/item/联合分布/5571059?fromtitle=%E8%81%94%E5%90%88%E6%A6% ...

  2. 机器学习笔记之深度信念网络(一)背景介绍与结构表示

    机器学习笔记之深度信念网络--背景介绍与结构表示 引言 深度信念网络 场景构建 深度信念网络的联合概率分布 引言 从本节开始,将介绍深度信念网络. 深度信念网络 深度信念网络(Deep Belief ...

  3. 机器学习笔记之深度信念网络(二)模型构建思想(RBM叠加结构)

    机器学习笔记之深度信念网络--模型构建思想 引言 回顾:深度信念网络的结构表示 解析RBM隐变量的先验概率 通过模型学习隐变量的先验概率 小插曲:杰森不等式(2023/1/11) 杰森不等式的数学证明 ...

  4. 机器学习笔记之变分推断(四)随机梯度变分推断(SGVI)

    机器学习笔记之变分推断--随机梯度变分推断 引言 回顾:基于平均场假设的变分推断 经典变分推断的问题 随机梯度变分推断的求解过程 引言 上一节介绍了基于平均场假设的变分推断与广义EM算法的关系,本节将 ...

  5. 机器学习笔记之配分函数(一)对数似然梯度

    机器学习笔记之配分函数--对数似然梯度 引言 回顾:过去介绍配分函数的相关结点 配分函数介绍 配分函数在哪些情况下会"直面"到? 场景构建 包含配分函数的极大似然估计 引言 从本节 ...

  6. 机器学习笔记之配分函数(三)对比散度

    机器学习笔记之配分函数--对比散度 引言 回顾:随机最大似然求解模型参数的过程 随机最大似然的缺陷 吉布斯采样的缺陷与对比散度思想 对比散度名称的由来 从 K L \mathcal K\mathcal ...

  7. 机器学习笔记之概率图模型(一)背景介绍

    机器学习笔记之概率图模型--背景介绍 引言 背景介绍 联合概率分布的求解困境 条件独立性假设 概率图的分类 总结 引言 从本节开始将介绍概率图模型. 背景介绍 概率图模型(Probabilistic ...

  8. 机器学习笔记之卡尔曼滤波(一)动态模型基本介绍

    机器学习笔记之卡尔曼滤波--动态模型基本介绍 引言 回顾:动态模型 动态模型的相关任务 卡尔曼滤波介绍 引言 本节从动态模型开始,介绍卡尔曼滤波(Kalman Filter). 回顾:动态模型 我们在 ...

  9. 机器学习笔记之受限玻尔兹曼机(四)推断任务——边缘概率

    机器学习笔记之受限玻尔兹曼机--推断任务[边缘概率] 引言 回顾:场景构建 推断任务--边缘概率求解 边缘概率与Softplus函数 引言 上一节介绍了受限玻尔兹曼机中随机变量节点的后验概率,本节将介 ...

  10. 机器学习笔记之受限玻尔兹曼机(二)模型表示

    机器学习笔记之受限玻尔兹曼机--模型表示 引言 回顾:玻尔兹曼分布 玻尔兹曼机 关于玻尔兹曼机的问题 受限玻尔兹曼机 引言 上一节基于马尔可夫随机场介绍了玻尔兹曼分布,本节将介绍受限玻尔兹曼机的模型表 ...

最新文章

  1. Zookeeper常用命令使用
  2. C# List Sort
  3. rust(53)-智能指针
  4. linux socket读写函数,Linux网络编程入门
  5. python输入数字成数组_python – Numpy:将数值插入数组的最快方法,使得数组按顺序排列...
  6. psp中java,PSP编程概述
  7. php为首字母的词语,PHP提取中英文词语及数字首字母的简单示例
  8. 浅谈长尾理论--《Makers》读后感
  9. css基础知识汇总7
  10. SQL数据库附加数据及查询方法
  11. 网络信息安全攻防实验室之基础关
  12. Linux 题库及答案永久开放共同学习进步
  13. 微信小程序 java社区快递柜取件管理系统python php
  14. Ogre引擎渲染系列之Normal Specular Mapping
  15. 实战录 | Spring中bean的生命周期
  16. K成本中心PO总账科目矛盾报错
  17. Java如何实现手动连接数据库(Mysql或Oracle) | 超级详细,建议收藏
  18. 数据运营与数据分析闲谈
  19. java经纬度凸包graham_凸包算法(Graham扫描法)详解
  20. delphi还有人用吗?delphi过时了吗?为什么还有人使用Delphi开发软件?一文说清Delphi的领先一个时代的开发工具DNA

热门文章

  1. cs61b实验记录(八)project 3:BearMaps 基于OSM的伯克利地图web应用
  2. 常用IP扫描工具整理一下
  3. php基于纯真IP数据库实现IP地址信息查询
  4. Python 获取 Flash SWF 文件宽度和高度(Width, Height)
  5. 三个优秀的Android图表开源控件
  6. 学习笔记第十四篇之知乎社交网络分析
  7. 开通一个博客,开启一个更高的要求
  8. 数据结构(python语言描述)第一章
  9. 怎样做好微商 怎样推广引流客源效果好
  10. FreeCAD开发:修改了源码,需要翻译成中文,如何更新语言包