文章目录

  • 3. 贝叶斯和朴素贝叶斯
    • 贝叶斯和朴素贝叶斯的区别
    • 贝叶斯网络的概念
    • 朴素贝叶斯的概念
      • 朴素贝叶斯分类的数学原理
      • 朴素贝叶斯的优缺点

3. 贝叶斯和朴素贝叶斯

贝叶斯和朴素贝叶斯的区别

朴素贝叶斯的假设前提有两个:

  • 各特征彼此独立
  • 各特征对被解释变量的影响一致,不能进行变量筛选

但是很多情况无法达到这个条件,比如:解决文本分类问题,相邻词关系,近义词关系等等。

彼此不独立的特征之间的关系,没办法通过朴素贝叶分类器训练得到,同时这种不独立性也给问题的解决方案引入了更多的复杂性。

此时,更具普遍意义的贝叶斯网络特征彼此不独立的情况下,可进行建模。但是,贝叶斯网络并不放宽第二个假设,故不能对变量进行筛选,因为需要各特征对被解释变量的影响一致

贝叶斯分类方法,是一种展现已知数据集属性分布的方法,其最终计算结果完全依赖于训练样本中类别和特征分布。与SVM等分类方法不同,它只是对事实进行展现

类型 贝叶斯网络 朴素贝叶斯
假设前提 各变量都是离散型的
各特征都有依赖(不确定的因果推理)关系(变量无关)
每一个节点在其直接前驱节点的值制定后,这个节点条件独立于其所有非直接前驱前辈节点
P(v∣par(v),x1,x2,⋯,xn)=P(v∣par(v))P(v|par(v), x_1, x_2, \cdots, x_n) = P(v|par(v))P(v∣par(v),x1​,x2​,⋯,xn​)=P(v∣par(v))
贝叶斯网络放宽了每个变量独立的假设
个特征彼此独立
朴素贝叶斯对于若干条件概率值不存在的问题,一般通过将所有概率值加一来解决
且对被解释变量的影响一致,不能进行变量筛选
应用案例 在信息不完备的情况下,通过可以观察随机变量推断不可观察的随机变量
解决文本分类问题时,相邻词的关系、近义词的关系
分类
缺点 不能对变量进行筛选,因为不能放宽对被解释变量影响一致的假设 彼此不独立的特征之间建立朴素贝叶斯,反而加大了模型复杂性
优点 贝叶斯原理和图论相结合,建立起一种基于概率推理的数学模型,对于解决复杂的不确定性和关联性问题,有很强的优势

* 对缺失数据不敏感
* 可以学习因果关系,加深对数据的理解
* 能将先验知识融入建模
* 避免了过度拟合问题,不需要保留数据进行检验

* 算法逻辑简单,易于实现
* 分类过程中,时空开销小

贝叶斯网络的概念

贝叶斯网络基本概念有两个:

  • 引入了一个有向无环图(Directed Acyclic Graph)
  • 一个条件概率表集合(不独立)

DAG: DAG的节点VVV包括随机变量(类别和特征),有向连接E(A—>B)E(A—>B)E(A—>B)表示结点AAA是结点BBB的parent,且BBB与AAA是有依赖关系的(不独立)

条件概率表集合: 同时引入了一个条件性独立概念:即图中任意结点vvv在给定vvv的parent结点的情况下,与图中其他结点都是独立的,也就是说P(v∣par(v),x1,x2,⋯,xn)=P(v∣par(v))P(v|par(v), x_1, x_2, \cdots, x_n) = P(v|par(v))P(v∣par(v),x1​,x2​,⋯,xn​)=P(v∣par(v))。这里的par(v)par(v)par(v)表示v的parent结点集,x1,x2,⋯,xnx_1, x_2, \cdots, x_nx1​,x2​,⋯,xn​表示图中其他结点。

如果已知所有联合概率值,那么任何形式的概率问题都可以迎刃而解。而现实是当特征集合过大>10)时,几乎无法通过统计得到。而特征集合的大小在一定程度上,与最终的分类效果是一个正反馈关系

所以这种问题的解决就是:通过条件独立的概念,来对各条件概率值进行优化。 bayesian net的tutorial对该问题进行了阐述。

贝叶斯网络中连线是如何产生的?

贝叶斯网络,不再表示因果关系,而是变量之间的相关依赖关系

x,yx, yx,y之间线代表的就是条件概率,p(y︱x1)︱x2,x3,⋯,xn)=p(y)p(y︱x_1)︱x_2, x_3, \cdots, x_n) =p(y)p(y︱x1​)︱x2​,x3​,⋯,xn​)=p(y),

  • 等于则不连线
  • 不等于,说明在控制了x2x_2x2​下,两者不是独立,而是相关的,则会连线。

朴素贝叶斯的概念

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。

朴素贝叶斯分类的数学原理

朴素贝叶斯分类算法的核心算法: 贝叶斯公式

P(B∣A)=P(A∣B)P(B)P(A)P(B|A)=\frac{P(A|B)P(B)}{P(A)} P(B∣A)=P(A)P(A∣B)P(B)​

其中,

AAA——特征

BBB——类别

即:

P(类别∣特征)=P(特征∣类型)P(类型)P(特征)P(类别|特征)=\frac{P(特征|类型)P(类型)}{P(特征)} P(类别∣特征)=P(特征)P(特征∣类型)P(类型)​

最终我们求得P(类别∣特征)P(类别|特征)P(类别∣特征)即可。

朴素贝叶斯的优缺点

优点:

  • 算法逻辑简单,易于实现
  • 分类过程中,时空开销小

缺点:

理论上,朴素贝叶斯模型与其他分类方法相比,具有最小的误差率

​ 但是实际上并非总是如此。这是因为朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多(>10),或者属性之间相关性比较大时,分类效果不好。

​ 而在属性相关性比较小时,朴素贝叶斯分类性能最为良好。对于这一点,有半朴素贝叶斯之类的算法,通过考虑部分关联性适度改进。

图像算法三 —— 贝叶斯和朴素贝叶斯相关推荐

  1. 朴素贝叶斯 半朴素贝叶斯_使用朴素贝叶斯和N-Gram的Twitter情绪分析

    朴素贝叶斯 半朴素贝叶斯 In this article, we'll show you how to classify a tweet into either positive or negativ ...

  2. 贝叶斯与朴素贝叶斯入门及实战

    文章目录 什么是贝叶斯 朴素贝叶斯 原理 朴素贝叶斯优点 朴素贝叶斯缺点 贝叶斯模型 高斯分布朴素贝叶斯 多项式分布朴素贝叶斯 伯努利分布朴素贝叶斯 总结 贝叶斯实战 生成式模型和判别式模型的区别 什 ...

  3. 贝叶斯算法c语言,01 贝叶斯算法 - 朴素贝叶斯

    引子: 1.孩子的性别问题 已知一对夫妻生了2个孩子,其中一个是女孩,那么另一个也是女孩的概率的多少? 普遍大家会觉得生男生女都一样,所以另一个也是女孩的概率是1/2.而另一部分稍微聪明一点的人认为: ...

  4. python推荐系统算法朴素贝叶斯_朴素贝叶斯算法在人才盘点中的应用(之一)

    一.识别人才首先是处理不确定性问题 做招聘面试的HR应该会认同这样的经历. 打开应聘者简历,赫然写着TOP10名学毕业.抬头一瞧,小伙长得一表人才,精神抖擞,朝气蓬勃.HR兴趣大增. 再一看,研究方向 ...

  5. 朴素贝叶斯 半朴素贝叶斯_SQL Server中的朴素贝叶斯预测

    朴素贝叶斯 半朴素贝叶斯 In this article, we will walk through Microsoft Naive Bayes algorithm in SQL Server. 在本 ...

  6. 贝叶斯(朴素贝叶斯,正太贝叶斯)及OpenCV源码分析

    一.原理 OpenCV实现的贝叶斯分类器不是我们所熟悉的朴素贝叶斯分类器(Naïve Bayes Classifier),而是正态贝叶斯分类器(Normal Bayes Classifier),两者虽 ...

  7. 情感分析朴素贝叶斯_朴素贝叶斯推文的情感分析

    情感分析朴素贝叶斯 Millions of tweets are posted every second. It helps us know how the public is responding ...

  8. 用matlab朴素贝叶斯,Matlab朴素贝叶斯

    你好我正在使用KDD 1999数据集,我正在寻找在matlab中应用朴素贝叶斯.我想知道的是,kdd数据集是一个494021x42数据数组,如果您注意到下面的朴素贝叶斯代码中的"traini ...

  9. 朴素贝叶斯基于朴素贝叶斯的文本分类算法

    朴素贝叶斯 以及 基于朴素贝叶斯的文本分类算法 参考文章: https://www.cnblogs.com/jorbin/articles/1915888.html

最新文章

  1. java unsafe cas_Java Unsafe CAS 小试
  2. PAT甲级1022 Digital Library (30分):[C++题解]结构体、排序、查询
  3. Database:Database数据库的简介、类型及其区别(关系数据库VS非关系型数据库)、案例应用之详细攻略
  4. html 文字输出语音,html 录音与文本转语音demo
  5. avalon2学习教程04显示隐藏处理
  6. C# Timer定时器用法
  7. mysql挪到小数点位置_mysql数据库迁移到另一个硬盘上
  8. 为什么要学python语言、学完有什么好处_学编程为什么首选Python?学完Python的优势有哪些?...
  9. UWP Acrylic Material
  10. 2015年上半年 系统分析师 案例分析真题
  11. 金融支付-银联卡支付系统产品介绍
  12. 数据库空间存储已满,如何清理释放空间
  13. layuiAdmin自定义模块
  14. HDU - 6638
  15. 谈谈keep-alive的理解
  16. 移动端屏幕适配和css美化浏览器自带的滚动条
  17. react报错Error: Too many re-renders. React limits the number of renders to prevent an infinite loop.
  18. 小程序:获取页面高度问题
  19. 人工智能ai换脸技术_人工智能技术如何帮助企业改善营销
  20. mcpe服务器网页控制台教程,mcpe服务器指令

热门文章

  1. 经典全变分图像去噪算法(tv算法)和维纳滤波结合 算法
  2. java.lang.RuntimeException: Unable to fence NameNode at hadoop1/192.168.43.100:8020
  3. Hexo如何修改网站图标favicon | Hexo
  4. 浅谈安卓Canvas,模拟心电图的绘制
  5. 带你轻松玩转C语言scanf和getchar
  6. 基于粒子群优化算法的微电网调度(光伏、储能、电动车、电网交互)(Matlab代码实现)
  7. vue组件的总结( 组件传值 )
  8. 双翌视觉对位系统图像处理方法说明——边缘匹配+单直线
  9. centos7 更新时间
  10. 鸟和青蛙 | 与诺奖擦肩而过的伟大物理学家戴森的演讲