图像算法三 —— 贝叶斯和朴素贝叶斯
文章目录
- 3. 贝叶斯和朴素贝叶斯
- 贝叶斯和朴素贝叶斯的区别
- 贝叶斯网络的概念
- 朴素贝叶斯的概念
- 朴素贝叶斯分类的数学原理
- 朴素贝叶斯的优缺点
3. 贝叶斯和朴素贝叶斯
贝叶斯和朴素贝叶斯的区别
朴素贝叶斯的假设前提有两个:
- 各特征彼此独立
- 各特征对被解释变量的影响一致,不能进行变量筛选
但是很多情况无法达到这个条件,比如:解决文本分类问题,相邻词关系,近义词关系等等。
彼此不独立的特征之间的关系,没办法通过朴素贝叶分类器训练得到,同时这种不独立性也给问题的解决方案引入了更多的复杂性。
此时,更具普遍意义的贝叶斯网络在特征彼此不独立的情况下,可进行建模。但是,贝叶斯网络并不放宽第二个假设,故不能对变量进行筛选,因为需要各特征对被解释变量的影响一致。
贝叶斯分类方法,是一种展现已知数据集属性分布的方法,其最终计算结果完全依赖于训练样本中类别和特征分布。与SVM等分类方法不同,它只是对事实进行展现。
类型 | 贝叶斯网络 | 朴素贝叶斯 |
---|---|---|
假设前提 |
各变量都是离散型的 各特征都有依赖(不确定的因果推理)关系(变量无关) 每一个节点在其直接前驱节点的值制定后,这个节点条件独立于其所有非直接前驱前辈节点 P(v∣par(v),x1,x2,⋯,xn)=P(v∣par(v))P(v|par(v), x_1, x_2, \cdots, x_n) = P(v|par(v))P(v∣par(v),x1,x2,⋯,xn)=P(v∣par(v)) 贝叶斯网络放宽了每个变量独立的假设 |
个特征彼此独立 朴素贝叶斯对于若干条件概率值不存在的问题,一般通过将所有概率值加一来解决 且对被解释变量的影响一致,不能进行变量筛选 |
应用案例 |
在信息不完备的情况下,通过可以观察随机变量推断不可观察的随机变量 解决文本分类问题时,相邻词的关系、近义词的关系 |
分类 |
缺点 | 不能对变量进行筛选,因为不能放宽对被解释变量影响一致的假设 | 彼此不独立的特征之间建立朴素贝叶斯,反而加大了模型复杂性 |
优点 |
贝叶斯原理和图论相结合,建立起一种基于概率推理的数学模型,对于解决复杂的不确定性和关联性问题,有很强的优势
* 对缺失数据不敏感 |
* 算法逻辑简单,易于实现 * 分类过程中,时空开销小 |
贝叶斯网络的概念
贝叶斯网络基本概念有两个:
- 引入了一个有向无环图(Directed Acyclic Graph)
- 一个条件概率表集合(不独立)
DAG: DAG的节点VVV包括随机变量(类别和特征),有向连接E(A—>B)E(A—>B)E(A—>B)表示结点AAA是结点BBB的parent,且BBB与AAA是有依赖关系的(不独立)
条件概率表集合: 同时引入了一个条件性独立概念:即图中任意结点vvv在给定vvv的parent结点的情况下,与图中其他结点都是独立的,也就是说P(v∣par(v),x1,x2,⋯,xn)=P(v∣par(v))P(v|par(v), x_1, x_2, \cdots, x_n) = P(v|par(v))P(v∣par(v),x1,x2,⋯,xn)=P(v∣par(v))。这里的par(v)par(v)par(v)表示v的parent结点集,x1,x2,⋯,xnx_1, x_2, \cdots, x_nx1,x2,⋯,xn表示图中其他结点。
如果已知所有联合概率值,那么任何形式的概率问题都可以迎刃而解。而现实是当特征集合过大(>10
)时,几乎无法通过统计得到。而特征集合的大小在一定程度上,与最终的分类效果是一个正反馈关系。
所以这种问题的解决就是:通过条件独立的概念,来对各条件概率值进行优化。 bayesian net的tutorial对该问题进行了阐述。
贝叶斯网络中连线是如何产生的?
贝叶斯网络,不再表示因果关系,而是变量之间的相关依赖关系。
x,yx, yx,y之间线代表的就是条件概率,p(y︱x1)︱x2,x3,⋯,xn)=p(y)p(y︱x_1)︱x_2, x_3, \cdots, x_n) =p(y)p(y︱x1)︱x2,x3,⋯,xn)=p(y),
- 等于则不连线
- 不等于,说明在控制了x2x_2x2下,两者不是独立,而是相关的,则会连线。
朴素贝叶斯的概念
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。
朴素贝叶斯分类的数学原理
朴素贝叶斯分类算法的核心算法: 贝叶斯公式
P(B∣A)=P(A∣B)P(B)P(A)P(B|A)=\frac{P(A|B)P(B)}{P(A)} P(B∣A)=P(A)P(A∣B)P(B)
其中,
AAA——特征
BBB——类别
即:
P(类别∣特征)=P(特征∣类型)P(类型)P(特征)P(类别|特征)=\frac{P(特征|类型)P(类型)}{P(特征)} P(类别∣特征)=P(特征)P(特征∣类型)P(类型)
最终我们求得P(类别∣特征)P(类别|特征)P(类别∣特征)即可。
朴素贝叶斯的优缺点
优点:
- 算法逻辑简单,易于实现
- 分类过程中,时空开销小
缺点:
理论上,朴素贝叶斯模型与其他分类方法相比,具有最小的误差率。
但是实际上并非总是如此。这是因为朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多(>10),或者属性之间相关性比较大时,分类效果不好。
而在属性相关性比较小时,朴素贝叶斯分类性能最为良好。对于这一点,有半朴素贝叶斯之类的算法,通过考虑部分关联性适度改进。
图像算法三 —— 贝叶斯和朴素贝叶斯相关推荐
- 朴素贝叶斯 半朴素贝叶斯_使用朴素贝叶斯和N-Gram的Twitter情绪分析
朴素贝叶斯 半朴素贝叶斯 In this article, we'll show you how to classify a tweet into either positive or negativ ...
- 贝叶斯与朴素贝叶斯入门及实战
文章目录 什么是贝叶斯 朴素贝叶斯 原理 朴素贝叶斯优点 朴素贝叶斯缺点 贝叶斯模型 高斯分布朴素贝叶斯 多项式分布朴素贝叶斯 伯努利分布朴素贝叶斯 总结 贝叶斯实战 生成式模型和判别式模型的区别 什 ...
- 贝叶斯算法c语言,01 贝叶斯算法 - 朴素贝叶斯
引子: 1.孩子的性别问题 已知一对夫妻生了2个孩子,其中一个是女孩,那么另一个也是女孩的概率的多少? 普遍大家会觉得生男生女都一样,所以另一个也是女孩的概率是1/2.而另一部分稍微聪明一点的人认为: ...
- python推荐系统算法朴素贝叶斯_朴素贝叶斯算法在人才盘点中的应用(之一)
一.识别人才首先是处理不确定性问题 做招聘面试的HR应该会认同这样的经历. 打开应聘者简历,赫然写着TOP10名学毕业.抬头一瞧,小伙长得一表人才,精神抖擞,朝气蓬勃.HR兴趣大增. 再一看,研究方向 ...
- 朴素贝叶斯 半朴素贝叶斯_SQL Server中的朴素贝叶斯预测
朴素贝叶斯 半朴素贝叶斯 In this article, we will walk through Microsoft Naive Bayes algorithm in SQL Server. 在本 ...
- 贝叶斯(朴素贝叶斯,正太贝叶斯)及OpenCV源码分析
一.原理 OpenCV实现的贝叶斯分类器不是我们所熟悉的朴素贝叶斯分类器(Naïve Bayes Classifier),而是正态贝叶斯分类器(Normal Bayes Classifier),两者虽 ...
- 情感分析朴素贝叶斯_朴素贝叶斯推文的情感分析
情感分析朴素贝叶斯 Millions of tweets are posted every second. It helps us know how the public is responding ...
- 用matlab朴素贝叶斯,Matlab朴素贝叶斯
你好我正在使用KDD 1999数据集,我正在寻找在matlab中应用朴素贝叶斯.我想知道的是,kdd数据集是一个494021x42数据数组,如果您注意到下面的朴素贝叶斯代码中的"traini ...
- 朴素贝叶斯基于朴素贝叶斯的文本分类算法
朴素贝叶斯 以及 基于朴素贝叶斯的文本分类算法 参考文章: https://www.cnblogs.com/jorbin/articles/1915888.html
最新文章
- java unsafe cas_Java Unsafe CAS 小试
- PAT甲级1022 Digital Library (30分):[C++题解]结构体、排序、查询
- Database:Database数据库的简介、类型及其区别(关系数据库VS非关系型数据库)、案例应用之详细攻略
- html 文字输出语音,html 录音与文本转语音demo
- avalon2学习教程04显示隐藏处理
- C# Timer定时器用法
- mysql挪到小数点位置_mysql数据库迁移到另一个硬盘上
- 为什么要学python语言、学完有什么好处_学编程为什么首选Python?学完Python的优势有哪些?...
- UWP Acrylic Material
- 2015年上半年 系统分析师 案例分析真题
- 金融支付-银联卡支付系统产品介绍
- 数据库空间存储已满,如何清理释放空间
- layuiAdmin自定义模块
- HDU - 6638
- 谈谈keep-alive的理解
- 移动端屏幕适配和css美化浏览器自带的滚动条
- react报错Error: Too many re-renders. React limits the number of renders to prevent an infinite loop.
- 小程序:获取页面高度问题
- 人工智能ai换脸技术_人工智能技术如何帮助企业改善营销
- mcpe服务器网页控制台教程,mcpe服务器指令
热门文章
- 经典全变分图像去噪算法(tv算法)和维纳滤波结合 算法
- java.lang.RuntimeException: Unable to fence NameNode at hadoop1/192.168.43.100:8020
- Hexo如何修改网站图标favicon | Hexo
- 浅谈安卓Canvas,模拟心电图的绘制
- 带你轻松玩转C语言scanf和getchar
- 基于粒子群优化算法的微电网调度(光伏、储能、电动车、电网交互)(Matlab代码实现)
- vue组件的总结( 组件传值 )
- 双翌视觉对位系统图像处理方法说明——边缘匹配+单直线
- centos7 更新时间
- 鸟和青蛙 | 与诺奖擦肩而过的伟大物理学家戴森的演讲