概率图模型的综合叙述：

特征函数便是图中的conditional。对图简单的说明，综合概述Naive Bayes，Logistic Regression，HMM，Linear-chain CRF之间的关系。Naive Bayes经过条件参数的加入即为Logistic Regression，同时这两者经过序列化即特征函数加入了对相邻状态之间的判断即变为HMM和Linear-chain CRF，最后经过广义图模型的扩展变为最后两者。

分类问题综述：

从数学角度来说，分类问题可做如下定义：

已知集合： C = y 1 , y 2 , … , y n C={y_1,y_2,\ldots,y_n} C=y1,y2,…,yn和 I = x 1 , x 2 , … , x m , … I={x_1,x_2,\ldots,x_m,\ldots} I=x1,x2,…,xm,…，确定映射规则 y = f ( x ) y=f(x) y=f(x)，使得任意 x i ∈ I x_i \in I xi∈I有且仅有一个 y j ∈ C y_j \in C yj∈C使得 y j = f ( x i ) y_j=f(x_i) yj=f(xi)成立。（不考虑模糊数学里的模糊集情况）。其中 C C C叫做类别集合，其中每一个元素是一个类别，而 I I I叫做项集合，其中每一个元素是一个待分类项， f f f叫做分类器。分类算法的任务就是构造分类器 f f f。

这里要着重强调，分类问题往往采用经验性方法构造映射规则，即一般情况下的分类问题缺少足够的信息来构造100%正确的映射规则，而是通过对经验数据的学习从而实现一定概率意义上正确的分类，因此所训练出的分类器并不是一定能将每个待分类项准确映射到其分类，分类器的质量与分类器构造方法、待分类数据的特性以及训练样本数量等诸多因素有关。

例如，医生对病人进行诊断就是一个典型的分类过程，任何一个医生都无法直接看到病人的病情，只能观察病人表现出的症状和各种化验检测数据来推断病情，这时医生就好比一个分类器，而这个医生诊断的准确率，与他当初受到的教育方式（构造方法）、病人的症状是否突出（待分类数据的特性）以及医生的经验多少（训练样本数量）都有密切关系。

贝叶斯分类算法

贝叶斯定理：

如果感兴趣可以看上一篇贝叶斯定理的相关链接：
P ( B ∣ A ) = P ( A ∣ B ) P ( B ) P ( A ) P(B | A)=\frac{P(A | B) P(B)}{P(A)} P(B∣A)=P(A)P(A∣B)P(B)

综述：

贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。

朴素贝叶斯分类：

朴素贝叶斯分类是一种十分简单的分类算法，叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素，朴素贝叶斯的思想基础是这样的：对于给出的待分类项，求解在此项出现的条件下各个类别出现的概率，哪个最大，就认为此待分类项属于哪个类别。通俗来说，就好比这么个道理，你在街上看到一个黑人，我问你你猜这哥们哪里来的，你十有八九猜非洲。为什么呢？因为黑人中非洲人的比率最高，当然人家也可能是美洲人或亚洲人，但在没有其它可用信息下，我们会选择条件概率最大的类别，这就是朴素贝叶斯的思想基础。

朴素贝叶斯分类的正式定义如下：

1、设待分类项： x = a 1 , a 2 , . . . , a m x={a_1,a_2,...,a_m} x=a1,a2,...,am，而每个 a i a_i ai为 x x x的一个特征属性。
2、设类别集合： C = y 1 , y 2 , . . . , y n C={y_1,y_2,...,y_n} C=y1,y2,...,yn。
3、计算 P ( y 1 ∣ x ) , P ( y 2 ∣ x ) , … , P ( y n ∣ x ) P(y_1|x),P(y_2|x),\ldots,P(y_n|x) P(y1∣x),P(y2∣x),…,P(yn∣x)。
4、如果 P ( y k ∣ x ) = max ⁡ { P ( y 1 ∣ x ) , P ( y 2 ∣ x ) , . . . , P ( y n ∣ x ) } P(y_k|x)=\max\left\{P(y_1|x),P(y_2|x),...,P(y_n|x)\right\} P(yk∣x)=max{P(y1∣x),P(y2∣x),...,P(yn∣x)}，则 x ∈ y k x \in y_k x∈yk。

那么现在的关键就是如何计算第3步中的各个条件概率。我们可以这么做：

1、找到一个已知分类的待分类项集合，这个集合叫做训练样本集。

2、统计得到在各类别下各个特征属性的条件概率估计。

P ( a 1 ∣ y 1 ) , P ( a 2 ∣ y 1 ) , … , P ( a m ∣ y 1 ) ; P ( a 1 ∣ y 2 ) , P ( a 1 ∣ y 2 ) , … , P ( a m ∣ y 2 ) ; … ; P ( a 1 ∣ y n ) , P ( a 2 ∣ y n ) , … , P ( a m ∣ y n ) P\left(a_{1} | y_{1}\right), P\left(a_{2} | y_{1}\right), \ldots, P\left(a_{m} | y_{1}\right) ; \\P\left(a_{1} | y_{2}\right),P\left(a_{1} | y_{2}\right), \ldots, P\left(a_{m} | y_{2}\right) ;\\ \ldots ;\\ P\left(a_{1} | y_{n}\right), P\left(a_{2} | y_{n}\right), \ldots, P\left(a_{m} | y_{n}\right) P(a1∣y1),P(a2∣y1),…,P(am∣y1);P(a1∣y2),P(a1∣y2),…,P(am∣y2);…;P(a1∣yn),P(a2∣yn),…,P(am∣yn)

3、如果各个特征属性是条件独立的，则根据贝叶斯定理有如下推导：

P ( y i ∣ x ) = P ( x ∣ y i ) P ( y i ) P ( x ) P\left(y_{i} | x\right)=\frac{P\left(x | y_{i}\right) P\left(y_{i}\right)}{P(x)} P(yi∣x)=P(x)P(x∣yi)P(yi)

因为分母对于所有类别为常数，因为我们只要将分子最大化皆可。又因为各特征属性是条件独立的，所以有对分子的分析如下：

P ( x ∣ y i ) = P ( a 1 ∣ y i ) P ( a 2 ∣ y i ) … P ( a m ∣ y i ) P\left(x | y_{i}\right)=P\left(a_{1} | y_{i}\right) P\left(a_{2} | y_{i}\right) \ldots P\left(a_{m} | y_{i}\right) P(x∣yi)=P(a1∣yi)P(a2∣yi)…P(am∣yi)

P ( x ∣ y i ) P ( y i ) = [ P ( a 1 ∣ y i ) P ( a 2 ∣ y i ) … P ( a m ∣ y i ) ] P ( y i ) = P ( y i ) ∏ j = 1 m P ( a j ∣ y i ) P\left(x | y_{i}\right) P\left(y_{i}\right)=[P\left(a_{1} | y_{i}\right) P\left(a_{2} | y_{i}\right) \ldots P\left(a_{m} | y_{i}\right) ]P\left(y_{i}\right)=P\left(y_{i}\right) \prod_{j=1}^{m} P\left(a_{j} | y_{i}\right) P(x∣yi)P(yi)=[P(a1∣yi)P(a2∣yi)…P(am∣yi)]P(yi)=P(yi)∏j=1mP(aj∣yi)

根据上述分析，朴素贝叶斯分类的流程可以由下图表示（暂时不考虑验证）：

可以看到，整个朴素贝叶斯分类分为三个阶段：

第一阶段——准备工作阶段，这个阶段的任务是为朴素贝叶斯分类做必要的准备，主要工作是根据具体情况确定特征属性，并对每个特征属性进行适当划分，然后由人工对一部分待分类项进行分类，形成训练样本集合。这一阶段的输入是所有待分类数据，输出是特征属性和训练样本。这一阶段是整个朴素贝叶斯分类中唯一需要人工完成的阶段，其质量对整个过程将有重要影响，分类器的质量很大程度上由特征属性、特征属性划分及训练样本质量决定。

第二阶段——分类器训练阶段，这个阶段的任务就是生成分类器，主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计，并将结果记录。其输入是特征属性和训练样本，输出是分类器。这一阶段是机械性阶段，根据前面讨论的公式可以由程序自动计算完成。

第三阶段——应用阶段。这个阶段的任务是使用分类器对待分类项进行分类，其输入是分类器和待分类项，输出是待分类项与类别的映射关系。这一阶段也是机械性阶段，由程序完成。

概率图模型（3）朴素贝叶斯分类相关推荐

机器学习笔记之概率图模型(一)背景介绍
机器学习笔记之概率图模型--背景介绍引言背景介绍联合概率分布的求解困境条件独立性假设概率图的分类总结引言从本节开始将介绍概率图模型. 背景介绍概率图模型(Probabilistic ...
《神经网络与深度学习》-概率图模型
概率图模型 1. 模型的表示 1.1 有向图模型 1.2 常见的有向图模型 1.2.1 Sigmoid信念网络 1.2.2 朴素贝叶斯分类器 1.2.3 隐马尔科夫模型 1.3 无向图模型 1.4 无 ...
机器学习笔记之概率图模型(四)基于贝叶斯网络的模型概述
机器学习笔记之概率图模型--基于贝叶斯网络的模型概述引言基于贝叶斯网络的模型场景构建朴素贝叶斯分类器混合模型基于时间变化的模型特征是连续型随机变量的贝叶斯网络动态概率图模型总结引言 ...
每个特征图1各因子和一个偏置_nlp中的概率图模型
在自然语言处理中,概率图模型极为重要,在中文分词.词性标注.命名实体识别等诸多场景中有着广泛的应用.概率图模型(Graphical Model)分为贝叶斯网络(Bayesian Network)和马尔 ...
朴素贝叶斯分类器原理解析与python实现
贝叶斯分类器是以贝叶斯原理为基础的分类器的总称,是一种生成式模型,朴素贝叶斯分类器是其中最简单的一种.要高明白贝叶斯分类器的原理,首先得明白一些基本概念. 预备知识基本概念先验概率:根据统计/经验 ...
【数据挖掘】拉普拉斯修正 ( 判别模型 | 概率模型 | 贝叶斯分类 | 拉普拉斯修正 | 朴素贝叶斯分类应用场景 | 朴素贝叶斯优缺点 )
文章目录 I . 判别模型与概率模型 II . 贝叶斯分类 III . 拉普拉斯修正 IV . 使用朴素贝叶斯分类器 + 拉普拉斯修正为样本分类 ( 完整分类流程 ) V . 朴素贝叶斯分类器 ...
基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_第十章：利用Python实现朴素贝叶斯模型
免责声明:本文是通过网络收集并结合自身学习等途径合法获取,仅作为学习交流使用,其版权归出版社或者原创作者所有,并不对涉及的版权问题负责.若原创作者或者出版社认为侵权,请联系及时联系,我将立即删除文章, ...
【人工智能】— 贝叶斯网络、概率图模型、全局语义、因果链、朴素贝叶斯模型、枚举推理、变量消元
[人工智能]- 贝叶斯网络频率学派 vs. 贝叶斯学派贝叶斯学派 Probability(概率): 独立性/条件独立性: Probability Theory(概率论): Graphical mo ...
用朴素贝叶斯分类模型判断病人是否感染幽门螺杆菌（Python实现）
注:如果您需要本文的数据集,请私信我的csdn账户一.算法说明朴素贝叶斯是贝叶斯模型中最简单的一种,其核心算法是贝叶斯公式. 朴素贝叶斯分类模型将问题分为特征变量构成的向量和目标变量构成的向量,假 ...

概率图模型（3）朴素贝叶斯分类

文章目录