平滑技术
平滑技术是为了解决训练集的数据稀松问题。
  零概率问题,就是在计算实例的概率时,如果某个量x,在观察样本库(训练集)中没有出现过,会导致整个实例的概率结果是0。在文本分类的问题中,当一个词语没有在训练样本中出现,该词语调概率为0,使用连乘计算文本出现概率时也为0。这是不合理的,不能因为一个事件没有观察到就武断的认为该事件的概率是0。
  一般的m阶马尔科夫链转移概率是这样训练的:

Laplace平滑
  为了解决零概率的问题,法国数学家拉普拉斯最早提出用加1的方法估计没有出现过的现象的概率,所以加法平滑也叫做拉普拉斯平滑。
  假定训练样本很大时,每个分量x的计数加1造成的估计概率变化可以忽略不计,但可以方便有效的避免零概率问题。
应用举例
  假设在文本分类中,有3个类,C1、C2、C3,在指定的训练样本中,某个词语K1,在各个类中观测计数分别为0,990,10,K1的概率为0,0.99,0.01,对这三个量使用拉普拉斯平滑的计算方法如下:
  1/1003 = 0.001,991/1003=0.988,11/1003=0.011

在实际的使用中也经常使用加 a(1≥a≥0)来代替简单加1。如果对N个计数都加上a,这时分母也要记得加上N*a。

内容转载自:
1、https://blog.csdn.net/zhengwantong/article/details/72403808
2、https://www.cnblogs.com/bqtang/p/3693827.html

理解拉普拉斯平滑 Laplace Smoothing相关推荐

  1. 平滑处理--拉普拉斯(Laplace Smoothing)

      拉普拉斯平滑(Laplace Smoothing)又被称为加 1 平滑,是比较常用的平滑方法.平滑方法的存在时为了解决零概率问题. 背景:为什么要做平滑处理?   零概率问题,就是在计算实例的概率 ...

  2. 通俗理解拉普拉斯算子(Laplace)

    离散的一阶微分 离散的一阶微分定义为差分,如二维离散函数 f(x,y)\ f(x,y) f(x,y) (图像其实就可以看作一种二维离散函数,因为其反映的是不同像素点在x 和 y 轴方向上灰度的变化)在 ...

  3. [CS229学习笔记] 5.判别学习算法与生成学习算法,高斯判别分析,朴素贝叶斯,垃圾邮件分类,拉普拉斯平滑

    本文对应的是吴恩达老师的CS229机器学习的第五课.这节课介绍了判别学习算法和生成学习算法,并给出了生成学习算法的一个实例:利用朴素贝叶斯进行垃圾邮件分类. 判别学习(Discriminative L ...

  4. Laplace Smoothing

    拉普拉斯平滑(Laplace Smoothing) 拉普拉斯平滑(Laplace Smoothing)又称为加 1 平滑,是比较常用的平滑方法.平滑方法的存在时为了解决零概率问题. 一.为什么要做平滑 ...

  5. 朴素贝叶斯 拉普拉斯平滑(Laplace Smoothing)

    转自:https://blog.csdn.net/qq_25073545/article/details/78621019 拉普拉斯平滑(Laplace Smoothing)又被称为加 1 平滑,是比 ...

  6. 神奇的拉普拉斯平滑(Laplacian Smoothing)及其在正则化上的应用~

    之前的博客介绍过自己对于正则化的理解,经过这段时间的进一步接触,尤其是看了一些关于这一方面的paper,做了一些简短的实验,发现正则化真是一个很给力的建模方法.近期,看到了Laplacian Smoo ...

  7. 【简单理解】自然语言处理-平滑方法(Smoothing)

    [简单理解]自然语言处理-平滑方法(Smoothing) 简单介绍平滑策略 平滑策略的引入,主要使为了解决语言模型计算过程中出现的零概率问题.零概率问题又会对语言模型中N-gram模型的Perplex ...

  8. Laplace(拉普拉斯)平滑

    平滑技术 平滑技术是为了解决训练集的数据稀松问题. 零概率问题,就是在计算实例的概率时,如果某个量x,在观察样本库(训练集)中没有出现过,会导致整个实例的概率结果是0.在文本分类的问题中,当一个词语没 ...

  9. 机器学习(十九)——拉普拉斯光顺(Laplace smoothing)

    原文:http://cs229.stanford.edu/notes/cs229-notes2.pdf 我们已经描述过的朴素贝叶斯算法能够很好地解决许多问题,但是有一个简单的改变使得它更好地工作,特别 ...

  10. 转载:全局拉普拉斯平滑之(1)Strucutre extraction from texture via relative total variation及稀疏矩阵求解...

    全局拉普拉斯平滑之(1)Strucutre extraction from texture via relative total variation及稀疏矩阵求解 2018年01月31日 22:04: ...

最新文章

  1. Spring MVC框架有哪些优点
  2. Struts2配置文件【代码库】
  3. 使用Convirt 2.0.1管理虚拟机环境
  4. DL之CNN:卷积神经网络算法简介之原理简介(步幅/填充/特征图)、七大层级结构(动态图详解卷积/池化+方块法理解卷积运算)、CNN各层作用及其可视化等之详细攻略
  5. Unity3D 中的程序后台运行
  6. 修改Bugzilla的主页图片
  7. 【Java】什么?你项目还在用Date表示时间?!日期类LocalDateTime的使用
  8. tensorflow 标准数据读取 tfrecords
  9. 计算机网络(九)——简述Socket
  10. 在SQL Server 2017中使用Python进行数据插值和转换
  11. 证明华为模拟器Wvrp5.2a的二三层可以通信的trunk实验
  12. 原生Js从0开始实现一个链家网地图画圈找房功能
  13. 计算机视觉--图像导数-图像梯度向量
  14. Android OpenGL ES纹理总结、纹理坐标系说明、使用代码示例
  15. 三级等保 mysql8.0.24密码策略设置
  16. sigma-delta_Delta调试-简化失败的测试用例
  17. 计算机上的数学符号怎么打平方,平方米符号电脑上怎么打
  18. 市政协调研组:建议设大数据管理局
  19. 关于数据驱动消费金融业务的几点看法
  20. 编写一个带两个变量和一个运算符的四则运算函数

热门文章

  1. 【财务篇】如何群发工资条?
  2. php mysql 简单聊天室_PHP实现最简单的聊天室应用
  3. iis 如何重启php,Windows下配置Nginx+PHP基本操作(启动、重启和退出)
  4. mysql批量插入大量数据
  5. c语言的舞蹈机器人开题报告范文,程序设计开题报告
  6. C6678/C6657+ZYNQ/K7/A7 FPGA+AD+北斗的软硬件设计方案
  7. PID控制及公式讲解
  8. 戴姆勒集团将拆分卡车业务;洲际酒店集团发布全新品牌标识;先正达集团中国创新研发中心落户南京 | 美通企业周刊...
  9. 2022年4月国产数据库大事记
  10. N1烧USB供电跳线修复方法