目录

一、分类与回归

二、逻辑回归不是回归

三、生成式逻辑回归

四、判别式逻辑回归

五、逻辑回归为什么不用均方误差做损失函数

六、判别模型与生成模型的比较

七、写在最后


一、分类与回归

回归与分类是机器学习的基本问题。回归是预测连续值,分类是预测离散值;回归的输出可以是任意值,而分类的输出只能是预设的分类输出的一个,比如(0,1)中的0或1.;理论上讲,如果回归的输入值相近,那么它的预测值也是相近的,而分类的输入相近(在同一个分类决策边界内),那么它们的预测值是一样的,代表属于同一类别。

举个例子:

预测明天的气温是回归问题,因为预测值可以是正常温度中的任意一个值,是连续的。

预测明天的天气是分类问题,它的预测值是阴、晴、雨等等,是离散的。

二、逻辑回归不是回归

逻辑回归,Logistic Regression,名为回归,实为分类算法。

逻辑回归的激活函数为:

通过计算,它的输出为(0,1)之间的某个数值,代表概率,输出值越接近1,表示判断为正的概率越大。和回归的区别在于,输出不能为连续的任意值,只能介于零一之间,而通过设置阈值θ,如果f(x)>θ,则最终输出为1,代表分类为正样本。如果输出f(x)<θ,输出为0,代表分类为负样本。所以逻辑回归不是回归而是分类。

三、生成式逻辑回归

假设我们有一个数据集,共有1000个样本,其中C1类有350个,C2类有650个。那么我们就已知了P(C1)和P(C2)。

贝叶斯公式为:

由贝叶斯公式上下同时除以分子可得:

令         则  (sigmoid函数)

sigmoid函数的性质如下图:

它可以完美的实现逻辑回归输出的要求,输出结果在(0,1)。所以逻辑回归以此为激活函数。

考虑到公式Z:

而对于一个样本,比如我们之前提到的,P(C1)H和P(C2)是已知的,只需要求前面一项即可。

现在假设每个特征的维度相互独立,则:

假设样本C1C2的分类均为高斯分布,且相互独立,则C1样本的均值为,样本方差为Σ1;C2的样本均值为,样本方差为Σ2。则:

通过计算最终可得:

其中最后一项为先验概率比值的ln值。

当我们不采用单独的方差,而是使用协方差矩阵代替,即Σ=Σ1=Σ2,那么问题将得到简化,

即:

               

这样通过先验概率和假设特征概率分布而求得参数的方法,成为生成式逻辑回归模型。

四、判别式逻辑回归

我们在线性回归时直接规定了损失函数为MSE,通过优化损失函数来求得最终的参数,那么我们可不可以直接也用MSE作为逻辑回归的损失函数而直接求参数呢?答案是否定的。当然,并不是因为不能优化损失函数来求参数,而是MSE不适合作为线性回归的损失函数。既然MSE的求距离方式不适用,那么我们可不可以找到另外一种求距离的方式来优化呢?答案是肯定的。那就是KL散度。

通过这一步,可以使输出值变为(0,1)内的一个概率值。

令(其中x1与x2为一类,x3为另一类):

我们要找出一对(w,b),使L(w,b)最大,这样就可以使x1x2为一类且x3为另一类的概率最大,即在训练集上的误差最小。 

最大化L(w,b)就是最小化  {-ln(L(w,b))}

这就是两个伯努利分布的交叉熵损失函数。

接下来就可以对w和b采用梯度下降或者其他优化算法求最优值了。方法和线性回归类似,这里不再详细推导。

五、逻辑回归为什么不用均方误差做损失函数

假如损失函数为均方误差,则:

由sigmoid函数特性可知,当初始化一组(w,b)后,f(x)的值接近0或者1的概率非常大,那么梯度值就会接近零,而根据更新公式:

当梯度值接近0时,每次更新幅度几乎为零,就会被判定更新到最优质。而实际上并没有进行任何优化,这显然是无法接受的。

既然我们选的初始(w,b)导致梯度为0,那么我们可以多次初始化,从中选择一个好的( w,b)进行优化吗?理论上可以,但现实非常难。

另外,MSE的局部最优值与特征数量的平方称正比,所以会非常容易陷入局部最优。而KL散度最为优化函数,因为是凸函数,所以是一定可以求得全局最优的。

六、判别模型与生成模型的比较

ng和Jordan的神论文《On Discriminative vs. Generative classifiers: A comparison of logistic regression and naive Bayes》的论文中提到:

判别式分类器才是首选。当训练集增加,尽管两种算法都会表现更好,但效果好的表现形式却是不同的。从反复实验中观察到,训练集增加后,判别式方法会达到更低的渐进误差,而生成式方法会更快的达到渐进误差,但这个误差比判别方法的渐进误差大。

而从我们上述推到过程中也可以发现,生成模型我们进行了诸多假设,这些假设可以使噪声的影响被抵消,所以生成式模型受样本数据的影响较小,而判别式模型受数据和噪声影响更大。

七、写在最后

我是一个刚接触机器学习不久的小白,借着写博客来记录一下学习历程并加深理解,文中难免有错误,若您读后发现有错误,望不吝赐教,谢谢。

机器学习之逻辑斯蒂回归相关推荐

  1. 【机器学习】逻辑斯蒂回归(Logistic Regression)详解

    引言 LR回归,虽然这个算法从名字上来看,是回归算法,但其实际上是一个分类算法,学术界也叫它logit regression, maximum-entropy classification (MaxE ...

  2. 【机器学习】逻辑斯蒂回归原理推导与求解

    1.概念 逻辑斯蒂回归又称为"对数几率回归",虽然名字有回归,但是实际上却是一种经典的分类方法,其主要思想是:根据现有数据对分类边界线(Decision Boundary)建立回归 ...

  3. 【机器学习】逻辑斯蒂回归原理

    逻辑斯蒂函数 引入: 在线性感知器算法中,我们使用了一个f(x)=x函数,作为激励函数,而在逻辑斯蒂回归中,我们将会采用sigmoid函数作为激励函数,所以它被称为sigmoid回归也叫对数几率回归( ...

  4. 【机器学习】逻辑斯蒂回归概率计算和手动计算对比

    二分类,逻辑斯蒂回归概率计算 import numpy as np from sklearn import datasets from sklearn.linear_model import Logi ...

  5. 机器学习笔记——逻辑斯蒂回归(Logistic)

    1.线性回归 1.1线性回归概念   如果特征值之间存在线性关系就可以使用线性回归建模对其预测结果. 1.2最小二乘法求解   何为最小二乘法,我们有很多的给定点,这时候我们需要找出一条线去拟合它,那 ...

  6. 逻辑斯蒂回归_逻辑斯蒂回归详细解析 | 统计学习方法学习笔记 | 数据分析 | 机器学习...

    本文包括: 重要概念 逻辑斯蒂回归和线性回归 二项逻辑斯谛回归模型 逻辑斯蒂回顾与几率 模型参数估计 多项逻辑斯谛回归 其它有关数据分析,机器学习的文章及社群 1.重要概念: 在正式介绍逻辑斯蒂回归模 ...

  7. 机器学习(四)——逻辑斯蒂回归(Logistic Regression)

    机器学习(四)--逻辑斯蒂回归(Logistic Regression) 一.算法简介 1.1 概念 二.Logistic回归理论推导 2.1 Logistic回归 2.1.1 参数向量θ 2.2 梯 ...

  8. 机器学习Python学习——逻辑斯蒂回归(Logistic Regression)

    目录 1. 基本概念 2. 数学原理 3.  代码实现 3.1 代码分析 3.2 数据集分类实现 4. 总结 1. 基本概念 Logistic回归也是一种分类方法,用于两分类问题.其基本思想为:(1) ...

  9. 机器学习(二)--sklearn之逻辑斯蒂回归和朴素贝叶斯

    文章目录 1.逻辑斯蒂回归 2.朴素贝叶斯 3.三种分类算法的比较 上回说到,sklearn中的k近邻算法解决多分类问题.k近邻的基本步骤是:收集数据.创建分类器.训练.预测.评估性能.调参(参数就是 ...

最新文章

  1. PHP:第一章——PHP中的关键字
  2. NPAPI——实现非IE浏览器的类似ActiveX的本地程序(插件)调用
  3. java 以什么开头_判断字符串以什么开头
  4. Windows 下 修改 Anaconda3 jupyter 默认启动目录
  5. 本地计算机上的SQL Server(MSSQLSERVER)服务启动后停止。某些服务在未由其他服务或程序使用时将自动停止...
  6. 算法设计与分析——回溯法——圆排列问题
  7. html鼠标悬停盒子凸起,css3 transform动画鼠标悬停div容器凸起放大显示
  8. CentOS安全设置
  9. 深入MTK平台bootloader启动分析笔记
  10. 【Python】pyCryptodome模块实现AES加密、解密
  11. java 生成枚举_为什么编译器在Java中生成Enums?
  12. AIX学习之--文件系统修复(/home)
  13. java 定义动态接口_使用自定义annotation接口进行aspectj动态缓存
  14. 构建企业级LAMMP环境
  15. python 区块链开发教程_区块链开发教程分享【201904】
  16. ssis 抽取mysql 实验_SSIS探索之SSIS增量抽取数据
  17. 利用python实现一个小型的人员管理系统
  18. HDAO 全新项目落地,带动区块链新一轮牛市
  19. 假短信截图在线生成器_一个工具箱:汇集200多款实用又好玩的在线工具的神奇百宝箱...
  20. 华光职业学院计算机专业,关于给予张庆俊等同学省高校计算机一级 考试成绩优秀奖励的通知...

热门文章

  1. ZigBee、Wi-Fi、蓝牙和几种无线技术之间,有什么区别?
  2. python实现按键精灵之按键操作key
  3. vivo s15真机调试 解析软件包时出现问题
  4. 简单的cgi程序——获取get、post请求的参数
  5. 关于Word无法启动转换器mswrd632.wpc错误的解决方法
  6. 水电气远程无线抄表 DTU无线数传终端应用
  7. Shizuku,小黑屋,手机冻结应用
  8. php数组(数组的定义、使用、删除数组、数组操作符、数组排序、数组元素查找、数组的常用函数)
  9. 回归模型中对数变换的含义
  10. 删除金山毒霸中 KAVEXT.DLL 心得!