目录

  • LR回归
  • 概率解释

LR回归

  Logistic 回归是一种分类器,功能与贝叶斯分类器,SVM等分类器一致,是用于分类的,而不是进行数据回归的。下面简单介绍下整个LR模型的基本原理,主要有两个核心问题,1是LR如何分类,2是如何得到模型内相应的参数。
  首先介绍sigmoid函数,sigmoid函数可以把任意实数域内的元素映射到(0,1)(0,1)(0,1)之间。表达式如下:

y(x)=11+e−x(1)y(x)=\frac{1}{1+e^{-x}}\tag{1}y(x)=1+e−x1​(1)

  图像如下:

  值得注意的是,(0,1)(0,1)(0,1)这个区间正好对应了概率的取值,因此sigmoid函数的函数值在某些情况下就可以看成概率。

  LR回归的模型很简单,表达式如下:

yi=11+e−wTxi−by_i=\frac{1}{1+e^{-w^Tx_i-b}}yi​=1+e−wTxi​−b1​

  首先wTxi+bw^Tx_i+bwTxi​+b是一个线性分类器(图像表达为一个超平面),为什么呢?考虑最简单的二维情况:

  当数据xix_ixi​落在直线上时有wTxi+b=0w^Tx_i+b=0wTxi​+b=0
  当数据xix_ixi​落在直线上方时有wTxi+b>0w^Tx_i+b>0wTxi​+b>0
  当数据xix_ixi​落在直线下方时有wTxi+b<0w^Tx_i+b<0wTxi​+b<0

  其次yi=11+e−wTxi−by_i=\frac{1}{1+e^{-w^Tx_i-b}}yi​=1+e−wTxi​−b1​也是一个分类器,为什么呢?也考虑二维最简单的情况:
  当数据xix_ixi​落在直线上时有yi=11+e−wTxi−b=0.5y_i=\frac{1}{1+e^{-w^Tx_i-b}}=0.5yi​=1+e−wTxi​−b1​=0.5
  当数据xix_ixi​落在直线上方时有yi=11+e−wTxi−b∈(0.5,1)y_i=\frac{1}{1+e^{-w^Tx_i-b}}\in(0.5,1)yi​=1+e−wTxi​−b1​∈(0.5,1)
  当数据xix_ixi​落在直线下方时有yi=11+e−wTxi−b∈(0,0.5)y_i=\frac{1}{1+e^{-w^Tx_i-b}}\in(0,0.5)yi​=1+e−wTxi​−b1​∈(0,0.5)

因此,LR模型可作为二分类的分类器。

概率解释

  已知有数据集X={X1,X2,...,XN}X=\{X_1,X_2,...,X_N\}X={X1​,X2​,...,XN​},对应的二分类标签为{0,1}\{0,1\}{0,1},要得到LR模型中的w,bw,bw,b,肯定有一个训练的过程,而且是有监督的训练过程。
  对于数据XiX_iXi​,若划分类别为yi(yi∈{0,1})y_i(y_i\in\{0,1\})yi​(yi​∈{0,1}),那么相应的概率如下:

p(yi=0∣Xi,w,b)=11+e−wTxi−bp(y_i=0|X_i,w,b)=\frac{1}{1+e^{-w^Tx_i-b}}p(yi​=0∣Xi​,w,b)=1+e−wTxi​−b1​

p(yi=1∣Xi,w,b)=1−11+e−wTxi−b=e−wTxi−b1+e−wTxi−bp(y_i=1|X_i,w,b)=1-\frac{1}{1+e^{-w^Tx_i-b}}=\frac{e^{-w^Tx_i-b}}{1+e^{-w^Tx_i-b}}p(yi​=1∣Xi​,w,b)=1−1+e−wTxi​−b1​=1+e−wTxi​−be−wTxi​−b​

  记h(Xi,w,b)=11+e−wTxi−bh(X_i,w,b)=\frac{1}{1+e^{-w^Tx_i-b}}h(Xi​,w,b)=1+e−wTxi​−b1​,因此yyy的概率分布为:

p(yi∣Xi,w,b)=h(Xi,w,b)y(1−h(Xi,w,b))1−y(2)p(y_i|X_i,w,b)=h(X_i,w,b)^y(1-h(X_i,w,b))^{1-y}\tag{2}p(yi​∣Xi​,w,b)=h(Xi​,w,b)y(1−h(Xi​,w,b))1−y(2)

  为什么是以上这个形式,可以考虑以下概率论中(0,1)(0,1)(0,1)分布的知识。

  有了(2)式,如何得到w,bw,bw,b?,由(2)(2)(2)式可知,这属于参数估计问题,最直接的办法是极大似然,似然函数如下:

L(yi∣Xi,w,b)=∏i=1Nh(Xi,w,b)iy(1−h(Xi,w,b))1−yiL(y_i|X_i,w,b)=\prod_{i=1}^Nh(X_i,w,b)^y_i(1-h(X_i,w,b))^{1-y_i}L(yi​∣Xi​,w,b)=i=1∏N​h(Xi​,w,b)iy​(1−h(Xi​,w,b))1−yi​

  取对数得:
J(yi∣Xi,w,b)=∑i=1N[yih(Xi,w,b)+(1−yi)(1−h(Xi,w,b))]J(y_i|X_i,w,b)=\sum_{i=1}^N[y_ih(X_i,w,b)+(1-y_i)(1-h(X_i,w,b))]J(yi​∣Xi​,w,b)=i=1∑N​[yi​h(Xi​,w,b)+(1−yi​)(1−h(Xi​,w,b))]

  要得到最优的w,bw,bw,b只需优化以下目标函数:

max[J(yi∣Xi,w,b)]max[J(y_i|X_i,w,b)]max[J(yi​∣Xi​,w,b)]

  其中XiX_iXi​为提取出来的特征向量,yiy_iyi​为标签,为了求解这个优化问题,可以使用梯度上升法等优化方法。

Logistic回归的基本原理(简单介绍)相关推荐

  1. VAE 模型基本原理简单介绍

    VAE 模型基本原理简单介绍 1. 编写目的 2. 推荐资料 3. 相关背景 3.1 生成模型(Generative model): 3.2 隐变量模型(Latent Variable Models) ...

  2. 机器学习:Logistic回归介绍

    Logistic回归定义 简单来说, 逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性.比如某用户购买某商品的可能性, ...

  3. logistic regression_【科研加油站】SPSS操作之有序Logistic回归的详细教程

    点击上方蓝字,轻松关注我们 以下内容转载自"医咖会"微信公众号(medieco-ykh),作者张耀文. 上一期我们讨论了有序多分类Logistic回归的SPSS简单操作,本期&qu ...

  4. MLA Review之四:logistic回归

    终于来到logistic回归,logistic回归其实很简单,之前的说到的神经网络就用到了这个方法,其中最重要的就是使用了sigmoid损失函数.当然使用的方法也就最简单的梯度下降法,这里并没有使用之 ...

  5. '决策树','Logistic回归','支持向量机'

    '决策树','Logistic回归','支持向量机' 一.决策树方法的基本原理: 决策树是一种基本的回归与分类方法:可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分 ...

  6. 请你介绍下Logistic回归模型?

    请你介绍下Logistic回归模型? 逻辑回归(Logistic Regression)是机器学习中的一种分类模型(注意,不是回归模型,虽然叫logistic Regression),由于算法的简单和 ...

  7. 如何通过牛顿方法解决Logistic回归问题 By 机器之心2017年8月09日 16:30 本文介绍了牛顿方法(Newton's Method),以及如何用它来解决 logistic 回归。log

    如何通过牛顿方法解决Logistic回归问题 By 机器之心2017年8月09日 16:30 本文介绍了牛顿方法(Newton's Method),以及如何用它来解决 logistic 回归.logi ...

  8. python logistic回归_logistic回归介绍与源码分析

    1. 介绍(由线性模型引出logistic回归) 首先介绍一下什么是线性模型呢? 线性模型的定义如下:给定 个属性描述的样本 , 代表样本在第 个属性上的取值. 线性模型的目的是学习一个函数,它可以通 ...

  9. Logistic回归模型和Zeppelin简单使用

    逻辑回归模型 一.模型用途: 一般用来: 通过一些用户个人信息,社会状态,信用历史,缴费信息等数据建立信用风险模型,来预测用户的违约概率. 信用风险一般有模型:Application模型, Behav ...

最新文章

  1. folder ground 文件访问
  2. 会计证考试《财经法规与职业道德》第三章精选题
  3. 开头和结尾标记 在不同系统_文本标记的宝藏平台——Docusky
  4. HDU1166敌兵布阵
  5. springboot配置定时任务及常用的cron表达式
  6. Drupal 关于节点(nodes)的理解
  7. 最优化课堂笔记05——一维最优化方法(含重点:黄金分割法)
  8. 1-4-14:计算邮资
  9. SharePoint 网站搬迁
  10. Redis 3.2.4配置文件翻译
  11. 电脑连不上wifi的三种处理办法。
  12. 汉王速录笔linux驱动下载,汉王速录笔v600驱动 官方版
  13. 聊一聊固态硬盘的那些事
  14. 现代 C++ 编译时 结构体字段反射
  15. 账号、密码管理系统 python
  16. 计算机毕业设计-基于神经网络APP-整合Vue+SpringBoot+TensorFlow框架-诗联AI
  17. 有了AI智能绘画,我也可以成为绘画大师——全球最大规模中文跨模态生成模型ERNIE-ViLG
  18. 【随机过程】随机过程第一章 随机过程的基本概念
  19. 这些大厂笔试题 你都见识(被无情鞭挞)过了吗?—— 哔哩哔哩篇
  20. git同步代码到远程github仓库

热门文章

  1. 51单片机风扇转动c语言代码,基于51单片机的c语言程序 电机转速测量与PWM控制...
  2. 为虚拟机创建远程用户
  3. python定时关闭进程_Python定时结束任务脚本
  4. 周末老板请吃东西,刮到多少算多少?Python带你制作一款刮刮卡小程序。
  5. 京东科技业务调整:整合成4大中心 负责人均向李娅云汇报
  6. [XR]动捕 UnityXR + FinalIK(VRIK) + SteamVR
  7. 机器从零到 K8S 集群 Worker 节点的安装过程
  8. Window入侵排查思路
  9. js实现农历、新历同时显示
  10. 如何解决每次打开Excel2016文件都是灰色空白页,要把文件拖进去才能显示