背景:逻辑回归可以说是机器学习领域最常用也最经典的模型。

问题:

(1)逻辑回归相比于线性回归有何异同?

异:

逻辑回归处理分类问题,而线性回归处理回归问题。(本质区别)

逻辑回归中,因变量的取值是一个二元分布,模型学习得到的是,即给定自变量和超参数后,得到因变量的期望,并基于这个期望来处理预测和分类问题。

线性回归中,实际求解的是,是对我们假设的真是关系的一个近似,其中

代表的是误差项,使用这个近似来处理回归问题。

分类和回归是如今机器学习中两个不同的任务,而属于分类算法的逻辑回归,它的命名有一定的历史原因。这个方法是由统计学家David Cox在他1958年的论文《二元序列中的回归分析》(The regression analysis of binary sequences)中提出来的,当年人对于回归与分类的定义与今天是有一定区别的,只是将“回归”这一名字沿用了。实际上,将逻辑回归的公式进行整理,得到其中p=p(y=1|x),也就是将给定输入x预测为正例样本的概率。如果把一个事件的几率(odds)定义为改事件发生的概率与不发生的概率的比值,那么逻辑回归就可以看作是

“y=1|x”这件事情的对数几率的线性回归,于是“逻辑回归”这一称谓也就延续下来了。

在关于逻辑回归的讨论中,我们均认为y是因变量,而并非,这便引出了逻辑回归与线性回归的最大区别,即逻辑回归的因变量是离散的,而线性回归中的因变量是连续的。  并且在自变量x与确定的前提下,逻辑回归可以看作是广义的线性回归,在因变量y服从二元分布时的一个特殊情况;而使用最小二乘法求解线性回归时,我们认为因变量y服从正态分布。

逻辑回归的定义:数据服从伯努利分布的前提下,使用极大似然估计,利用梯度下降求解参数。

同:

二者都使用了极大似然估计对训练样本进行建模。

(线性回归使用最小二乘法,实际就是自变量x与确定,因变量y服从正态分布的假设下,使用极大似然估计的化简:而逻辑回归中通过对似然函数的学习,得到最佳的参数。另外,二者在求解超参数的过程中,都使用了梯度下降的方法,这也是监督学习中一个常见相似处之一。

(2)当逻辑回归处理多标签的分类任务时,有哪些常见做法,分别应用于哪些场景,他们之间又有什么样的关系?

使用那种办法来处理多分类问题取决于具体问题的定义。

首先,如果一个样本只对应一个标签,我们假设每个样本属于不同标签的概率服从于几何分布,使用多项逻辑回归(softmax Regression)来进行分类

其中为模型参数,而可以看作是对概率的归一化。为了方便起见,我们将{}这K个向量按顺序排列形成n*k维的矩阵,写作,表示整个参数集。一般来说,多项逻辑回归具有参数冗余的特点,即将同时加减一个向量后预测结果不变。

特别的 当类别数为2时,

利用参数冗余的特点,我们将所有的参数都减去,上式变为

其中 而整理后的式子与逻辑回归一致。因此,多项式回归实际上是一个二分类逻辑回归在多标签下的一种拓展。

当存在样本可能属于多个标签的情况时,我们可以训练K个二分类的逻辑回归分类器。第i个分类器以区分每个样本是否可以归为i类,训练该分类器时,需要把标签重新整理为“第i个标签”与“非第i类标签”两类。通过这样的办法,就可以解决了每个样本可能拥有多个标签的情况。

参考文献:

[1] 百面机器学习:算法工程师带你去面试/诸葛越主 编,葫芦娃著 北京:人民邮电出版社, 2018 ISBN 978 7-115-48736-0

机器学习算法(一):逻辑回归(Logistic Regression)相关推荐

  1. 吴恩达机器学习 8.6 逻辑回归(Logistic Regression)

    6.1 分类问题 参考文档: 6 - 1 - Classification (8 min).mkv 在这个以及接下来的几个视频中,开始介绍分类问题. 在分类问题中,你要预测的变量 $y$ 是离散的值, ...

  2. Coursera公开课笔记: 斯坦福大学机器学习第六课“逻辑回归(Logistic Regression)”

    Coursera公开课笔记: 斯坦福大学机器学习第六课"逻辑回归(Logistic Regression)" 斯坦福大学机器学习第六课"逻辑回归"学习笔记,本次 ...

  3. 斯坦福大学机器学习第四课“逻辑回归(Logistic Regression)”

    斯坦福大学机器学习第四课"逻辑回归(Logistic Regression)" 本次课程主要包括7部分: 1) Classification(分类) 2) Hypothesis R ...

  4. 机器学习笔记04:逻辑回归(Logistic regression)、分类(Classification)

    之前我们已经大概学习了用线性回归(Linear Regression)来解决一些预测问题,详见: 1.<机器学习笔记01:线性回归(Linear Regression)和梯度下降(Gradien ...

  5. 逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种。通过历史数据的表现对未来结果发生的概率进行预测。例如,我们可以将购买的概率设置为因变量,将用户的

    逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种.通过历史数据的表现对未来结果发生的概率进行预测.例如,我们可以将购买的概率设置为因变量,将用户的 ...

  6. 机器学习算法 03 —— 逻辑回归算法(精确率和召回率、ROC曲线和AUC指标、过采样和欠采样)

    文章目录 系列文章 逻辑回归 1 逻辑回归介绍 1.1 逻辑回归原理 输入 激活函数 1.2 损失以及优化 2 逻辑回归API介绍 3 案例:肿瘤良性恶性预测 4 分类模型的评估 4.1 分类评估方法 ...

  7. 机器学习算法之逻辑回归(LR)

    1.前言 说起机器学习,就不得不说说逻辑回归,它是区别于另一个基础算法:线性回归:对于回归(比如线性回归Linear Regression)可以理解为连续的值(类似模拟量),分类(比如逻辑回归Logi ...

  8. 逻辑回归(Logistic Regression

    6.1 分类问题 参考文档: 6 - 1 - Classification (8 min).mkv 在这个以及接下来的几个视频中,开始介绍分类问题. 在分类问题中,你要预测的变量 y y y 是离散的 ...

  9. 逻辑回归(logistic regression)的本质——极大似然估计

    文章目录 1 前言 2 什么是逻辑回归 3 逻辑回归的代价函数 4 利用梯度下降法求参数 5 结束语 6 参考文献 1 前言 逻辑回归是分类当中极为常用的手段,因此,掌握其内在原理是非常必要的.我会争 ...

  10. CS229学习笔记(3)逻辑回归(Logistic Regression)

    1.分类问题 你要预测的变量yyy是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regression) 的算法,这是目前最流行使用最广泛的一种学习算法. 从二元的分类问题开始讨论. 我们 ...

最新文章

  1. Hibernate 和快照
  2. 批量探测工具fpingping常用命令集合大学霸IT达人
  3. 软件外包故事 - 加入团队战斗
  4. 钉钉产品介绍_钉钉上线安全教育新功能家校联动护航学生暑期安全
  5. 使用jackson对Java对象与JSON字符串相互转换的一些总结
  6. LeetCode 225. Implement Stack using Queues
  7. T系统和应用集成-从SOA架构思想到服务架构规划设计
  8. js json制表符报错_Node.js一个好汉的三个帮
  9. 文件包含原理及本地文件包含漏洞演示(本地文件,远程包含文件的测试)
  10. polar函数--Matplotlib
  11. 数据分析师mysql面试题_30个sql面试题及答案(数据分析师福利)
  12. php自定义建站系统,PbootCMS(开源免费PHP建站系统) V2.0.9 官方版
  13. 云服务器需要芯片吗,什么时候手机不再需要芯片——计算云端化是不可逆转的未来...
  14. 论“渤海—黄海开凿人工运河”
  15. 绝对收敛级数重排定理的证明
  16. 我爷爷来了都能看懂的数据库主键,候选键,外键,非空和check的几种约束方式及使用方法
  17. 挂件巡检机器人_最近DIY的室内巡检机器人
  18. ## 03. Stream流
  19. 鸿蒙强者排行榜,琉璃美人煞十大强者排名,腾蛇垫底,司凤第七,罗喉计都屈居第二...
  20. ftpclient查看服务器文件,使用Apache FtpClient在FTP服务器中计算文件校验和

热门文章

  1. centos7如何把虚拟网卡名称ifcfg-eno16777736改成ifcfg-eth0(无法重启网卡的终极解决方案)
  2. css字体不能缩小,CSS字体大小在%不降低,当我们缩小浏览器窗口大小
  3. JAVA调用JNA修改桌面壁纸
  4. Spring-单例模式和依赖注入
  5. setq setf
  6. android和ios GoogleMap画导航线路图 路径规划(Directions)
  7. 解决微信浏览器苹果手机复制的时候连旁边的也复制的办法
  8. I. Pudding Store
  9. 多智能体系统MASs,编队控制,自适应理论,基于干扰观测器的控制DOBC,Matlab数值仿真实验
  10. 深度学习之模型量化学习笔记