1. 简单介绍一下逻辑回归?

逻辑回归主要用来解决分类问题,线性回归的结果YYY带入一个非线性变换的Sigmoid函数中,得到[0,1][0,1][0,1]之间取值范围的数SSS,SSS可以把它看成是一个概率值,如果我们设置概率阈值为0.5,那么SSS大于0.5可以看成是正样本,小于0.5看成是负样本,就可以进行分类了。

2. 逻辑回归的损失函数推导?

逻辑回归本质上是线性回归,即先把特征线性求和,然后带入Sigmoid函数中作为假设函数来进行预测。

逻辑回归用来分类0/1 问题,也就是预测结果属于0 或者1 的二值分类问题。这里假设了二值满足伯努利分布,也就是:

可以合并成:

似然函数为:

取对数并取反则得到负对数损失函数

3. 可以进行多分类吗?

  • 采用一对多的方法扩展到多分类:
    每次将一个类型作为正例,其他的作为反例,训练NNN个分类器。在预测阶段,每个分类器可以根据测试样本,得到当前正类的概率,选择概率最大的分类器,其正类就可以作为预测结果。
    特点:效率较高,有多少个类别就训练多少个分类器,复杂度使O(n)。
    但容易造成训练集样本数量的不平衡(Unbalance),尤其在类别较多的情况下,经常容易出现正类样本的数量远远不及负类样本的数量,这样就会造成分类器的偏向性。
  1. 一对一的方法:
    将NNN个类别两两配对,得到多个分类器(N(N−1)/2N(N-1)/2N(N−1)/2),预测的时候,将样本通过所有分类器,通过投票来得到结果,最后票数最多的类别被认定为该样本的类

4. LR+离散特征原因?

  1. 提高计算速度。稀疏向量内积乘法运算速度快,计算结果方便存储
  2. 鲁棒性。减小异常数据的干扰。
  3. 稳定性。降低特征变化带来的影响。
  4. 方便交叉与特征组合。进一步引入非线性
  5. 简化模型。特征离散化以后,起到了简化了逻辑回归模型的作用,降低了模型过拟合的风险。

5. 逻辑回归常用的优化方法

  1. 一阶方法:
    梯度下降、随机梯度下降、mini 随机梯度下降降法。随机梯度下降不但速度上比原始梯度下降要快,局部最优化问题时可以一定程度上抑制局部最优解的发生。
  2. 二阶方法:
    牛顿法、拟牛顿法。

这里详细说一下牛顿法的基本原理和牛顿法的应用方式。牛顿法其实就是通过切线与x轴的交点不断更新切线的位置,直到达到曲线与x轴的交点得到方程解。在实际应用中我们因为常常要求解凸优化问题,也就是要求解函数一阶导数为0的位置,而牛顿法恰好可以给这种问题提供解决方法。实际应用中牛顿法首先选择一个点作为起始点,并进行一次二阶泰勒展开得到导数为0的点进行一个更新,直到达到要求,这时牛顿法也就成了二阶求解问题,比一阶方法更快。我们常常看到的x通常为一个多维向量,这也就引出了Hessian矩阵的概念(就是x的二阶导数矩阵)。
缺点:牛顿法是定长迭代,没有步长因子,所以不能保证函数值稳定的下降,严重时甚至会失败。还有就是牛顿法要求函数一定是二阶可导的。而且计算Hessian矩阵的逆复杂度很大。
拟牛顿法不用二阶偏导而是构造出Hessian矩阵的近似正定对称矩阵的方法称为拟牛顿法。拟牛顿法的思路就是用一个特别的表达形式来模拟Hessian矩阵或者是他的逆使得表达式满足拟牛顿条件。主要有DFP法(逼近Hession的逆)、BFGS(直接逼近Hession矩阵)、 L-BFGS(可以减少BFGS所需的存储空间)。

6. 逻辑回归的优缺点

优点:

  • 易于理解,实现简单;
  • 计算量小,计算速度快,存储资源低;
  • 方便观测样本的概率。
    缺点:
  • 容易欠拟合,分类精度不高;
  • 特征空间很大时表现效果不好;

7. RL与SVM有什么区别

  • 线性回归做分类因为考虑了所有样本点到分类决策面的距离,所以在两类数据分布不均匀的时候将导致误差非常大;
    LR和SVM克服了这个缺点,其中LR将所有数据采用sigmoid函数进行了非线性映射,削弱远离分类决策面的数据的作用;SVM直接去掉了远离分类决策面的数据,只考虑支持向量的影响;
  • LR是参数模型,SVM是非参数模型;
  • 从目标函数来看,区别在于逻辑回归采用的是交叉熵损失函数,SVM采用的是hinge loss;
  • 逻辑回归相对来说模型更简单,好理解,特别是大规模线性分类时比较方便。而SVM的理解和优化相对来说复杂一些;

答题不要贪多反而最主要的都没说清楚,主观题言之有理即可不用面面俱到。基础的问题一定要耐心背熟,有了框架线索,思路就会清晰,易于扩展。

8. 线性回归与逻辑回归的区别

  • 线性回归主要解决回归任务,逻辑回归主要解决分类问题
  • 线性回归的输出一般是连续的,逻辑回归的输出一般是离散的;
  • 逻辑回归的输入是线性回归的输出;
  • 线性回归的损失函数是MSEMSEMSE,逻辑回归中,采用的是负对数损失函数

另一个回答思路:线性回归做分类因为考虑了所有样本点到分类决策面的距离,所以在两类数据分布不均匀的时候将导致误差非常大;而LR克服了这个缺点,其中LR将所有数据采用sigmod函数进行了非线性映射,削弱远离分类决策面的数据的作用。

二、逻辑回归LR面试题总结相关推荐

  1. python机器学习案例系列教程——逻辑分类/逻辑回归LR/一般线性回归(softmax回归)

    全栈工程师开发手册 (作者:栾鹏) python数据挖掘系列教程 线性函数.线性回归 参考:http://blog.csdn.net/luanpeng825485697/article/details ...

  2. 逻辑回归LR vs 支持向量机SVM

    目录 LR vs SVM LR和SVM的相同点 LR和SVM的不同点 逻辑回归LR LR损失函数 LR公式推导 支持向量机SVM 间隔和支持向量 对偶问题 核函数 软间隔和正则化 LR vs SVM ...

  3. 【机器学习算法笔记系列】逻辑回归(LR)算法详解和实战

    逻辑回归(LR)算法概述 逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法. 逻辑 ...

  4. 推荐系统(4)-逻辑回归LR、POLY2、FM、FFM

    逻辑回归LR.POLY2.FM.FFM 1.逻辑回归LR 2.辛普森悖论 3.POLY2 4.FM-2010 5.FFM 6.GBDT+LR-2014 7.LS-PLM-2017 <深度学习/推 ...

  5. 机器学习——逻辑回归常见面试题整理

    逻辑回归 1.介绍 逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯队下降来求解参数,来达到将数据二分类的目的. 2.逻辑回归的损失函数和梯度下降参数迭代方法 逻辑回归的损失函数是它的 ...

  6. 吴恩达机器学习作业二——逻辑回归

    有了作业一的铺垫,作业二的代码更容易理解了. 逻辑回归 题目描述:在训练的初始阶段,我们将要构建一个逻辑回归模型来预测,某个学生是否被大学录取.设想你是大学相关部分的管理者,想通过申请学生两次测试的评 ...

  7. 机器学习实战(四)逻辑回归LR(Logistic Regression)

    目录 0. 前言 1. Sigmoid 函数 2. 梯度上升与梯度下降 3. 梯度下降法(Gradient descent) 4. 梯度上升法(Gradient ascent) 5. 梯度下降/上升法 ...

  8. sklearn之逻辑回归LR

    对于线性回归,由于都是求线性参数:逻辑回归,由于其呈S型,具有在坐标轴两个左右边进行急剧上升下降的趋近1或者0,因此具有分类特性. 决策树是天生的过拟合,而线性回归是天生的欠拟合: L1范式可以完成 ...

  9. 机器学习算法——逻辑回归(LR)

    LR是很多分类算法的基础组件,它的好处是输出值自然地落在0到1之间,并且有概率意义.模型清晰,背后的概率学经得住推敲.它拟合出来的参数就代表了每一个特征(feature)对结果的影响. Logisti ...

  10. 逻辑回归LR模型简介

    1. 定义 LR是线性二分类模型,也是广义的线性回归模型,可以计算某个样本特征下事件发生的概率. 假设数据服从伯努力分布,通过极大化似然函数的方法,运用梯度下降求解参数,来达到将数据二分类的目的. 1 ...

最新文章

  1. 第 27 章 Optimization
  2. 72 Zabbix邮件告警
  3. 分布式经典书籍--深入分布式缓存 从原理到实践
  4. txt文件导入mysql--转
  5. 图像反光能被一键去除了?港科大开源RFC,仅用一个操作,强反光也能完美去除|CVPR2021
  6. TopicPartition的存储
  7. 自制vue组件通信插件:教你如何用mixin写插件
  8. Pipe HDU - 2150(判断线段相交+向量叉乘线代详解)
  9. PHP 数组的内部实现
  10. 刘强东夫妇向英国捐赠大量防疫物资:在英华侨及留学生可免费认领
  11. idea服务器如何手动加载项目,idea导入本地idea的web项目(服务器用的是tomcat)
  12. node中exports和module.exports的关系及使用
  13. Word中插入图表目录
  14. 知识图谱入门 (二) 知识表示与知识建模
  15. ArcGIS 发布自定义打印模板
  16. Sequence (矩阵快速幂+快速幂+费马小定理)
  17. UltraEdit for Mac 18.00 强大的文本编辑器 中文破解版下载
  18. Python编程之四书五经
  19. mathcad入门二
  20. Kubernetes工作实用命令集结号

热门文章

  1. 2021计算机组装视频,2021年做影视后期电脑配置单推荐PR AE软件视频后期电脑组装...
  2. iPhone手机微信下载的文档传输到win10系统桌面
  3. c语言二维指针类型转换,二维数组和指针(C语言)
  4. 基于MODBUS总线的变频调速系统设计与实现
  5. 中医药天池大数据竞赛——中医文献问题生成挑战(二)
  6. echarts:中国地图-省市区二级联动
  7. 微信小游戏开发实战教程16-微信小游戏如何优化
  8. java yml文件_Yml文件的写入和读取
  9. Windows 10系统安装AutoCAD 2007
  10. Unity发布游戏在iOS设备上出现的字体问题