李宏毅第四次打卡

P9 logit regression

Step 1:Function Set

找一个Pw,b(C1∣x)P_{w,b}(C_1|x)Pw,b​(C1​∣x)


function set:

fw,b(x)f_{w,b}(x)fw,b​(x) =

pw,b(C1∣x)p_{w,b}(C_1|x)pw,b​(C1​∣x)

对于对数几率回归,output函数的原因,所以是0-1之间的

Step 2: Goodness of a Function

最优化w,b和,原本是最大化L找w,b,然后加个-号,找到最小的w和b

转化损失函数

Step 3: Find the best function

分别进行偏微分,进行最小化

Discriminative v.s. Generative

一般而言分类模型比生成模型要好

生成模型做了一些假设。

不是所有时候分类模型都优于生成模型,如果此时数据很小。

生成模型的data量对于generative模型的影响相对于分类模型比较小。

Multi-class Classification

Limitation of Logit Regression

对于异或问题是无法正确分类的。

Feature Transformation

使用这个方法,使得对于异或问题可以正确可分。

转化一下feature。6

问题在于我们希望让电脑来进行feature转化

我们可以使用多个对数几率回归进行转化。

对于这两个的推导:LR损失函数(1) && 学习LR梯度下降(2)

Softmax原理

softmax损失函数

softmax梯度下降

推荐一篇好的关于softmax的链接

LR and Softmax相关推荐

  1. 【机器学习】 二次损失函数的不足及交叉熵损失softmax详解

    二次代价函数的不足: 以sigmoid激活函数为例,由于初始化是随机的,假设目标值为0,第一次随机初始化使得输入为0.82,那么还可以,多次迭代之后可以收敛到0.09,但如果第一次随机初始化到0.98 ...

  2. softmax分类器_[ML] 逻辑回归与 Softmax 回归

    Logistic Regression (LR) 译为逻辑回归,但实际上这是一种分类模型(二分类或多分类).下面精要地把模型中的核心概念.推导梳理一下.本文主要内容如下: 逻辑回归的概率模型 逻辑回归 ...

  3. 机器学习面试题之LR

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 1. LR为什么是线性模型 2. LR如何解决低维不可分 特征映射:通过特征变换的方式把低维空 ...

  4. 机器学习面试题之——LR问题集合

    一.LR为什么是线性模型 Logistic Regression从几率的概念构建线性回归模型.一个事件发生的几率(odds)为该事件发生的概率与不发生概率的比值,几率的取值范围为[0,+∞),其对数的 ...

  5. 3.Deep Neural Networks for YouTube Recommendations论文精细解读

    一.总述 今天分享的是Deep Neural Networks for Y ouTube Recommendations这篇论文的一些核心,这篇论文被称为推荐系统工程实践领域的一篇神文,每一个细节都值 ...

  6. CIKM 2021 | Deep Retrieval:字节跳动深度召回模型论文精读

    ©作者 | 杰尼小子 单位 | 字节跳动 研究方向 | 推荐算法 文章动机/出发点 这是一篇字节跳动发表在 CIKM 2021 的论文,这一项工作在字节很多业务都上线了,效果很不错.但是这篇文章整体读 ...

  7. 06_LR和最大熵模型_统计学习方法

    文章目录 一.理解LR模型 1. 对数几率 2.函数映射 3.概率解释 二.LR模型参数估计 梯度下降求解最优参数 多项逻辑斯谛回归(multi-nominal logistic regression ...

  8. 从春招到秋招,算法工程师养成记

    本文转载自  牛客网 自我介绍 大家好,我是老班长,一名老牛油(至于多老呢?我基本是第一批关注牛客网的同学,我加牛客网qq1群的时候,群里只有400多人(现在估计10多个群了吧),那时的产品经理是兴宝 ...

  9. 年薪翻倍的100篇面经:如何转型AI拿到阿里等大厂的40万offer

    前言 熟悉我的朋友可能已经知道,我个人从 2010 年开始在CSDN写博客,写了十年,如今接近1700万PV,创业做「七月在线」则已五年,五年已30多万学员.这五年经历且看过很多的人和事,比如我们的机 ...

最新文章

  1. [ARM-assembly]-ARMv8-A64指令集总结和学习
  2. android新闻管理,Android资讯新闻类App(头条、网易等),频道管理集成之数据库存储...
  3. 【JS 逆向百例】复杂的登录过程,最新微博登录逆向
  4. 部门日报系统部署备忘录
  5. 两个网口芯片接一个变压器_关于以太网网络变压器的几个问题
  6. [leetcode]227. 基本计算器 II
  7. 对java中路径的一些理解
  8. 微信小程序云数据库操作
  9. 计算机基础(一):二进制详解
  10. 京东云魏伟:做最懂视频的云
  11. MVP结合(RecycleView,Retorfit,GreenDao和EventBus)数据展示
  12. PHP事务数据库写法,PHP 操作 MySQL 执行数据库事务
  13. 为什么以及如何通过机器人学习编程和项目实践
  14. 学习笔记:cnn 猫狗识别
  15. lol丢失base.dll文件怎么办?base.dll文件下载
  16. phpmailer SMTP ERROR: Password command failed: 526 Authentication failure[0] 阿里云企业邮箱
  17. matlab建模sar adc,SAR ADC的系统级建模与仿真
  18. HttpClient 获得手机规属地
  19. OA系统共享服务器,协同oa系统服务器多少
  20. amqp协议java_AMQP协议介绍

热门文章

  1. Aigtek线束测试仪——飞机线束检测仪器
  2. QQ空间伤感日志:泪是我唯一的朋友
  3. Swiper - 免费开源、功能强大的触摸滑动 js 特效插件
  4. OSG+VS2010+win7环境搭建
  5. 小清新有木有,豆瓣五款移动应用介绍
  6. Win11下安装eNSP
  7. 中国海洋大学第四届朗讯杯高级组 Playing Fair with Cryptography
  8. 斗图神器--纯前端实现视频转GIF制作表情包(已开源)
  9. 《PolyLaneNet:Lane Estimation via Deep Polynomial Regression》论文笔记
  10. sklearn中Polynomialfeatures