分类模型——Softmax回归

第一章 机器学习是什么
第二章 深度学习是什么
第三章 前馈神经网络
第四章 卷积神经网络
第五章 交叉熵函数


文章目录

  • 分类模型——Softmax回归
  • 前言
  • Softmax回归模型
  • 单样本分类的矢量计算表达式
  • 总结

前言

之前我们一直在说“线性回归”,而Softmax回归虽然也叫回归,但是它与线性回归的应用有本质区别。线性回归主要适用于输出为连续值的情景,而Softmax回归主要适用于输出为离散值的分类场景。此外,softmax回归的输出单元从一个变成了多个,且引入了softmax运算使输出更适合离散值的预测和训练。


Softmax回归模型

softmax回归跟线性回归一样将输入特征与权重做线性叠加。但是,softmax回归的输出值并非一个,而是和要预测的类别数相等,

例如,如果要根据4种特征预测三种动物类别,那么权重包含12个标量(带下标的w)、偏差包含3个标量(带下标的b),且对每个输入计算o1,o2,o3这三个输出:


softmax回归同线性回归一样,也是一个单层神经网络,且输入层和输出层进行全连接。

既然分类问题需要得到离散的预测输出,那么就把每个离散值Oi作为输入样本属于该类别的置信度,并将所有离散值中值最大的输出所对应的类作为预测输出,即

例如,O1,O2,O3分别为0.1,10,0.1,对应的类别分别为鸡,猫和狗,由于O2值最大,那么预测类别为2,其代表猫。

然而,直接使用输出层的输出有两个问题。

第一:由于输出层的输出值的范围不确定,我们难以直观上判断这些值的意义。输出值的范围跨度可能会很大,有的输出可能为0.1,有的甚至为上百上千,这就很难通过比较不同的输出值进行分析,例如刚才举的例子中的输出值10表示“很置信”图像类别为猫,因为该输出值是其他两类的输出值的100倍。但如果o1=o3=10的3次方,那么输出值10却又表示图像类别为猫的概率很低。。

第二:由于真实标签是离散值,这些离散值与不确定范围的输出值之间的误差难以衡量。

softmax运算符(softmax operator)解决了以上两个问题。它相当于对所有输出做了归一化处理,通过下式将输出值变换成值为正且和为1的概率分布:


其中:

我们注意到

因此softmax运算不改变预测类别输出。


单样本分类的矢量计算表达式

为了提高计算效率,我们可以将单样本分类通过矢量计算来表达。在上面的图像分类问题中,假设softmax回归的权重和偏差参数分别为


设高和宽分别为2个像素的图像样本 i 的特征为


输出层的输出为


预测为狗、猫或鸡的概率分布为


softmax回归对样本ii分类的矢量计算表达式为


总结

  • softmax回归适用于分类问题。它使用softmax运算输出类别的概率分布。
  • softmax回归是一个单层神经网络,输出个数等于分类问题中的类别个数。
  • 交叉熵适合衡量两个概率分布的差异。

参考文献:《动手学深度学习》(pytorch版) 李沐 著;

分类模型——Softmax回归相关推荐

  1. 适合离散值分类的多分类模型——softmax回归

    适合离散值分类的多分类模型--softmax回归 一.什么是softmax回归? 简单来说softmax回归是用来做多分类任务的模型,是一个单层神经网络.与线性回归模型针对连续值的预测(预测房屋价格. ...

  2. pytoch人工神经网络基础:最简单的分类(softmax回归+交叉熵分类)

    softmax回归分类原理 对于回归问题,可以用模型预测值与真实值比较,用均方误差这样的损失函数表示误差,迭代使误差最小训练模型. 那么分类问题是否可以用线性回归模型预测呢.最简单的方法就是用soft ...

  3. 逻辑回归和线性回归的区别_[PRML]线性分类模型贝叶斯逻辑回归

    线性分类相关文章:1.Fisher线性判别分析(LDA)[1]2.广义模型与线性模型& 判别分析 [2]3.逻辑回归[3]4.线性分类模型简介5.感知机原理及代码复现6.概率生成模型7.概率判 ...

  4. 经典机器学习方法(2)—— Softmax 回归

    参考:动手学深度学习 注:本文是 jupyter notebook 文档转换而来,部分代码可能无法直接复制运行! 前文介绍的 经典机器学习方法(1)-- 线性回归 适用于连续值预测问题(回归问题),本 ...

  5. 多分类任务ovo、ovr及softmax回归

    多分类任务OVO.OVR及softmax回归 – 潘登同学的Machine Learning笔记 文章目录 多分类任务OVO.OVR及softmax回归 -- 潘登同学的Machine Learnin ...

  6. 分类模型(将回归模型的输出离散化)

    对于二分类模型,我们将介绍逻辑回归(logistic regression)和Fisher线性判别分析两种分类算法:对于多分类模型,我们将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步 ...

  7. 机器学习算法之 logistic、Softmax 回归

    逻辑回归本质是分类问题,而且是二分类问题,不属于回归,但是为什么又叫回归呢.我们可以这样理解,逻辑回归就是用回归的办法来做分类.它是在线性回归的基础上,通过Sigmoid函数进行了非线性转换,从而具有 ...

  8. pytorch学习笔记(六):softmax回归

    文章目录 前言 1. 分类问题 2. softmax回归模型 3. 单样本分类的矢量计算表达式 4. 小批量样本分类的矢量计算表达式 5. 交叉熵损失函数 6. 模型预测及评价 小结 前言 模型输出可 ...

  9. python 使用Softmax回归处理IrIs数据集

    本文章包含以下内容: 数据: lris数据集; 模型: Softmax回归模型; 损失函数:交叉嫡损失; 优化器:梯度下降法; 评价指标:准确率. 1.实验数据集 Iris(1).csv无法上传,这里 ...

最新文章

  1. wince 串口调试信息输出
  2. 基于FFmpeg和Android的音视频同步播放实现
  3. Java面试中常问的计算机网络方面问题
  4. linux通过c语言编程访问远程mysql
  5. 互联网广告系统综述一生态圈
  6. android usb多个,android、windows上多个USB Camera同时使用实验小结
  7. Java LocalDate类| minusYears()方法与示例
  8. 企业应当如何编制信息安全策略
  9. 【机器学习】分类性能度量指标 : ROC曲线、AUC值、正确率、召回率、敏感度、特异度
  10. java毕设答辩准备
  11. 反向代理为何叫反向代理?(含案例)
  12. nginx代理、白名单过滤、双域名备案代理
  13. python剪贴板操作_python操作剪贴板
  14. 三重积分的轮换对称性及极坐标形式确定上下限
  15. STM32CUBEMX 配置12脚3641BS以及串口显示RTC时间
  16. domoticz添加和风天气与彩云天气
  17. 音视频 | 音视频学习-01
  18. Vant Weapp组件picker选择器初始默认选中
  19. foxmail邮件加载失败重试_foxmail 提示错误
  20. 谈谈技术人的英语学习

热门文章

  1. 刻录光盘(cdrom)
  2. 最近几年,国内好多家实体企业都开始用上低代码了,它有什么好?
  3. CCM调试的理论依据
  4. python分析《爱情公寓》电影评分为何2.7, 电影界的“拼多多”!(转)
  5. HTML常用标签之表格标签(合并单元格)
  6. 02-部署wtm vue项目
  7. 手把手教你用pycharts绘制各种图(常做报表可视化的同学请进)
  8. vim:配置vundle插件
  9. ios 只用3x图可以吗_iOS 图片 @2x与@3x区别
  10. html段落取消首行缩进,HTML段落首行缩进