一。Softmax回归

1.Softmax回归,名字是回归,其实是一个分类问题。

2.回归和分类的区别是什么?

①回归估计的是一个连续值:比如预测二手房卖出的价格

Ⅰ回归是在自然区间R单连续值的输出

Ⅱ跟真实值的区别作为损失

②分类是预测一个离散类别。比如:图片是猫还是狗

Ⅰ分类有多个输出o1,o2,o3。等于类别的个数

Ⅱ 输入的i是预测第i类的置信度

3.介绍两个数据集

①MNIST:手写数字识别(10类)

②ImageNet:自然物体分类(1000类)

4.从回归到多类分类——均分损失【无校验比例】

①对类别进行一位有效编码:独热编码。

独热编码是一个向量,它的分量和类别一样多。 类别对应的分量设置为1,其他所有分量设置为0。 “猫”(1,0,0)、对应于“鸡”(0,1,0)、对应于“狗”(0,0,1)。

②使用均分损失训练

③找出o1,o2,o3数值最大的一个为预测值

④需要更置信的识别正确类(大余量):真正的类和其他的类拉开距离。

5.从回归到多类分类—校验比例

把softmax(o)展开,第i类的概率。

分子:e为底oi的指数,非负数

分母:e为底oi的指数 从第一个加到最后一个的和。

这样第的值从第1类相加最后一类,分子等于分母和为1.

②概率y和区别作为损失

6.交叉熵:作为概率的损失函数

①交叉熵衡量两个概率的区别

②损失函数:

损失函数的个人理解:输入一张照片y=(猫,狗,兔),真实值y=(0,1,0)

预测值=(0.05,0.8,0.15).

然后展开求和。最后只剩下-log(0.8),这就是损失值。所以,只跟正确哪一类的对应输出有关。(只关心正确类。)

③损失函数的梯度:

总结:用softmax将结果概率化,用交叉熵做损失函数。

二。损失函数:衡量真实值和预测值的区别

1.L2Loss均方损失函数

2.L1Loss  绝对值损失函数:

L1=

①优点:即使当预测值跟真实值相差大,但是梯度一直是常数,权重更新的时候不会相差太大,比较稳定。

②缺点:但0点数不可导,不平滑。真实值跟预测值想接近的是时候,变得不稳定

3.Robust Loss(结合上两个的优点)

好处:真实值和预测值远的时候,梯度是常数,权重更新变得均匀。

真实值和预测值接近的时候,梯度慢慢变小,没有大幅度更新。

深度学习——Softmax回归+损失函数(笔记)相关推荐

  1. 深度学习-softmax回归

    softmax regression 1- softmax 基本概念 1-1 极大似然估计 2- Fashion-MNIST图像分类数据集 2-1 下载数据集 2-2 可视化 3- softmax回归 ...

  2. 跟李沐学深度学习-softmax回归

    softmax回归 分类和回归的区别 无校验比例 校验比例 交叉熵 常见损失函数 均方误差 L2 loss 绝对值损失L1 loss 鲁棒损失 图像分类数据集 分类和回归的区别 回归:估计一个连续值 ...

  3. 动手学深度学习——softmax回归之OneHot、softmax与交叉熵

    目录 一.从回归到多类分类 1. 回归估计一个连续值 2. 分类预测一个离散类别 二.独热编码OneHot 三.校验比例--激活函数softmax 四.损失函数--交叉熵 五.总结 回归可以用于预测多 ...

  4. 【动手学深度学习】Softmax 回归 + 损失函数 + 图片分类数据集

    学习资料: 09 Softmax 回归 + 损失函数 + 图片分类数据集[动手学深度学习v2]_哔哩哔哩_bilibili torchvision.transforms.ToTensor详解 | 使用 ...

  5. 【CS224n】2斯坦福大学深度学习自然语言处理课程笔记——词向量、词义和神经分类器

    Natural Language Processing with Deep Learning 课程笔记2 1. 词向量和word2vec 2. 优化基础知识 3. 我们能否通过计数更有效地抓住词义的本 ...

  6. Yann Lecun纽约大学《深度学习》2020课程笔记中文版,干货满满!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! [导读]Yann Lecun在纽约大学开设的2020春季<深度学习>课 ...

  7. 《Python深度学习》第一章笔记

    <Python深度学习>第一章笔记 1.1人工智能.机器学习.深度学习 人工智能 机器学习 深度学习 深度学习的工作原理 1.2深度学习之前:机器学习简史 概率建模 早期神经网络 核方法 ...

  8. 《神经网络与深度学习》nndl读书笔记

    目录 本书的知识体系 深度学习与神经网络概要 人工智能 机器学习 机器学习模型步骤 表示学习 局部表示与分布式表示 深度学习 常用的深度学习框架 端到端学习 神经网络 人工神经网络 神经网络的发展历史 ...

  9. 损失能收敛到0么 深度学习_人工智能-Tensorflow进行深度学习的一些损失函数的可视化...

    TensorFlow目前是数值计算的最佳开源库,它使机器学习更快更容易.在这篇文章中,您将学习机器学习中使用的一些损失函数.损失函数在机器学习领域非常重要.它们用作测量模型预测输出Y_out与grou ...

最新文章

  1. 从零开始一起学习SLAM | 为啥需要李群与李代数?
  2. 从软件思想抽象出几条做事原则
  3. 研究生调剂!!急!!!跪求解答!!?
  4. @capire/common is not needed at runtime at all
  5. QT中的模态对话框及非模态对话框
  6. MAUI 跨平台播客应用程序(Conf 2021)
  7. 1万字30张图说清TCP协议
  8. 搜索——滑雪(poj1088)
  9. java过去localhost出错,http://localhost:8080/ 访问出404,不知道哪错了
  10. Atitit Server Side Include  ssi服务端包含规范 csi  esi
  11. My First HelloWorld Module for Apache~
  12. c#使用word、excel、pdf ——转
  13. plc控制电机实验报告_PLC控制步进电机实验报告
  14. 微信小程序显示圆形图片
  15. 一转眼,波士顿动力 Atlas 机器人又会过独木桥了!
  16. 好用的json在线工具
  17. [转贴]比《同居密友》更搞笑的【阿奴与唐玉】陶海风格
  18. 杭州大江东科目三路线经验分享
  19. 40亿美金史上最大 ICO,EOS 疑云
  20. 写博客没高质量配图?python爬虫教你绕过限制一键搜索下载图虫创意图片!

热门文章

  1. Qt:数据库插入数据
  2. VM虚拟机里的系统鼠标不能动的问题
  3. 171218 逆向-TPCTF(re200)
  4. SpringCloud微服务实战——搭建企业级开发框架(四十一):扩展JustAuth+SpringSecurity+Vue实现多租户系统微信扫码、钉钉扫码等第三方登录
  5. 绕过微软正版认证的方法
  6. Java实训(181110~181111)
  7. 词嵌入及方法one-hot、词袋、TFIDF
  8. OReilly.iMovie.The.Missing.Manual.2014.5.epub 英文原版 免费下载
  9. php 魔术方法 sleep,PHP 魔术方法: __sleep __wakeup
  10. 高斯过程分类 matlab,matlab 高斯过程回归模型 matlab Gaussian process regression model