1 梯度下降介绍

我们首先随机一个点,然后沿着梯度方向的反方向寻找最低点

迭代多次,直到找到局部最优(也有可能是全局最优)【线性回归问题里面,局部最优就是全局最优了】

多个参数同理,分别进行梯度下降

2.1 梯度与Hessian矩阵

梯度为0的时候,不一定是local minimum。他还可能是local maxinum 和鞍点,那么,怎么判断是不是local minimum呢?

我们类比一元二次方程a的正负和上下开口的问题,考虑二阶导(hessian矩阵)

local min hessian矩阵半正定
local max hessian矩阵半负定
鞍点 hessian矩阵既不半正定也不半负定

2  梯度下降可能存在的问题

我们可能会找到鞍点,可能会找到局部最优,而且从不同位置出发,可能最终梯度下降的结果会有很大的区别

3 梯度下降小tips

3.1 合理调整学习率

pytorch笔记:调整学习率(torch.optim.lr_scheduler)_UQI-LIUWJ的博客-CSDN博客

3.2 特征缩放

当我们面对多维度特征问题的时候,我们需要保证这些特征都有相近的尺度,这样会帮助梯度下降更快地收敛。

以上图为例,图像非常扁平,梯度下降算法需要非常多次的迭代才能够收敛

为了更快地收敛,我们将所有特征的尺度放缩到-1~1之间:

4 梯度下降原理

4.1 泰勒级数

我们可以用这种方式来近似函数f(x)

用求和的方式来写,有:

4.1.1 用于函数近似的泰勒级数

换言之,泰勒级数越靠后的项,越小。

因此,出于近似考虑,我们可以只考虑最初的两项:

4.1.2 多变量的泰勒近似

 4.2 梯度下降的理论,

||v||是一样的,所以我们的目标就是找的最小值

可以看成是向量和向量v的内积。那么什么时候内积的结果最小呢?就是

v=的时候

机器学习笔记:梯度下降相关推荐

  1. 吴恩达机器学习笔记-梯度下降

    通过前面的文章我们现在已经有了假设函数$h_\theta(x)$并知道如何度量这个函数与数据的符合程度,即代价函数$J(\theta_0,\theta_1)$取得最小值.那么现在要做的,就是如何去预估 ...

  2. 《机器学习》 梯度下降

     <机器学习> 梯度下降 2012-09-21 17:46 2712人阅读 评论(0) 收藏 举报 matrixc 参照<机器学习>这本书的第4.4.3节. 一.解决目标及 ...

  3. 【机器学习】梯度下降的Python实现

    作者 | Vagif Aliyev 编译 | VK 来源 | Towards Data Science 梯度下降是数据科学的基础,无论是深度学习还是机器学习.对梯度下降原理的深入了解一定会对你今后的工 ...

  4. 唐宇迪​​机器学习实战——梯度下降求解逻辑回归(理论基础+源代码实现)

    问题的提出 符号问题,这里的lg就是指log2,你的理解是正确的!在计算机科学中有些符号的使用跟我们在数学中使用的有区别.比如有时候log用来表示自然对数(以e为底数).希望对你有帮助! 首先计算机科 ...

  5. 机器学习中梯度下降法和牛顿法的比较

    在机器学习的优化问题中,梯度下降法和牛顿法是常用的两种凸函数求极值的方法,他们都是为了求得目标函数的近似解.在逻辑斯蒂回归模型的参数求解中,一般用改良的梯度下降法,也可以用牛顿法.由于两种方法有些相似 ...

  6. 人工智障学习笔记——梯度下降(1)基础变种

    一.概念 梯度下降法(gradient descent)是一个最优化算法,常用于机器学习和人工智能当中用来递归性地逼近最小偏差模型.梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以 ...

  7. 机器学习中为什么需要梯度下降_机器学习 —— 多元梯度下降

    一.多维特征 前面所述的房价预测的线性模型,只用到了一维特征,即size,房屋尺寸,要用这个特征量来预测房屋价格: 当数据集的信息不止一种时,便有了多维特征,比如: 上图有四个X,即四个特征,来预测房 ...

  8. 【机器学习】梯度下降 (python代码)

    梯度下降 (python代码) 文章介绍 1.前提 2.代码实现 文章介绍 文章配图来自网络 个人学习笔记,推荐直接买课去学习 得懂python,本文代码可直接跑,环境基于[ PyCharm 2022 ...

  9. 几种优化算法的读书笔记——梯度下降、牛顿法、拟牛顿法、随机梯度下降、AdaGrad、RMSProp、Adam及选择优化算法的建议

    文章目录 1 梯度下降 1.1 特点 1.2 思想 1.3 数学基础 1.4 具体算法 2 牛顿法和拟牛顿法 2.1 特点 2.2 牛顿法 2.2.1 数学基础 2.2.2 思想 2.2.3 具体算法 ...

  10. Gradient Descen-univariate(吴恩达机器学习:梯度下降在线性模型的应用)

    梯度下降算法在Linear Regression中的应用 文章目录 梯度下降算法在Linear Regression中的应用 单变量(univariate) 题目:预测利润 处理Training se ...

最新文章

  1. python编写格斗游戏_C语言实现的开源 2D 格斗游戏: Punch Kick
  2. 基于MATLAB的turbo码代码,一种基于Simulink的Turbo码仿真实现
  3. esp32 cam工作电流_我如何在家工作:Cam的生产力之痛
  4. java对象不会被改变_Java 并发编程(二)对象的不变性和安全的公布对象
  5. maven 打包失败 提示找不到jar的问题
  6. ios 点生成线路 百度地图_网站地图全面解析
  7. mysql 多物理机_MySQL 5.6同一物理主机配置多实例
  8. 5g理论速度_华为5G随行WiFi Pro 有多强 我们试一下NSA网络下的5G速度
  9. VVC/JEM代码学习15:xCheckRDCostAffineMerge2Nx2N
  10. linux编辑乱码华为光猫,华为光猫修改双模、SN序号、MAC地址方法
  11. 计算机无法安装cad,AutoCAD 2022不能安装是为什么?安装AutoCAD Electrical 2022时显示“无法安装:此计算机不满足最低要求”...
  12. 梦三国服务器维护多久,《梦三国2》天命地图开启时间变更公告
  13. U3D性能优化之MeshBaker(带光照)
  14. 网络安全—Linux命令
  15. Cocos2D:塔防游戏制作之旅(十)
  16. I.MX6Q(TQIMX6Q/TQE9)学习笔记——新版BSP之kernel移植
  17. mysql查询数据库版本
  18. 关于新加坡IT薪酬和找工作网站
  19. 2022.05.18-使用Lightroom批量将图像从Raw转换为jpg
  20. yo generator 强制更新文件

热门文章

  1. 浅析x86架构中cache的组织结构
  2. inline函数包涵static变量,调用时是否会有多份拷贝
  3. WatiN——Web自动化测试(三)【弹出窗口处理】
  4. Cacti安装插件:email,msn,fetion报警(转载)
  5. 电话无人应答转总机的配置方法
  6. 802.11w协议介绍
  7. 在Windows下安装chromedriver
  8. 《算法竞赛进阶指南》打卡-基本算法-AcWing 95. 费解的开关:位运算、枚举、递推
  9. ios 悬浮窗_多达2000个频道,支持7天回看!这才是我要的看电视app(安卓/ios)...
  10. mysql雨凇_Unity3D研究院之Unity中连接本地或局域网MySQL数据库(五十九) | 雨松MOMO程序研究院...