1 学习率的大小

2 Adagrad

2.1 Adagrad结论

2.2 Adagrad推导

g不变

η随着t的增加而减少

σ是之前梯度的均方根

3 Adagrad的优缺点

3.1 优点

可以动态调整学习率,因而相比于SGD来说,可以更少地进行手动对学习率的调参

3.2 缺点

  • 如果我们把 视为学习率的话,那么学习率会很快降到一个很小的值,之后会很慢收敛了。
  • η的值需要认为指定,如果设置的太大的话,就会发生震荡;太小的话全局学习率又会较低

机器学习笔记:Adagrad相关推荐

  1. 李弘毅机器学习笔记:第十二章—Recipe of Deep Learning

    李弘毅机器学习笔记:第十二章-Recipe of Deep Learning 神经网络的表现 如何改进神经网络? 新的激活函数 梯度消失 怎么样去解决梯度消失? Adaptive Learning R ...

  2. 李弘毅机器学习笔记:第十章:Keras2.0

    李弘毅机器学习笔记:第十章:Keras2.0 创建网络 配置 选择最好的方程 使用模型 创建网络 假设我们要做的事情是手写数字辨识,那我们要建一个Network scratch,input是28∗28 ...

  3. 李弘毅机器学习笔记:第十一章—Keras Demo

    李弘毅机器学习笔记:第十一章-Keras Demo 创建网络 配置 选择最好的方程 使用模型 创建网络 假设我们要做的事情是手写数字辨识,那我们要建一个Network scratch,input是28 ...

  4. 一份520页的机器学习笔记!附下载链接

    点击上方"视学算法",选择"星标"公众号 第一时间获取价值内容 近日,来自SAP(全球第一大商业软件公司)的梁劲(Jim Liang)公开了自己所写的一份 52 ...

  5. 700 页的机器学习笔记火了!完整版开放下载

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 作者       梁劲(Jim Liang),来自SAP(全球第一大商业软件公司). 书籍特点       条理清晰 ...

  6. 机器学习笔记十四:随机森林

    在上一篇机器学习笔记十三:Ensemble思想(上)中,简要的提了一下集成学习的原理和两种主要的集成学习形式.  而在这部分要讲的随机森林,就算是其中属于bagging思路的一种学习方法.为了篇幅,b ...

  7. 机器学习笔记七:损失函数与风险函数

    一.损失函数 回顾之前讲过的线性回归模型,我们为了要学习参数使得得到的直线更好的拟合数据,我们使用了一个函数 这个函数就是比较模型得到的结果和"真实值"之间的"差距&qu ...

  8. 吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection)

    吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection) 对于异常检测算法,使用特征是至关重要的,下面谈谈 ...

  9. Python机器学习笔记:sklearn库的学习

    自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了,scikit-learn简称sklearn,支持包括分类,回归,降维和聚类四大机器学习算法.还包括了特征提取,数据 ...

  10. 神经网络与机器学习 笔记—LMS(最小均方算法)和学习率退火

    神经网络与机器学习 笔记-LMS(最小均方算法)和学习率退火 LMS算法和Rosenblatt感知器算法非常想,唯独就是去掉了神经元的压制函数,Rosenblatt用的Sgn压制函数,LMS不需要压制 ...

最新文章

  1. android 图片缓存
  2. sklearn中的RandomForestClassifier参数详解
  3. android fersco 框架,Android Fresco框架的简单使用
  4. Centos7.2部署各类服务
  5. Swift与Objective-C交互
  6. 电脑的发展史_互联网发展史 硅谷传奇之 IBM
  7. UVA - 1339 ​​​​​​​Ancient Cipher
  8. 深度学习笔记(44) Triplet 损失
  9. linux 1060显卡,Steam最受欢迎显卡型号出炉:GTX 1060显卡的占有率依然排名第一
  10. Vue.js安装方法
  11. 深入TextCNN(一)详述CNN及TextCNN原理
  12. vue个人学习(三)----组件
  13. Unit Testing with JUnit - Tutorial
  14. 自动生成proto Js语句
  15. 【图像几何】基于matlab GUI图像几何运算系统【含Matlab源码 206期】
  16. malloc函数详解
  17. 麒麟服务器数据库协议,麒麟服务器神通数据库安装
  18. 塔菲克蓝牙适配器驱动_TAFIQ蓝牙适配器驱动下载
  19. cmyk rgb 数值转换_计算机视觉学习笔记2 图像类型转换
  20. 原型工具Axure:Axure的实用小技巧

热门文章

  1. uva 10034 Freckles (kruskal||prim)
  2. [BZOJ4403]序列统计
  3. ThinkPHP的易忽视点小结
  4. 关于Core Data的一些整理(一)
  5. Mylyn 2.0,第 2 部分: 自动上下文管理
  6. asp.net ajax 弹不出alert对话框的解决办法
  7. [总结]Asp.net中的页面乱码的问题
  8. 算法提高课-搜索-Flood fill算法-AcWing 1098. 城堡问题:flood fill、bfs
  9. PAT甲级1042 Shuffling Machine:[C++题解]模拟、哈希表、洗牌机
  10. PAT甲级1154 Vertex Coloring :[C++题解]图论、模拟、结构体存边