在读论文(FAST AND ACCURATE DEEP NETWORK LEARNING BY
EXPONENTIAL LINEAR UNITS (ELUS))时说到,ReLU激活函数的一些缺点,包括使得数据分布发生偏移。

而Nature Gradient则为一种解决办法,以下为Nature Gradient的介绍:
示例:
假设现在有一个5个参数的向量(data),我们要衡量梯度更新前后的距离:

total_distance = 0for i in range(5):for j in range(5):totoal_distance += data[i] * data[j] * metric[i][j]

我们在此引入一个5x5的矩阵(matric),如果matric为单位矩阵。
如果matic是Fisher Information Matix, 则距离为KL散度。

Nature Gradient 自然梯度相关推荐

  1. kl散度的理解_以曲率的视角理解自然梯度优化

    一个故事 我要讲一个故事:一个你几乎肯定听过的故事,但它的侧重点与你习以为常关注的不同. 所有现代深度学习模型都使用梯度下降进行训练. 在梯度下降的每个步骤中,您的参数值从某个起始点开始,然后将它们移 ...

  2. PyTorch 笔记(13)— autograd(0.4 之前和之后版本差异)、Tensor(张量)、Gradient(梯度)

    1. 背景简述 torch.autograd 是 PyTorch 中方便用户使用,专门开发的一套自动求导引擎,它能够根据输入和前向传播过程自动构建计算图,并执行反向传播. 计算图是现代深度学习框架 P ...

  3. NIPS 2017 | 线上分享第一期:似自然梯度的优化算法KFAC与强化学习算法ACKTR

    上周我们发布了<攻略 | 虽然票早已被抢光,你可以从机器之心关注 NIPS 2017>,在 NIPS 2017 正式开始前,我们将选出数篇优质论文,邀请论文作者来做线上分享,聊聊理论.技术 ...

  4. 一般梯度、随机梯度、相对梯度和自然梯度

    一般梯度 也称常规梯度,就是 f ( w ⃗ ) f(\vec w) f(w ) 对 w ⃗ \vec w w 的偏导,即 ∂ f ( w ⃗ ) ∂ w ⃗ \frac{\partial f(\ve ...

  5. 强化学习笔记(六):Policy Gradient/策略梯度

    目录 考题 知识点1:critic.actor​ 定理1:策略梯度理论 定理2:函数近似理论 知识点3:蒙特卡洛策略梯度 知识点4:Actor-critic算法 知识点:Advantage Funct ...

  6. 【ML03】Gradient Descend 梯度下降

    Gradient Descend 梯度下降 (一)概念 (二)Notation (三)Gradient Descent in Linear Regression (四)python with Grad ...

  7. Gradient Descent梯度下降(透彻分析)

    ----------首先了解什么是梯度? 官方解释: 梯度的本意是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大(为 ...

  8. 【李宏毅机器学习】Gradient Descent_1 梯度下降(p5、p6、p7 )学习笔记

    李宏毅机器学习学习笔记汇总 课程链接 文章目录 Review Gradient Descent Tips Tip1: Tuning your learning rate 小心微调你的学习率 Tip 2 ...

  9. 深度学习100问之深入理解Vanishing/Exploding Gradient(梯度消失/爆炸)

    这几天正在看梯度消失/爆炸,在深度学习的理论中梯度消失/爆炸也是极其重要的,所以就抽出一段时间认真地研究了一下梯度消失/爆炸的原理,以下为参考网上的几篇文章总结得出的. 本文分为四个部分:第一部分主要 ...

最新文章

  1. wpf scrollviewer 两个事件相互影响_WPF绘制3D效果显示密集立体集装箱
  2. 记录自定义的代码片段位置
  3. 为什么正则化可以起到对模型容量进行控制_论文解读 | 基于正则化图神经网络的脑电情绪识别...
  4. JavaWeb学习之路——SSM框架之Mybatis(三)
  5. 迭代反投影法代码_程序员的数学笔记3--迭代法
  6. vs2008使用技巧
  7. python对文件进行读写操作
  8. 32获取外部中断状态_Linux中断一网打尽(1) — 中断及其初始化
  9. C/C++ 按行读取文件
  10. Python零基础学习笔记(二十)—— tuple元组
  11. 递归(二)-------经典递归实例(汉诺塔问题)
  12. 软件构造-线程安全性
  13. 云宏武汉大学国际软件学院桌面云
  14. php 左右分栏,如何设置分栏格式
  15. TK1+yolo安装指南
  16. 由验证控件引起的IE的超级爆笑BUG
  17. 爱马仕橙JOYEAS休闲沙发
  18. 利用imu估计roll、pitch的理解
  19. linux装好了启动不了系统,Linux系统不能启动怎么办
  20. Vue基础之指令与过滤器

热门文章

  1. Windows快捷键笔记
  2. java 多媒体_Java播放多媒体
  3. 分享65个NET源码,总有一款适合您
  4. 重申java代码规范问题
  5. mx-link无线打印服务器,TP-LINK USB Printer Controller(TP-LINK打印服务器)
  6. Atcoder abc257 E
  7. android+浪漫程序,让互联网充满浪漫————程序猿专属小情话来啦
  8. 危鸡之夜服务器维护,2018热门对战竞技游戏大盘点
  9. html许愿墙源码,jQuery实现可拖拽的许愿墙效果
  10. CUMT2021一道SSRF