转自https://blog.csdn.net/xxy0118/article/details/84333635

  1. Xavier初始化:
  • 条件:正向传播时,激活值的方差保持不变;反向传播时,关于状态值的梯度的方差保持不变。
  • 初始化方法:
    W∼U[−6√ni+ni+1√,6√ni+ni+1√]

W∼U[−ni​+ni+1​​6​​,ni​+ni+1​​6

  • ​​]
  • 假设激活函数关于0对称,且主要针对于全连接神经网络。适用于tanh和softsign
  • 论文地址:Understanding the difficulty of training deep feedforward neural networks
  • 参考资料:
    深度学习之参数初始化(一)——Xavier初始化
  1. He初始化
  • 条件:正向传播时,状态值的方差保持不变;反向传播时,关于激活值的梯度的方差保持不变。
  • 适用于ReLU的初始化方法:
    W∼N[0,2niˆ−−√]

W∼N[0,ni​^​2​

  • ​]
  • 适用于Leaky ReLU的初始化方法:
    W∼N[0,2(1+α2)niˆ−−−−−−−√]
  • W∼N[0,(1+α2)ni​^​2​​]
    niˆ=hi∗wi∗dini​^​=hi​∗wi​∗di​
    其中,hihi​、wiwi​分别表示卷积层中卷积核的高和宽,而didi​当前层卷积核的个数。

    • 疑问:在论文里,当前层卷积核个数di

    di​与当前层输出通道个数outiouti​(下一层输入通道个数ini+1ini+1​)是一致的,即di=outi−1=ini+1di​=outi−1​=ini+1​。但是在tensorflow的实现中,di=ini∗outi

    • di​=ini​∗outi​。在用tensorflow实现He初始化时,应该以哪个为准?(个人倾向前者)
  • 论文地址:Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification
  • 参考资料:
    深度学习之参数初始化(二)——Kaiming初始化
    He初始化论文阅读笔记与实现

Xavier初始化和He初始化相关推荐

  1. 标准K-means算法的缺陷、K-mean++初始化算法、初始化算法步骤、Kmeans++算法实现

    标准K-means算法的缺陷.K-mean++初始化算法.初始化算法步骤.Kmeans++算法实现 目录 标准K-means算法的缺陷.K-mean&

  2. Spark源码剖析 - SparkContext的初始化(八)_初始化管理器BlockManager

    8.初始化管理器BlockManager 无论是Spark的初始化阶段还是任务提交.执行阶段,始终离不开存储体系.Spark为了避免Hadoop读写磁盘的I/O操作成为性能瓶颈,优先将配置信息.计算结 ...

  3. Java静态初始化,实例初始化以及构造方法

    静态初始化:是指执行静态初始化块里面的内容. 实例初始化:是指执行实例初始化块里面的内容. 构造方法:一个名称跟类的名称一样的方法,特殊在于不带返回值. 1.一个对象第一次被创建时,先要加载该对象所属 ...

  4. 初始化全局变量实例说明C语言中初始化和未初始化的全局变量所在不同的段

    本文是一篇关于初始化全局变量的帖子 实例说明C语言中初始化和未初始化的全局变量地点不同的段 一个程序: Makefile: objs := bss.oall: bss bss: $(objs)gcc ...

  5. 28.构造函数中,成员变量一定要通过初始化列表来初始化的?

    首先要明确:如果对象成员是const或者引用的话,必须将其初始化! 构造函数中,成员变量一定要通过初始化列表来初始化的的几种情况! 1)对象成员是const或者引用 #include <iost ...

  6. 复制初始化和直接初始化

    string str("12345"); string str = "12345"; 在写代码时忽然想到这个两个有啥区别呢,其实这个还是c++基础薄弱的原因 于 ...

  7. 【Java4】实例初始化,类初始化,/接口,多态,final/static,权限修饰符/native

    文章目录 1.实例初始化过程:有几个构造器,就会有几个实例初始化方法 2.实例初始化和类初始化结合:先类(静态)后实 3.接口:只有abstract可省 3.1 鸟类案例:Flyable相当于父类的一 ...

  8. C++直接初始化与复制初始化的区别深入解析

    首先:这是原文地址,这个哥们的文章解决了我的问题.谢谢这个哥们了.下面把原文地址放在这里: https://www.jb51.net/article/54773.htm C++中直接初始化与复制初始化 ...

  9. C++中的值初始化和默认初始化

    1.值初始化 顾名思义,就是用数值初始化变量.如果没有给定一个初始值,就会根据变量或类对象的类型提供一个初始值.对于int类型其值初始化后的值为0. 2.默认初始化:如果定义变量时没有指定初值,则变量 ...

  10. 列表初始化和赋值初始化的使用注意事项

    成员变量初始化方式有两种:列表初始化和赋值初始化.如下代码.但是这两种初始化表面上看着相同,但是用法和原理却并不相同.本篇博客主要讨论这两种初始化的使用方法和基本原理. class Test {pub ...

最新文章

  1. vs2010打不开vs2017的.sln文件,出现错误提示 “选择的文件是解决方案文件 但是用此应用程序的较新版本创建的,无法打开”
  2. Acey.ExcelX组件如何保证稳定性?
  3. pytorch笔记:VGG 16
  4. 关于架构的优化和设计,架构师必须悟透的事情
  5. 面试必考-从URL输入到页面展现到底发生了什么
  6. 单层感知器应用实例--坐标点的二分类模式分类
  7. 专栏 | 基于 Jupyter 的特征工程手册:特征选择(三)
  8. STL源码剖析 算法开篇
  9. DEDECMS 关键字不能小于2个字节!
  10. HTML元素-META全集
  11. ios打包ipa的四种实用方法(.app转.ipa)
  12. opencv-api fitEllipse
  13. 一个特殊的事件绑定程序(通用于各种浏览器)
  14. UGUI之Toggle使用
  15. 网络存储NAS网络存储器术语解释
  16. 如何使用计算机做海报,用word做的海报步骤_word怎么设计海报
  17. 扫码登录的原理和实现
  18. 【Android】技术调研:用代码模拟屏幕点击、触摸事件
  19. Web 图片引用之相对路径与绝对路径
  20. M1 系统打包ipa

热门文章

  1. 魔兽世界怀旧服最新服务器开发时间,怀旧服开70最新消息汇总 魔兽怀旧服TBC开放时间几个阶段?...
  2. ubuntu python3.5安装_ubuntu16.04升级Python3.5到Python3.7的方法步骤
  3. 关于sql和MySQL的语句执行顺序
  4. easyui 传递参数报错(错误:uncaught SyntaxError: Unexpected identifier)
  5. 第五章:条件、循环以及其他语句(上)
  6. go语言练习:幂、函授接收和返回参数、转义字符、变量和常量
  7. Python网络数据采集2-wikipedia
  8. 【原创】如何使用Jmockit进行单元测试
  9. 郁闷心情——电话聊天排解法
  10. MySQL 数据备份与同步