优点:

a. 克服梯度消失的问题
b. 加快训练速度

缺点:

a. 0 点连续不可导(直上直下),梯度下降过程中不那么流畅。
b. ReLU 只有正值,没有负值,bp 时有 zigzag 现象, 容易陷入局部最优。
c. 当 x<0 时,结果为0,有信息损失。

对于缺点b解释如下:


       公式第一行是正向传播计算公式,其中x为经过激活函数后的上一个神经元,f 为当前神经元,如果使用ReLU激活函数的话,x的值是大于0的。第二行是 f 对 w 求偏导,结果为 x,是大于 0 的,第三行是损失函数L对权重w求偏导(即w的梯度,更新权重时要用,也是我们反向传播的最终目的),结果等于 L 对 f 求偏导乘以x。此时x的值一定是大于0的,因此可以得出 L 对于 w 的偏导的符号就等于 L 对于 f 的偏导的符号(符号即正或负)。权重导数的符号可以等价于权重更新的方向,所以最终可以得出所有的权重w都会朝着一个方向更新,方向取决于L对于f求偏导的符号,正或者负。

如右图所示,假设w_i只有w1和w2两个值。那么由以上推断可以得出,w1和w2每次更新的方向是一致的,因此权重最终的更新过程便如右图所示。那么更新时走的路程会更长,就更容易进入局部最小值点,假设此时局部最小值点不可导,那么权重将无法更新。

【激活函数】ReLU激活函数的思考相关推荐

  1. tensorflow中Relu激活函数

    tensorflow中Relu激活函数 引用API:tensorflow.nn.relu(x) 初学者建议选择Relu激活函数 Relu激活函数 Relu激活函数是一个分段函数,只需要考虑值是否大于0 ...

  2. 转:ReLU激活函数:简单之美

    纯粹学习收藏. 转载地址:https://blog.csdn.net/cherrylvlei/article/details/53149381 导语 在深度神经网络中,通常使用一种叫修正线性单元(Re ...

  3. 为什么要ReLU激活函数

    导语 在深度神经网络中,通常使用一种叫修正线性单元(Rectified linear unit,ReLU)作为神经元的激活函数.ReLU起源于神经科学的研究:2001年,Dayan.Abott从生物学 ...

  4. ReLU激活函数:简单之美

    导语 在深度神经网络中,通常使用一种叫**修正线性单元(Rectified linear unit,ReLU)**作为神经元的激活函数.ReLU起源于神经科学的研究:2001年,Dayan.Abott ...

  5. 使用opencv dnn 模块调用darknet模型时候出错,不支持relu激活函数

    问题: 使用opencv dnn 模块调用darknet模型时候出错,报错信息为 不支持relu激活函数 以下过程为笔者自己解决该问题的过程,供各位参考学些,因为中间又遇到新的坑,所以各位务必看完再决 ...

  6. 零基础学caffe源码 ReLU激活函数

    零基础学caffe源码 ReLU激活函数 原创 2016年08月03日 17:30:19 1.如何有效阅读caffe源码 1.caffe源码阅读路线最好是从src/cafffe/proto/caffe ...

  7. 【深度学习】ReLU激活函数的缺点

    关于ReLU的详细介绍可以参考: ReLU激活函数 - 知乎 训练的时候很"脆弱",很容易就"die"了,训练过程该函数不适应较大梯度输入,因为在参数更新以后, ...

  8. 卷积神经网络(卷积层,激活函数Relu,池化层,计算公式及API解释)

    1. 卷积神经网络 (卷积层,激活函数,池化层,全连接层) (1)  把神经网络的隐藏层分为卷积层和池化层(又叫下采样层) · 卷积层 :  通过在原始图像上平移来提取特征 ·  池化层 : 通过特征 ...

  9. input自适应_一种Dynamic ReLU:自适应参数化ReLU激活函数(调参记录13)

    自适应参数化ReLU,本身就是一种动态的ReLU(Dynamic ReLU,Dy-ReLU).该论文在2019年5月的时候,投稿到IEEE Transactions on Industrial Ele ...

最新文章

  1. vim 插件_你不得不知道的适用于程序员的VIM插件
  2. MFC中修改静态文本框中文字的字体、颜色
  3. Gartner:6个容器和Kubernetes策略的最佳实用技巧
  4. 以太坊智能合约 编译脚本
  5. python打印字符金字塔_Python教程第7篇:print打印字符串
  6. Android9编程一:安装开发环境
  7. Java基础-运行原理及变量(01)
  8. 飞机模拟flightgear
  9. C盘空间不足怎么办?试试这款软件
  10. 华为手机电源键不止锁屏关机那么简单!这些操作不能浪费,望周知
  11. Field [price] of type [text] is not supported for aggregation [avg]
  12. 3D建模:角色手办的制作流程,分分钟一个手办
  13. 带固态硬盘的电脑Ubuntu和Windows双系统安装
  14. MATLAB与C++的接口问题
  15. (附源码)ssm美通留学管理系统 毕业设计 130854
  16. 从车联网基础知识出发通往5G彼岸
  17. WSS、SSL 和 https 之间的关系
  18. 看“华为人”如何管理时间
  19. js 实现简易ATM机
  20. 电脑自带字体包的文件夹位置

热门文章

  1. 基于ARM IP的看门狗设计与功能验证
  2. java 集合操作工具包_java之操作集合的工具类--Collections
  3. 内核并发控制---顺序锁 (来自网易)
  4. 【转】面向对象之多态(向上转型与向下转型)
  5. Jenkins pipeline job 根据参数动态获取触发事件的分支
  6. CF914E Palindromes in a Tree
  7. 初识生成器与生成器表达式 Day12
  8. CSS3中display属性的Flex布局
  9. C# - 多线程(基础)
  10. 再谈AbstractQueuedSynchronizer3:基于AbstractQueuedSynchronizer的并发类实现