1:BPTT: 其实就是BP算法正常的链式推导展开,只是因为它涉及到了之前时刻的ht输出,所以将时间信息给带进去了;而这也是为什么说RNN不能很好的保存长期记忆的原因,因为偏导的连乘,长期的记忆被不断的缩小,很容易出现梯度消失,也就是把长期记忆丢失了

 2:LSTM的细胞状态和隐藏状态

参考:(41 封私信 / 13 条消息) 如何理解 LSTM 中的 cell state 和 hidden state? - 知乎 (zhihu.com)

快速理解LSTM,从懵逼到装逼 - 知乎 (zhihu.com)

我的理解是认为,细胞状态是包含了全部的长短期信息的,而hidden state则是从细胞状态里面抽取的与当前输入最相关的信息(因为最相关不一定就是短期信息,所以hidden state也可以是长期信息);综上,细胞状态是包含整体的长短期信息,而隐藏状态则是包含的与当前输入最相关的信息

3;GRU

首先,ht-1 融合xt之后,分别生成重置门rt和更新门zt,rt决定ht-1中有多少信息需要遗忘,也可以说是从ht-1中选择与当前输入更相关的信息来与输入进行融合(所以此时融合的信息可以理解为和当前输入联系最紧密的信息,既有短期信息也有长期信息);zt则是更新门,他决定上一步融合的信息有多少会加入到ht中去。而因为之前融合的信息是与当前信息最相关的,所以我们还应该加上与当前信息不那么相关的信息,来保证ht信息的完整性(这就是1-zt,再乘上ht-1的原因)。

BPTT算法 / LSTM的细胞状态和隐藏状态 / GRU相关推荐

  1. 人工智能里的数学修炼 | 隐马尔可夫模型 : 维特比(Viterbi)算法解码隐藏状态序列

    人工智能里的数学修炼 | 概率图模型 : 隐马尔可夫模型 人工智能里的数学修炼 | 隐马尔可夫模型:前向后向算法 人工智能里的数学修炼 | 隐马尔可夫模型 : 维特比(Viterbi)算法解码隐藏状态 ...

  2. HMM(三)维特比算法推测隐藏状态序列

    仍沿用上一节中HMM模型盒子和球的例子,已知盒子与球的模型及取3次球以后球的颜色观测序列{红,白,红},需推测三次取球可能对应的盒子序列(隐藏状态序列),每一次分别是从哪一个盒子取的球. 第一个时刻: ...

  3. RNN BPTT算法详细推导

    BPTT算法推导 BPTT全称:back-propagation through time.这里以RNN为基础,进行BPTT的推导. BPTT的推导比BP算法更难,同时所涉及的数学知识更多,主要用到了 ...

  4. 【Pytorch神经网络理论篇】 17 循环神经网络结构:概述+BP算法+BPTT算法

    1 循环神经网络结构概述 循环神经网络(Recurrent Neural Network,RNN)是一个具有记忆功能的网络模型.它可以发现样本彼此之间的相互关系.它多用于处理带有序列特征的样本数据. ...

  5. 深度学习算法 | LSTM算法原理简介及Tutorial

    北京 | 深度学习与人工智能研修 12月23-24日 再设经典课程  重温深度学习 阅读全文 > 正文共4880个字 17张图,预计阅读时间:13分钟. 1.背景 LSTM(Long Short ...

  6. RNN BPTT算法推导

    目录 BPTT算法推导 注1:激活函数tanh(x)求导 注2 softmax求导 BPTT算法推导 对于一个普通的RNN来说,其前向传播过程为: 先介绍一下等下计算过程中会用到的偏导数:   关于t ...

  7. LSB图像信息隐藏算法matlab,实验二LSB信息隐藏实验.doc

    实验二LSB信息隐藏实验.doc 实验二LSB信息隐藏实验 综合评分: [实验目的]: 掌握MATLAB基木操作 实现LSB信息隐藏和提取 [实验内容]:(请将你实验完成的项11涂"■&qu ...

  8. Android官方开发文档Training系列课程中文版:管理系统UI之隐藏状态条

    原文地址:http://android.xsoftlab.net/training/system-ui/status.html 这节课将会介绍如何隐藏不同的版本的状态条.隐藏状态条可以使内容展示区域更 ...

  9. 算法题:一个圆环上有100个灯泡,灯泡有打开关闭两种状态,灯泡状态随机。设计算法,使灯泡都亮。

    算法题:一个圆环上有100个灯泡,灯泡有打开关闭两种状态,灯泡状态随机,按一个灯泡,相邻两个灯泡的状态也会改变. eg: ' 暗 - 亮 - 暗 ' 按中间灯泡 ,变化为 ' 亮 - 暗 - 亮 '. ...

最新文章

  1. R语言缺失值替换:缺失的值(NA)替换每个分组最近的非缺失值
  2. 中国700万程序员不够用怎么办?我们去问了北大谢涛,顶会ASE最有影响力论文奖首批华人得主...
  3. 重根迭代法解方程(两种方法)(Python实现)
  4. [导入]编写程序实现n阶(n为奇数)魔方(C)
  5. java用继承编写宠物乐园_MoreThanJavaDay 5:面向对象进阶继承详解
  6. InvokeWebServiceActivity
  7. codeforces 650B - Image Preview
  8. aud to php,HKD to PHP
  9. C语言课后习题(9)
  10. 图解PostgreSQL进程结构和内存结构
  11. selenium 表单提交结果_了解 Selenium 定位方式
  12. 中兴通讯:将在全球范围内发布近10款5G手机
  13. 最详细的Java入门完整教程,学Java先收藏了!
  14. Mirth Connect 第一章 快速安装
  15. shader函数整理
  16. linux下安装陈桥五笔
  17. 一瑞士法郎是多少人民币
  18. 辅警小丁同志 灵宝西站派出所第一警务区赵桥
  19. autodesk fbx sdk sample里面的工程无法调试解决方法
  20. Ravpower苹果20W充电器,充电快又稳,使用更安全

热门文章

  1. MS SQL入门基础:数据库缺省值
  2. 【Jackson】@JsonCreator 注解
  3. 遵义微红科技直销系统开发,马来西亚直销企业新商机!
  4. 淘宝层级改版,五力模型上线!
  5. go每日新闻(2021-03-22)——Go 泛型尝鲜
  6. jmp指令流程图怎么写_策划新人分享——如何写策划案
  7. 仿射变换与透视变换(也即射影变换)的直观理解
  8. IOT物联网安全概述
  9. B. Nick and Array 简单简洁
  10. 从魔术师到统计学家 2