因果卷积(causal)与扩展卷积(dilated)之An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling

author:gswycf

  最近在看关于NLP(自然语言处理)方面的文章,(其实不是自己要看),anyway,看了一个“An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling“,讲到了:虽然人们现在都在用RNN和LSTm去处理序列问题(sequence modeling),但是明显最近几年这些模型在这些问题上出现了瓶颈,你们之前都说CNN不适合处理sequence modeling问题,但其实并不是的,作者提出了一个普适的CNNN模型,在多个序列问题上和之前的RNN和LSTM比较,结果发现,CNN在这方面的能力确实是被低估了,CNN建立的model要比之前人们之前用的RNN要好很多,而且简洁。

  这篇blog并不是要讲那篇文章,我可能会单独写一篇(看有没有时间),这篇blog主要是结束那篇文章中提出的两个概念:因果卷积(causal)与扩展卷积(dilated)

  

  因果卷积:

  因为要处理序列问题(即要考虑时间问题,)就不能使用普通的CNN卷积,必须使用新的CNN模型,这个就是因果卷积的作用,看下面一个公式,对与序列问题(sequence modeling),主要抽象为,根据x1......xt和y1.....yt-1去预测yt,使得yt接近于实际值

  

  我们根据图片来看下因果卷积的样子,下面这个图片来自:https://deepmind.com/blog/wavenet-generative-model-raw-audio/

  上面的图片可以详细的解释因果卷积,但是问题就来,如果我要考虑很久之前的变量x,那么卷积层数就必须增加(自行体会)。。。卷积层数的增加就带来:梯度消失,训练复杂,拟合效果不好的问题,为了决绝这个问题,出现了扩展卷积(dilated)

  因果卷积:

  对于因果卷积,存在的一个问题是需要很多层或者很大的filter来增加卷积的感受野。本文中,我们通过大小排列来的扩大卷积来增加感受野。扩大卷积(dilated convolution)是通过跳过部分输入来使filter可以应用于大于filter本身长度的区域。等同于通过增加零来从原始filter中生成更大的filter。

这就可以解决因果卷积带来的问题,在示意图中,卷积感受野扩大了1,2,4,8倍。扩大卷积(dilated convolution)可以使模型在层数不大的情况下有非常大的感受野。

转载于:https://www.cnblogs.com/fantastic123/p/9389128.html

因果卷积(causal)与扩展卷积(dilated)相关推荐

  1. 因果卷积(causal Convolutions)和扩展卷积(Dilated Convolutions)

    背景 对于序列问题(Sequence Modeling)的处理方法,通常采用RNN或者LSTM,例如处理一段视频/音频,往往会沿着时间方向(时序)进行操作.通常CNN网络都被认为适合处理图像数据而不适 ...

  2. 从一维卷积、因果卷积(Causal CNN)、扩展卷积(Dilation CNN) 到 时间卷积网络 (TCN)

    来源: AINLPer微信公众号(每日干货分享!!) 编辑: ShuYini 校稿: ShuYini 时间: 2022-09-30 引言 卷积神经网络 (CNN) 尽管通常与图像分类任务相关,但经过改 ...

  3. 场景分割:MIT Scene Parsing 与DilatedNet 扩展卷积网络

    MIT Scene Parsing Benchmark简介 Scene parsing is to segment and parse an image into different image re ...

  4. 因果卷积,膨胀卷积,混合膨胀卷积

    因果卷积: 常常用于CNN网络来处理序列问题,针对序列问题x1,...xt,和y1,...,yt-1来预测yt. 时间t的状态预测依赖于前t-1个状态,具有因果关系. 如果考虑很久之前的变量x,就会导 ...

  5. DL之CNN:卷积神经网络算法简介之卷积矩阵、转置卷积(反卷积Transpose)、膨胀卷积(扩张卷积Dilated/带孔卷积atrous)之详细攻略

    DL之CNN:卷积神经网络算法简介之卷积矩阵.转置卷积(反卷积Transpose).膨胀卷积(扩张卷积Dilated/带孔卷积atrous)之详细攻略 目录 卷积矩阵的简介 卷积.转置卷积--Tran ...

  6. 一文读懂 12种卷积方法(含1x1卷积、转置卷积和深度可分离卷积等)

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 我们都知道卷积的重要性,但你知道深度学习领域的卷积究竟是什么,又有 ...

  7. 图卷积神经网络4-空域卷积:空域卷积局限性分析和过平滑解决方案

    知乎主页https://www.zhihu.com/people/shuang-shou-cha-dai-53https://www.zhihu.com/people/shuang-shou-cha- ...

  8. 卷积神经网络四种卷积类型

    卷积神经网络四种卷积类型 https://www.toutiao.com/a6631333810287936013/ 一般卷积 首先,我们需要就定义卷积层的一些参数达成一致. 卷积核大小(Kernel ...

  9. 【深度学习】讲一个深度分离卷积结构和空洞卷积的应用

    [深度学习]讲一个深度分离卷积结构和空洞卷积的应用 文章目录 前言:看一张图像 1 概述1.1 正常卷积1.2 Depth可分离卷积 2 深度可分离卷积的优点 3 空洞(扩张)卷积(Dilated/A ...

最新文章

  1. python编程入门书籍推荐-Python编程启蒙书籍推荐
  2. 【MOSS】SPListItems操作
  3. 【转】java项目应该知道的核心重点部分
  4. html5 js贪吃蛇,html5+js 贪吃蛇
  5. php js urlencode,JavaScript版本的UrlEncode和UrlDecode函数实现
  6. 基于数据库的事务消息解决分布式事务方案
  7. 从输入 URL 到页面加载完的过程中都发生了什么事情?
  8. CentOS7配置rsync实现文件同步
  9. 史上最简单的Mybatis教程(5天就够了)
  10. Docker搭建rtmp视频直播
  11. Android短信息验证码自动填写详细介绍
  12. 2019年CSDN博客排名前10名
  13. 2021年全球起酥油收入大约4171.6百万美元,预计2028年达到5052.7百万美元,2022至2028期间,年复合增长率CAGR为 2.8%
  14. LINUX(socket)网络编程部分头文件归纳解释
  15. B. Petya and Exam
  16. 贪心算法和动态规划的区别
  17. vue 水印插件 插件:directives.js
  18. 谈性能测试-FPS流畅度
  19. Android studio 安装配置SDK
  20. Inception模块

热门文章

  1. 打开或关闭 Windows 功能
  2. ChatGPT在线网页版和接口
  3. 三年磨一剑:蚂蚁金服的研发效能洞察实践
  4. 【unity】FPS用鼠标控制游戏对象转动
  5. air.tv.douyu.android,斗鱼(air.tv.douyu.android) - 7.0.6.1 - 应用 - 酷安
  6. 2021免费领取微软onedrive云盘1T空间
  7. 群智能(SI)与蚁群优化(ACO)概述
  8. 一个很好的看电子书的软件
  9. 微电网日前优化调度入门:求解一道数学建模题
  10. 用CSS制作大背景网站,以及80个大背景图片网站。