目录

  • 引言
  • 二维CNN | Conv2D
  • 一维CNN | Conv1D
  • 三维CNN | Conv3D
  • 总结

引言

当我们说卷积神经网络(CNN)时,通常是指用于图像分类的二维CNN。但是,现实世界中还使用了其他两种类型的卷积神经网络,即1维CNN和3维CNN。在本指南中,我们将介绍1D和3D CNN及其在现实世界中的应用。我假设您已经大体上熟悉卷积网络的概念。
初学者可能会理解为1维CNN处理一维的数据,2维CNN处理二维的数据,这是错误的!!!

在卷积神经网络(CNN)中,一维和二维滤波器并不是真正的一维和二维。这是只是描述的惯例。

二维CNN | Conv2D

在Lenet-5架构中首次引入的标准卷积神经网络,其Conv2D通常用于图像数据。之所以称其为2维CNN,是因为内核在数据上沿2维滑动,如下图所示。


内核在图像上滑动

使用CNN的整体优势在于,它可以使用其内核从数据中提取空间特征,而其他网络则无法做到。例如,CNN可以检测图像中的边缘,颜色分布等,这使得这些网络在图像分类和包含空间属性的其他类似数据中非常强大。

# 以下是在keras中添加Conv2D图层的代码。import kerasfrom keras.layers import Conv2Dmodel = keras.models.Sequential()model.add(Conv2D(1, kernel_size=(3,3), input_shape = (128, 128, 3)))model.summary()

参数input_shape(128、128、3)表示图像的(高度,宽度,深度)。参数kernel_size(3,3)表示内核的(高度,宽度),并且内核深度将与图像的深度相同。

一维CNN | Conv1D

在介绍Conv1D之前,首先给出一个提示。即在Conv1D中,内核沿一维滑动。现在,让我们在此处暂停博客,考虑哪种类型的数据仅需要内核在一个维度上滑动并具有空间特性?
答案是时间序列数据。让我们看一下以下数据。

来自加速度计的序列数据

该数据是从人戴在手臂上的加速度计中收集的。数据表示所有三个轴的加速度。一维CNN可以根据加速度计数据执行活动识别任务,例如人的身姿,行走,跳跃等。此数据有2个维度。第一维是时间步长,其他维是3轴上的加速度值。
下图说明了内核如何在加速度计数据上移动。每行代表某个轴的时间序列加速度。内核只能沿时间轴一维移动。


内核在加速度计数据上滑动

# Keras中的Conv1D层
import kerasfrom keras.layers import Conv1Dmodel = keras.models.Sequential()model.add(Conv1D(1, kernel_size=5, input_shape = (120, 3)))model.summary()

参数input_shape(120,3)表示120个时间步,每个时间步中有3个数据点。这3个数据点是x,y和z轴的加速度。参数kernel_size为5,表示内核的宽度,内核高度将与每个时间步中的数据点数相同。
同样,一维CNN也可用于 音频和文本数据因为我们还可以将声音和文本表示为时间序列数据。请参考下面的图片。

文本数据作为时间序列

Conv1D广泛应用于感官数据,加速度计数据就是其中之一。

三维CNN | Conv3D

在Conv3D中,内核按3个维度滑动,如下所示。让我们再考虑一下哪种数据类型需要内核在3维上移动?

内核在3D数据上滑动

Conv3D主要用于3D图像数据。例如磁共振成像(MRI)数据。MRI数据被广泛用于检查大脑,脊髓,内部器官等。甲计算机断层扫描(CT)扫描也是三维数据,这是通过组合从身体周围的不同角度拍摄的一系列X射线图像的创建的一个例子。我们可以使用Conv3D对该医学数据进行分类或从中提取特征。

CT扫描和MRI的3D图像的横截面

# 以下是在keras中添加Conv3D层的代码。
import kerasfrom keras.layers import Conv3Dmodel = keras.models.Sequential()model.add(Conv3D(1, kernel_size=(3,3,3), input_shape = (128, 128, 128, 3)))model.summary()

这里参数Input_shape(128,128,128,3)有4个维度。3D图像是4维数据,其中第四维代表颜色通道的数量。就像平面2D图像具有3维一样,其中3维代表色彩通道。参数kernel_size(3,3,3)表示内核的(高度,宽度,深度),并且内核的第4维与颜色通道相同。

总结

  • 在1D CNN中,内核沿1个方向移动。1D CNN的输入和输出数据是2维的。主要用于时间序列数据。
  • 在2D CNN中,内核沿2个方向移动。2D CNN的输入和输出数据是3维的。主要用于图像数据。
  • 在3D CNN中,内核在3个方向上移动。3D CNN的输入和输出数据是4维的。通常用于3D 图像数据(MRI,CT扫描)。

理解1D、2D、3D卷积神经网络的概念相关推荐

  1. 1D/2D/3D卷积详解

    目录 概述 1D卷积 2D卷积 3D卷积 概述 1D/2D/3D卷积计算方式都是一样的,其中2D卷积应用范围最广.与全连接层相比,卷积层的主要优点是参数共享和稀疏连接,这使得卷积操作所需要学习的参数数 ...

  2. [十三]深度学习Pytorch-卷积层(1D/2D/3D卷积、卷积nn.Conv2d、转置卷积nn.ConvTranspose)

    0. 往期内容 [一]深度学习Pytorch-张量定义与张量创建 [二]深度学习Pytorch-张量的操作:拼接.切分.索引和变换 [三]深度学习Pytorch-张量数学运算 [四]深度学习Pytor ...

  3. 了解1D和3D卷积神经网络|Keras

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 译者|Arno 当我们说卷积神经网络(CNN)时,通常是指用于图像 ...

  4. 卷积层(1D,2D,3D..反卷积)

    文章目录 1d/2d/3d卷积 卷积-nn.Conv2d() 尺寸计算 转置卷积-nn.ConvTranspose nn.ConvTranspose代码 尺寸计算 1d/2d/3d卷积 卷积运算:卷积 ...

  5. 卷积神经网络(2D卷积神经网络和3D卷积神经网络理解)

    前言 卷积神经⽹络(convolutional neural network,CNN)是⼀类强⼤的神经⽹络,正是为处理图像 数据而设计的.基于卷积神经⽹络结构的模型在计算机视觉领域中已经占主导地位,当 ...

  6. 卷积神经网络基本概念

    卷积神经网络基本概念 最近有一个词特别火啊,那就是"内卷",我一开始看到还以为是说头发弄卷了呢,但是好像不太对,那么什么是内卷呢?通俗的讲就是内部竞争,内卷是从内卷化而来,内卷化最 ...

  7. 多时间尺度 3D 卷积神经网络的步态识别

    多时间尺度 3D 卷积神经网络的步态识别 论文题目:Gait Recognition with Multiple-Temporal-Scale 3D Convolutional Neural Netw ...

  8. python图像人类检测_OpenCV人类行为识别(3D卷积神经网络)

    1. 3D卷积神经网络 相比于2D 卷积神经网络,3D卷积神经网络更能很好的利用视频中的时序信息.因此,其主要应用视频.行为识别等领域居多.3D卷积神经网络是将时间维度看成了第三维. 人类行为识别的实 ...

  9. 深度学习之3D卷积神经网络

    一.概述 3D CNN主要运用在视频分类.动作识别等领域,它是在2D CNN的基础上改变而来.由于2D CNN不能很好的捕获时序上的信息,因此我们采用3D CNN,这样就能将视频中时序信息进行很好的利 ...

最新文章

  1. 揭秘百度微服务监控:百度游戏服务监控的演进
  2. 「NLP」 深度学习NLP开篇-循环神经网络(RNN)
  3. 又一方案实现发行Token的功能,BCH平台Token即将迎来大爆发
  4. Yenista光学发布新型无源器件测试平台CTP10
  5. [算法] 求环形数组中和值最大子段
  6. Microsoft.Net框架程序设计学习笔记(11):类型构造器
  7. 谷歌提出新型卷积网络EfficientNet: 推理速度升5.1倍参数减少88%,需要我们的验证
  8. 北京大学孙俊教授课题组深度视频研究室招收2021级博士生
  9. (1)vmware安装ubuntu13.10之后无法进入桌面;(2)ubuntu13.10无法显示eclipse的下拉菜单...
  10. 使用qsort()和bsearch()函数对值和字符串进行排序和查找
  11. 福利月|这个月你想要什么书
  12. Redis高并发5-redis数据持久化之企业应用
  13. BMFont 快速入门教程
  14. vue 如何对两个文本比较
  15. 西雅图亚马逊1个月入职日记,传闻中的“血汗工厂”真实存在吗?
  16. VBA 贴片电阻名称转换
  17. SICP练习题1.14
  18. 微软Project Europe或将帮助Win10应用开发
  19. 手机连接电脑热点 显示 连接超时,已解决
  20. 高中数学必考知识点:二元一次不等式(组)及简单的线性规划问题

热门文章

  1. android studio开发rtk,科学网—基于VS2017编译调试rnx2rtkp - 陈超的博文
  2. 自动驾驶中camera方案(一)camera链路框架
  3. 文献简述丨癌症的趋势—表观遗传学在癌症中的应用
  4. 【RED-V】基于 RISC-V 架构的开源开发板
  5. 又一大佬离职?天猫淘宝搞拆分~
  6. WINDOWS 2003 远程桌面不能记录登陆IP真是件头痛的事,本方法可以记录登陆者IP,具体的操作步骤如下:
  7. 华为手机里的计算机怎么设置,简单十步设置Huawei Share,手机与电脑传输从此告别数据线-华为手机怎么连接电脑...
  8. winpcap实现ARP欺骗攻击
  9. 分享84个NET源码,总有一款适合您
  10. 56.订单明细实付金额分摊(实时)