目录

1.什么是通道?

1.输入通道数等于卷积核通道个数

2.卷积核个数 等于 输出通道个数

2.为什么要增加通道

3.补充


1.什么是通道?

        通道在我看来可以简单理解为图像的深度。通过阅读一些帖子,我觉得有两个总结对理解通道很有帮助,这里在下面介绍一下。

计算机在存储图片时是以数字矩阵的形式存储,例如我们最常见的彩色图片,RNG格式,它包含红,黄,蓝三个通道,而灰色图片只有一个通道。

1.输入通道数等于卷积核通道个数

例如当我们输入的图片为三通道时,那么卷积核也会有三个通道,就像上述图片,最左边的三个矩阵是一个图片的三个通道(因为计算机上是以数字矩阵存储),与这张图片相乘的是一个1*1的三通道卷积核。

为了让图像的三个通道和卷积核分别进行点积并相加得到一个矩阵,即一个特征图,所以卷积核的通道也要有三个,为了和图像的每个通道都进行运算。

2.卷积核个数 等于 输出通道个数

卷积核的数量决定输出的通道数,比如说现在有一张像素为16*16的三通道图片(16*16*3),其实这张照片就由三个16*16的矩阵组成,如果这时我们有256个3*3*3的卷积核,其实就是每个卷积核由3个3*3的矩阵,有256个这样的卷积核。那么这张16*16*3的图片要和256个3*3*3的卷积核都进行点积并相加得出特征图,即得到的特征图有256个,即卷积核的个数,也是输出通道的个数。

2.为什么要增加通道

在一张照片中可能有很多信息,比如人,动物....,我们人眼可以一下子就分辨出来,但是计算机不可以,他要进行特征提取,也是卷积的第一个操作。

我们增加通道数就代表着增加特征,而造成通道数增加的操作其实就是卷积核的增加,不同的卷积核可以提取到不同特征,比如说平滑卷积核,它可以让整个图像更加平滑清晰,还比如增加水平边界过滤器,垂直边界过滤器(本质都是卷积核),让图像的矩阵和卷积核进行点积相加,得到不同的矩阵,即不同的特征图,这些特征图越多,越利于计算机学习,这将教会计算机识别特征。

因为不同的卷积核可以分辨出不同的特征,所以增加卷积核的个数很必要,计算机通过利用这些特征图,来最终得到结论,分辨出图像的事物到底是什么。

3.补充

池化操作是为了在降低像素的同时保存重要信息,而降低像素也十分必要,要通过降低像素来减少计算机的内存消耗。

网络中常常增加通道同时降低像素,但如果不断降低像素而不增加通道,那么图片通过激活函数等操作后很可能会遗漏重要信息,那么这个网络的训练效果可能就会不理想。

深度学习的通道到底是什么?有什么用?(小白可看)相关推荐

  1. 深度学习VS机器学习——到底什么区别

    最近在听深度学习的课,老师提了一个基本的问题:为什么会出现深度学习?或者说传统的机器学习有什么问题.老师讲解的时候一带而过,什么维度灾难啊之类的,可能觉得这个问题太浅显了吧(|| Д)````不过我发 ...

  2. [研究方向]什么是深度学习?它到底有多火?

    本文转自CSDN,作者Anymake 本文是一篇供程序员了解的深度学习入门文章.由于目前深度学习很火,也是考研的热门研究方向之一,于是就提供给同学们啦~ 作为一名软件工程师,我们应该活到老学到老,时刻 ...

  3. 2020 年了,深度学习接下来到底该怎么走?

    2020-02-10 11:33:44 作者 | Ajit Rajasekharan 编译 | 亚希伯恩•菲 编辑 | 丛末在过去的一年,深度学习技术在各个领域一如既往地取得了不少进展.然而当前深度学 ...

  4. 当我们在谈深度学习时,到底在谈论什么(三)--转

    原文:http://suanfazu.com/t/topic/13744 正则化 相信对机器学习有一定了解的朋友对正则化(Regularization)这个概念都不会陌生.可以这么说,机器学习中被讨论 ...

  5. 当我们在谈深度学习时,到底在谈论什么(一)--转

    原文地址:http://suanfazu.com/t/topic/13741 深度学习最近两年在音频分析,视频分析,游戏博弈等问题上取得了巨大的成果.由于微软,谷歌等科技巨头的推动及应用上的可见突破, ...

  6. 深度学习与机器学习到底什么关系?

    最近广州的天气老是变幻无常,前脚还冻得瑟瑟发抖,后脚又开始夏天模式(如下图),让小天甚是怀念每天艳阳高照的夏天,虽然热了点但好歹不用担心猝不及防地收到寒风暴雨黄色预警. 说到夏天,不得不提一下1956 ...

  7. 深度学习框架 通道顺序

    https://www.cnblogs.com/yongy1030/p/11728103.html 不同框架下的默认图片通道顺序 caffe: NCHW pytorch: NCHW mxnet: NC ...

  8. 当我们在谈深度学习时,到底在谈论什么(二)--转

    原文地址:http://suanfazu.com/t/topic/13742 上一次的分享我们提到了神经网络的几个基本概念,其中提到了随机梯度下降(SGD)算法是神经网络学习(或者更通用的,一般性参数 ...

  9. 深度学习核心技术精讲100篇(四十)-微信“看一看“内容理解与推荐,背后深层次的技术知多少?

    前言 相信对于不少人而言微信已经成为获取资讯的主要场景.与此同时,由于微信用户群体的庞大,也吸引了大量的内容生产者在微信公众平台创造内容,以获取用户关注.点赞.收藏等.微信内的内容推荐产品:看一看应运 ...

最新文章

  1. 《WCF技术内幕》翻译1:《WCF技术内幕》目录和作者简介
  2. hdu 3018 Ant Trip
  3. MongoDB基础--数据库和集合基本操作
  4. iphone以旧换新活动_iPhone第3轮降价背后:销售下滑库克甩锅给中国,国产手机崛起分食蛋糕...
  5. aws dynamodb_DynamoDB备忘单–您需要了解的有关2020 AWS认证开发人员助理认证的Amazon Dynamo DB的所有信息
  6. 如何安装python3.8_python3.8下载及安装步骤详解
  7. java 金额_货币金额的计算 - Java中的BigDecimal
  8. 不,你根本不需要ML/AI,有SQL就够了
  9. 同城门户同城分类信息网站源码discuz插件+pc端+小程序端+49款插件
  10. 检测文章相似度的方法?文章原创度检测工具免费
  11. 做了一个iGoogle新闻Gardget
  12. 计算机在线使用.l,【本周福利】免费好用的在线计算工具,推荐给大家!
  13. 14款CSS3炫酷表单input输入框美化效果【附源码】
  14. 安全工具-curl学习
  15. 3D建模布线需要注意哪些?
  16. Guide哥连夜赶的7000+字的Spring事务总结来啦!我饱了!
  17. linux/windows下基于opc ua协议使用open62541开发客户端-上
  18. 湛蓝代码自动生成工具有感
  19. ios 调整麦克风音量_iOS 音量柱的实现(mic 采集的声音DB反映成音量柱)
  20. flash 场景转换问题

热门文章

  1. Spring Security+Oauth2四种授权模式
  2. Mysql服务器安装配置和可视化链接等信息整理总和
  3. 表:数据的主要存储方式
  4. php点击按钮更换图片,单击事件做个替换图片
  5. JS控制Video播放器
  6. html5播放器自动全屏,HTML5 video播放器全屏(fullScreen)实现的方法
  7. 【桌面开发】vscode+Debugger-For-NWjs+nwjs-sdk-vx.x.x-xxos调试环境搭建
  8. 广西师范大学计算机网络试卷,广西师范大学网络中心
  9. 结构化查询语言(SQL)简介
  10. 曲线积分与曲面积分的计算机应用,谈曲线积分与曲面积分的运算