原文链接:https://adeshpande3.github.io/adeshpande3.github.io/A-Beginner's-Guide-To-Understanding-Convolutional-Neural-Networks/

借这篇文章进行卷积神经网络的初步理解(Convolutional Nerual Networks)

Image Classification

  Image classification(图像分类) is the task of taking an input image and outputting a class(a dog, a cat, ect.) or a probablity of classes that best describes the image.

Inputs and Outputs

  When a computer sees an image, it will see an array of pixel values, e.g. 32*32*3, RGB(red,green,blue) values.

  /****补充****/

  单通道图:俗称灰度图,每个像素点只能有一个值表示颜色,像素值在0-255之间(0是黑色,255是白色,中间值是一些不同等级的灰色)。

  三通道图(RGB):每个像素点有三个值表示,对红、绿、蓝三个颜色的通道值变化以及它们之间的相互叠加来得到各种各样的颜色。三通道灰度图指的是三个通道的值相同。

Biological Connection

  某些神经元只对特定方向的边缘做出响应,一些神经元只对垂直方向做出响应,一些只对水平方向等。这些神经元都在一个柱状组织里(人眼中的光感受器:柱状体,对事物有一个总体感知),是卷积神经网络的基础。

First Layer - Math Part(Convolutional Layer aka conv layer)

  

  The filter(or a neuron神经元/kernel) has an array of numbers,called weights or parameters. The filter is convolving, next step(stride) is moving to the right by 1 unit.

  The depth of this filter has to be the same as the depth of the input, so the filter is 5*5*3. If we use two filters(5*5*3), the output would be 28*28*2.

First Layer - High Level Perspective

  Each of these filters can be thought of as feature identifiers(straight edges, colors, curves ect.).

  E.g. a curve detector

  The filter will have a pixel structure in which there will be higher numerical values along the area that is a shape of a curve.

  

  So we take this image as example.

  

  (可见第一幅图匹配度高,第二幅匹配度低)

Going Deeper Through the Network

  A classic CNN architecture would look like this:

  Input -> Conv -> ReLU -> Conv -> ReLU -> Pool -> ReLU -> Conv -> ReLU -> Pool -> Fully Connected Layer

  (ReLU:激活函数,Pool:池化层)

  There're other layers that are interspersed(点缀,散布) between these conv layers, they provide nonlinearities (ReLU) and preservation(维度保护) of dimension(Pool) that help to improve the robustness(鲁棒性) of the network and control overfitting.

  As you go through more and more conv layers,(i).you get activation maps that represent more and more complex features;(ii).the filters begin to have a larger and larger receptive field.

Fully Connected Layer(FC)

  全连接层在整个网络中起到分类器的作用,可用卷积实现。

  目前全连接由于参数冗余(仅全连接层参数就可占整个网络参数80%左右),近期有使用全局平均池化(global average pooling,GAP),通常有较好的预测性能。

  

转载于:https://www.cnblogs.com/zhenggege/p/8922406.html

A Beginner's Guide To Understanding Convolutional Neural Networks Part One (CNN)笔记相关推荐

  1. A Beginner‘s Guide To Understanding Convolutional Neural Networks(part 1)

    原文网址:http://blog.csdn.net/darkprince120/article/details/52807029 Introduction 卷积神经网络CNN,虽然它听起来就像是生物学 ...

  2. A Beginner's Guide To Understanding Convolutional Neural Networks

    Introduction 卷积神经网络CNN,虽然它听起来就像是生物学.数学和计算机的奇怪混杂产物,但在近些年的机器视觉领域,它是最具影响力的创新结果.随着Alex Krizhevsky开始使用神经网 ...

  3. (翻译)Understanding Convolutional Neural Networks for NLP

    原文:Understanding Convolutional Neural Networks for NLP 当我们听说卷积神经网络(CNN)时,我们通常会想到计算机视觉. CNN负责图像分类方面的重 ...

  4. 卷积神经网络简介(Convolutional Neural Networks,简称CNN)

    原文地址:卷积神经网络简介(Convolutional Neural Networks,简称CNN) 作者:josephzh0423 卷积神经 网络是 近年发展起来,并引起广泛重视的一种高效识别方法. ...

  5. 【文本分类】Deep Pyramid Convolutional Neural Networks for Text Categorization

    ·阅读摘要:   本文提出了DPCNN(深度金字塔CNN)模型.在transformer.bert还没兴起的年代,模型越深效果越好,但是模型的复杂度会随着深度提升.粗略地说,DPCNN就是为了解决CN ...

  6. Convolutional Neural Networks for Visual Recognition 8

    Convolutional Neural Networks (CNNs / ConvNets) 前面做了如此漫长的铺垫,现在终于来到了课程的重点.Convolutional Neural Networ ...

  7. Convolutional Neural Networks for Visual Recognition 1

    Introduction 这是斯坦福计算机视觉大牛李菲菲最新开设的一门关于deep learning在计算机视觉领域的相关应用的课程.这个课程重点介绍了deep learning里的一种比较流行的模型 ...

  8. Action Recognition Using Attention-Joints Graph Convolutional Neural Networks翻译

    对Action Recognition Using Attention-Joints Graph Convolutional Neural Networks(19年ieee上的一篇)这篇论文的翻译,可 ...

  9. 人群密度估计--CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes

    CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes CVPR2018 ...

  10. 有效感受野--Understanding the Effective Receptive Field in Deep Convolutional Neural Networks

    Understanding the Effective Receptive Field in Deep Convolutional Neural Networks NIPS 2016 本文主要分析了 ...

最新文章

  1. win10 调用计算机,Win10系统打开此电脑提示正在处理它解决方法
  2. Could not GET “XXXXX.xml”Received status code 400
  3. 用unity制作简单的太空游戏(1):简单飞船控制
  4. csdn怎么快速转载别人的文章
  5. Apache本地环境部署
  6. 以太坊2.0合约余额新增8768 ETH
  7. python open找不到文件的原因_python – logger找不到文件
  8. 《火球——UML大战需求分析》(第3章 分析业务模型-类图)——3.7 关于对象图
  9. java json转excel_JSON转Excel怎么转?
  10. SteamVR简介(Yanlz+Steam+VR+Unity+AR+MR+XR+=)
  11. vscode 显示/设置隐藏文件夹
  12. 文件包含漏洞+php伪协议
  13. CleanMyMac最新破解安装版
  14. tablayou设置固定下划线和根据文字显示长短显示下划线
  15. unity 监听文件夹更新,获取本地图片并显示
  16. 10种最热门的编程语言出道至今历史排行情况-2020年TIOBE最新
  17. AHB协议(2/2)
  18. 数据结构——二叉树总结
  19. 百度联盟原负责人周品创办B2C网站
  20. Go实战--golang中使用gRPC和Protobuf实现高性能api(golang/protobuf、google.golang.org/grpc)

热门文章

  1. inDesign入门教程,如何对齐和分组内容?
  2. ON1 Resize 2022 for Mac(图片大小修改工具)
  3. EditRocket for Mac(源代码编辑器)v4.5.10
  4. 在 Mac 上修复 Touch ID 问题的 6 种方法
  5. Mac电脑如何把备忘录添加到通知栏组件中?
  6. 使用Power Manager设置自动关闭Mac
  7. Python技术公众号100天了
  8. 前端文档汇总(觉得对您有用的话,别忘了给点个赞哦 ^_^ !) 1
  9. [python] 在指定目录下找文件
  10. Openfire 4.1.0