CNN(卷积神经网络:Convolutional neural network)

一、计算机视觉的应用

cnn非常普遍地运用在计算机视觉当中(工作室也涉及了很多小牧,在医疗上更多一点)

二、计算机视觉分类

1.计算机视觉分类主要有四大类:

(a)Image classification(同项分类)

图像分类,用于识别图像中物体的类别(如:bottle、cup、cube)

(b)Object localization(目标检测)

目标检测,用于检测图像中每个物体的类别,并准确标出它们的位置。

(c)Semantic segmentation(语义分割)

图像语义分割,用于标出图像中每个像素点所属的类别,属于同一类别的像素点用一个颜色标识。

(d)Instance segmentation(实例分割)(与语义分割不同的是,实例分割,笼统来说分割地更细一点,它在同一类别的基础上,将每一个对象作为独立的个体来再进行分割,如下图对比所示)

实例分割,值得注意的是(b)中的目标检测任务只需要标注出物体位置,而(d)中的实例分割任务不仅要标注出物体位置,还需要标注出物体的外形轮廓。

2. cnn解决的问题

在 CNN 出现之前,图像对于人工智能来说是一个难题,有2个原因:
(1).图像需要处理的数据量太大,导致成本很高,效率很低(因为:图像是由一个个像素构成的,而像素又由颜色构成,所以像素的画质越高,像素越密,所以数据量大)
(2).图像在数字化的过程中很难保留原有的特征,导致图像处理的准确率不高

解释:像传统的那些算法,在汲取特征的过程中,但不好吧特征给抽象出来,二cnn正好可以解决这两个问题。

具体如何解决的:

a、能够有效的将大数据量的图片降维成小数据量
b、能够有效的保留图片特征,符合图片处理的原则

三、卷积神经网络(sonvolutional neural network,CNN),是一种专门用来处理具有类似网格结构的数据的神经网络

translation:平移, scaling:缩放, rotation:旋转, weight:增加像素,查询算法,进行图像的一个填充

2、CNN五层网络结构
       a、 数据输入层/Input layer I
        b、卷积层/ CONV layer (提取图像中的局部特征)
        c、Relu 激励层/ReLu layer(激励层又称“激活层”)
        b、池化层/Pooling layer(降低参数量级)
        e、全连接层/FClayer
3、数据输入层

预处理,图片的像素矩阵
4、卷积层(Convolution Layer)

卷积层被称为过滤器(filter)或者内核(kernel)或卷积核。
     对输入图像和滤波矩阵(恒定的滤波器flter)做内积(逐个元素相乘再求和)的操作就是卷积,也是卷积神经网络的名字来源。

(2)卷积计算

(3)填充值zero-padding(其作用:避免边缘数据的丢失)

以10来说,正常情况下,10会被用到四次;但对与13来说,只用到了红色这个框,13被用到了一次。

a、 边界上填充0值

b、避免边缘数据丢失

(4)步幅(stride)

减少参数的数目,减少计算量

5、激活层

神经元:y=wx+b(w:无米伽)——下一个神经元:z=w的平方(wx+b)+b——.....以此类推

激活函数(加入非线性因素)

(1) 提高模型鲁棒性(抗干扰能力),非线性表达能力,缓解梯度消失问题、加速模型收敛
(2) 将当前特征空间映射转换到另一个空间,让数据能更好的被分类
(3)非线性激活函数
       a、 假若网络中全部是线性部件,那么线性的组合还是线性,与单独一个线性分类器无异。
       b、网络更加强大,学习复杂的事物,复杂的表单数据,从输入输出之间生成非线性映射。
ReU激活函数(非常非常重要,可以直接去网上搜)

6、池化层(Pooling)

(1)平均池化层(mean pooling)

(2)最大池化层(max pooling)

(3)目的:(最重要的一块

a、使特征图变小,简化网络计算复杂度
 b、特征压缩,提取主要特征

c、加快计算速度

d、防止过拟合

推荐文章或视频

1、如何理解卷积层和池化层

卷积层:它是用来提取特征的。其中卷积核为核心,它相当于一个矩阵。

池化层:它用来减少参数数量。而降低参数的方法就是删除参数。

查阅的一些相关资料:卷积层与池化层 - 知识天地 - 博客园 (cnblogs.com)如何理解卷积神经网络(CNN)中的卷积和池化? - 知乎 (zhihu.com)

2、激活函数的作用是什么

(1)在我们面对线性可分的数据集的时候,简单的用线性分类器即可解决分类问题。但是现实生活中的数据往往不是线性可分的,面对这样的数据,一般有两个方法:引入非线性函数、线性变换。

(2)就是把当前特征空间通过一定的线性映射转换到另一个空间,让数据能够更好的被分类。

梅科尔工作室——深度学习第五课相关推荐

  1. 梅科尔工作室深度学习第五课-CNN

    CNN解决了什么问题 在 CNN 出现之前,图像对于人工智能来说是一个难题,有2个原因: 图像需要处理的数据量太大,导致成本很高,效率很低 图像在数字化的过程中很难保留原有的特征,导致图像处理的准确率 ...

  2. 梅科尔工作室-深度学习第五节-CNN学习

    目录 1.什么是CNN(卷积神经网络) 2.卷积层与池化层 2.1卷积层 2.2池化层 3.卷积神经网络的输入与输出 4.卷积神经网络之层级结构 5.激活函数 6.计算公式 1.什么是CNN(卷积神经 ...

  3. 梅科尔工作室——深度学习第四课

    SVM第一阶段学习 一.SVM与KUN的对比 1.KUN 回顾上一节:kun叫做邻近算法(又叫分类算法),首先要有k值,因为k值决定了虚线圆圈的大小,即以要算的未知值为圆心,k的值为半径,画一个虚线圆 ...

  4. 梅科尔工作室-深度学习第五讲 CNN-卷积神经网络

    目录 前言 1.计算机视觉 1.1. 计算机视觉分类 2. CNN 3. 卷积层 3.1. 什么是卷积 3.2. 动态卷积操作 4. 池化层 5.激活函数的作用 前言 本文记录梅科尔工作室深度学习培训 ...

  5. 梅科尔工作室-深度学习-CNN

    目录 1.基本概念 2.cnn常见任务 3.cnn组成 3.1.输入层 3.2.卷积层 3.3.激活层 3.4.池化层 3.5.全连接层 4.AI Studio公开项目的展示 1.基本概念 卷积神经网 ...

  6. 梅科尔工作室-深度学习-SVM

    目录 1.svm介绍 1.1.svm概念 1.2.svm与knn的对比 2.svm算法原理 2.1.距离计算 2.2.目标函数 2.3.软间隔优化 2.4.核函数 3.百度飞桨已有公开项目的展示 1. ...

  7. 梅科尔工作室-深度学习第三讲

    什么是KNN KNN的原理就是当预测一个新的值x的时候,根据它距离最近的K个点是什么类别来判断x属于哪个类别. 图中绿色的点就是我们要预测的那个点,假设 K=3 .那么 KNN 算法就会找到与它距离 ...

  8. Emojify - v2 吴恩达老师深度学习第五课第二周编程作业2

    吴恩达老师深度学习第五课第二周编程作业2,包含答案! Emojify! Welcome to the second assignment of Week 2. You are going to use ...

  9. 梅科尔工作室-Django学习笔记(二次学习)(3)

    本次学习的是如何用django实现前端鸿蒙OS登录 下面介绍一下本次的操作过程. 1.首先创立MySQL数据并将数据库导入到django当中 其中:导入数据库的操作: 2.配置urls 对应新建的pe ...

最新文章

  1. 阿里程序员连续两次绩效3.25!大老板威胁要开除他!还不给赔偿金!问大家该如何维权?...
  2. 站在巨人的肩膀上眺望未来
  3. python制作图片数据集_Pytorch自己加载单通道图片用作数据集训练的实例
  4. SmartPDA图片
  5. k8s源码分析 pdf_rook源码分析之一:rook架构解析
  6. web前端开发怎么样学习?看这份web前端学习路线
  7. Workflow相关表简单分析
  8. mysql获取当前时间,前一天,后一天
  9. 未来10年,将被人工智能/机器学习/大数据颠覆的三大行业
  10. Oracle Library cache 内部机制 说明
  11. 《数据挖掘概念与技术》第八章 分类:基本概念
  12. python清理浏览器缓存_浏览器缓存看这一篇就够了
  13. Python 中 jieba 库
  14. 使用N2N搭建虚拟局域网|可用于红警、我的世界联机
  15. 第一次做Google SEO,如何才能做好谷歌的优化?
  16. 基于STC89C52RC的小车黑线钝角、锐角、迷宫、虚线循迹模块化代码
  17. Java实现咖啡馆选餐系统
  18. 从微软的万物互联到腾讯的三网:当今世界就是一台计算机!
  19. 【深度学习】数据读取与数据扩增方法
  20. python 图片文字识别orc

热门文章

  1. MySQL数据库常用命令大全(完整)(表格形式)
  2. Java学习第二十七天<面向对象综合练习><猜拳游戏>
  3. ubuntu shell 编程学习
  4. pdf怎么转换成ppt文件,5种方法任你选
  5. 中国移动和中国广电共用700MHz,联通和电信的5G输定了
  6. oracle 密码过期验证
  7. 很有用但鲜有人知的 Linux 命令
  8. Convex Optimization: Primal Problem to Dual problem clearly explained 详细
  9. 凡泰小程序技术—可持续的数字化转型
  10. 初次使用matlab导入txt文件