这是我的最爱啊 还没学明白 欢迎大佬来指点哦

卷积神经网络

虽然人类对于生物神经系统的认知并非十分透彻,但针对于这个问题,科学家采取了人工神经网络的算法进行应对。并随着机器深度学习算法的不断进步,对于物体识别与图像处理的机器应用与研究方面也有很大的帮助。不仅如此,人工神经网络的算法也在不断地完善与创新。从最开始的手写数字的自动识别时开始传统神经网络的应用。但是这种图像识别首先需要大量的正负标记的物体样本数据,然后使用选定的神经网络和损失函数模型通过监督学习的方法进行训练,以确定网络中不同神经元的权重。

学习过程中的知识是成功的关键。为了增强网络的表达能力,需要足够数量的隐藏层和神经网络中的神经元数量。由于一般图像中包含的像素数量非常多,相应的神经网络的参数量也很大。虽然理论上全连接神经网络可以将包含图像的高纬度像素空间映射到代表类别的低纬度特征空间,但实际应用中所需的神经元参数空间是巨大的,尤其是隐藏层增加了训练成本和难度也大大增加,在很大程度上影响了手写图片的识别准确率。

识别准确率不高原因

相较于传统的神经网络带来的种种不便,法裔美国计算机学家杨立昆1989年发明了卷积神经网络。这项研究成果是人工智能深度学习历史上划时代的里程碑,其核心思想得益于美国神经学家大卫·休伯尔和托斯坦·威泽尔对动物视觉神经感知过程的研究成果,也受到日本计算机科学家福島邦彦的新认知子理论模型的启发。

卷积神经网络的发展历程

卷积神经网络的基本结构由输入层、卷积层、池化层(也称为取样层)、全连接层及输出层构成。卷积层和池化层一般会取若干个,采用卷积层和池化层交替设置,即一个卷积层连接一个池化层,池化层后再连接一个卷积层,依此类推。由于卷积层中输出特征面的每个神经元与其输入进行局部连接,并通过对应的连接权值与局部输入进行加权求和再加上偏置值,得到该神经元输入值,该过程等同于卷积过程。

卷积神经网络的基本结构

同样,图像识别的实质是将图像的像素数据经过某种压缩编码提取其中物体的语义信息,卷积神经网络发挥着关键的作用,它通过使用低维度卷积核或滤波器对图像的局部像素空间进行卷积,然后进入神经元激活来提取图像的特征,所产生图像被称为特征图。接下来可以对卷积后的特征图进行池化,即首先用滤波器在特征图按给定步长移动,每次对每个区域的元素通过“平均”或“最大”化操作进行数据压缩,从而产生一组维度更低的特征图。

卷积网络相邻连接的局部性导致整体连接的稀疏性,有助于减少训练过程中的过度拟合,提高的网络的泛化能力。使用同一滤波器以实现参数共享,不仅大大减少的网络的参数空间,也在一定程度上确保了特征对位移、拉伸和旋转的相对不变性,从而提高了算法的鲁棒性。在深度学习神经网络中,一般均采取多个“卷积-激活-池化”层分级提取图像的特征信息,不断对原始图像数据进行压缩编码最终通过完全连接网络实现图像分类与识别。[2]

卷积神经网络由浅到深、从局部到全局,通过不断提取和压缩图像的特征数据,最终实现对图像中数字识别的过程。在这个过程中“编码-解码”的基本规则不可忽视。卷积神经网络通过不断卷积和池化编码提取图像的宏观特征和语义,但同时会损失图像的空间分辨率和局部特征。为了平衡全局物体分类和局部物体定位之间的矛盾,科学家采用了通过数据扩展的“上采样”提高图像的分辨率和获取图像的局部特征,这种方式很好地弥补了卷积池化这种数据压缩的“下采样”带来的问题。

韩国浦项工科大学的研究者在标准卷积网络上附加一个对称的“反卷积”网络,对卷积网络产生的特征图进行对应的上采样,最终输出与输入图像同样尺寸和分辨率的语义分割图像。这种端到端“编码-解码”神经网络的下采样和上采样参数均通过训练学习获得,能够取得更高的语义分割精度。

在图像识别与人工智能的处理过程中,先验知识也起到关键的作用。因为虽然通过人工智能的相关算法可以较为精准地识别出图像。但是针对于图像应该作出的判断与反应,例如识别出该图像具体是一个什么事物,这些事物之间的可能存在的关系,以及这些事物所代表的含义等等,却是需要先验知识作为前提,再用现有知识与之进行比对才能做出合适的判断。正如我们在“自然智能”章节中所讲到的有关情绪智能的部分。如果想让人工智能真正如电影《人工智能》里面一般,可以通过图像识别分辨出人的表情,从而分析出他的喜怒哀乐的情感。那么这个图像识别程序中就必须要有一定的先验知识,才能达到这样的境界。 哈哈 不过这个电影并没看过 估计 也不怎么好看把

矛盾的解决

物体识别既要提取语义信息,又要获取位置信息,前者需要全局特征,而后者需要局部特征。这两个矛盾看似不可调和,实际上却存在非常丰富的解决办法。在讨论这个问题之前。我们要先明确计算机视觉的任务,它主要分为两大类:物体检测与实例分割。物体检测即确定包含目标物体边框的大小与位置并识别其所属类别,而实例分割即确定包含目标物的像素空间并识别其所属类别。物体检测或事件分割既需要识别目标物体的类别,又需要确定被识别物体的定位边框或所占据的像素空间。

当只有单物体需要识别时,通过神经网络卷积与池化之后产生了一组特征图,通过两个完全连接网络,我们既可以对图像中的物体进行分类,也可以对物体所处的边框参数进行回归等等的方法解决。

如果要进行多物体的识别,解决这两个矛盾的基本方法之一是先设法确定图像中可能包含不同物体的边框,再对每一个边框中的单一物体进行分类。这种先分割、再分类的策略需要找到可以包含被识别物体的边框。但是由于现实中图像中的物体呈现的情形非常复杂以及综合原因的影响,在分类之前识别和定位这些物体本身也是一件极具挑战性的问题。虽然理论上可以先将图像按某种方式分为不同尺寸的边框,希望这些边框能够以最小边框最大限度覆盖图像中包含的物体。针对这个问题,科学家们人工设计一种选择搜索的算法,对一幅给定图像产生若干个可能覆盖物体的边框。于是美国加州大学伯克利分校的博士后研究员 Girshick及合作者在骨干网络产生特征图之后再用选择搜索算法产生定位边框,从而大大减少了图像分类的重复计算。[3] 虽然这种方法可以取得比较高的精度,但网络训练过程复杂且效率低。

为了解决这个问题,科学家们提出了单步算法,美国华盛顿大学博士研究生Redmon 等提出的“你只看一次”(YOLO)算法,基本思想是将物体识别问题视为针对不同定位边框和分类概率的回归问题,YOLO首先将输入图像划分为网格,然后以每个网格为中心定义若干个不同比例和尺寸的锚定边框,作为卷积神经网络的输入。在卷积神经网络的输出端对每个网格输出所有锚定边框与基础真相边框的相对位置和尺寸参数以及对应边框中不同类别的概率。我们只考虑信心系数大于一定阈值的锚定边框,最终只输出包含目标物体的边框,否则则认为边框所对应的是背景。[4]其应用非常广泛,如识别下面图像中自行车和小狗的应用:                whaosoft aiot http://143ai.com

YOLO算法的实际应用

为了更进一步的保证定位边框的精度,微软研究院何凯明等人于2017年发明了“掩膜R-CNN”, 在原Fast R-CNN基础上引入一个与物体检测平行的卷积神经网络对区域建议网络产生的物体区域提取掩膜。为了克服原来物体识别网络“关注区域池化”中输入图像与特征图图像像素之间产生的偏移误差,采取了线性插值方法进行校准,并以“关注区域对准”取而代之。[5]这种在包含物体的定位边框内生成物体所对应的像素空间的方法是一种“先检测再区分”的策略。这在极大程度上解决了这两者之间的矛盾。

卷积神经网络及YOLO算法 相关相关推荐

  1. 全连接神经网络的BP算法(BP神经网络模型)与卷积神经网络的BP算法

    1.神经网络模型 1.1神经网络模型的演变: 神经元模型------->感知机模型------->神经网络模型 神经元模型:1943年,W.S.McCulloch和W.Pitts根据生物学 ...

  2. 从0开始学习卷积神经网络与Yolo系列目标检测算法

    目录 (一)卷积神经网络初了解 一.卷积神经网络 1.1 计算机视觉 1.2 卷积运算 1.卷积运算介绍 2.卷积运算示例:边缘检测 3.对于一张RGB图像进行卷积 4.提取RGB图像的多个特征 1. ...

  3. 人工智能专业术语:物体识别、卷积神经网络、YOLO分别都是什么?

    初学者区分不同的相关计算机视觉任务可能具有挑战性.例如,图像分类比较易于理解,但目标定位和目标检测之间的差异可能会令人困惑,尤其是当所有三个任务都可以等同地称为目标识别时. 图像分类涉及为图像分配类标 ...

  4. 卷积神经网络(CNN)相关知识以及数学推导

    神经网络概述 神经元模型 以上就是经典的"M-P神经元模型".在这个模型中,神经元接收来自n个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元接收到的总输 ...

  5. 卷积神经网络的训练算法,卷积神经网络算法实现

    卷积神经网络算法是什么? 一维构筑.二维构筑.全卷积构筑. 卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feed ...

  6. 卷积神经网络(CNN)相关的基础知识

    卷积神经网络(Convolutional Neural Network,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,广泛地运用在图像识别,语音识别.自然语言处理.医学影像,甚至物理学和气象 ...

  7. 卷积神经网络有哪些算法,卷积神经网络算法实现

    卷积神经网络通俗理解 . 卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetwork ...

  8. 卷积神经网络有哪些算法,神经网络卷积算法公式

    卷积神经网络通俗理解 . 卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetwork ...

  9. 经典卷积神经网络(CNN)图像分类算法详解

    本文原创,转载请引用 https://blog.csdn.net/dan_teng/article/details/87192430 CNN图像分类网络 一点废话:CNN网络主要特点是使用卷积层,这其 ...

最新文章

  1. 对于技术 方法 生活等问题的思考
  2. 票务系统思维导图_【思维导图】第六章:气体灭火系统
  3. Java集合篇:Hashtable原理详解(JDK1.8)
  4. oracle复制sequence,oracle sequence语句重置方介绍
  5. 理解图像的傅里叶变换
  6. M - Kill the tree 计蒜客 - 42552(2019icpc徐州/树的重心/树形dp)
  7. 怎么查看父子级目录linux,如何查找linux中特定父目录的所有文件?
  8. Verilog实现的多个按键消抖(具体模块可用)
  9. L1-029 是不是太胖了 (5 分)—团体程序设计天梯赛
  10. C++:怎样把一个int转成4个字节?
  11. Spring Boot 阿里云短信平台手机验证码测试
  12. Excel 技术篇-使用excel启用宏提示:“可能是因为该宏在此工作簿中不可用,或者所有的宏都被禁用“问题解决方法
  13. 你好,法语!A2知识点总结(1)
  14. 四.电影/综艺网站(包含搜索经验, 我的经验, 必看) 彻底帮你解决看电影/综艺的问题
  15. 使用scipy.integrate模块中的quad和dblquad方法分别进行单重积分和多重积分
  16. bootstrap入门步骤
  17. 1 什么是末端柔顺控制?
  18. KITTI 相关信息汇总
  19. DEDE织梦网站首页仿制实战操作
  20. 18:求N分之一序列前N项和

热门文章

  1. trello清单(二)
  2. 蓄电池维护——蓄电池的日常检测与维护
  3. 价值网络和策略网络的简单融合
  4. stm32F051 HAL库+DMA+串口空闲中断
  5. python123第四章第五题_第五章 Python 函数
  6. 朗强科技HDMI网线延长器
  7. FCPX插件平面图片转三维空间动画 PRODEPTH
  8. no protocal specified
  9. 武汉理工大学 操作系统复习
  10. 电大实训平台计算机专业考核答题,新疆电大计算机信息管理专业集中实践环节实施细则201109...