转载:https://blog.csdn.net/wills798/article/details/97974617

在阅读基于深度卷积神经网络的图像识别、分类或检测的文献时经常看到“patch”,不是很能理解,后来就总结了一下。

通过阅读,“patch”似乎是CNN输入图像的其中一小块,但它究竟是什么呢?当使用CNN解决问题时,“patch”什么时候开始起作用?为什么我们需要“patch”? “patch”和内核(即特征检测器)之间有什么关系?

在CNN学习训练过程中,不是一次来处理一整张图片,而是先将图片划分为多个小的块,内核 kernel (或过滤器或特征检测器)每次只查看图像的一个块,这一个小块就称为 patch,然后过滤器移动到图像的另一个patch,以此类推。

当将CNN过滤器应用到图像时,它会一次查看一个 patch 。

CNN内核/过滤器一次只处理一个 patch,而不是整个图像。这是因为我们希望过滤器处理图像的小块以便检测特征(边缘等)。这也有一个很好的正则化属性,因为我们估计的参数数量较少,而且这些参数必须在每个图像的许多区域以及所有其他训练图像的许多区域都是“好”的。

所以 patch 就是内核 kernel 的输入。这时内核的大小便是 patch 的大小。

如图,主动脉弓和心脏,绿色部分相同,而黄色部分不同。传统的CNN算法,区分效果不佳。在 Multi-Instance Multi-Stage Deep Learning for Medical Image Recognition 这篇文章中,作者针对这种场景提出了解决方法。

这样训练出的网络,就会对有区分度的patch敏感,而对无区分度的无感。

一个CNN层生成一个中间表示。该表示被传递到下一层。如果下一层是CNN,则应用完全相同的“patch”概念,并以完全相同的方式进行计算,即使中间表示不是您或我可以识别为“图像”的东西。

深度卷积神经网络中的patch相关推荐

  1. 深度卷积神经网络_深度卷积神经网络中的降采样

    加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...

  2. pcm 降采样_深度卷积神经网络中的降采样

    降采样指的是成比例缩小特征图宽和高的过程,比如从(W,H)变为(W/2,H/2).深度卷积神经网络中降采样的方法主要有三种: 1.stride大于1的pooling 2.stride大于1的conv ...

  3. 介绍深度卷积神经网络中各种类型的模型

    深度卷积神经网络(DCNN)是一种深度学习技术,它可以帮助计算机从复杂的图像或音频数据中识别出特征.DCNN可以用来解决许多计算机视觉和语音识别任务,其中包括图像分类.目标检测.语音识别和自然语言处理 ...

  4. 一、深度卷积神经网络中图像语义分割研究总结

    时间:20220410 内容:语义分割研究进程总结 参考:深度卷积神经网络图像语义分割研究进展 http://www.cjig.cn/html/jig/2020/6/20200601.htm 语义分割 ...

  5. 深度卷积神经网络演化历史及结构改进脉络-40页长文全面解读

    导言 从1989年LeCun提出第一个真正意义上的卷积神经网络到今天为止,它已经走过了29个年头.自2012年AlexNet网络出现之后,最近6年以来,卷积神经网络得到了急速发展,在很多问题上取得了当 ...

  6. 深度卷积神经网络在目标检测中的进展

    作者:travelsea 链接:https://zhuanlan.zhihu.com/p/22045213 来源:知乎 近些年来,深度卷积神经网络(DCNN)在图像分类和识别上取得了很显著的提高.回顾 ...

  7. 学习笔记 | 深度卷积神经网络在计算机视觉中的应用

    图像识别是一种利用计算机对图像进行处理.分析和理解,以识别各种不同模式的目标和对象的技术,是计算机视觉领域的一个主要研究方向,在以图像为主体的智能化数据采集与处理中具有十分重要 的作用和影响.目前图像 ...

  8. 2020-12-09 深度学习 卷积神经网络中感受野的详细介绍

    卷积神经网络中感受野的详细介绍 1. 感受野的概念 在卷积神经网络中,感受野(Receptive Field)的定义是卷积神经网络每一层输出的特征图(feature map)上的像素点在输入图片上映射 ...

  9. 基于深度卷积神经网络的小样本分割算法综述

    ↑ 点击蓝字 关注视学算法 来源丨AI算法修炼营 编辑丨极市平台 介绍 深度卷积神经网络在图像分类.目标检测.语义分割等许多视觉理解任务上都取得了重大突破.一个关键的原因是大规模数据集的可用性,比如 ...

最新文章

  1. php320,PHP_PHP正式版-320mp3下载站
  2. win10专业版关闭smartscreen
  3. 模糊查询实例 只要相关匹配即可
  4. 微信小程序多选取值判断显示内容
  5. 使用amap-js引入高德地图AMap及其UI组件AMapUI
  6. JDK 8中几乎命名的方法参数
  7. MySQL使用规范_心得总结
  8. uva 11178(几何)
  9. 虚断、虚短及同相放大与反相放大
  10. python软件工程师认证证书报考条件_软件工程师怎么考 报考条件是什么
  11. 马上谈薪了,五险一金你还不知道?作为毕业生,钱不能白交!!!
  12. GANs(生成对抗网络)浅析
  13. 腾讯蓝鲸-蓝鲸应用统一开发环境指南
  14. 国产MCU替代STM8S003方案汇总
  15. STL——标准模板库
  16. 类神经网络训练不起来怎么办——机器学习模型训练指南
  17. 李沐动手学深度学习V2-attention注意力机制
  18. Qt之实现图片轮播效果
  19. Python学习笔记---day12函数进阶
  20. 如何测试 tpc-c

热门文章

  1. md radeon hd 6670 显卡是什么显卡
  2. 循迹避障小车系统设计
  3. MAC电脑使用教程大全
  4. 11月10日学习总结
  5. 美国宾夕法尼亚大学推出关于区块链和加密货币的线上课程
  6. 数藏行业周报(06.20-06.26)
  7. 致传统投资人的一封信:从宏观视角看投资数字资产的合理性
  8. html5 strokestyle,HTML canvas strokeStyle 属性 - JavaScript 参考手册 - 自强学堂
  9. 线性代数——LU(LR)分解
  10. 全国计算机二级选择题(自总结易错题)