YOLO-v3

  • 6. YOLO-v3
    • 6.1 YOLO-v3 改进综述
    • 6.2 多scale方法改进与特征融合
    • 6.3 经典变换方法对比分析
    • 6.4 残差连接方法解读
    • 6.5 整体网络模型架构分析
    • 6.6 先验框设计改进
    • 6.7 softmax层改进

6. YOLO-v3

**tips:**作者本人因为美军广泛运用于军事领域,所以决定不再继续开发YOLO系列。但是其他人还是继续往后做了~v8都有了

注意,原点值(x轴预测时间,y轴map)是50而不是0!YOLO-v3比其他的强很多!

6.1 YOLO-v3 改进综述

  1. 终于到 V3了,最大的改进就是网络结构,使其更适合小目标检测
  2. 特征做的更细致,融入多持续特征图信息来预测不同规格物体
  3. 先验框更丰富了,3种scale,每种3个规格,一共9种
  4. softmax改进,预测多标签任务:多分类改成很多个二分类

6.2 多scale方法改进与特征融合

从上到下依次是检测小、中、大物体

[外链图片转存中…(img-tcdXelFQ-1675132984921)]

6.3 经典变换方法对比分析

很明显,左图的图像金字塔更能满足多尺度特征融合的要求,但是YOLO的特点是速度快,因此这样反而不合适,那右图合适吗?我们接着往下看:

右图是YOLO-v3的核心思想,13 * 13 的特征图可以上采样成26 * 26的特征图,然后融合原来的26 * 26的特征图。

6.4 残差连接方法解读

右边的曲线图表示模型的卷积层并不是越多越好;左图就是resnet所提出的想法:残差连接

残差连接会自动检测出不适合的参数,然后跳过,总结就是一句话:至少不比原来差!

6.5 整体网络模型架构分析

[外链图片转存中…(img-E1iE52ku-1675132984924)]

所有的重复部分用2x,8x等表示出来了。下图表示出了残差连接的部分:上采样——》拼接——》卷积

6.6 先验框设计改进

[外链图片转存中…(img-Td8DWG3g-1675132984924)]

*13 13 * 3 * 85:

  1. 尺度13*13
  2. 3种先验框
  3. 85=80(类别)+4(x,y,w,h)+1(confidence置信度)

[外链图片转存中…(img-rCJDp7RE-1675132984925)]

还是用聚类选择的先验框

结果:

[外链图片转存中…(img-rFfQYa7R-1675132984925)]

6.7 softmax层改进

加了一个交叉熵损失

二分类任务:取阈值大于某个值的作为正确值。

[外链图片转存中…(img-k45c0d5b-1675132984926)]

CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)相关推荐

  1. 《PHP 5.5从零开始学(视频教学版)》源代码、视频下载

    <PHP 5.5从零开始学(视频教学版)>源代码.教学视频下载地址: http://pan.baidu.com/s/1zt9hW 防止光盘在发布时老出丢失.压碎.划痕等错误. 

  2. 百度Paddle免费课程——从零开始学视觉Transformer

    百度Paddle免费课程--从零开始学视觉Transformer 课程内容如下: 很推荐这门课,原因如下: 学习笔记的百度网盘链接 本学习笔记来源于百度Paddle免费课程从零开始学视觉Transfo ...

  3. PyTorch 实现经典模型7:YOLO (v1, v2, v3, v4)

    YOLO (v1, v2, v3, v4) 网络结构 YOLO v3 网络结构 代码 Ref <机器爱学习>YOLO v1深入理解 <机器爱学习>YOLOv2 / YOLO90 ...

  4. IC卡解密从零开始学1 (也许会有2) 解密工具V2 V3大放送 By:lookyour

    IC卡解密从零开始学1 (也许会有2) 解密工具V2 V3大放送 By:lookyour 前段时间发了一个破解的PN532工具,详见 =========================== IC卡解密 ...

  5. 从零开始学Pytorch(零)之安装Pytorch

    本文首发于公众号"计算机视觉cv" Pytorch优势   聊聊为什么使用Pytorch,个人觉得Pytorch比Tensorflow对新手更为友善,而且现在Pytorch在学术界 ...

  6. 从零开始学前端:jQuery官网 --- 今天你学习了吗?(CSS:Day26)

    从零开始学前端:程序猿小白也可以完全掌握!-今天你学习了吗?(CSS) 复习:从零开始学前端:标签渐变和媒体查询 - 今天你学习了吗?(CSS:Day25) 文章目录 从零开始学前端:程序猿小白也可以 ...

  7. 区块链DApp从零开始学 (二) | 超详细 DApp创建 | 发行代币token | 宠物领养

    初学记录 · 欢迎交流 区块链DApp从零开始学 (一) | DApp抓包 区块链DApp从零开始学 (二) | 超详细 DApp创建 | 发行代币token |宠物领养 区块链知识 (一) | 实例 ...

  8. IC卡解密从零开始学2 版本更新! 解密工具PN532-mfoc-mfcuk-GUI V2.1 By:lookyour

    IC卡解密从零开始学2 版本更新! 解密工具PN532-mfoc-mfcuk-GUI V2.1 By:lookyour 程序更新  更新内容最下面 2017/5/3  V2.1 =========== ...

  9. 从零开始学人脸检测之Retinaface篇(内含魔改版GhostNet+mbv2)

    从零开始学人脸检测之Retinaface篇(内含魔改版) 代码已开源,欢迎白嫖和star: github.com/pengtougu/Retinaface_Ghost 一.论文解读 论文研读工作由Sa ...

最新文章

  1. luogu P1345 [USACO5.4]奶牛的电信Telecowmunication(建图技巧 - “割点”模板 、最小割)
  2. 什么是HTTP Headers?
  3. 把html追加到指定id后面,javascript – jQuery,动态追加元素时增加id号
  4. SpringBoot2 整合 CXF 服务端和客户端
  5. Java枚举getDeclaringClass()方法与示例
  6. 26 SD配置-主数据-信用管理-指定信用控制区域及信用部分
  7. 在线文字图标logo文章封面图生成工具
  8. sap成本流怎么看_SAP FICO成本结算的流程到底是怎样的?
  9. oracle宣传片,会声会影X8震撼的宣传片效果该怎么制作?
  10. 城市信息学其五-空间经济学、城市信息学、和交通便利
  11. 基于Kears的Reuters新闻分类
  12. win7电脑蓝屏没有修复计算机,Win7旗舰版系统电脑老是出现蓝屏的修复教程
  13. 中国历代大大小小的皇帝(2)
  14. I2C协议研读(十)
  15. CJSON 使用介绍
  16. python爬取指定分辨率模特壁纸
  17. tZERO母公司Overstock股票五个月暴涨37倍背后:已深耕区块链业务数年
  18. delphi tclientdataset字段显示type mismatch
  19. 杰奇为什么只能用php5.2,杰奇小说1.7程序用php5.3
  20. Java获取代理地址和端口

热门文章

  1. 14. Redis 发布订阅-实现消息队列
  2. python拉丁猪文字游戏_java拉丁猪文字游戏
  3. 怎样用AT指令查询本机手机号码
  4. json.loads
  5. 如何通过命令查询当前JAVA版本
  6. 数学中的元、元数学和元认知
  7. 17岁女孩叛逆期谈恋爱,不回家怎么办
  8. 第十三届蓝桥杯省赛C++C组-纸张尺寸
  9. SYSTEM32 下DLL文件的简单说明
  10. 快递物流驿站签收的单号查询筛选的方法