CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)
YOLO-v3
- 6. YOLO-v3
- 6.1 YOLO-v3 改进综述
- 6.2 多scale方法改进与特征融合
- 6.3 经典变换方法对比分析
- 6.4 残差连接方法解读
- 6.5 整体网络模型架构分析
- 6.6 先验框设计改进
- 6.7 softmax层改进
6. YOLO-v3
**tips:**作者本人因为美军广泛运用于军事领域,所以决定不再继续开发YOLO系列。但是其他人还是继续往后做了~v8都有了
注意,原点值(x轴预测时间,y轴map)是50而不是0!YOLO-v3比其他的强很多!
6.1 YOLO-v3 改进综述
- 终于到 V3了,最大的改进就是网络结构,使其更适合小目标检测
- 特征做的更细致,融入多持续特征图信息来预测不同规格物体
- 先验框更丰富了,3种scale,每种3个规格,一共9种
- softmax改进,预测多标签任务:多分类改成很多个二分类
6.2 多scale方法改进与特征融合
从上到下依次是检测小、中、大物体
[外链图片转存中…(img-tcdXelFQ-1675132984921)]
6.3 经典变换方法对比分析
很明显,左图的图像金字塔更能满足多尺度特征融合的要求,但是YOLO的特点是速度快,因此这样反而不合适,那右图合适吗?我们接着往下看:
右图是YOLO-v3的核心思想,13 * 13 的特征图可以上采样成26 * 26的特征图,然后融合原来的26 * 26的特征图。
6.4 残差连接方法解读
右边的曲线图表示模型的卷积层并不是越多越好;左图就是resnet所提出的想法:残差连接
残差连接会自动检测出不适合的参数,然后跳过,总结就是一句话:至少不比原来差!
6.5 整体网络模型架构分析
[外链图片转存中…(img-E1iE52ku-1675132984924)]
所有的重复部分用2x,8x等表示出来了。下图表示出了残差连接的部分:上采样——》拼接——》卷积
6.6 先验框设计改进
[外链图片转存中…(img-Td8DWG3g-1675132984924)]
*13 13 * 3 * 85:
- 尺度13*13
- 3种先验框
- 85=80(类别)+4(x,y,w,h)+1(confidence置信度)
[外链图片转存中…(img-rCJDp7RE-1675132984925)]
还是用聚类选择的先验框
结果:
[外链图片转存中…(img-rFfQYa7R-1675132984925)]
6.7 softmax层改进
加了一个交叉熵损失
二分类任务:取阈值大于某个值的作为正确值。
[外链图片转存中…(img-k45c0d5b-1675132984926)]
CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)相关推荐
- 《PHP 5.5从零开始学(视频教学版)》源代码、视频下载
<PHP 5.5从零开始学(视频教学版)>源代码.教学视频下载地址: http://pan.baidu.com/s/1zt9hW 防止光盘在发布时老出丢失.压碎.划痕等错误.
- 百度Paddle免费课程——从零开始学视觉Transformer
百度Paddle免费课程--从零开始学视觉Transformer 课程内容如下: 很推荐这门课,原因如下: 学习笔记的百度网盘链接 本学习笔记来源于百度Paddle免费课程从零开始学视觉Transfo ...
- PyTorch 实现经典模型7:YOLO (v1, v2, v3, v4)
YOLO (v1, v2, v3, v4) 网络结构 YOLO v3 网络结构 代码 Ref <机器爱学习>YOLO v1深入理解 <机器爱学习>YOLOv2 / YOLO90 ...
- IC卡解密从零开始学1 (也许会有2) 解密工具V2 V3大放送 By:lookyour
IC卡解密从零开始学1 (也许会有2) 解密工具V2 V3大放送 By:lookyour 前段时间发了一个破解的PN532工具,详见 =========================== IC卡解密 ...
- 从零开始学Pytorch(零)之安装Pytorch
本文首发于公众号"计算机视觉cv" Pytorch优势 聊聊为什么使用Pytorch,个人觉得Pytorch比Tensorflow对新手更为友善,而且现在Pytorch在学术界 ...
- 从零开始学前端:jQuery官网 --- 今天你学习了吗?(CSS:Day26)
从零开始学前端:程序猿小白也可以完全掌握!-今天你学习了吗?(CSS) 复习:从零开始学前端:标签渐变和媒体查询 - 今天你学习了吗?(CSS:Day25) 文章目录 从零开始学前端:程序猿小白也可以 ...
- 区块链DApp从零开始学 (二) | 超详细 DApp创建 | 发行代币token | 宠物领养
初学记录 · 欢迎交流 区块链DApp从零开始学 (一) | DApp抓包 区块链DApp从零开始学 (二) | 超详细 DApp创建 | 发行代币token |宠物领养 区块链知识 (一) | 实例 ...
- IC卡解密从零开始学2 版本更新! 解密工具PN532-mfoc-mfcuk-GUI V2.1 By:lookyour
IC卡解密从零开始学2 版本更新! 解密工具PN532-mfoc-mfcuk-GUI V2.1 By:lookyour 程序更新 更新内容最下面 2017/5/3 V2.1 =========== ...
- 从零开始学人脸检测之Retinaface篇(内含魔改版GhostNet+mbv2)
从零开始学人脸检测之Retinaface篇(内含魔改版) 代码已开源,欢迎白嫖和star: github.com/pengtougu/Retinaface_Ghost 一.论文解读 论文研读工作由Sa ...
最新文章
- luogu P1345 [USACO5.4]奶牛的电信Telecowmunication(建图技巧 - “割点”模板 、最小割)
- 什么是HTTP Headers?
- 把html追加到指定id后面,javascript – jQuery,动态追加元素时增加id号
- SpringBoot2 整合 CXF 服务端和客户端
- Java枚举getDeclaringClass()方法与示例
- 26 SD配置-主数据-信用管理-指定信用控制区域及信用部分
- 在线文字图标logo文章封面图生成工具
- sap成本流怎么看_SAP FICO成本结算的流程到底是怎样的?
- oracle宣传片,会声会影X8震撼的宣传片效果该怎么制作?
- 城市信息学其五-空间经济学、城市信息学、和交通便利
- 基于Kears的Reuters新闻分类
- win7电脑蓝屏没有修复计算机,Win7旗舰版系统电脑老是出现蓝屏的修复教程
- 中国历代大大小小的皇帝(2)
- I2C协议研读(十)
- CJSON 使用介绍
- python爬取指定分辨率模特壁纸
- tZERO母公司Overstock股票五个月暴涨37倍背后:已深耕区块链业务数年
- delphi tclientdataset字段显示type mismatch
- 杰奇为什么只能用php5.2,杰奇小说1.7程序用php5.3
- Java获取代理地址和端口