yolov3的缺点_YOLOV3问答式解读
一、YOLOV3相比上个版本有哪些改进策略?
答:1、加入了FPN结构 2、使用残差结构,这样可以构建更深的网络结构,由darknet19变成darknet53.
二、如何理解anchor boxes的作用?
答:1、关于anchor box最早是在faster-rcnn中出现,最早的目标检测都要金字塔多尺度+遍历滑窗的方式,逐尺度逐位置判断"这个尺度的这个位置处有没有认识的目标",非常笨重耗时。
fast-rcnn提出的RPN是一个conv3x3+两个并列的conv1x1,一边预测anchor中是否包含目标,一边预测目标框偏离固定anchor多远。
所以anchors的作用一方面是代替耗时的显式 的密集滑窗方法,另一方面式取代了显式SSP,解决多尺度问题,代替ssp,每个特征图上的点对应若干个anchors,这些anhors大小尺寸可以基本覆盖到检测目标此寸,范围。
而在yolo模型中anchors的作用也是类似的。
当然anchors优缺点如下:
1. 优点:
(1)使用anchor机制产生密集的anchor box,使得网络可直接在此基础上进行目标分类及边界框坐标回归;
(2)密集的anchor box可有效提高网络目标召回能力,对于小目标检测来说提升非常明显。
2. 缺点:
(1)anchor机制中,需要设定的超参:尺度(scale)和长宽比( aspect ratio)是比较难设计的。这需要较强的先验知识。
(2)冗余框非常之多:一张图像内的目标毕竟是有限的,基于每个anchor设定大量anchor box会产生大量的easy-sample,即完全不包含目标的背景框。这会造成正负样本严重不平衡问题,也是one-stage算法难以赶超two-stage算法的原因之一。
(3)网络实质上是看不见anchor box的,在anchor box的基础上进行边界回归更像是一种在范围比较小时候的强行记忆。
三、如何选择anchor boxes的
答:yolo上的anchor box的从第一个版本是借鉴了RPN网络,在此基础上做了些优化,RPN网络选择三组固定尺寸 宽高比分别为1:1,1:2和2:1 ,每个特征图上的点对应这九个anchor boxes,而yolo在这点上改进,通过对训练数据集的检测目标的尺寸聚类得到,这样做的好处是可以避免选择与训练目标尺寸相差太大的anchor box提高精度。
四、坐标预测方式
1、通过预测目标与anchor的偏移来预测,公式如下:
这里为什么会选sigmoid函数来作为中心点坐标预测方式,这样的目的是将目标的偏差约束在一个cell的范围,sigmoid的取值范围为[0,1]。
五、损失函数
yolov3的缺点_YOLOV3问答式解读相关推荐
- yolov3的缺点_YOLOv3:训练自己的数据(附优化与问题总结)
如何批量检测? 可以看我github的修改,也可以按照下面的修改.修改传送门 首先在添加一个获取图片名字的函数: #include "darknet.h" #include sta ...
- 为企业门户提供问答式检索--------让系统能回答普通用户提出的问题
为企业门户提供问答式检索 -------让系统能回答普通用户提出的问题 为网站提供一个全文搜索功能已是件很简单的事情,但是,就象GOOGLE,BAIDU一样,这类搜索 无论排序方式如何的优 ...
- 作业1丨创建问答式简历程序
一个问答式简历程序 通过一句一句的提问获取用户的信息,生成一个格式化的简历 如例: 作业答案: 钻石价 5 折 当前隐藏内容需要支付 1悦币 已有101人支付 支付查看
- 问答式网络社区(ASK)
问答式网络社区(ASK) 一.问答式网络社区(ASK)的概念 问答式网络社区是一种知识问答式网络社区,如百度知道.腾讯问间.新浪爱问.知乎网站等.在这些ASK社区中,用户可以提出问题,同时每一个人也都 ...
- 步进式解读RT-Thread所遵循的Apache许可证
RT-Thread所遵循的Apache2.0协议你了解吗? 不了解也没关系,今天的文章将带大家逐层步进的去了解 Apache许可证. 我们知道,朋友之间或者有一定信任的人之间发生经济往来时(比如借贷或 ...
- yolov3损失函数改进_YOLOv3论文解析
YOLOv3已经出来很久了,自己的文字检测也是用的YOLOv3完成的,最近一直被问到一些相关细节问题,自己不看源码也确实记不起来了,干脆就简单写下来好了.代码参考均来自于Github:keras-yo ...
- yolov3安卓实现_YOLOv3 的 TensorFlow 实现,GitHub 完整源码解析
来自华盛顿大学的 Joseph Redmon 和 Ali Farhadi 提出的YOLOv3 通过在 YOLO 中加入设计细节的变化,这个新模型在取得相当准确率的情况下实现了检测速度的很大提升,一般它 ...
- HCNA基础篇问答式笔记整理
@一.网络三要素的重要性 一.简述什么是网络. 网络是一种载体,承载各种各样应用程序产生的数据流量,通过介质发送,实现数据传 输,资源共享. 二.组成网络的三要素各是什么? 终端系统,中间系统,介质. ...
- C++ 博客专栏汇总 面试学习用 非突击问答式
c和c++的区别 c++和java的区别 继承和多态区别 菱形继承 怎样实现多态? 虚函数表的原理1 虚函数表的原理2 -----好帖 c++对象内存分布 虚析构函数 构造函数为什么不定义为虚函数 构 ...
最新文章
- plotly可视化表格数据:以表格可视化pandas dataframe
- 周志华教授公布IJCAI 2021投稿量:4204篇,相比去年下降10%!
- iOS开发 - UITextView输入时高度自适应
- MySql设置外网访问
- 【数据竞赛】厦门国际银行 “数创金融杯”数据建模大赛-冠军分享
- HBase Shell 基本操作
- 1015 德才论 (25分)
- 【转】RocketMQ的一些特性(生产者消费者配置参数的含义)
- Android官方开发文档Training系列课程中文版:电池续航时间优化之检查、检测网络连接状态...
- Mysql 如何通过binlog日志恢复数据
- linux 线程就绪态_动手使用Linux就绪的Dell XPS 13开发人员版
- 数字通信系统相关基本概念(一)
- vue项目通讯录_vue组件--通讯录
- gamepad android,传说之下虚拟手柄
- Linux线程详解(概念、原理、实现方法、优缺点)
- 接口文档要写在概要设计里吗_概要设计报告怎么写
- matlab命令窗口汉字显示为乱码 添加绝对路径
- LeetCode 101Pro
- 3D体验平台品牌应用——ENOVIA
- 【MM小贴士】SAP 采购申请与采购订单的匹配关系