一、YOLOV3相比上个版本有哪些改进策略?

答:1、加入了FPN结构 2、使用残差结构,这样可以构建更深的网络结构,由darknet19变成darknet53.

二、如何理解anchor boxes的作用?

答:1、关于anchor box最早是在faster-rcnn中出现,最早的目标检测都要金字塔多尺度+遍历滑窗的方式,逐尺度逐位置判断"这个尺度的这个位置处有没有认识的目标",非常笨重耗时。

fast-rcnn提出的RPN是一个conv3x3+两个并列的conv1x1,一边预测anchor中是否包含目标,一边预测目标框偏离固定anchor多远。

所以anchors的作用一方面是代替耗时的显式 的密集滑窗方法,另一方面式取代了显式SSP,解决多尺度问题,代替ssp,每个特征图上的点对应若干个anchors,这些anhors大小尺寸可以基本覆盖到检测目标此寸,范围。

而在yolo模型中anchors的作用也是类似的。

当然anchors优缺点如下:

1. 优点:

(1)使用anchor机制产生密集的anchor box,使得网络可直接在此基础上进行目标分类及边界框坐标回归;

(2)密集的anchor box可有效提高网络目标召回能力,对于小目标检测来说提升非常明显。

2. 缺点:

(1)anchor机制中,需要设定的超参:尺度(scale)和长宽比( aspect ratio)是比较难设计的。这需要较强的先验知识。

(2)冗余框非常之多:一张图像内的目标毕竟是有限的,基于每个anchor设定大量anchor box会产生大量的easy-sample,即完全不包含目标的背景框。这会造成正负样本严重不平衡问题,也是one-stage算法难以赶超two-stage算法的原因之一。

(3)网络实质上是看不见anchor box的,在anchor box的基础上进行边界回归更像是一种在范围比较小时候的强行记忆。

三、如何选择anchor boxes的

答:yolo上的anchor box的从第一个版本是借鉴了RPN网络,在此基础上做了些优化,RPN网络选择三组固定尺寸 宽高比分别为1:1,1:2和2:1 ,每个特征图上的点对应这九个anchor boxes,而yolo在这点上改进,通过对训练数据集的检测目标的尺寸聚类得到,这样做的好处是可以避免选择与训练目标尺寸相差太大的anchor box提高精度。

四、坐标预测方式

1、通过预测目标与anchor的偏移来预测,公式如下:

这里为什么会选sigmoid函数来作为中心点坐标预测方式,这样的目的是将目标的偏差约束在一个cell的范围,sigmoid的取值范围为[0,1]。

五、损失函数

yolov3的缺点_YOLOV3问答式解读相关推荐

  1. yolov3的缺点_YOLOv3:训练自己的数据(附优化与问题总结)

    如何批量检测? 可以看我github的修改,也可以按照下面的修改.修改传送门 首先在添加一个获取图片名字的函数: #include "darknet.h" #include sta ...

  2. 为企业门户提供问答式检索--------让系统能回答普通用户提出的问题

    为企业门户提供问答式检索    -------让系统能回答普通用户提出的问题    为网站提供一个全文搜索功能已是件很简单的事情,但是,就象GOOGLE,BAIDU一样,这类搜索 无论排序方式如何的优 ...

  3. 作业1丨创建问答式简历程序

    一个问答式简历程序 通过一句一句的提问获取用户的信息,生成一个格式化的简历 如例: 作业答案: 钻石价 5 折 当前隐藏内容需要支付 1悦币 已有101人支付 支付查看

  4. 问答式网络社区(ASK)

    问答式网络社区(ASK) 一.问答式网络社区(ASK)的概念 问答式网络社区是一种知识问答式网络社区,如百度知道.腾讯问间.新浪爱问.知乎网站等.在这些ASK社区中,用户可以提出问题,同时每一个人也都 ...

  5. 步进式解读RT-Thread所遵循的Apache许可证

    RT-Thread所遵循的Apache2.0协议你了解吗? 不了解也没关系,今天的文章将带大家逐层步进的去了解 Apache许可证. 我们知道,朋友之间或者有一定信任的人之间发生经济往来时(比如借贷或 ...

  6. yolov3损失函数改进_YOLOv3论文解析

    YOLOv3已经出来很久了,自己的文字检测也是用的YOLOv3完成的,最近一直被问到一些相关细节问题,自己不看源码也确实记不起来了,干脆就简单写下来好了.代码参考均来自于Github:keras-yo ...

  7. yolov3安卓实现_YOLOv3 的 TensorFlow 实现,GitHub 完整源码解析

    来自华盛顿大学的 Joseph Redmon 和 Ali Farhadi 提出的YOLOv3 通过在 YOLO 中加入设计细节的变化,这个新模型在取得相当准确率的情况下实现了检测速度的很大提升,一般它 ...

  8. HCNA基础篇问答式笔记整理

    @一.网络三要素的重要性 一.简述什么是网络. 网络是一种载体,承载各种各样应用程序产生的数据流量,通过介质发送,实现数据传 输,资源共享. 二.组成网络的三要素各是什么? 终端系统,中间系统,介质. ...

  9. C++ 博客专栏汇总 面试学习用 非突击问答式

    c和c++的区别 c++和java的区别 继承和多态区别 菱形继承 怎样实现多态? 虚函数表的原理1 虚函数表的原理2 -----好帖 c++对象内存分布 虚析构函数 构造函数为什么不定义为虚函数 构 ...

最新文章

  1. plotly可视化表格数据:以表格可视化pandas dataframe
  2. 周志华教授公布IJCAI 2021投稿量:4204篇,相比去年下降10%!
  3. iOS开发 - UITextView输入时高度自适应
  4. MySql设置外网访问
  5. 【数据竞赛】厦门国际银行 “数创金融杯”数据建模大赛-冠军分享
  6. HBase Shell 基本操作
  7. 1015 德才论 (25分)
  8. 【转】RocketMQ的一些特性(生产者消费者配置参数的含义)
  9. Android官方开发文档Training系列课程中文版:电池续航时间优化之检查、检测网络连接状态...
  10. Mysql 如何通过binlog日志恢复数据
  11. linux 线程就绪态_动手使用Linux就绪的Dell XPS 13开发人员版
  12. 数字通信系统相关基本概念(一)
  13. vue项目通讯录_vue组件--通讯录
  14. gamepad android,传说之下虚拟手柄
  15. Linux线程详解(概念、原理、实现方法、优缺点)
  16. 接口文档要写在概要设计里吗_概要设计报告怎么写
  17. matlab命令窗口汉字显示为乱码 添加绝对路径
  18. LeetCode 101Pro
  19. 3D体验平台品牌应用——ENOVIA
  20. 【MM小贴士】SAP 采购申请与采购订单的匹配关系

热门文章

  1. 2020年团体程序设计天梯赛-总决赛 L3-3 可怜的复杂度
  2. 局域网文件管理系统_生产设备日常巡检管理系统解决方案
  3. echarts怎么控制圆饼图的大小
  4. 构建嵌入式系统软件开发环境-VMware的安装及搭建嵌入式Linux开发环境
  5. tr 去除空行_Shell去除空格和空行的方法
  6. Django项目的调试
  7. 用友T3 批处理开启防火墙 1433 4630端口
  8. 序列(sequence)
  9. python wifi 切换网络
  10. arcpy 批量读取shp文件属性表、中心点,范围边界点