最近研究一个文本检测网络时,用到了RFCN,但是发现pytorch版本没有简洁的实现版本,故复现论文并开源在github上:
项目链接

结构分析

RFCN以ResNet101为backbone,从layer3输出的特征用于训练RPN; layer4中的步长被更改为stride=1, 使用空洞卷积替换,整个resnet101的下采样倍数为16x,输出特征用于训练PsRoI Head.

PsRoI 与 RoI 相似,只是不同位置的感兴趣区域的特征分别从不同输入通道上获取,使用cuda实现时主要将输入特征索引匹配好。

PyTorch实现

Pytorch实现主要把握PsRoI的cuda实现,注:实验发现PyTorch自带的PsROI模块输入和反传结果与MxNet不一致,mAP也低了约5个点,也没有group_size选项,故使用了自己写的PsROI模块。

将RPN和PsROI Head 进行联合训练

  • 在voc2007上训练,使用OHEM,在voc2007上测试mAP可达72.5%(论文为voc07+12训练)
  • 在voc07+12训练还可提升近5个点

==>项目指路:
https://github.com/elbert-xiao/Simple-RFCN-PyTorch

该项目完全基于PyTorch实现,内存占用非常小(训练时约为3GB),效果还不错。欢迎查看交流,star or fork . ^_^

RFCN 论文要点与PyTorch实现相关推荐

  1. WS_DAN论文要点理解

    近期在学习See Better Before Looking Closer: Weakly Supervised Data Augmentation Network for Fine-Grained ...

  2. 深度人脸识别:CVPR2020论文要点

    深度人脸识别:CVPR2020论文要点 Towards Universal Representation Learning for Deep Face Recognition 论文链接:https:/ ...

  3. 一段话描述相控阵论文要点(持续学习更新中...)

    一段话描述相控阵论文要点(持续学习更新中...) 2109005-许唐红,詹珍贤,胡帅帅,宋豪.T/R组件阻抗失配对相控阵天线性能的影响[J].微波学报,2021,37(03):82-84+98. 分 ...

  4. AlexNet论文解读以Pytorch实现(含论文训练细节)

    AlexNet论文解读以Pytorch实现 一.AlexNet背景 1.ILSVRC 2.GPU 二.AlexNet研究成果及意义 1.研究成果 2.研究意义 三.AlexNet网络结构 1.网络结构 ...

  5. [时序波动关联]模型CoFLUX论文要点整理

    时序波动关联模型CoFLUX论文要点整理 简介 在互联网公司里面,通常都会监控成千上万的时间序列,用于保障整个系统或者平台的稳定性.在这种情况下,如果能够对多条时间序列之间判断其是否相关,则对于监控而 ...

  6. R-FCN论文解读及难点理解

    原文:R-FCN:https://arxiv.org/abs/1605.06409 Github链接:https://github.com/daijifeng001/r-fcn(https://git ...

  7. ResNet论文笔记及Pytorch代码解析

    注:个人学习记录 感谢B站up主"同济子豪兄"的精彩讲解,参考视频的记录 [精读AI论文]ResNet深度残差网络_哔哩哔哩_bilibili 算法的意义(大概介绍) CV史上的技 ...

  8. 论文笔记及Pytorch复现:A Dual-Stage Attention-Based Recurrent Neural Network for Time Series Prediction

    论文地址 GitHub代码地址 论文题目为<基于双阶段注意力机制的循环神经网络>,文章本质上还是基于Seq2Seq的模型,结合了注意力机制实现的时间序列的预测方法,文章的一大亮点是:不仅在 ...

  9. RFCN论文阅读笔记

    论文地址 R-FCN: Object Detection via Region-based Fully Convolutional Networks 内容 经典的基于区域的检测器faster-rcnn ...

最新文章

  1. Docker安装Hadoop
  2. element ui 图片上传_游民晚播报:PS5手柄续航情况测试 UI界面概览放出
  3. 通过调用API函数实现的无边框窗体的拖拽,比判断坐标更快捷
  4. 数据拆分缺点和解决方案
  5. SWFUpload V2.2.0 说明文档
  6. html内容权重计算,HTML CSS 选择器权重计算规则
  7. maven中pom文件中scope的作用
  8. etcd nginx 容器_Etcd+confd实现动态修改nginx文件
  9. wildfly access log 开启
  10. python信息安全书籍_2018年信息安全从业者书单推荐
  11. Java实现视频编码格式转换(转libx264编码格式)
  12. win10自带录屏工具
  13. 计算机bios更改usb端口,联想电脑bios怎么设置usb接口
  14. python卡方检验 scipy_卡方检验的scipy实现
  15. 推荐系统-推荐冷启动问题
  16. Linux安装zabbix4
  17. Python基础练习题目
  18. C语言实现汉诺塔问题(保姆式讲解)
  19. 使用tushare检验沪深300收益率和中证500收益率相关性
  20. 企业级360°全方位用户画像:标签系统[四]

热门文章

  1. 第三章 NTP时间服务
  2. 学c语言要先学什么,C语言入门要先学什么,你知道怎么入手吗?
  3. 词霸天下---词根229【-rud- 原始,粗野】
  4. Gin blog 总结1
  5. react+hook函数组件实现表单添加数据,表格展现
  6. 怎么批量打印CAD图纸?打印需要注意哪些问题。
  7. Mybatis基础知识
  8. 运动控制:台达驱动器下载参数失败
  9. 领导者与管理者有什么区别?
  10. 外呼系统是怎么帮助销售提升电销效率的?