model {faster_rcnn {num_classes: 3  //获取要识别的类数image_resizer {keep_aspect_ratio_resizer {min_dimension: 128  //最小的图片像素max_dimension: 1024  //最大的图片像素}}feature_extractor {  // 特征提取的配置type: "faster_rcnn_resnet101"first_stage_features_stride: 16  //rpn特征图的输出}first_stage_anchor_generator {  //构建Anchorgrid_anchor_generator {  //构建过程二选一,是使用grid_anchor_generator还是ssd_anchor_generator 使用传入的参数对grid_anchor_generator进行初始化height_stride: 16  //锚点的高度 default = 16width_stride: 16  //锚点的高度 default = 16scales: 0.1scales: 0.25scales: 0.5scales: 0.75scales: 1.0scales: 2.0aspect_ratios: 0.5aspect_ratios: 1.0aspect_ratios: 1.5aspect_ratios: 2.0}}first_stage_box_predictor_conv_hyperparams {  //卷积神经网络的参数op: CONVregularizer {l2_regularizer {  //选择一种归一化方法weight: 0.00002}}initializer {truncated_normal_initializer { //选择一种初始化方法stddev: 0.00999999977648}}}first_stage_nms_score_threshold: 0.0 //用于第一层的nms的值 default=0.0first_stage_nms_iou_threshold: 0.66  //第一层中重叠率的阈值  default=0.7first_stage_max_proposals: 100  //多少个rpn提出的nms进入第二阶段 default=300first_stage_localization_loss_weight: 2.0  //第一阶段的定位的损失权重在反向中的比例  default=1.0first_stage_objectness_loss_weight: 1.0  第一阶段总物品判断的损失比例 default=1.0initial_crop_size: 14  //ROI 池化层上切取的输出的大小maxpool_kernel_size: 2  //在ROI pooling上切取的feature map上进行池化是的核的大小maxpool_stride: 2  // 上面的有了核的大小,现在是步长second_stage_box_predictor {  //第二个识别阶段的参数mask_rcnn_box_predictor {fc_hyperparams {op: FCregularizer {l2_regularizer {weight: 0.0000012}}initializer {  //初始化权重的方式variance_scaling_initializer {  //选择一种初始化方法factor: 1.0uniform: truemode: FAN_AVG}}}use_dropout: truedropout_keep_probability: 1.0}}second_stage_post_processing {  //在第二阶段的box的预测上的预处理batch_non_max_suppression {score_threshold: 0.300000011921  //前景box的最低阈值 default = 0.0iou_threshold: 0.600000023842  //进行融合是的IOU阈值 default = 0.6max_detections_per_class: 40  //每一个类别最多返回多少个检测 default = 100max_total_detections: 40  // 总共最多返回多少个 default = 100}score_converter: SOFTMAX  // Score converter to use}second_stage_localization_loss_weight: 2.0  //第二阶段定位的损失比例second_stage_classification_loss_weight: 1.0  //第二阶段的识别的损失比例}
}
train_config {batch_size: 1data_augmentation_options {  // 数据扩容的选项random_horizontal_flip {}}data_augmentation_options {random_crop_image {}}data_augmentation_options {random_adjust_brightness {}}optimizer {momentum_optimizer {learning_rate {manual_step_learning_rate {initial_learning_rate: 0.000300000014249schedule {step: 1learning_rate: 0.000300000014249}schedule {step: 900000learning_rate: 2.99999992421e-05}schedule {step: 1200000learning_rate: 3.00000010611e-06}}}momentum_optimizer_value: 0.8666625}use_moving_average: false  // default=false}gradient_clipping_by_norm: 10.0   如果大于0,在将梯度在这个值进行截断fine_tune_checkpoint: "/********/model.ckpt"// 如果是从一个检测(detection)模型进行恢复,则分类// 数量必须相等,如果不定则检查点要从一个识别(classification)模型恢复from_detection_checkpoint: true  //default=false
}

 num_classes: 该参数为必调项,与该模型设计需要检测的缺陷种类数量相同。
 image_resizer: 该参数为原始图像的缩放尺寸指示,通常有两种配置方式:
 keep_aspect_ratio_resizer:输入图像的大小是可变的,但是需要保持长宽比,
它有两个子参数:min_dimension和max_dimension,表示最小和最大维度,例如:
min_dimension :800
max_dimension:1000
image_resizer配置-固定长宽比
其含义是对于任一个图片,最短的边最小是800,最长的边最大是1024。举例:假设输入的图像尺寸是100 * 100,则会调整到800 * 800;输入为2000 * 2000,会调整为1024 * 1024,输入为900 * 1000,则首先会将短边调整到800,然后长边按比例调整到(800 / 900) * 1000。
 feature_extractor:表示用于特征提取的backbone网络的选型
First_stage_features_stride表示第一阶段特征提取步长,根据经验,训练时可以保持 16 不变,如果待检测目标比较密集且较小,则可以尝试将其修改为8,以降低特征提取步长,提高特征提取密度,从而提升模型效果。修改为4的话会导致及结算量巨大,而且容易导致训练的过度抖动,难以拟合,因此建议最小改成8。
 first_stage_anchor_generator:用于指示在RPN网络在feature map上生成锚点的策略。
对RPN的性能有较大影响,因为它直接影响着提取出来的候选框区域的数量、大小、密度等因素。如果生成的proposals太少,或者尺度不合理,则可能导致对于大小目标检测的失衡,或者对部分目标的漏检;而设置的太多,则又会增加训练难度,加大运算量,同时使得RPN网络拟合困难。因此,需要根据具体情况具体分析后,结合经验值进行合理的设定。
first_stage_anchor_generator {
grid_anchor_generator {
height_stride: 16
width_stride: 16
scales: 0.1
scales: 0.25
scales: 0.5
scales: 1.0
scales: 2.0
aspect_ratios: 0.5
aspect_ratios: 1.0
aspect_ratios: 1.5
aspect_ratios: 2.0
}
}
相邻的Anchor中心点横向间隔为16,纵向间隔也是16。
对于每一个anchor中心点,以它为中心围绕其生成20个anchor。这20个anchor的尺寸分别为0.1, 0.25,0.5,1.0,2.0;长宽比分别为0.5,1.0,1.5,2.0。也就是说,分别会以中心点坐标为中心,生成长0.1,宽0.10.5;长0.10.5,宽0.1 … … 的共20个anchor,所有的长宽分别是[scales] x [aspect_ratios]。
在模型训练时,可通过加密scales以及aspec_ratios来对RPN网络产生影响,但是要注意把握计算量、训练拟合难度、数据特征等因素质检的权衡,否则很容易导致模型的RPN网络不收敛,从而使得训练一直震荡。

maskRcnn 参数相关推荐

  1. 目标分割:Mask RCNN

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 目标分割:Mask RCNN 目标分割:Mask RCNN 气 ...

  2. 1小时上手MaskRCNN·Keras开源实战 | 深度应用

    作者 | 小宋是呢 来源 | CSDN博客 0. 前言介绍 开源地址: https://github.com/matterport/Mask_RCNN 个人主页: http://www.yansong ...

  3. 轻松学Pytorch – 行人检测Mask-RCNN模型训练与使用

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 大家好,这个是轻松学Pytorch的第20篇的文章分享,主要是给大 ...

  4. WIN10python3.7配置MaskRCNN环境及demo测试(tensorflow-gpu1.x)

    WIN10python3.7配置MaskRCNN环境及demo测试(tensorflow-gpu1.x) 一.工具 二. 环境搭建 三.下载mask_R-CNN 四.运行demo进行测试 #本文参考了 ...

  5. mask rcnn算法分析_在modelarts上部署mask-rcnn模型

    最近老山完成了对mask-rcnn在modelarts上的部署,部署模型来自于这个项目.部署的过程大体和我的上篇文章使用modelarts部署bert命名实体识别模型相似,许多细节也不在赘述.这篇文章 ...

  6. 【Pytorch神经网络实战案例】26 MaskR-CNN内置模型实现目标检测

    1 Pytorch中的目标检测内置模型 在torchvision库下的modelsldetecton目录中,找到__int__.py文件.该文件中存放着可以导出的PyTorch内置的目标检测模型. 2 ...

  7. 张航、李沐等人提出ResNet最强改进版:性能提高3%,参数不增

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :机器之心 AI博士笔记系列 ...

  8. 在modelarts上部署mask-rcnn模型

    最近老山完成了对mask-rcnn在modelarts上的部署,部署模型来自于这个项目.部署的过程大体和我的上篇文章使用modelarts部署bert命名实体识别模型相似,许多细节也不在赘述.这篇文章 ...

  9. 超越Mask-RCNN:谷歌大脑的AI,自己写了个目标检测AI

    方栗子 发自 凹非寺 量子位 出品 | 公众号 QbitAI 这是一只AI生出的小AI. 谷歌大脑的Quoc Le团队,用神经网络架构搜索 (NAS) ,发现了一个目标检测模型.长这样: △ 看不清请 ...

最新文章

  1. jQuery中的Ajax----03
  2. python输入函数格式_python如何提取.c文件中的指定函数的输入参数
  3. Java经典面试题总结(一)
  4. 多案分库分表带来的问题-分布式事务
  5. 使用HANA studio创建XS project
  6. acer软件保护卡清除工具clear_使用Windows 10内置工具释放硬盘空间的最佳方法
  7. 【转】const int *p和int * const p的区别(常量指针与指向常量的指针)
  8. Java怎么去最高分最低分,深入java虚拟机:原子操作ParkEvent和Parker
  9. Python3 内建模块 hashlib、itertools、HTMLParser、urllib
  10. 雷军微博点名夸黑鲨2 强烈建议“提前备货”
  11. jupyter报错Invalid credentials
  12. 提前俯瞰应用变现行业前景,抢占未来先机
  13. Codeforces Round #666 (Div. 2)B. Power Sequence(等比数列)
  14. NSThread、Cocoa NSOperation
  15. KITTI数据集简介与使用
  16. java面经_Java面经
  17. HDU 4173(计算几何
  18. 【2018华科机试】十二进制
  19. mysql rds 是什么_mysql.rds.aliyuncs.com
  20. Android初级教程调用手机拍照与摄像功能

热门文章

  1. ADC0808/ADC0809引脚图及功能和工作原理介绍
  2. 综合布线的六大子系统
  3. python人口数据_python获取人口数据(500m网格)GeoQ智图api
  4. 缓解压力,情绪低落食品
  5. 1一1剖面图方向_方向在哪里?(阶段性总结1)
  6. 考研数一数二数三之间的具体详细区别
  7. Axure RP 9滚动条制作
  8. Linux的MySQL用户编程使用_MySQL数据库在linux的安装,编程与操作
  9. WriteProcessMemory
  10. android 对讲功能开发,关于Android辅助功能对讲 . 是否有任何对讲焦点听众?