冻结pytorch的网络有两种方式

1. 冻结方式一:lr=0

caffe反正是这么写的,具体方式如下

model_params = [{'params': base_params, 'lr': 0}, # 注释【1】{'params': new_params, 'lr': cfg.SOLVER.BASE_LR * cfg.SOLVER.LR_MULTIPLE}]
# base_params和new_params都是提前设定好的
#然后初始化优化器
optimizer = torch.optim.SGD(model_params,lr=solver.BASE_LR * lr_multi,momentum=solver.MOMENTUM,weight_decay=solver.WEIGHT_DECAY)

【1】干脆不设置这一组也是可以的

2. 冻结方式二:require_grad=False

pytorch和mxnet都提供了相似的接口

for p in model.named_parameters():if p[0] in match_layers:p[1].requires_grad = False

3. 补充:只冻结主干网络的方法

 #假设主干网络是model.module.mobilenet,backbone=mobilenettry:sub_model = eval('model.module.' + backbone)#也等同于 model.module.mobilenet.eval()sub_model.eval()except Exception as e:pass

冻结网络pytorch相关推荐

  1. keras冻结_Keras 实现加载预训练模型并冻结网络的层

    在解决一个任务时,我会选择加载预训练模型并逐步fine-tune.比如,分类任务中,优异的深度学习网络有很多. ResNet, VGG, Xception等等... 并且这些模型参数已经在imagen ...

  2. ResNet残差网络Pytorch实现——对花的种类进行训练

    ResNet残差网络Pytorch实现--对花的种类进行训练 上一篇:[结合各个残差块] ✌✌✌✌ [目录] ✌✌✌✌ 下一篇:[对花的种类进行单数据预测] 大学生一枚,最近在学习神经网络,写这篇文章 ...

  3. 【医学图像分割网络】之Res U-Net网络PyTorch复现

    [医学图像分割网络]之Res U-Net网络PyTorch复现 1.内容 U-Net网络算是医学图像分割领域的开山之作,我接触深度学习到现在大概将近大半年时间,看到了很多基于U-Net网络的变体,后续 ...

  4. CNN经典之VGG网络+PyTorch复现

    一.前情说明: 写在前面的话 本系列博客在于汇总CSDN的精华帖,类似自用笔记,方便以后的复习回顾,博文中的引用都注明出处,并点赞收藏原博主. 博客大致分为两部分,第一部是转载于<雪饼>大 ...

  5. 使用SAGAN生成二次元人物头像(GAN生成对抗网络)--pytorch实现

    这是训练250epoch左右的成果. 之前的文章里面,我们使用了残差网络的形式实现生成器与辨别器,它理论上可以实现很不错的效果,但有一个很致命的缺点,就是训练太慢,很难见到成果. 这一次,我们实现了一 ...

  6. GAN-生成对抗网络(Pytorch)合集(2)--pixtopix-CycleGAN

    pixtopix(像素到像素) 原文连接:https://arxiv.org/pdf/1611.07004.pdf 输入一个域的图片转换为另一个域的图片(白天照片转成黑夜) 如下图,输入标记图片,输出 ...

  7. pytorch训练网络冻结某些层

    引言:首先我们应该很清楚地知道冻结网络中的某些层有什么作用?如何进行相关的冻结设置?代码何如呢? 话不多说说,首先我们探讨第一个问题: 1.冻结网络的某些层有什么作用? 这个问题顾名思义就是冻结网络中 ...

  8. Pytorch:图像语义分割-FCN, U-Net, SegNet, 预训练网络

    Pytorch: 图像语义分割-FCN, U-Net, SegNet, 预训练网络 Copyright: Jingmin Wei, Pattern Recognition and Intelligen ...

  9. Pytorch实现FCN图像语义分割网络

    针对图像的语义分割网络,本节将介绍PyTorch中已经预训练好网络的使用方式,然后使用VOC2012数据集训练一个FCN语义分割网络. 一.使用预训练好的语义分割网络 PyTorch提供了已预训练好的 ...

最新文章

  1. 任务型对话系统预训练最新研究进展
  2. 谢烟客---------Linux之DNS服务系统的基础知识
  3. 关于开源产业的5个真相
  4. CSS 元素超出部分滚动, 并隐藏滚动条
  5. Cesium:通过字符串创建颜色
  6. P1491 集合位置
  7. html与word字体大小转换,word字号大小对照表 Word里面打印字体要多大???
  8. 美国大学生数学建模竞赛O奖最高级别国家一等奖论文超全资料分享写作排版编程建模全覆盖资料参赛真实经历小白必拥有
  9. 20200726 plecs 元件显示变量名
  10. Ucos操作系统任务优先级分配原则
  11. STM32学习——GPIO应用之按键实验
  12. 我理解的Sentinel:时间窗统计
  13. RabbitMQ-官方指南-RabbitMQ配置
  14. 香港云服务器安全吗?
  15. 怎么做简单版ps碎片飞溅效果
  16. CCNet: Criss-Cross Attention for Semantic Segmentation论文解读
  17. html版本绩拼音怎么写,绩这个字怎么读、绩怎么念、绩怎么拼音、绩怎么组词...
  18. Opencv项目实战:09 物体尺寸测量
  19. 爬虫120例之第17例,用Python面向对象的思路,采集各种精彩句子
  20. SVM与K-Means

热门文章

  1. HttpClient入门教程
  2. Spark综合小案例之莎士比亚诗文集词频统计
  3. 关于Java静态成员变量和静态初始化块等的初始化顺序的详细介绍
  4. mfgtools工具BootStrap阶段使用文件的介绍
  5. python----计算邮资问题
  6. 一个老程序员分析程序员为什么会跳槽
  7. 绿地深蓝机器人_打败世界冠军的深蓝机器人
  8. zephyr-os 线程
  9. 段码液晶屏的信号响应时间为多少好?
  10. Interspeech 2022丨FFSVC 2022 远场说话人识别比赛