1. Adam:
    init_lr=5e-4(3e-4)(⭐⭐⭐⭐⭐),3e-4号称是Adam最好的初始学习率,有理有据,请看下图;SGD就更考验调参功力,这里就不详说(因为我也一般般)。

  2. finetune,微调也是有许多比较fancy的技巧,在这里不做优劣比较,针对分类任务说明。

  • 微调方式一,最常用,只替换掉最后一层fc layer,改成本任务里训练集的类别数目,然后不做其余特殊处理,直接开始训练;

  • 微调方式二,在微调一的基础上,freeze backbone的参数,只更新(预训练)新的fc layer的参数(更新的参数量少,训练更快)到收敛为止,之后再放开所有层的参数,再一起训练;

  • 微调方式三,在微调方式二预训练fc layer之后或者直接就是微调方式一,可选择接上差分学习率(discriminative learning rates)即更新backbone参数和新fc layer的参数所使用的学习率是不一致的,一般可选择差异10倍,理由是backbone的参数是基于imagenet训练的,参数足够优秀同时泛化性也会更好,所以是希望得到微调即可,不需要太大的变化。

  • 微调方式四,freeze浅层,训练深层(如可以不更新resnet前两个resnet block的参数,只更新其余的参数,一样是为了增强泛化,减少过拟合)。

  1. Find the best init_lr,前面说到3e-4在Adam是较优的init_lr,那么如何寻找最好的init_lr?
  • 选取loss function仍在明显降低的较大的学习速率,优劣性其实也是相对而言,不一定都是最好的。

Kaggle调参技巧整理相关推荐

  1. XGBoost调参技巧(二)Titanic实战Top9%

    学习Kaggle的第一个比赛就是Titanic,断断续续的半年时间,从小白到杀入9%.XGBoost果真是Kaggle杀器,帮我在Titanic中进入9%.zillow进入22%. 简介 Titani ...

  2. 深度学习这么调参训练_聊一聊深度学习中的调参技巧?

    本期问题能否聊一聊深度学习中的调参技巧? 我们主要从以下几个方面来讲.1. 深度学习中有哪些参数需要调? 2. 深度学习在什么时候需要动用调参技巧?又如何调参? 3. 训练网络的一般过程是什么? 1. ...

  3. 手把手写深度学习(18):finetune微调CLIP模型的原理、代码、调参技巧

    前言:在前面的博客<手把手写深度学习(16):用CILP预训练模型搭建图文检索系统/以图搜图/关键词检索系统>中介绍了如何在图文检索.以图搜图.关键词检索等任务中使用CLIP.这篇博客重点 ...

  4. 深度学习网络调参技巧

    深度学习网络调参技巧 本文转载自[炼丹实验室],讲了一些深度学习训练的技巧,其中包含了部分调参心得:深度学习训练心得.不过由于一般深度学习实验,相比普通机器学习任务,时间较长,因此调参技巧就显得尤为重 ...

  5. 深度卷积神经网络(CNN tricks)调参技巧

    (53条消息) 深度卷积神经网络(CNN tricks)调参技巧(一)学习率调节_踏雪飞鸿的博客-CSDN博客https://blog.csdn.net/weixin_38957591/article ...

  6. 天下苦深度强化学习久矣,这有一份训练与调参技巧手册

    ©作者 | 申岳 单位 | 北京邮电大学 研究方向 | 机器人学习 天下苦 RL 久矣,其中最苦的地方莫过于训练和调参了,人人欲"调"之而后快. 在此为 RL 社区贡献一点绵薄之力 ...

  7. 漫谈机器学习的【泛化能力】【模型能力】【调参技巧】_CodingPark编程公园

    漫谈机器学习 完成第一幅初稿 完成终稿 1945年12月5日 1946年1月17日 前言 上面的画就是20世纪最著名的抽象派画家毕加索于1946年1月17日完稿的画作--公牛,寥寥几笔,勾勒出公牛的& ...

  8. 深度学习调参技巧总结

    深度学习调参技巧总结 做dl也有一段时间了,积累了一些经验,也在网上看到一些别人的经验.  为了面试,结合知乎上面的问答,我也总结了一下,欢迎大家补充. 知乎 深度学习调参有哪些技巧? 一. 初始化  ...

  9. 深度学习这么调参训练_深度学习调参技巧

    训练技巧对深度学习来说是非常重要的,作为一门实验性质很强的科学,同样的网络结构使用不同的训练方法训练,结果可能会有很大的差异.这里我总结了近一年来的炼丹心得,分享给大家,也欢迎大家补充指正. 参数初始 ...

最新文章

  1. 【 MATLAB 】fliplr 函数介绍(从左到右翻转阵列)
  2. 【PHP】循环 调用第三方API (curl ),性能优化
  3. 科技文明等级那一级有量子计算机,人类科技在宇宙中属于几级文明,最高级文明多强?...
  4. 表达式如何获取复选框的值_Nuke表达式 Expression节点讲解
  5. 洛谷T172100 商店-贪心
  6. MYSQL中取当前周/月/季/年的第一天与最后一天
  7. using的一种用法
  8. sqlserver 还原bak文件 查看不到_SQL还原数据库备份方法
  9. 过滤钩子驱动程序一(微软DDK文档,FLASHSKY翻译) (转)
  10. 小鹤双拼入门和小鹤音形的搜狗输入法配置方法
  11. 浙江学生头戴“金箍”,上课走神自动通知家长
  12. 【图像加密】基于多种混沌序列Logistic+Tent+Kent+Hent实现图像加密与解密含Matlab源码
  13. 十年风雨,一个普通程序员的成长之路(三)铜陵:大雪与加班
  14. 【Linux】写实拷贝、父子进程间数据共享以及僵死进程
  15. torch.nn.Conv2d() 用法讲解
  16. Spring Cloud架构教程 (六)消息驱动的微服务【Dalston版】
  17. 高版本android怎么玩低版本游戏,手机玩安卓系统安装变态版手游常见问题解决方法_android游戏安装教程详解...
  18. (附源码)计算机毕业设计SSM基于web的图书借阅管理系统
  19. 基于java的自动排课系统
  20. js随机排列图片顺序

热门文章

  1. 蓝湖、Cutterman使用方法
  2. HierarchyView
  3. Shopify 基础须知
  4. python做视频抽帧图_利用Python和ffmpeg从视频中抽帧,此方法比opencv抽帧法快。
  5. 双屏 = 双倍快乐?ThinkBook Plus 评测
  6. sysbench 压测
  7. WCF Data transfer buffered VS streamed
  8. mysql连接字符串db2_ADO.NET入门教程(三) 连接字符串,你小觑了吗?
  9. 大数据各组件安装(数据中台搭建)
  10. excel表格xlsx解开加密软件,excel表格xlsx不能复制打印怎么办?