loss问题——工作中对出现的loss问题描述与解决参考
问题一:loss跑飞
如下图描述
1、学习率(lr)过大,可以自定义一个学习率的值(较小)开始学习。
参考blog:https://blog.csdn.net/CHNguoshiwushuang/article/details/81784299
也就是说,学习率如果设置过大,会导致其直接跑到另外一边,从而导致loss跑飞。当然真实的loss变化是在一个奇异空间里的,不是图上的那种二维曲线。
设置学习率的方法:https://blog.csdn.net/mao_feng/article/details/52902666
2、训练与测试数据出现了偏差。
这个问题其实很容易遇到,
原因有:1.数据打标不准确,存在错误的label.
2.划分数据集没有使数据分布均匀,导致traindata,valdata,testdata数据独立。
等等
3、梯度更新出现问题,爆炸或者消失。
同理,因为初始学习率设置不合理,loss震荡后,梯度回传受阻,所以此时finetune会导致loss无法回来(梯度回传受阻,参数无法有效更新),只能不断向上,从而出现跑飞的情况。
*******************************************************************************************************************************************
问题二:loss不收敛
参考:https://blog.csdn.net/comway_li/article/details/81878400
很多同学会发现,为什么我训练网络的时候loss一直居高不下或者准确度时高时低,震荡趋势,一会到11,一会又0.1,不收敛。 又不知如何解决,博主总结了自己训练经验和看到的一些方法。
首先你要保证训练的次数够多,不要以为一百两百次就会一直loss下降或者准确率一直提高,会有一点震荡的。只要总体收敛就行。若训练次数够多(一般上千次,上万次,或者几十个epoch)没收敛,则试试下面方法:
1. 数据和标签
数据分类标注是否准确?数据是否干净?数据库太小一般不会带来不收敛的问题,只要你一直在train总会收敛(rp问题跑飞了不算)。反而不收敛一般是由于样本的信息量太大导致网络不足以fit住整个样本空间。样本少只可能带来过拟合的问题
2. 学习率设定不合理
在自己训练新网络时,可以从0.1开始尝试,如果loss不下降的意思,那就降低,除以10,用0.01尝试,一般来说0.01会收敛,不行的话就用0.001. 学习率设置过大,很容易震荡。不过刚刚开始不建议把学习率设置过小,尤其是在训练的开始阶段。在开始阶段我们不能把学习率设置的太低否则loss不会收敛。我的做法是逐渐尝试,从0.1,0.08,0.06,0.05 ......逐渐减小直到正常为止,
有的时候候学习率太低走不出低估,把冲量提高也是一种方法,适当提高mini-batch值,使其波动不大。,
3.网络设定不合理
如果做很复杂的分类任务,却只用了很浅的网络,可能会导致训练难以收敛,换网络换网络换网络,重要的事情说三遍,或者也可以尝试加深当前网络。
4.数据集label的设置
检查lable是否有错,有的时候图像类别的label设置成1,2,3正确设置应该为0,1,2。
5、改变图片大小
博主看到一篇文章,说改变图片大小可以解决收敛问题,具体博主没试过,只看到有这个方法,具体文章链接:https://blog.csdn.net/Fighting_Dreamer/article/details/71498256
感兴趣的可以去看看。
6、数据归一化
神经网络中对数据进行归一化是不可忽略的步骤,网络能不能正常工作,还得看你有没有做归一化,一般来讲,归一化就是减去数据平均值除以标准差,通常是针对每个输入和输出特征进行归一化
******************************************************************************************************************************************
问题三:自定义loss(Keras)
参考:https://spaces.ac.cn/archives/4493
很推荐这个,后面还有embedding层的内容。
*****************************************************************************************************************************************
问题N:读者看到以后如果有其他关于loss的问题可以留言,可以学习一下。
loss问题——工作中对出现的loss问题描述与解决参考相关推荐
- java中记忆深刻的问题_工作中碰到比较印象深刻的问题(面试必问)
面试官经常会问到这么一个问题.有些人可能有些误区认为我们工作中碰到的问题都必须是很牛的技术来解决了才能说出来.其实不是的,我们工作中碰到的任何难点都只是在解决办法上的思想上没有打通而已. 举个例子: ...
- 工作中对数据分析思路的一点思考
工作中,经常会遇到产品.运营等各方人员对某个数据的疑问,或者各种各样的数据需求和数据问题.对于数据从业者,我越来越意识到我们不仅仅需要掌握必要的编程基础和专业知识,也需要掌握一些常见的数据分析思路,进 ...
- 工作中的设计模式 —— 策略模式
前言 返利网站 https://m.cpa5.cn/ 策略模式是一种行为设计模式,它能让你定义一系列算法,并将每种算法分别放入独立的类中,以使算法的对象能够相互替换. 使用场景 策略模式在工作中使用的 ...
- 【HTML】处理<br>换行符追加到前端换行无效的问题 --- html中渲染的字符串中包含HTML标签无效的处理方法,字符串中包含HTML标签被转义的问题 解决
[HTML]处理 换行符追加到前端换行无效的问题 --- html中渲染的字符串中包含HTML标签无效的处理方法,字符串中包含HTML标签被转义的问题 解决 参考文章: (1)[HTML]处理 换行符 ...
- 关于微信小程序开发中遇到的缺少game.json问题的解决
关于微信小程序开发中遇到的缺少game.json问题的解决 参考文章: (1)关于微信小程序开发中遇到的缺少game.json问题的解决 (2)https://www.cnblogs.com/ygxd ...
- Equalization Loss理解-更新中
Equalization Loss for Long-Tailed Object Recognition 一.前言 二.交叉熵回顾 2.1.Softmax Cross-Entropy Loss 2.2 ...
- [概念]医学图像分割中常用的Loss function(损失函数) + 从loss处理图像分割中类别极度不均衡
目录 一.前言 二.损失函数 2.1 根据像素正确与否设计的loss function 2.1.1 Log Loss 2.1.2 WCE Loss 2.1.3 Focal Loss 2.2 根据评测 ...
- 机器学习中的损失函数(Loss Function)介绍、说明
损失函数 损失函数介绍 常见的损失函数 1.对数损失函数(Logloss) 2. hinge loss 合页损失函数 3. exp-loss 指数损失函数 4. cross-entropy loss ...
- 【损失函数:3】感知损失:Perceptual Loss、总变分损失(TV Loss)(附Pytorch实现)
损失函数 一.感知损失(Perceptual Loss) 1.相关介绍 1)Perceptual Loss是什么? 2)Perceptual Loss如何构造? 3)代码实现 2.代码示例 二.总变分 ...
最新文章
- 为什么以太网的最小数据帧长度为64字节?
- (总结)Linux的/etc/services文件简析
- b^3 - a^3 = c
- Android LocalBroadcastManager 的使用总结
- RHEL4- DNS服务(四)DNS的开机自动启动控制
- 06jQuery-04-DOM操作
- js页面文字选中后分享到新浪微博实现
- iptables 一些有用的规则
- 解决博易博客后台文章管理页面无法显示分页的问题
- Echo团队Alpha冲刺随笔 - 第六天
- 在optenstack配置nova
- 重构Webpack系列之五 ---- Plugins
- SQL数据库学习心得
- lede虚拟服务器,在虚拟机中安装 LEDE 软路由
- 计算机网络各章节知识点总结
- 【ubuntu20】虚拟机下ubuntu联网
- 解决学校邮箱屏蔽邮件的问题/收不到邮件
- HDR的个人理解FAQ
- 运动健身八段锦APP开发案例分析
- 如何在html添加css样式表,网页中添加CSS样式表的四种方式
热门文章
- pythoneducoder苹果梨子煮水的功效_苹果梨禁忌,苹果梨煮水的功效(糖尿病患者禁食)...
- 信用卡账单 php源码,华夏信用卡电子账单读取
- 智慧校园大数据云平台(1)
- 计算机会计表格应用知识,会计电算化知识之报表管理模块的应用
- “新经济 新境界 新发展”跨境电商高峰论坛在兰举行
- 用html和css画画,如何用 html 和 css 画一拳超人
- 访问某网站会出现此站点的连接不安全字样
- python编写程序输出诗句_Python文本处理简介:44行代码编写一个简单的隐藏诗生成器,python,入门,藏头诗...
- Golang:输出Emoji表情符号
- do sb suggest to_do sb suggest to_Suggest用法小结