BCELoss BCEWithLogitsLoss以及参数weight
在进行pytorch编写程序过程中,会发现loss有两种相对较相似的或是看起来就是一类loss的函数,即BCELoss和BCEWithLogitsLoss,下面简单的描述一下。
首先,BCELoss创建一个标准来度量目标和输出之间的二元交叉熵,即对一个batch里面的数据做二元交叉熵并且求平均。BCELoss函数的形式如下:
CLASS torch.nn.BCELoss(weight=None, size_average=None, reduce=None, reduction='mean')
其中,
weight: 给每个batch元素的权重,一般没用;不一般情况下非常有用,如果训练样本不均衡,或者输出重要性不同时可以设置权重。举例:
样本不均衡:在覆冰预测中,样本中覆冰数据和未覆冰数据比例未1:26,这时可以设置权重:
weight=torch.one(b,class)
weight[t=0]=1/26 #设置未覆冰权重为1/26
输出重要性不同:在目标检测中,检测到目标是背景的重要性较小
weight=torch.one(b,classes) #classes = 0:背景 1,2,3,4,5,6
weight[:,0]=1/10 #背景权重为1/10
size_average: 默认为True;
reduce: True/False 默认为True,对每个minibatch做;
reduction: 指定返回各损失值,批损失均值,批损失和,默认返回批损失均值,用的比较多的是这个参数。
再次,BCEWithLogitsLoss函数是将Sigmoid层和BCELoss合并在一个类中,在数值上比使用一个简单的Sigmoid和一个BCELoss,通过将操作合并到一个层中,其利用log-sum-exp技巧来实现数值稳定性。具体形式如下:
CLASStorch.nn.BCEWithLogitsLoss(weight=None, size_average=None, reduce=None, reduction='mean', pos_weight=None)
实质上,BCELoss与BCEWithLogitsLoss差了一个Sigmoid函数。
BCELoss BCEWithLogitsLoss以及参数weight相关推荐
- loss函数之BCELoss, BCEWithLogitsLoss
BCELoss 二分类交叉熵损失 单标签二分类 一个输入样本对应于一个分类输出,例如,情感分类中的正向和负向 对于包含 N N N个样本的batch数据, l o s s loss loss计算如下: ...
- 初始化模型参数 python_pytorch 网络参数 weight bias 初始化详解_python_脚本之家
权重初始化对于训练神经网络至关重要,好的初始化权重可以有效的避免梯度消失等问题的发生. 在pytorch的使用过程中有几种权重初始化的方法供大家参考. 注意:第一种方法不推荐.尽量使用后两种方法. # ...
- BCELoss BCEWithLogitsLoss 多标签损失函数
BCELoss 在图片多标签分类时,如果3张图片分3类,会输出一个3*3的矩阵. 先用Sigmoid给这些值都搞到0~1之间: 假设Target是: emmm应该是我上面每次都保留4位小数,算到最后误 ...
- pytorch 中网络参数 weight bias 初始化方法
权重初始化对于训练神经网络至关重要,好的初始化权重可以有效的避免梯度消失等问题的发生. 在pytorch的使用过程中有几种权重初始化的方法供大家参考. 注意:第一种方法不推荐.尽量使用后两种方法. # ...
- pytorch_BCELoss的reduction参数理解
文章目录 BCELoss[错了跟我讲,我可以改,一起学] 参考文档 理解 BCELoss[错了跟我讲,我可以改,一起学] 用于二分类问题,计算loss值,与sigmoid函数一起使用(就是逻辑回归的那 ...
- BCELoss、crossentropyLoss、NLLLoss的使用(pytorch)
文章目录 BCELoss 参考文档 理解 demo 应用 crossentropyLoss.NLLLoss 参考文档 crossEntropyLoss NLLLoss BCELoss 用于二分类问题, ...
- nn.LayerNorm的参数
nn.LayerNorm的参数: 参考: 1.pytorch LayerNorm参数详解,计算过程 2.nn.LayerNorm的具体实现方法(通过公式复现) normalized_shape 如果传 ...
- 使用pycaffe读取caffemodel参数(保存到txt文件)
#!/usr/bin/env python # 引入"咖啡" import caffe import numpy as np # 使输出的参数完全显示 # 若没有这一句,因为参数太 ...
- python查看CNN训练模型参数
参照:http://blog.csdn.net/u011762313/article/details/49851795 #!/usr/bin/env python# 引入"咖啡" ...
最新文章
- 关于华为虚拟操作键收起后页面高度不会刷新问题的总结
- layer用ajax往jsp页面传值,layer.open中父页面向子页面传值(示例代码)
- my life-long goal
- ios 内存深度优化_iOS 25个性能优化/内存优化常用方法
- element UI 制作模糊搜索框
- vue中rules校验是验证首字符_小白也能秒懂Vue源码中那些精细设计(选项处理)...
- Flutter 中的国际化之多语言环境
- html语言中的链接方式,什么是超链接_在html中设置超链接的方法 - 驱动管家
- Java 对用户密码加密(Jeecg 登录密码加密方式)MD5andDES方式
- windows 安装Rabbit MQ
- mysql联合查询 课程表_oracle 学生表,课程表,选课表. 三表联合查询
- wifi认证源码html,openwrt 实现本地wifidog简单认证,认证端纯html
- 使用python opencv批量对贴图进行除透明边并压缩
- div css经典布局实例,div+css布局实例:常用图文混排(一)--腾讯图文 - 蜗爱CSS
- 中国物流企业家谈“物流”
- 音视频之渲染yuv图片
- 第一次约会聊天话题,资深老司机教你6个万能话题
- pcl小知识(十一)——对StatisticalOutlierRemoval的理解
- 分布式协调器ZooKeeper3.4—程序员手册
- 理解UVM中的virtual sequencer和virtual sequence
热门文章
- 关于word转pdf我找到的 最简单的解决方法
- html5中设置省略号颜色,CSS3中text-overflow实现文章标题带省略号的显示效果(代码实例 )...
- 收藏|建筑专业都有什么证书?
- 留住员工的七个“秘诀”(zt)
- Linux主分区,扩展分区,逻辑分区的联系和区别
- 虚拟机的三种网络模式详解
- 计算机网络课程设计--基于TCP协议网上聊天程序--python实现带图形界面--socket--多线程
- nginx代理ftp端口,实现文件传输
- C++ debug和release版本运行结果不一致浅析
- 转行:隔行如隔山,转行等于翻山.