在进行pytorch编写程序过程中,会发现loss有两种相对较相似的或是看起来就是一类loss的函数,即BCELoss和BCEWithLogitsLoss,下面简单的描述一下。

首先,BCELoss创建一个标准来度量目标和输出之间的二元交叉熵,即对一个batch里面的数据做二元交叉熵并且求平均。BCELoss函数的形式如下:

CLASS torch.nn.BCELoss(weight=None, size_average=None, reduce=None, reduction='mean')

其中,

weight: 给每个batch元素的权重,一般没用;不一般情况下非常有用,如果训练样本不均衡,或者输出重要性不同时可以设置权重。举例:

样本不均衡:在覆冰预测中,样本中覆冰数据和未覆冰数据比例未1:26,这时可以设置权重:

weight=torch.one(b,class)

weight[t=0]=1/26 #设置未覆冰权重为1/26

输出重要性不同:在目标检测中,检测到目标是背景的重要性较小

weight=torch.one(b,classes) #classes = 0:背景 1,2,3,4,5,6

weight[:,0]=1/10 #背景权重为1/10

size_average: 默认为True;
reduce: True/False 默认为True,对每个minibatch做;
reduction: 指定返回各损失值,批损失均值,批损失和,默认返回批损失均值,用的比较多的是这个参数。
再次,BCEWithLogitsLoss函数是将Sigmoid层和BCELoss合并在一个类中,在数值上比使用一个简单的Sigmoid和一个BCELoss,通过将操作合并到一个层中,其利用log-sum-exp技巧来实现数值稳定性。具体形式如下:

CLASStorch.nn.BCEWithLogitsLoss(weight=None, size_average=None, reduce=None, reduction='mean', pos_weight=None)

实质上,BCELoss与BCEWithLogitsLoss差了一个Sigmoid函数。

BCELoss BCEWithLogitsLoss以及参数weight相关推荐

  1. loss函数之BCELoss, BCEWithLogitsLoss

    BCELoss 二分类交叉熵损失 单标签二分类 一个输入样本对应于一个分类输出,例如,情感分类中的正向和负向 对于包含 N N N个样本的batch数据, l o s s loss loss计算如下: ...

  2. 初始化模型参数 python_pytorch 网络参数 weight bias 初始化详解_python_脚本之家

    权重初始化对于训练神经网络至关重要,好的初始化权重可以有效的避免梯度消失等问题的发生. 在pytorch的使用过程中有几种权重初始化的方法供大家参考. 注意:第一种方法不推荐.尽量使用后两种方法. # ...

  3. BCELoss BCEWithLogitsLoss 多标签损失函数

    BCELoss 在图片多标签分类时,如果3张图片分3类,会输出一个3*3的矩阵. 先用Sigmoid给这些值都搞到0~1之间: 假设Target是: emmm应该是我上面每次都保留4位小数,算到最后误 ...

  4. pytorch 中网络参数 weight bias 初始化方法

    权重初始化对于训练神经网络至关重要,好的初始化权重可以有效的避免梯度消失等问题的发生. 在pytorch的使用过程中有几种权重初始化的方法供大家参考. 注意:第一种方法不推荐.尽量使用后两种方法. # ...

  5. pytorch_BCELoss的reduction参数理解

    文章目录 BCELoss[错了跟我讲,我可以改,一起学] 参考文档 理解 BCELoss[错了跟我讲,我可以改,一起学] 用于二分类问题,计算loss值,与sigmoid函数一起使用(就是逻辑回归的那 ...

  6. BCELoss、crossentropyLoss、NLLLoss的使用(pytorch)

    文章目录 BCELoss 参考文档 理解 demo 应用 crossentropyLoss.NLLLoss 参考文档 crossEntropyLoss NLLLoss BCELoss 用于二分类问题, ...

  7. nn.LayerNorm的参数

    nn.LayerNorm的参数: 参考: 1.pytorch LayerNorm参数详解,计算过程 2.nn.LayerNorm的具体实现方法(通过公式复现) normalized_shape 如果传 ...

  8. 使用pycaffe读取caffemodel参数(保存到txt文件)

    #!/usr/bin/env python # 引入"咖啡" import caffe import numpy as np # 使输出的参数完全显示 # 若没有这一句,因为参数太 ...

  9. python查看CNN训练模型参数

    参照:http://blog.csdn.net/u011762313/article/details/49851795 #!/usr/bin/env python# 引入"咖啡" ...

最新文章

  1. 关于华为虚拟操作键收起后页面高度不会刷新问题的总结
  2. layer用ajax往jsp页面传值,layer.open中父页面向子页面传值(示例代码)
  3. my life-long goal
  4. ios 内存深度优化_iOS 25个性能优化/内存优化常用方法
  5. element UI 制作模糊搜索框
  6. vue中rules校验是验证首字符_小白也能秒懂Vue源码中那些精细设计(选项处理)...
  7. Flutter 中的国际化之多语言环境
  8. html语言中的链接方式,什么是超链接_在html中设置超链接的方法 - 驱动管家
  9. Java 对用户密码加密(Jeecg 登录密码加密方式)MD5andDES方式
  10. windows 安装Rabbit MQ
  11. mysql联合查询 课程表_oracle 学生表,课程表,选课表. 三表联合查询
  12. wifi认证源码html,openwrt 实现本地wifidog简单认证,认证端纯html
  13. 使用python opencv批量对贴图进行除透明边并压缩
  14. div css经典布局实例,div+css布局实例:常用图文混排(一)--腾讯图文 - 蜗爱CSS
  15. 中国物流企业家谈“物流”
  16. 音视频之渲染yuv图片
  17. 第一次约会聊天话题,资深老司机教你6个万能话题
  18. pcl小知识(十一)——对StatisticalOutlierRemoval的理解
  19. 分布式协调器ZooKeeper3.4—程序员手册
  20. 理解UVM中的virtual sequencer和virtual sequence

热门文章

  1. 关于word转pdf我找到的 最简单的解决方法
  2. html5中设置省略号颜色,CSS3中text-overflow实现文章标题带省略号的显示效果(代码实例 )...
  3. 收藏|建筑专业都有什么证书?
  4. 留住员工的七个“秘诀”(zt)
  5. Linux主分区,扩展分区,逻辑分区的联系和区别
  6. 虚拟机的三种网络模式详解
  7. 计算机网络课程设计--基于TCP协议网上聊天程序--python实现带图形界面--socket--多线程
  8. nginx代理ftp端口,实现文件传输
  9. C++ debug和release版本运行结果不一致浅析
  10. 转行:隔行如隔山,转行等于翻山.