在tensorflow2.0中用cifar10数据集中发现用 binary_crossentropy 和categorical_crossentropy不同的交叉熵损失函数模型在测试集上的效果差异较大,用binary_crossentropy的效果要优于categorical_crossentropy,
在网上查阅资料后发现原因如下,参考来源(https://zhuanlan.zhihu.com/p/48078990)

原文如下
在运行keras的代码时,发现一个有趣的现象,当使用binary_crossentropy和categorical_crossentropy时,其日志中输出的acc有较大差异,后经多方查阅,发现原因是keras对两者使用了不同的metrics计算acc,对于binary_crossentropy使用的是binary_accuracy,对于后者使用的是categorical_accuracy,读者有兴趣可以参考官方源码(https://github.com/keras-team/keras/blob/master/keras/metrics.py)
如果不想使用默认值可以在调用compile手动设置metrics参数:

model.compile(optimizer=optimizers.Adam(lr

损失函数binary_crossentropy和categorical_crossentropy在单标签多分类模型中评价效果差异较大的原因相关推荐

  1. 【深度学习】单标签多分类问题之新闻主题分类

    # -*- coding: utf-8 -*- """单标签多分类问题之新闻主题分类.ipynbAutomatically generated by Colaborato ...

  2. 机器学习之单标签多分类及多标签多分类

    单标签二分类算法 Logistic算法 单标签多分类算法 Softmax算法 One-Versus-One(ovo):一对一 One-Versus-All / One-Versus-the-Rest( ...

  3. 单标签多分类+多标签单分类

    1.单标签二分类 label标签的取值只有两种,并且算法中只有一个需要预测的label标签.直白来讲就是每个实例的可能类别只有两种(A or B).此时的分类算法其实是在构建一个分类线将数据划分为两个 ...

  4. 单标签多分类及多标签多分类算法

    1.单标签二分类算法 单标签二分类这种问题是我们最常见的算法问题,主要是指label标签的取值只有两种,并且算法中只有一个需要预测的label标签.直白来讲就是每个实例的可能类别只有两种(A or B ...

  5. python输入数据的维度_keras分类模型中的输入数据与标签的维度实例

    在<python深度学习>这本书中. 一.21页mnist十分类 导入数据集 from keras.datasets import mnist (train_images, train_l ...

  6. 【多标签文本分类】融合CNN-SAM与GAT的多标签文本分类模型

    ·阅读摘要:   在本文中,作者基于CNN.Attention.GAT提出CS-GAT模型,在一些通用数据集上,表现良好. ·参考文献:   [1] 融合CNN-SAM与GAT的多标签文本分类模型   ...

  7. 前端开发 表单标签 完成一个简单登陆的效果 0228

    表单标签的功能 提交数据给服务器 表单的基本结构 格式各样的控件 input标签的多样性 目标效果 表格的结构 设置宽高 合并单元格 继续合并单元格 填写内容 . 插入表单控件 按钮添加 按钮居中 用 ...

  8. Python实现BP神经网络ANN单隐层分类模型项目实战

    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 BP(back propagation)神经网络是1986年由R ...

  9. 干货:如何利用机器学习实现有噪声标签样本分类模型?

    在工业生产活动中,有一类常见机器学习问题,就是如何基于有噪声样本标签训练模型,以进行故障检测和分类. 先解释下什么是有噪声样本标签,它指的是训练模型用的样本标签并非完全准确,部分样本的标签有标错的情况 ...

  10. torchtext使用-- 单标签多分类任务TREC

    本篇文章参考: Multi-class Sentiment Analysis 部分细节可能会略作改动,代码注释尽数基于自己的理解.文章目的仅作个人领悟记录,并不完全是tutorial的翻译,可能并不适 ...

最新文章

  1. Jquery mobile技术咖们走进来瞧瞧吧
  2. c语言switch自动贩卖机,JAVA程式-自动贩卖机SWITCHCASE.doc
  3. 一个物理学家学习Windows编程的感受
  4. CRM_PRICING_MERGE_FROM_BUPA_OW
  5. 为了偷吃东西你能有多拼?! | 今日最佳
  6. 软件工程师所需掌握的“终极技术”是什么?
  7. Git使用的奇技淫巧
  8. 欢迎大家推荐使用小技巧
  9. 变量求和_高中生看过来:高考数列求和的方法有哪些?本文主要分享6种方法...
  10. 使用shell脚本删除rabbitMq的exchange
  11. 机器学习 主成分分析(Principal Component Analysis)
  12. 设为首页和收藏的JS
  13. CARLA 笔记(07)— 地图和导航(Landmarks、Waypoints、Lanes、Junctions、Environment Objects、路径点导航、地图导航、分层和非分层地图)
  14. Spec Explorer 2010
  15. 企业为什么要上云?企业上云的好处和优势有哪些
  16. 【网站备案】2018年以后的阿里云备案以及公安备案流程最佳实践
  17. 解决 ClickOnce 发布出现: 清单中的引用与下载的程序集 *.exe 的标识不匹配 问题
  18. 指数函数----e是什么?
  19. ARM与嵌入式Linux的入门建议
  20. 5G测试完毕,梦想能否照进现实

热门文章

  1. X-WRT安装Zerotier
  2. 客户端服务端文件传输代码,还贷计算器功能
  3. 多多情报通:拼多多新品标为什么不见了?拼多多新品标掉了可以恢复吗?
  4. Oracle 常见的几种等待事件
  5. 内容型的产品该怎么做?
  6. 青岛电大计算机组装与维护试题,电大专科计算机组装与维护-复习资料.docx
  7. Unity_Shader扩展篇_18_Unity Shader入门精要
  8. 通过Rust编译时出现的错误来学习Rust
  9. 5日精通css样式表-第1日4-6页[转]
  10. 【开题报告】基于微信小程序的奶茶店奶茶点单系统