F1分数(F1 Score),是统计学中用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的精确率和召回率。F1分数可以看作是模型精确率和召回率的一种加权平均,它的最大值是1,最小值是0。

1. TP、TN、FP、FN解释说明

真实情况 预测结果
正例 反例
正例 TP(真正例) FN(假反例)
反例 FP(假正例) TN(真反例)
  • 行表示预测的label值,列表示真实label值
  • TP:True Positive, 被判定为正样本,事实上也是正样本。
  • FP:False Positive,被判定为正样本,但事实上是负样本。
  • TN:True Negative, 被判定为负样本,事实上也是负样本。
  • FN:False Negative,被判定为负样本,但事实上是正样本。

2. precision 和 recall 的计算

  • Accuracy:表示预测结果的精确度,预测正确的样本数除以总样本数。
  • precision: 准确率,又称为查准率,表示预测结果中,预测为正样本的样本中,正确预测为正样本的概率;
  • recall: 召回率,又称为查全率,表示在原始样本的正样本中,最后被正确预测为正样本的概率;

3. 分类模型的评估方法-F分数(F-Score)

精确率(Precision)和召回率(Recall)评估指标,理想情况下做到两个指标都高当然最好,但一般情况下,Precision高,Recall就低,Recall高,Precision就低。

4. P-R曲线、平均精度(Average-Precision,AP)

P-R图直观地显示出学习器在样本总体上的查全率、查准率.总体趋势,精度越高,召回越低,进行比较

  • 若一个学习器的P-R曲线被另一个学习器的曲线完全“包住”,则可断言后者的性能优于前者,如图中学习器A的性能优于学习器C;
  • 如果两个学习器的P-R曲线发生了交叉,如图中的A与B,则难以一般性地断言两者孰优孰劣? 只能在具体的查准率或查全率条件下进行比较.

“平衡点”(Break Event Point,简称BEP )就是这样一个度量,它是“查准率=查全率”时的取值, 如图中学习器C的BEP 是0.64, 而基于BEP的比较,可认为学习器A 优于B.

但BEP 还是过于简化了些,更常用的是Fl 度量

5. 分类模型的评估方法-F分数(F-Score)

精确率(Precision)和召回率(Recall)评估指标,理想情况下做到两个指标都高当然最好,但一般情况下,Precision高,Recall就低,Recall高,Precision就低。

所以在实际中常常需要根据具体情况做出取舍,例如一般的搜索情况,在保证召回率的条件下,尽量提升精确率。而像癌症检测、地震检测、金融欺诈等,则在保证精确率的条件下,尽量提升召回率。引出了一个新的指标F-score,综合考虑Precision和Recall的调和值.

  • β=1时,称为 F1-score或者 F1-Measure,这时,精确率和召回率都很重要,权重相同。
  • 当有些情况下,我们认为精确率更重要些,那就调整β的值小于1,
  • 如果我们认为召回率更重要些,那就调整β的值大于1。

F1指标(F1-score):F1-score表示的是precision和recall的调和平均评估指标。

举个例子:癌症检查数据样本有10000个,其中10个数据祥本是有癌症,其它是无癌症。假设分类模型在无癌症数据9990中预测正确了9980个,在10个癌症数据中预测正确了9个,此时真阳=9,真阴=9980,假阳=10,假阴=1。

Accuracy = 99.89%

Precision = 47.3%

Recall = 90%

F1-Scoce = 62%

F2-Score = 76.2%

本文部分内容来自一位前辈,非常感谢分享!谢谢!

F1-score值计算相关推荐

  1. 机器学习中精准度、召回率、准确率、F1 Score、G分数计算学习笔记

    目录 1.基本符号表示 2.类别下的精准度计算(precision) 3.类别下的召回率计算(recall) 4.准确率的计算(accuracy) 5.F1 Score 6.G分数 1.基本符号表示 ...

  2. TP、TN、FP、FN、Recall、Miss Rate、MCC、F1 Score 等指标计算

    对一个二分类问题,实际取值只有正.负两例,而实际预测出来的结果也只会有0,1两种取值.如果一个实例是正类,且被预测为正类,就是真正类(True Positive),如果是负类,被预测为正类,为假正类( ...

  3. sklearn计算准确率、精确率、召回率、F1 score

    目录 混淆矩阵 准确率 精确率 召回率 P-R曲线 F1 score 参考资料 分类是机器学习中比较常见的任务,对于分类任务常见的评价指标有准确率(Accuracy).精确率(Precision).召 ...

  4. R语言计算F1评估指标实战:F1 score、使用R中caret包中的confusionMatrix()函数为给定的logistic回归模型计算F1得分(和其他指标)

    R语言计算F1评估指标实战:F1 score.使用R中caret包中的confusionMatrix()函数为给定的logistic回归模型计算F1得分(和其他指标) 目录

  5. 『NLP学习笔记』Sklearn计算准确率、精确率、召回率及F1 Score

    Sklearn计算准确率.精确率.召回率及F1 Score! 文章目录 一. 混淆矩阵 1.1. 混淆矩阵定义 1.2. 例子演示 二. 准确率 2.1. 准确率定义 2.2. 例子演示 三. 精确率 ...

  6. F1 score的意义

    F1 score是一个平均数:对精确率与召回率进行平均的一个结果: 平均算法有四个,如图所示: 调和平均数:Hn=n/(1/a1+1/a2+...+1/an) 几何平均数:Gn=(a1a2...an) ...

  7. YOLOv5的参数IOU与PR曲线,F1 score

    YOLOv5的参数IOU与PR曲线,F1 score conf_thres Confidence Threshold,置信度阈值. 只显示预测概率超过conf_thres的预测结果.想让YOLO只标记 ...

  8. 机器学习指标(Precision、Recall、mAP、F1 Score等)

    以下文章摘录自: <机器学习观止--核心原理与实践> 京东: https://item.jd.com/13166960.html 当当:http://product.dangdang.co ...

  9. f1 score与f2 score的区别

    beta值代表1或者2 beta=1,f1 score beta=2,f2 score

最新文章

  1. Servlet Listener
  2. springmvc+mybatis+html 下将查询数据以excell形式上传到ftp(下)
  3. mysql-5.2 lib_Centos 5.2下安装多个mysql数据库配置详解
  4. python学习笔记 day25 封装
  5. Web项目中引进EasyUI的路径问题
  6. mysql 过程 的函数的区别是什么意思_Mysql中存储过程和函数的区别是什么
  7. 新浪微博api(.net)时间格式问题
  8. windows service 2008 内存吃尽解决方案
  9. 了结对编程和飞鸽传书
  10. 刷机-升级到4.01M33-2的方法
  11. QT入门学习(一):什么是QT
  12. 美图秀秀 web开发图片编辑器
  13. js切换图片会闪动_js 图片闪动,间隔几分钟闪动一下
  14. driver: linux下如何模拟按键输入和模拟鼠标
  15. systemd 知:介绍
  16. Python入门基础总结笔记——正则表达式
  17. Java菜鸟到大牛学习路线之高级篇
  18. 抖音吸粉_抖音上热门快速吸粉的6个方法,新手建议收藏看看
  19. Twitter的推荐系统开源了,Twitter的推荐系统是什么样的呢?Twitter推荐系统的架构说明
  20. java动物声音模拟器_动物声音模拟器app|动物声音模拟器下载_v9.2.3_9ht安卓下载...

热门文章

  1. 充电电流的大小是谁决定的?
  2. 持续集成(第二版)[来自:Martin Fowler]
  3. 用Mpvue开发微信小程序,微信语音聊天
  4. 阿里云互动课堂解决方案助力淘宝教育,打造普惠教育平台
  5. python社区发现对gml文件的分析,用Python将gml文件中边的信息输出为csv(或者txt)格式...
  6. MPEG DASH MPD文件字段解释
  7. 与苹果和谷歌抗争堡垒创造者发动了远征
  8. 中国大学MOOC C语言程序设计(大连理工大学) 课后编程题 第十二周题解(个人向仅供参考)
  9. 怎么用视频转换器把mp4转换成mp3
  10. 小学数学动画 android,小学数学课堂app下载-小学数学课堂 安卓版v2.2.0-PC6安卓网...