PR曲线和ROC曲线是数据挖掘中2个常见的评估指标(对于二分器而言),理解如下:

一、pr曲线:

1)y轴为precision,x轴为recall。

2)pr曲线上各个取值为当前p下,样本判断结果:大于p的为正样本,反之为负样本。

3)pr曲线从左到右的取值点,为p值降序下的锚点。

4)随着p值降低,越多样本判为正样本,recall不断增大,而precision则计算大于p的那些样本的precision(给定一些样本,模型预测的有多准),理论上precision不断降低,最小值为全量样本中正样本占比。

5)可知,pr曲线容易受到样本分布(训练样本中的正负样本比值)影响。

二、ROC/AUC

1)y轴是正样本的正判概率(对全量样本而言,正样本的召回率),x轴是负样本的误判概率(对于全量样本而言,负样本的判错率)。

2)同pr曲线,x轴和y轴的取值都是依据降序的p值计算而来。

3)随着p值不断降低,正样本召回率不断增大,而负样本的错判率也是不断增大,最后相交于(1,1)处。

4)ROC曲线计算过程中,不涉及到正负样本的比值(样本分布)的影响,只受到正样本集合或者负样本集合的影响。

5)物理含义:随机给出一个正样本和一个负样本,正样本预测概率大于负样本预测概率的程度。

总结:

1、pr曲线因为涉及到精确率precision计算,容易受到样本分布的影响。而roc曲线本质上是正样本或者负样本召回率计算,不收样本分布的影响。

2、区分精确率、准确率的区别:精确率是对于预测为正样本的那些样本而言,准确率是对于全量样本的预测结果(预测为正样本或者预测为负样本)而言。

更多学习笔记可以关注我的微信公众号「kelly学挖掘」,欢迎交流。

-- over --

PR曲线和ROC曲线理解相关推荐

  1. 一文详尽混淆矩阵、准确率、精确率、召回率、F1值、P-R 曲线、ROC 曲线、AUC 值、Micro-F1 和 Macro-F1

    文章目录 二分类的评价指标 一.混淆矩阵与 TP.TN.FP.FN 二.准确率.精确率.召回率.F1值 三.P-R 曲线 四.ROC 曲线.AUC 值 五.P-R曲线和ROC曲线有什么区别,如何选择? ...

  2. python画pr曲线代码_利用Python中的numpy包实现PR曲线和ROC曲线的计算

    闲来无事,边理解PR曲线和ROC曲线,边写了一下计算两个指标的代码.在 python 环境下,sklearn里有现成的函数计算ROC曲线坐标点,这里为了深入理解这两个指标,写代码的时候只用到numpy ...

  3. python绘制pr曲线图_利用Python中的numpy包实现PR曲线和ROC曲线的计算!

    闲来无事,边理解PR曲线和ROC曲线,边写了一下计算两个指标的代码.在python环境下,sklearn里有现成的函数计算ROC曲线坐标点,这里为了深入理解这两个指标,写代码的时候只用到numpy包. ...

  4. 机器学习笔记(一)P-R曲线与ROC曲线

    P-R曲线与ROC曲线 一.什么是P-R曲线? 二.什么是ROC曲线? 三.P-R曲线与ROC曲线有什么用? 三.绘制P-R曲线代码 一.什么是P-R曲线? 要知道什么是P-R曲线,首先,我们要先了解 ...

  5. python 计算曲线面积_利用Python中的numpy包实现PR曲线和ROC曲线的计算!

    闲来无事,边理解PR曲线和ROC曲线,边写了一下计算两个指标的代码.在python环境下,sklearn里有现成的函数计算ROC曲线坐标点,这里为了深入理解这两个指标,写代码的时候只用到numpy包. ...

  6. 机器学习:python绘制P-R曲线与ROC曲线

    Python绘制P-R曲线与ROC曲线 查准率与查全率 P-R曲线的绘制 ROC曲线的绘制 查准率与查全率   P-R曲线,就是查准率(precision)与查全率(recall)的曲线,以查准率作为 ...

  7. 模型评估指标:P-R曲线和ROC曲线

    在机器学习建模中,模型评估指标用于评估不同模型的优劣. 在分类任务中,最简单的评估指标莫过于错误率和精度了,错误率表示的是错误分类的样本个数占总样本个数的比例,精度则是1减去错误率. 错误率和精度的优 ...

  8. 机器学习中的性能指标:精度、召回率,PR曲线,ROC曲线和AUC,及示例代码

    机器学习中的性能指标:精度.召回率.PR曲线,ROC曲线和AUC 精度.召回率 基本概念 F-Score 度量曲线 PR曲线 ROC曲线 PR曲线和ROC曲线的比较 AUC 精度.召回率 基本概念 可 ...

  9. 机器学习模型性能评估(二):P-R曲线和ROC曲线

    上文简要介绍了机器学习模型性能评估的四种方法以及应用场景,并详细介绍了错误率与精度的性能评估方法.本文承接上文,继续介绍模型性能评估方法:P-R曲线和ROC曲线.                   ...

最新文章

  1. unordered_map的使用特性
  2. Unix整理笔记——起步——里程碑M2
  3. Swift - 自定义UIActivity分享
  4. Redis 再牛逼,也得设置密码
  5. C语言中数组所占字节怎么算
  6. 第六课 多算法组合与模型调优
  7. android设计安全性,Android操作系统安全性增强方案的设计与实现
  8. vivo发布OriginOS Ocean,国产定制系统越来越好了
  9. VB.net小技巧——VB中调用matlab
  10. 常微分方程的数值解法
  11. 豆瓣9.6分,Scala编程圣经第5版隆重来袭
  12. 华为数通考试正式改版,改版前后有什么区别?
  13. 陕西省计算机中考模拟试题软件,中学信息技术考试练习系统——陕西省版
  14. ipad无法加入网络怎么办?
  15. 2020-11-25
  16. 今天买了正版的beyondcompare 4.0
  17. 《按自己的意愿过一生》语录一
  18. Rs—Ri—部分差Rsf部分
  19. KDD 2020(五) | 基于多源异构信息整合的视频标题生成模型(作者带你读论文)...
  20. 狂写2万字带你快速上手React

热门文章

  1. Android 中使用 ServiceLoader、AutoService 摔坑记录
  2. 获取App Store app下载链接
  3. 命令行的艺术(The Art of Command Line 中文翻译)
  4. 【附源码】Java计算机毕业设计防疫物资捐赠(程序+LW+部署)
  5. 最小公倍数算法题题解
  6. 借助CSDN将本地图片生成为链接
  7. hp 服务器双cpu 无显示,HP z600 用双CPU点不亮?请问要设置那儿?单CPU是可以点亮的。...
  8. Dell U2518D显示器拆解
  9. 如何检测是否使用gpu
  10. Data Mining KDD