ROC曲线以及AUC值

ROC 曲线(接收者操作特征曲线)是一种显示分类模型在所有分类阈值下的效果的图表。该曲线绘制了以下两个参数:

真正例率 :将实际正的预测为正的占实际正的比例
假正例率:将实际负的预测正的占实际负的比例


真正例率

假正例率

阈值:
用于程序判断实例是正是负的临界值。

实例

sklearn.metrics.roc_curve(y_true,y_score,*,pos_label = None,sample_weight = None,drop_intermediate = True)

参数

y_true:真实的样本标签,默认为{0,1}或者{-1,1}。如果要设置为其它值,则 pos_label 参数要设置为特定值。例如要令样本标签为{1,2},其中2表示正样本,则pos_label=2。
y_score:对每个样本的预测结果。
pos_label:正样本的标签。

返回值,roc_curve() 函数有3个返回值:

fpr:假正例率
tpr:真正例率
thresholds:阈值

>>> import numpy as np
>>> from sklearn import metrics
>>> y = np.array([1, 1, 2, 2])
>>> scores = np.array([0.1, 0.4, 0.35, 0.8])
>>> fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2)
>>> fpr
array([0. , 0. , 0.5, 0.5, 1. ])
>>> tpr
array([0. , 0.5, 0.5, 1. , 1. ])
>>> thresholds
array([1.8 , 0.8 , 0.4 , 0.35, 0.1 ])

在上面实例中,假设2表示正,1表示负,则TP+FN=2;FP+TN=2TP + FN = 2;FP + TN = 2TP+FN=2;FP+TN=2
1、当阈值取1.8时
TP=0FP=0所以fpr0=;tpr=0TP = 0 \\ FP = 0 \\ 所以fpr0=;tpr=0 TP=0FP=0所以fpr0=;tpr=0

2、当阈值取0.8时,第二个2被预测为正
TP=1FP=0所以fpr=0;tpr=0.5TP = 1 \\ FP = 0 \\ 所以fpr=0;tpr=0.5 TP=1FP=0所以fpr=0;tpr=0.5

3、当阈值取0.4时,第二个1被预测为正,
TP=1FP=1所以fpr=0.5;tpr=0.5TP = 1 \\ FP = 1 \\ 所以fpr=0.5;tpr=0.5 TP=1FP=1所以fpr=0.5;tpr=0.5

3、当阈值取0.35时,两个2都被预测为正,再加上第二个1被预测为正
TP=2FP=1所以fpr=0.5;tpr=1TP = 2 \\ FP = 1 \\ 所以fpr=0.5;tpr=1 TP=2FP=1所以fpr=0.5;tpr=1

3、当阈值取0.35时,所有都预测为2了
TP=2FP=2所以fpr=1;tpr=1TP = 2 \\ FP = 2 \\ 所以fpr=1;tpr=1 TP=2FP=2所以fpr=1;tpr=1

ROC曲线以及AUC值相关推荐

  1. 分类模型的ROC曲线、AUC值、GINI系数、Lift、Gain、KS指标分别是什么?计算公式是什么?有什么意义?

    分类模型的ROC曲线.AUC值.GINI系数.Lift.Gain.KS指标分别是什么?计算公式是什么?有什么意义? 目录

  2. 机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率

    北京 | 高性能计算之GPU CUDA课程11月24-26日3天密集学习 快速带你晋级阅读全文> 在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度.错误率指的是在所有测试样例中错分 ...

  3. 一文详尽混淆矩阵、准确率、精确率、召回率、F1值、P-R 曲线、ROC 曲线、AUC 值、Micro-F1 和 Macro-F1

    文章目录 二分类的评价指标 一.混淆矩阵与 TP.TN.FP.FN 二.准确率.精确率.召回率.F1值 三.P-R 曲线 四.ROC 曲线.AUC 值 五.P-R曲线和ROC曲线有什么区别,如何选择? ...

  4. 机器学习中的度量指标:ROC曲线,AUC值,K-S曲线

    机器学习中的度量指标:ROC曲线,AUC值,K-S曲线 首先,回顾一下二分类问题的一些定义: 预测 1 0 实 1 TP FN ​际 0 FP TN 上表中,四个项分别为:TP真阳性:FN假阴性:FP ...

  5. 分类模型-评估指标(2):ROC曲线、 AUC值(ROC曲线下的面积)【只能用于二分类模型的评价】【不受类别数量不平衡的影响;不受阈值取值的影响】【AUC的计算方式:统计所有正负样本对中的正序对】

    评价二值分类器的指标很多,比如precision.recall.F1 score.P-R曲线等.但这些指标或多或少只能反映模型在某一方面的性能.相比而言,ROC曲线则有很多优点,经常作为评估二值分类器 ...

  6. 正确率/精度(precision),召回率(recall),F1-score,ROC 曲线,AUC值

    准确率(accuaracy)= (TP+TN)/ ALL 即(TP+TN+FP+FN),是我们最熟知的. 正确率/精度(precision),召回率(recall),F1-score,ROC 曲线,A ...

  7. 机器学习之分类器性能指标之ROC曲线、AUC值

    机器学习之分类器性能指标之ROC曲线.AUC值 http://www.cnblogs.com/dlml/p/4403482.html 分类器性能指标之ROC曲线.AUC值 一 roc曲线 1.roc曲 ...

  8. 分类性能度量指标:ROC曲线、AUC值、正确率、召回率、敏感度、特异度

    在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度.错误率指的是在所有测试样例中错分的样例比例.实际上,这样的度量错误掩盖了样例如何被分错的事实.在机器学习中,有一个普遍适用的称为混淆矩阵 ...

  9. 机器学习之性能度量指标——决定系数R^2、PR曲线、ROC曲线、AUC值、以及准确率、查全率、召回率、f1_score

    一.线性回归的决定系数(也称为判定系数,拟合优度) 相关系数是R哈~~~就是决定系数的开方! 正如题所说决定系数是来衡量回归的好坏,换句话说就是回归拟合的曲线它的拟合优度!也就是得分啦~~ 决定系数它 ...

  10. ROC曲线,AUC值,PR曲线,AP值

    Receiver Operating Characteristic (ROC) with cross validation - scikit-learn 1.0.2 documentation Pre ...

最新文章

  1. 万引大佬自曝这样被MIT拒掉:“系里不喜欢你”,找校长对峙后悟了
  2. 设置开机时自动开启和关闭的软件
  3. 【Android 逆向】整体加固脱壳 ( DexClassLoader 加载 dex 流程分析 | 查找 DexFile 对应的C代码 | dalvik_system_DexFile.cpp 分析 )
  4. 大数据之“用户行为分析”
  5. 10个最“优秀”的代码注释
  6. 线性结构(顺序存储和链式存储)和非线性结构的特点及区别
  7. 学习Java的十大理由,益处太多了
  8. 求助:如何获取ueditor的上传路径
  9. 怎么开启PHP 的错误提示?
  10. Android自定义xml解析
  11. Hadoop学习总结:Map-Reduce入门
  12. vb.net 数据集设计器 新增列_SQLPro for MSSQL for Mac(数据库客户端)
  13. “拉勾2020年超级雇主”奖项颁布:美团、腾讯等获得“巅峰雇主”奖
  14. mysql json类型存储list_list存储json字符串
  15. Linux下安装ntp时间同步服务器
  16. 最强悍的FCKEditor配置和攻略(转载)
  17. easyexcel 在 设置标题_EasyExcel 自定义单元格式的问题。
  18. You have new mail in /var/spool/mail/root提示的原因与解决办法
  19. android导入excel文件格式,android 把数据导入到excel文件中的三种方法
  20. 服务器代维护 云桥,Citrix

热门文章

  1. 歇斯底里呐喊的手机游戏行业
  2. Matplotlib 绘制股票走势图
  3. 亲测生产环境一年多的真正免费的网管软件,功能强大无任何限制,公布个人电话欢迎吐槽...
  4. category显示html,wordpress文章.html伪静态,分类category和页面设置 - 搜外SEO问答
  5. Sklearn中的F1值计算
  6. mysql:解决数据库名字的格式——不能用横杠-
  7. 混沌数学之非线性电路电容中的混沌控制系统
  8. matlab深度学习——【卷积神经网络】手写字的识别
  9. 王小草【机器学习】笔记--分类算法之朴素贝叶斯
  10. OpenCV学习笔记(三十四)——OpenCV路在何方