机器学习:分类模型的评估精确率Presicion和召回率Recall
estimator.score()
准确率:预测结果正确的百分比
混淆矩阵
预测结果Predicted Condition
正确标记 True Condition
预测结果 | 正例 | 假例 |
---|---|---|
真实 正例 | 真正例TP | 伪反例FN |
结果 假例 | 伪正例FP | 真反例TN |
T True
F False
P Positive
N Negative
精确率 Presicion
预测结果为正中真实为正的比例(查的准)
召回率 Recall
真实为正中预测结果为正的比例(查的全,对正样本的区分能力)
F1-score 模型的稳健性
F1=(2TP)/(2TP + FN + FP)
= (2 x Precision x Recall)/(Precision + Recall)
代码示例
from sklearn.datasets import fetch_20newsgroups
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import classification_report
import sslssl._create_default_https_context = ssl._create_unverified_context# 如果获取不到就下载
data = fetch_20newsgroups(subset="all")# 数据分割
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.33, random_state=42
)# 特征抽取
tfidf = TfidfVectorizer()# 以训练集中的词列表对每篇文章做重要性统计
X_train = tfidf.fit_transform(X_train)
print(tfidf.get_feature_names())X_test = tfidf.transform(X_test)# 朴素贝叶斯算法预测,alpha是拉普拉斯平滑系数
mlt = MultinomialNB(alpha=1.0)
mlt.fit(X_train, y_train)
y_predict = mlt.predict(X_test)
score = mlt.score(X_test, y_test)
print("socre: {}".format(score))
# socre: 0.83# 分类报告
print(classification_report(y_test, y_predict, target_names=data.target_names))
"""precision recall f1-score supportalt.atheism 0.86 0.71 0.78 260comp.graphics 0.86 0.77 0.81 321comp.os.ms-windows.misc 0.82 0.83 0.82 314...avg / total 0.87 0.83 0.83 6220
"""
机器学习:分类模型的评估精确率Presicion和召回率Recall相关推荐
- 一文看懂分类模型的评估指标:准确率、精准率、召回率、F1等
2019-11-21 21:59:23 机器学习模型需要有量化的评估指标来评估哪些模型的效果更好. 本文将用通俗易懂的方式讲解分类问题的混淆矩阵和各种评估指标的计算公式.将要给大家介绍的评估指标有:准 ...
- python 两点曲线_python机器学习分类模型评估
python机器学习分类模型评估 1.混淆矩阵 在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多 ...
- 机器学习模型评估的方法总结(回归、分类模型的评估)
建模的评估一般可以分为回归.分类和聚类的评估,本文主要介绍回归和分类的模型评估: 一.回归模型的评估 主要有以下方法: 指标 描述 metrics方法 Mean Absolute Error(MAE) ...
- 机器学习分类模型评价指标详述
问题建模 机器学习解决问题的通用流程:问题建模--特征工程--模型选择--模型融合 其中问题建模主要包括:设定评估指标,选择样本,交叉验证 解决一个机器学习问题都是从问题建模开始,首先需要收集问题的资 ...
- 回归和分类模型性能评估指标MSE,MAE,PR,ROC,AUC
文章目录 0. 模型评估是什么,为什么 1. 不同类型问题的评估指标 1.1 回归问题 1.2 分类问题 1.2.1 准确率和错误率 1.2.2 精确率和召回率 1.2.3 PR曲线图 1.2.4 F ...
- 传统机器学习分类模型预测股价涨跌
前言 股票市场风起云涌,只有对股价有良好的预测才能够更好的抓住盈利机会.那么传统的机器学习分类模型在这方面的效果如何呢? 本文在只考虑5.10.20日移动平均线.移动指数平均线这六项指标的情况下,比较 ...
- R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果(accuray、F1、偏差Deviance):随机森林在Bagging算法的基础上加入了列采样(分枝特征随机)
R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果(accuray.F1.偏差Deviance):随机森林在Bagging算法的基础上加入了列采样(分枝特征随机) ...
- sklearn预测评估指标计算详解:准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1score
目录 前言 一.准确率 二.精确率 三.召回率 四.F1-score
- FP、FN、TP、TN、精确率(Precision)、召回率(Recall)、准确率(Accuracy)评价指标详述
来自微信公众号:小白CV关注可了解更多CV,ML,DL领域基础/最新知识;如果你觉得小白CV对您有帮助,欢迎点赞/收藏/转发 在机器学习领域中,用于评价一个模型的性能有多种指标,其中几项就是FP.FN ...
最新文章
- 利用Procdump+Mimikatz获取Windows帐户密码
- Redis架构第二天:CenterOS集群、RDB和AOF、主从复制架构实践
- 五千万美元注资孵化器,ETC能实现绝地反击吗?
- SQL点滴22—性能优化没有那么神秘
- python调用c++_python高性能编程之Cython篇 第一章
- 奥斯卡“最佳国际电影”奖,《哪吒之魔童降世》申请出战!
- opengl开启垂直同步_玩游戏卡顿?只要简单2步,开启电脑最大性能,速度提升10倍!...
- 51单片机60秒倒计时 数码管显示
- 自用tomcat、springboot、rust发布脚本
- linux 网络错误代码,Linux版本登录提示网络错误
- 笔记本未指定打印机服务器,打印机出现在未指定里怎么办?可以这样解决
- 数据集生成期间遇到的BUG及解决方案
- 关于POI设置打印区域 动态添加打印区域问题
- iOS 相机拍照、相册获取照片(仿微信) 一一 拍照、图片裁剪
- PointPainting 复现
- angular4的脏值检测
- mysql--MGR
- 笔记1:√2是无理数求证
- github上新晋star3K的开源AI模型,包含情感分析等
- Trimble接收机T02格式转RINEX
热门文章
- mysql导入dat文件_.dat导入数据库
- 硬盘函数不正确怎么解决
- java 画图 graphics
- 北京航空航天大学研究生院计算机科学与技术哪个方向偏嵌入式,北京航空航天大学研究生2018年考研专业介绍:计算机科学与技术...
- 网络入侵检测IDS常用数据集KDD Cup99/NSL-KDD/UNSW-NB15/ADFA/CIC IDS2017/2018下载途径
- 机器学习实战(1)—— 机器学习基础
- Google 和赛门铁克开撕!
- Elasticsearch学习--索引快速检索
- 如何才能够有效长高?避免走弯路
- listview条目有下划线