数据链接:FE_pima-indians-diabetes.csv · biabianm/pima-indians-diabetes - Gitee.com

import pandas as pd
from sklearn.model_selection import train_test_split  # 数据分离
from sklearn.linear_model import LogisticRegression  # 逻辑回归模型
from sklearn import metrics  # 准确率评估path = f"../FE_pima-indians-diabetes.csv"def confusion_matrix_test():"""pima 印第安人糖尿病混淆矩阵分析:return:"""pima = pd.read_csv(path)print(pima.columns.values)# x,y赋值feature_names = ['pregnants', 'serum_insulin', 'BMI', 'Age']x = pima[feature_names]y = pima['Target']# 维度确认print(x.shape)print(y.shape)# 数据分离x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=0)# 模型训练logreg = LogisticRegression()logreg.fit(x_train, y_train)# 基于测试数据集结果预测y_pred = logreg.predict(x_test)# 使用准确率进行评估print(metrics.accuracy_score(y_test, y_pred))# 确认自负样本数据量print(y_test.value_counts())# 1的比例print(y_test.mean())# 0的比例print(1 - y_test.mean())# 空准确率print(max(y_test.mean(), 1 - y_test.mean()))# 单独准确率评估局限性大# 混淆矩阵实现# 计算展示混淆矩阵print(metrics.confusion_matrix(y_test, y_pred))# 展示部分实际结果与预测结果(25组)print("true", y_test.values[0:25])print("pred", y_pred[0:25])# 四个因子赋值confusion = metrics.confusion_matrix(y_test, y_pred)TN = confusion[0, 0]FP = confusion[0, 1]FN = confusion[1, 0]TP = confusion[1, 1]print(TN, FP, FN, TP)# 混淆矩阵指标# 准确率accuracy = (TP + TN) / (TP + TN + FP + FN)print(accuracy)print(metrics.accuracy_score(y_test, y_pred))# 错误率mis_rate = (FP + FN) / (TP + TN + FP + FN)print(mis_rate)print(1 - accuracy)# 灵敏度(召回率:正样本中,预测正确的比例)recall = TP / (TP + FN)print(recall)# 特异度:负样本中,预测正确的比例specificity = TN / (TN + FP)print(specificity)# 精确率:预测结果为正的样本中,预测正确的比例precision = TP / (TP + FP)print(precision)# F1分数:综合Precision和Recall的一个判断指标f1_recall = 2 * precision * recall / (precision * recall)print(f1_recall)if __name__ == '__main__':confusion_matrix_test()

sklearn 混淆矩阵分析pima 印第安人糖尿病数据相关推荐

  1. 学习笔记——仅仅为了留下Pima印第安人糖尿病发病数据集的网址

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/qq_42370150/article/ ...

  2. Pima Indians Diabetes Database(Pima印第安人糖尿病数据库)

    原文: Pima Indians Diabetes Database Predict the onset of diabetes based on diagnostic measures This d ...

  3. 跟我一起学Python——机械学习实现之数据预处理(混淆矩阵,印第安人糖尿病案例)(Second day)

    首先说明一下,我使用的是上一篇所说的jupyter Notebook ,所以有一些是标记,并没有带"#"注释,这里边也用到了上次所说的两个库,sklearn以及panda数据导入的 ...

  4. 多层感知器(MLP)详解【基于印第安人糖尿病数据】

    文章目录: 1 概述 2 Pima印第安人数据集 3 导入数据和keras 4 定义模型 5 编译模型 6 训练 7 评估和预测 8 完整代码 1 概述 多层感知器是最简单的神经网络模型,用于处理机器 ...

  5. Python机器学习零基础入门 -- Pima印第安人糖尿病发病数据集统计分析

    查看对应的版本 # 下载和安装Python和SciPy # Python version import sys print('Python: {}'.format(sys.version)) # sc ...

  6. 糖尿病预测模型-Pima印第安人数据集-论文_企业科研

    糖尿病概述 糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变.肾脏疾病.高血 ...

  7. 《Keras深度学习:入门、实战与进阶》之印第安人糖尿病诊断

    本文摘自<Keras深度学习:入门.实战与进阶>. 1.数据理解 本节使用Pima Indians糖尿病发病情况数据集.该数据集最初来自国家糖尿病/消化/肾脏疾病研究所.数据集的目标是基于 ...

  8. 实战五:基于Pima印第安人数据——Model_ensemble-example

    数据读取 import pandas as pd # 数据科学计算工具data = "pima-indians-diabetes.data.csv" #年纪.怀孕.血液检查的次数. ...

  9. 机器学习之模型训练(二)皮马印第安人糖尿病数据集

    1. 数据说明: Pima Indians Diabetes Data Set(皮马印第安人糖尿病数据集) 根据现有的医疗信息预测5年内皮马印第安人糖尿病发作的概率. 数据链接:https://arc ...

最新文章

  1. dsoframer控件注册,解注册和检查注册情况
  2. 设计模式--建造者(Builder)模式
  3. 【转】3D图形引擎(DX9): FX
  4. ST_Curve --- 一个专业的曲线绘制控件
  5. 如何申请一份iOS工作
  6. Oracle 调度程序(scheduler)摘自一位大神
  7. 使用Apache KeyedObjectPool的ssh连接池
  8. Caused by: java.lang.NoSuchMethodError: javax.persistence.spi.PersistenceUnitInfo.getValidationMode(
  9. CString::Format出现的Buffer too small错误
  10. python网络爬虫系列教程——Python+PhantomJS +Selenium组合应用
  11. replace vfp_VFP字符串替换函数CHRTRAN()使用方法
  12. xamarin android界面框架,Xamarin图表开发基础教程(3)OxyPlot框架
  13. 人工智能助力三维几何自动化建模
  14. Linux服务器重启后crs,Linux服务器重启后crs_stat -t 命令无法正常使用以及解决思路...
  15. 计算机处理器缓存参数,小知识:通俗易懂理解处理器中的主频、架构、核心、线程、缓存...
  16. 什么是重放攻击与中间人攻击?
  17. php获取蓝凑云文件列表,蓝奏云网盘登录获取文件例程
  18. iOS公司开发者账号申请详细教程
  19. vue3-element-admin 后台管理系统模板
  20. 基于Python+django的 天天生鲜超市网上购物商城-计算机毕业设计

热门文章

  1. 上海大学计算机考研专业群,19考研|2019考研专业、院校交流群,请对号入座!...
  2. 量具管理-GUI模板
  3. ext 两个grid横向排列_Intel新研究:180°横向FOV的曲面VR光学模组,体积缩减二分之一...
  4. H5调用iOS和安卓方法
  5. c语言程序设计神奇算式,神奇算式
  6. 导出数据库dmp出现EXP-00091: Exporting questionable statistics.问题解决!
  7. EXP-00091: Exporting questionable statistics 问题
  8. 弹性均质圆环法计算过程_第十章盾构隧道衬砌计算方法综述.ppt
  9. extjs 方法执行顺序_透析Extjs的Ext.js源码(二)能在定义时就能执行的方法的写法 function(){...}...
  10. mykit-db-sync之——数据库同步工具正式开源