机器学习——糖尿病预测
- 实验目的
表格数据分类,糖尿病预测。
根据生活、饮食、教育、收入等属性,预测得1型、2型和不得糖尿病的概率。
- 实验内容
- 获得数据
- 从数据探索和数据可视化中获得洞见
- 数据探索
- 数据预处理
- 划分数据并训练模型
- 微调模型
- 编码
#获取数据
import pandas as pd
diabetes = pd.read_csv('糖尿病预测.csv')
print('dataset shape {}'.format(diabetes.shape))
diabetes.head()
结果:
#输出前五行数据
from sklearn.model_selection import train_test_split
diabetes.info()
x_train, x_test, y_train, y_test = train_test_split(
diabetes.loc[:, diabetes.columns != 'Diabetes_012'],
diabetes['Diabetes_012'], stratify=diabetes['Diabetes_012'],
random_state=66)
#数据相关性
corr = diabetes.corr()
Corr
#绘图
import seaborn as sns
import matplotlib.pyplot as plt
sns.countplot(diabetes['Diabetes_012'], label="Count")
plt.show("糖尿病数据处理图片")
输出图片:
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors=9)
knn.fit(x_train, y_train)
print("Accuracy of K-NN classifier on training set: {:.2f}".format(knn.score(x_train, y_train)))
print("Accuracy of K-NN classifier on test set: {:.2f}".format(knn.score(x_test, y_test)))
输出结果:
# 数据探索
%matplotlib inline
import matplotlib.pyplot as plt
diabetes.hist(bins=50, figsize=(20,15))
plt.show()
from sklearn.metrics import confusion_matrix
from sklearn.metrics import classification_report
y_pred = knn.predict(x_test)
print(classification_report(y_pred, y_test))
confusion = confusion_matrix(y_pred, y_test)
df_cm = pd.DataFrame(confusion)
plt.figure()
sns.heatmap(df_cm, annot=True)
plt.savefig('confusion_matrix')
plt.show()
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr.fit(x_train,y_train)
predictions = lr.predict(x_test)
lr.predict_proba([[0,0,0,30,1,0,0,1,1,0,0,1,0,30,0,13,1,0,11,5,3]])
输出结果:
机器学习——糖尿病预测相关推荐
- 【阿旭机器学习实战】【36】糖尿病预测---决策树建模及其可视化
[阿旭机器学习实战]系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流. [阿旭机器学习实战][36]糖尿病预测-决策树建模及其可视化 目录 [阿旭机器学习实战][36]糖 ...
- 利用python机器学习库进行Kaggle皮马印第安人糖尿病预测分析
利用python机器学习库进行Kaggle皮马印第安人糖尿病预测分析 项目摘要 本项目主要使用python对各医学参数与糖尿病之间的关系进行可视化分析.描述性分析.使用scikit-learn机器学习 ...
- 机器学习实验之糖尿病预测
文章目录 机器学习实验之糖尿病预测 **实验内容:** **实验要求:** 加载糖尿病数据集diabetes,观察数据 载入糖尿病情数据库diabetes,查看数据 切分数据,组合成DateFrame ...
- 机器学习 预测模型_使用机器学习模型预测心力衰竭的生存时间-第一部分
机器学习 预测模型 数据科学 , 机器学习 (Data Science, Machine Learning) 前言 (Preface) Cardiovascular diseases are dise ...
- 机器学习糖尿病预测模型-美国疾控中心CDC25万数据集,生物医药企业科研_论文作业_专利
糖尿病概述 糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变.肾脏疾病.高血 ...
- 小组作业:糖尿病预测
提示:该Blog仅用于作业汇报展示,大佬请绕路 文章目录 一.作业介绍 二.数据处理 三.数据分析 四.特征选择 五.模型训练与评价 六.模型优化 七.与原模型进行对比 八.作业总结 一.作业介绍 该 ...
- 计算机书籍-Apress机器学习和预测分析
书名:Microsoft Azure机器学习和预测分析 作者:[美] Roger,Barga,巴尔加,[美] Valentine,Fontama 出版社: 人民邮电出版社 出版时间:2017-08-0 ...
- 50多种适合机器学习和预测应用的API,你的选择是?(2018年版本)
对于做工程项目和搞科研的人来说,有现成的模块或工具使用是一件多么美妙的事情啊,无需访问源码或理解内部工作机制的细节即可完成相应的任务.常用的方法是调用一些API,即一些预先定义的函数,目的是提供应用程 ...
- python财务报表预测股票价格_机器学习股票价格预测从爬虫到预测-数据爬取部分...
声明:本文已授权公众号「AI极客研修站」独家发布 前言 各位朋友大家好,小之今天又来给大家带来一些干货了.上篇文章机器学习股票价格预测初级实战是我在刚接触量化交易那会,因为苦于找不到数据源,所以找的一 ...
最新文章
- BAT都在使用的开源接口管理平台,你用了吗?
- 数学狂想曲(八)——核弹当量问题, Lanchester战争模型, 随机过程
- 离线安装Eclipse的Color theme plugin
- c语言如何监控网卡信息,查看网卡信息及状态和网卡日志信息
- 求第k小的数(洛谷P1923题题解,Java/C++语言描述)
- php带参数跳转页面,如何带参数跳转php界面_后端开发
- 苹果推出网页版Apple Music 浏览器上听音乐 这波操作有点迟?
- OFDM系统MATLAB仿真
- 10月| R社区原创作者免费赠书
- 蓝色清爽可用做排行的侧边列表滑动门代码
- C++“”字符与字符“”相加是连接
- accept 返回0_Netty深入浅出系列:Netty源码分析之accept过程
- 智能陈桥五笔输入法 for linux,智能陈桥五笔 for Linux
- (自适应手机版)中英文双语响应式新材料类网站源码 HTML5新型环保材料网站织梦dedecms模板
- Spring中静态代理与动态代理的实现及区别
- 换个思维学领域建模方法和实践
- mayapython常用模块_Maya入门之在Maya 中使用 Python 的基础知识有那些
- Oracle格式化总结
- awesome PHP之依赖注入容器pimple
- PS案例提升课视频教程
热门文章
- linux环境下载云盘资料
- 【工业智能】传统工业如何实现工业智能?工业发展的痛点体现在哪里?
- skew width_css3 skew()属性怎么用
- python中国余数定理_中国剩余定理CRT(孙子定理)
- vue项目中onscroll的坑
- 计算机毕业设计springboot技术安家租房平台系统设计与实现7i2eb源码+系统+程序+lw文档+部署
- 成都python工作-成都python工资收入多少
- ESP32 基础篇: 启动时 rst cause 和 boot mode
- [转载] 财经郎眼20120402:中美经贸关系解析
- css 2倍行距,如何在css中设置行间距