【机器学习实战】使用sklearn中的决策树对红酒数据集进行分类(Jupyter)
1. sklearn中的决策树
2. sklearn基本建模流程
3.决策树的基本流程
4.代码实现
4.1 数据集 —— 红酒
- 特征值(前13列)
- 目标值(3类)
4.2 代码及结果
4.2.1 预测部分
# 获取数据集
wine = load_wine()
# 划分数据集
x_train, x_test, y_train, y_test = train_test_split(wine.data, wine.target, test_size=0.3)
# 建模
clf = tree.DecisionTreeClassifier(criterion='entropy',random_state=30)
clf = clf.fit(x_train, y_train)
score = clf.score(x_test, y_test) # 分类的精确度
print(score)
结果:
4.2.2 绘制分类树
# 绘制树
feature_name = ['酒精','苹果酸','灰','灰的碱性','镁','总酚','类黄酮','非黄烷类酚类','花青素','颜色强度','色调','od280/od315稀释葡萄酒','脯氨酸']
class_name = ["琴酒","雪莉","贝尔摩德"]
dot_data = tree.export_graphviz(clf,feature_names = feature_name,class_names = class_name,filled = True,rounded = True)
graph = graphviz.Source(dot_data)
graph
结果:
4.2.3 特征重要性
# 特征重要性
clf.feature_importances_
[*zip(feature_name, clf.feature_importances_)]
结果
5.参数选择
5.1 max_depth 选择
%matplotlib inline
import matplotlib.pyplot as plttest = []for i in range(10): clf = tree.DecisionTreeClassifier(max_depth = i+1,criterion='entropy',random_state=30)clf = clf.fit(x_train, y_train)score = clf.score(x_test, y_test)test.append(score)plt.plot(range(1,11), test, color='red', label='max_depth')
plt.legend()
plt.show()
结果:
参考: sklearn菜菜的b站视频以及文档。
【机器学习实战】使用sklearn中的决策树对红酒数据集进行分类(Jupyter)相关推荐
- 利用sklearn中的Kmeans对seeds_dataset数据集进行分类分析
目录 前言 一.k-means主要步骤 二.数据集 三.不使用PCA降维 1.读入数据 2.找簇心 3.训练以及评估 4.完整代码 四.使用PCA降维 五.对比结果 前言 本篇文章是主要讲述利用skl ...
- 【阿旭机器学习实战】【13】决策树分类模型实战:泰坦尼克号生存预测
[阿旭机器学习实战]系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流. 本文用机器学习中的决策树分类模型对泰坦尼克号生存项目进行预测. 关于决策树的详细介绍及原理参见前一 ...
- 【ML/DL】python3学习《机器学习实战》书中的报错及解决办法
python3学习<机器学习实战>书中的报错及解决办法(更新中) <机器学习实战>是一本很不错的书,其采用的是py2的语法格式,在用最新的python3.6编写代码的过程中,书 ...
- sklearn中的决策树(分类)
本文在我的知乎上同步更新:sklearn中的决策树(分类) - 知乎 Sklearn库有很多机器学习模型,不同的模型有着不同的特点,针对不同的问题,选取对应的模型,可以很好地解决问题.树模型作为经典的 ...
- sklearn中的决策树(回归)
本文在我的知乎上同步分享:sklearn中的决策树(分类) - 知乎 前面提到,sklearn中的tree模组有DecisionTreeClassifier与DecisionTreeRegressor ...
- 机器学习实验:使用sklearn的决策树算法对葡萄酒数据集进行分类
机器学习实验:使用sklearn的决策树算法对葡萄酒数据集进行分类 问题如下: 使用sklearn的决策树算法对葡萄酒数据集进行分类,要求: ①划分训练集和测试集(测试集占20%) ②对测试集的预测类 ...
- 【机器学习实战】利用sklearn中的随机森林对红酒数据集进行分类预测
1. sklearn中的集成算法 sklearn中的集成算法模块ensemble 2.预测代码及结果 %matplotlib inline from sklearn.tree import Decis ...
- 免费课程 | 云脑机器学习实战训练营,中美大咖携手带你飞!
随着机器学习的不断发展,人工智能掀起了新一轮的热潮.这次人工智能的复兴,最大的特点就是AI能够走入业界的真实应用场景,与商业模式紧密结合,开始在产业界发挥出真正的价值. 在业界的真实应用中,如何挖掘用 ...
- 决策树5:剪枝与sklearn中的决策树
0x01 剪枝 当训练数据量大.特征数量较多时构建的决策树可能很庞大,这样的决策树用来分类是否好?答案是否定的. 决策树是依据训练集进行构建的,为了尽可能正确地分类训练样本,结点划分过程将不断重复,有 ...
最新文章
- 激光雷达激烈竞争市场
- 博客笔记导读目录-temp
- SAP系统里的胖接口Fat interface
- SpringMVC之——转发与重定向
- 调用图灵机器人API实现简单聊天
- python asyncio tcp转发_asyncio不通过tcp发送整个图像数据
- SCOM 2016 配置报警邮件 (下)
- Python+OpenCv实现摄像头人脸识别
- html 跑步比赛小游戏,跑步比赛小班游戏教案
- 常用服务器查询日志命令(持续添加)
- word 2016 设置边框 大小 长宽
- Node.js 更新到最新版本
- SparkStreaming 实现广告计费系统中在线黑名单过滤实战
- android5.0源码开发之NVRam存储,恢复出厂设置数据不被擦除--上篇
- shell 经典教程[大神之路]
- IDEA因Untrusted project无法导入jar包解决方法
- 8 月最新编程语言排行榜
- 人性的弱点-读书总结
- 别再迷茫了,熬夜肝了一份适合普通大学生的学习路线
- 国密wireshark下载