决策树分析

1.文档读取

data <- read.csv(file.choose(),header=TRUE) </cenetr>
View(data)

2.建立训练数据与测试数据

set.seed(12345)
select <- sample(1:nrow(data),nrow(data)*0.7)
train <- data[select,]
test <- data[-select,]

3、建立模型

library(rpart)
library(rpart.plot)CART.tree <- rpart(Class ~ ., data=train, control=rpart.control(minsplit=2, cp=0))
rpart.plot(CART.tree)

3、模型检验及评价

CART.Prediction <- predict(CART.tree, newdata=test, type='class')Results <- table(Prediction=CART.Prediction, Actual=test$Class)
ResultsCorrect_Rate <- sum(diag(Results)) / sum(Results)
Correct_Rate

4、查找CP并重组检测模型

CART.tree <- prune(CART.tree, cp=0.03)
rpart.plot(CART.tree)CART.Prediction <- predict(CART.tree, newdata=test, type='class')results <- table(Prediction=CART.Prediction, Actual=test$Class)
resultsCorrect_Rate <- sum(diag(results)) / sum(results)
Correct_Rate

问题区:

  1. set.seed(12345)

说明:在此模型中,关于随机种子数的设置会导致实验数据出现异同尽管随机种子在众多博客中只是标识性作用,但实质上在本分析中改变了模型的准确率

  1. 联系方式: crays_1995@foxmail.com

R语言——一秒决策树分析相关推荐

  1. 数据分享|R语言因子分析、相关性分析大学生兼职现状调查问卷数据可视化报告...

    全文链接:http://tecdat.cn/?p=31765 随着大学的普及教育,大学生就业形势变得更加困难,很多学生都意识到这个问题(点击文末"阅读原文"获取完整代码数据). 相 ...

  2. R语言Kaplan-Meier绘制生存分析、Log-rank假设检验、Cox回归曲线实战案例:恶性黑色素瘤的术后数据生存分析

    R语言Kaplan-Meier绘制生存分析.Log-rank假设检验.Cox回归曲线实战案例:恶性黑色素瘤的术后数据生存分析 目录

  3. R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据

    R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据 目录

  4. R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析:拟合连续性自变量和事件风险之间的关系并绘制直方图、平滑曲线、双Y轴于同一个图像中

    R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析:拟合连续性自变量和事件风险之间的关系并绘制直方图.平滑曲线.双Y轴于同一个图像中 目录

  5. R语言教程:生存分析

    生存分析处理预测特定事件将要发生的时间.它也被称为故障时间分析或分析死亡时间.例如,预测患有癌症的人将存活的天数或预测机械系统将失败的时间. 命名为survival的R语言包用于进行生存分析.此包包含 ...

  6. R语言基础数据分析—单因素方差分析

    有了试验数据,我们就需要进行数据的处理与分析,而在试验设计中,通常分为单因素试验或者双因素试验.试验中要考察的指标称为试验指标,影响试验指标的条件称为因素,因素所处的状态称为水平,若试验中只有一个因素 ...

  7. 【R语言文本挖掘】:分析单词和文档频率——TF-IDF

    [R语言文本挖掘]:分析单词和文档频率--TF-IDF

  8. r语言进行go富集分析_R语言-GO富集分析的超几何检验和可视化

    Gene Ontology 可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分.蛋白质或 ...

  9. R语言画图的实例分析,坐标轴,图例等设置

    通过一个具体的案例对R语言的画图进行分析,主要包括辅助线的添加,plot()函数的基本参数设置,以及图例坐标轴的设置. 案例分析 ##数据的输入, dose  <- c(20, 30, 40, ...

最新文章

  1. 常考数据结构与算法:平衡二叉树
  2. 性能测试知多少---系统架构分析
  3. hdu 5182 PM2.5
  4. 【机器视觉】 endwhile算子
  5. 分布式缓存memcached
  6. 在git bush中如何退出vim编辑器
  7. php如何复制一个对象,PHP中的对象复制及__clone() 函数
  8. git如何切换用户_git切换用户、多用户切换的正确方式 git commit和git push 切换用户...
  9. 随想录(由自定义打印函数想到的)
  10. Notes on Operating System
  11. php程序员 软考考什么好,软考考什么好_软考哪个好考_软考哪个更容易考 - 希赛网...
  12. mysql-connector-java-8.0.26.jar MySQLJDBC下载
  13. 【51单片机】:智能交通灯设计(带车流量计数和蜂鸣功能)
  14. OPENGL和DX的不同.
  15. 如何做一个2D 横版过关类游戏
  16. 实时统计分析系统-Apache Druid
  17. 论文阅读 Solving Mixed Integer Programs Using Neural Networks
  18. 什么是用户故事地图?
  19. 浙师大和浙商大计算机专业谁好,浙江工商大学与杭州师范大学哪个好些?
  20. 三面阿里失败,幸获阿里P8大牛指点,奋战三个月30*14薪入职字节

热门文章

  1. Oracle BIEE 总结
  2. java来电通1.0_来电通 v1.0.0 iPhone版
  3. php和java哪个好学,哪个好找工作,好就业
  4. 【Windows Server 2019】网络负载均衡服务配置与管理——安装配置及验证
  5. OpenCV—PnP单目测距
  6. brew安装、启动nginx,Error
  7. 现在android开发都会用到那些快速开发框架或者第三库?Android百大框架分享,附完整项目
  8. Godot Engine:布娃娃系统(Ragdoll System)及物理骨骼(PhysicalBone)的工作流程
  9. windows下使用fftw进行傅里叶变换及其编程实例
  10. ChatGPT: History is temporarily unavailable. We‘re working to restore this feature as soon as possib