import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings("ignore")
# 读取CTG文件
df = pd.read_csv('CTG.csv')
df.head()
# 预处理 去掉不需要的列和空值
df=df.drop(["FileName","Date","SegFile","b","e"],axis=1).dropna()

# 导入pycaret包的分类
from pycaret.classification import *
# 建立分类器,传入完整数据集和预测特征标签
clf = setup(data=df,target='NSP')

# 比较所有分类模型
compare_models()

# 创建xgboost模型
xgboost_classifier=create_model('xgboost')
# 调参优化
tuned_xgboost_classifier=tune_model(xgboost_classifier)

# 绘制分类report
plot_model(tuned_xgboost_classifier,plot='class_report')

# 混淆矩阵
plot_model(tuned_xgboost_classifier,plot='confusion_matrix')

# 保存模型
save_model(tuned_xgboost_classifier,"XGBOOST CLASSIFIER")
# 加载模型
saved_model=load_model('XGBOOST CLASSIFIER')

pycaret实现CTG分类案例相关推荐

  1. [Python人工智能] 十二.循环神经网络RNN和LSTM原理详解及TensorFlow编写RNN分类案例

    从本专栏开始,作者正式开始研究Python深度学习.神经网络及人工智能相关知识.前一篇讲解了TensorFlow如何保存变量和神经网络参数,通过Saver保存神经网络,再通过Restore调用训练好的 ...

  2. 机器学习Sklearn——红酒分类案例详解决策树模型参数

    目录 1 分类树 1.1 红酒分类案例 1.1.1 导入包 1.1.2 观察.分割数据 1.1.3 三段论 2 参数介绍 2.1 重要参数 2.2 控制随机选项参数 2.3 剪枝参数 3 批量测试合适 ...

  3. 机器学习-新闻分类案例

    新闻分类案例 项目概述 用TF-IDF和词袋表示文档特征 使用 CounterVectorizer 和 TfidfTransformer 计算 TF-IDF 直接使用 TfidfVectorizer ...

  4. PySpark——随机森林分类案例

    PySpark--随机森林分类案例 一.随机森林 随机森林案例 """ Random Forest Classifier Example. ""&qu ...

  5. KNN算法解决鸢尾花分类案例

    KNN算法解决鸢尾花分类案例 本文分别通过KNN底层算法实现和sklearn中的KNeighbors Classifier(K近邻分类模拟)和对3中不同的鸢尾花的分类. 一.K近邻(KNN)算法介绍 ...

  6. ML之RF:基于葡萄牙银行机构营销活动数据集(年龄/职业/婚姻/违约等)利用Pipeline框架(两种类型特征并行处理)+RF模型预测(调参+交叉验证评估+模型推理)客户是否购买该银行的产品二分类案例

    ML之RF:基于葡萄牙银行机构营销活动数据集(年龄/职业/婚姻/违约等)利用Pipeline框架(两种类型特征并行处理)+RF模型预测(调参+交叉验证评估+模型推理)客户是否购买该银行的产品二分类案例 ...

  7. Tensorflow 学习之猫狗分类案例

    Tensorflow 学习之猫狗分类案例 本人一直在Cousera上学习Ng Andrew老师的Tensorflow课程,在本次猫狗分类案例当中,我对课程做了相应的记录,呈现在此,一方面加深学习的印象 ...

  8. keras_猫狗分类案例(三)_卷机神经网络的可视化(可视化卷积神经网络的中间输出)

    keras_猫狗分类案例(三)_卷积神经网络的可视化 参考: https://blog.csdn.net/Einstellung/article/details/82832872 卷积神经网络的可视化 ...

  9. python决策树分类案例_银行产品销售案例与决策树分类算法

    案例数据集来源于UCI网站.案例是基于一家葡萄牙金融机构的电话销售数据.营销目标是确认客户是否愿意认购银行发行的一款定期储蓄产品.该数据集内包含41188条记录和20个特征变量,和1个分类变量.变量包 ...

最新文章

  1. 汉字的理据与造字取向
  2. 用eclipse如何解决项目迁移问题
  3. 科大星云诗社动态20210321
  4. OpenCV PCA与指定的保留差异量的实例(附完整代码)
  5. [PHP] 运维新增服务器导致的附件上传失败问题
  6. Node.js基本讲解
  7. 软件测试黑马程序员课后答案_软件测试教程课后答案
  8. vivado 亚稳态_VIVADO时序约束及STA基础
  9. 使用路由器配置DHCP
  10. LINUX下载编译vo-amrwbenc
  11. Android获取应用程序信息——PackageManager的基本使用
  12. 广东电信在线人工服务器,202.96.128.86广东电信DNS故障及解决方法
  13. STGNN(www 2020)论文总结
  14. 控制面板里卸载软件的入口注册表项
  15. 百度地图线路颜色_旅游厕所电子地图:让“方便”更方便
  16. 程序员述职报告和转正
  17. 机械振动学习笔记1-3章
  18. 后端人眼中的Vue(五)
  19. 微信小程序 - 云开发轮询实现定时推送订阅消息
  20. 细看00后90后80后的不同

热门文章

  1. 华为企业业务首登MWC重磅发布数字平台
  2. DataGrid控件实现单选功能
  3. 查看进程PID的几种方法记录-20230328
  4. 网站内容检测-免费整站内容SEO检测软件
  5. 1.聊聊Netty那些事儿之从内核角度看IO模型
  6. 马斯克光环下的 PayPal,枪口对准微信、支付宝?
  7. c++ bind 函数讲解
  8. 【CMU15-445 Part-3】DatabaseStorage i
  9. 安卓发布更新 封堵了高通处理器带来的严重漏洞
  10. 短路与和逻辑与、短路或||和逻辑或|的区别