数据清洗;特征工程;缺失值填补;分类。
na_values["?"]—空
数据特别大,不适合放在内存里面处理,不适合用pandas处理
pandas中的describe()可以将数据所有特征显示出来,describe()显示的是数字特征,非数字特征加上include=[‘0’]
默认前5行。head(5)
子图作用:将每一个特征尽可能的表现出来
对所有特征有一个大的认知
missingno查看确实值,中间画白色横线的都有缺失
目标:了解有哪些特征;了解这些特征与目标之间的关系
缺失值:要么去除;要么填补。填补方式:均值,众数,中位数,也可以用线性回归的方式拟合缺失值。数据量特别大,可以去除。数据处理在机器学习中非常重要,基分类器对数据非常的敏感

一个一个看特征:

将预测值变成0,1;然后做一个0,1的分布图;
当样本不均匀的时候,用逻辑回归效果会更好。

分成十块,忽略部分
分箱知识了解
最好的分布是:正态分布
机器学习接受的是数字型变量;将字符型编码为数字型的过程—编码;我们用到:One-Hot;Lable encoding
将以前的连续型的数据变成0,1二值型
降维两种算法:PCA,SVD
选择:过滤+包装+嵌入式
需要明确的是:选择了什么模型,调整了什么参数;

机器学习分类综合案例相关推荐

  1. Python_机器学习_常用科学计算库_第6章_ Seaborn+综合案例

    Python_机器学习_常用科学计算库_第6章_ Seaborn+综合案例 文章目录 Python_机器学习_常用科学计算库_第6章_ Seaborn+综合案例 Seaborn 学习目标 6.1 Se ...

  2. 【机器学习-分类】一句话+一张图说清楚朴素贝叶斯算法(附案例+代码)

    说在前面 同一个算法本身存在各种不同的变体,即各种改进版本.一句话+一张图并不能涵盖所有情况,只是尽量用通俗的语言介绍其中经典的算法版本.希望对某算法本身不了解的人看完能迅速get到该算法在干什么:二 ...

  3. 机器学习之sklearn-KNN近邻算法分类小案例(乳腺癌预测最优模型)

    (案例):用sklearn包实现knn分类小案例,通过交叉验证网格搜索获取最优参数模型,进行参数评估. 导包: from sklearn.datasets import load_breast_can ...

  4. 【理论 | 代码】机器学习分类与回归性能评估指标大全

    一.回归指标 1.1 均方误差(Mean Squared Error, MSE) MSE 称为均方误差,又被称为 L2 范数损失,该统计参数是预测数据和原始数据对应点误差的平方和的均值,公式如下: M ...

  5. 2021年大数据Hive(十二):Hive综合案例!!!

    全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive综合案例 一.需求描述 二.项目表的字段 三.进 ...

  6. 15分钟带你入门sklearn与机器学习——分类算法篇

    作者 | 何从庆 本文转载自AI算法之心(ID:AIHeartForYou) [导读]众所周知,Scikit-learn(以前称为scikits.learn)是一个用于Python编程语言的免费软件机 ...

  7. 来!一起捋一捋机器学习分类算法

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:算法与数学之美 可是,你能够如数家珍地说出所有常用的分类算法,以及他们的特征.优 ...

  8. 利用深度学习(Keras)进行癫痫分类-Python案例

    目录 癫痫介绍 数据集 Keras深度学习案例 本分享为脑机学习者Rose整理发表于公众号:脑机接口社区 QQ交流群:903290195 癫痫介绍 癫痫,即俗称"羊癫风",是由多种 ...

  9. 机器学习:分类_机器学习基础:K最近邻居分类

    机器学习:分类 In the previous stories, I had given an explanation of the program for implementation of var ...

最新文章

  1. Java中static的作用详解_java中static作用详解
  2. python创建excel_python创建Excel文件数据的方法
  3. .Net——使用DataContractJsonSerializer进行序列化及反序列化基本操作
  4. GenXus学习笔记——Transaction的建立
  5. Full_of_Boys训练1总结
  6. Apache Apollo REST API
  7. 博士毕业2年后,他成为985大学副院长
  8. Merge Into 语句代替Insert/Update在Oracle中的应用实战
  9. 【破解】Flash Decompiler Trillix.4.1.1.720 破解补丁
  10. HCIE-RS面试----数据帧格式
  11. Ubuntu 19 ✖64安装GDAL
  12. java clone()用法_java clone方法使用详解(转)
  13. java中访问权限控制顺序_Java中的四种访问权限控制 | 学步园
  14. macos系统安装homebrew包管理工具
  15. Greenplum 实时数据仓库实践(5)——实时数据同步
  16. 从Controller注解切入了解spring注解原理
  17. psn注册什么服务器,怎么注册PSN港服账号?PSN港服官网注册教程
  18. lesson 12 goodbye and good luck 再见,一路顺风-将来时态-early in the morning
  19. codewars练习(javascript)-2021/3/16
  20. C/C++标准库之numeric

热门文章

  1. 浅谈IC卡、ID卡、M1卡和CPU卡
  2. RetinaFace论文阅读
  3. MGR Switch Muti-Primary to single_primary
  4. mui打包ios_MUI打包APP流程
  5. 【信用评分预测模型(四)】Python随机森林模型
  6. Minecraft 服务器搭建
  7. 记录微博爬虫遇到问题
  8. 最详细前端vue框架实现结束日期大于开始日期以及计算两个日期天数差
  9. 手机扫描网页二维码登录实现原理分析
  10. 如何自动注销Linux服务器系统中不活动的用户