python:sklearn标签编码(LabelEncoder)

sklearn.preprocessing.LabelEncoder的使用

在训练模型之前,通常都要对数据进行一定得处理。将类别编号是一种常用的处理方法,比如把类别“电脑”,“手机”编号为0和1,可使用LabelEncoder函数。

作用
将n个类别编码为0~n-1之间的整数(包括0和n-1)

例子
假设对电子产品数据进行编码,数据可以分为两种情况:有NaN,无NaN

方法一:使用fit()函数及transform()函数

from sklearn import preprocessingdata=['电脑','手机','手机','手表']enc=preprocessing.LabelEncoder()
enc=enc.fit(['电脑','手机','手表'])#训练LabelEncoder,将电脑,手表,手机编码为0,1,2
data=enc.transform(data)#使用训练好的LabelEncoder对原数据进行编码,也叫归一化print(data)#[2 0 0 1]

方法二:使用fit_transform函数

from sklearn import preprocessingdata=['电脑','手机','手机','手表']enc=preprocessing.LabelEncoder()
data=enc.fit_transform(data)#训练LabelEncoder,将电脑,手表,手机编码为0,1,2print(data)#[2 0 0 1]

fit,transform,fit_transform区别看连接

python:sklearn标签编码(LabelEncoder)相关推荐

  1. python one hot编码_对python sklearn one-hot编码详解

    one-hot编码的作用 使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点 将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类 ...

  2. OneHotEncoder独热编码和 LabelEncoder标签编码——机器学习

    学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别. 首先了解机器学习中的特征类别:连续型特征和离散型特征 拿到 ...

  3. 独热编码(OneHotEncoder)和标签编码(LabelEncoder)

    数据分类 我们在构建模型对数据进行训练之前,需要对数据进行特征工程,我们的数据可以分为连续型和离散型. 对于连续型数据,我们一般的做法是对其进行标准化或者归一化,之前写过一篇标准化和归一化的介绍,大家 ...

  4. python独热编码作用_关于sklearn独热编码

    一.数值型类别变量 #简单来说 LabelEncoder 是对不连续的数字或者文本进行编号 from sklearn.preprocessing import LabelEncoder le = La ...

  5. python sklearn学习笔记大全(常见代码速查)

    skleran是python中常见的机器学习包,整理下笔记.方便查询. 官方文档链接:sklearn官方英文文档 常见模型 from sklearn.linear_model import Linea ...

  6. python 分类变量编码_深度学习编码分类变量的3种方法——AIU人工智能学院

    :数据科学.人工智能从业者的在线大学. 数据科学(Python/R/Julia) 作者 | CDA数据分析师 像Keras中的机器学习和深度学习模型一样,要求所有输入和输出变量均为数字. 这意味着,如 ...

  7. 机器学习之数据预处理——特征编码(标签编码,独热编码)

    机器学习之数据预处理--特征编码 数据预处理--特征编码 离散数据的编码 标签编码 sklearn LabelEncoder(使用fit_transform函数) sklearn LabelEncod ...

  8. python+sklearn训练决策树分类模型(绘制学习曲线和验证曲线)

    本文所用文件的链接 链接:https://pan.baidu.com/s/1RWNVHuXMQleOrEi5vig_bQ 提取码:p57s 关于决策树的初级应用,可以看我之前的文章: https:// ...

  9. python sklearn 回归案例:车流量预测

    文件下载地址: 链接:https://pan.baidu.com/s/1e68J9gubRGc9WkRDPh97tQ 提取码:uxwj """回归案例 车流量预测根据已有 ...

最新文章

  1. usaco Money system
  2. 为基于类的策略选择突发数据量和超额突发数据量
  3. 线性代数 —— 矩阵与矩阵运算
  4. 【186天】黑马程序员27天视频学习笔记【Day15-上】
  5. appium+python自动化-adb shell模拟点击事件(input tap)
  6. CUDA——Windows上CUDA的安装教程
  7. Java基础练习之流程控制(四)
  8. Python书籍推荐:《Python编程之美:最佳实践指南》
  9. 新春活动策划案例(共31份)
  10. Google浏览器调试页面时设置分辨率
  11. Redies(一款高性能的数据库)
  12. 分数阶微积分_通知 | 上海大学理学院微积分小导师答疑第一期
  13. linpack环境搭建:Openmpi+Openblas+HPL安装教程
  14. matlab中字体修改,matlab——修改图中字体
  15. HTTP response codes
  16. 短视频平台api接口php源码
  17. phpmywind教程:单页信息调用说明【进阶篇一】
  18. 关于公众号的运营干货与常用的工具
  19. 数码管显示电路的设计
  20. 浅析M-lag技术(后附华为交换机配置命令)

热门文章

  1. Arduino简单实例之四_PS2游戏摇杆
  2. Visual Studio Code——SSH连接Linux
  3. 【小家Spring】SpringBoot中使用Servlet、Filter、Listener三大组件的三种方式以及原理剖析
  4. XSS学习-pikachu靶场之xss
  5. 成品app直播源码中Android酷炫礼物动画实现方案(上篇)
  6. JavaScript:三目运算符
  7. 苹果A10处理器内核图曝光:找不到小核心CPU
  8. 区块链角色对战游戏nft游戏开发
  9. 路由器后面再接一个路由器怎么设置(二级路由)
  10. Python 函数用法之(eval函数)