python:sklearn标签编码(LabelEncoder)
python:sklearn标签编码(LabelEncoder)
sklearn.preprocessing.LabelEncoder的使用:
在训练模型之前,通常都要对数据进行一定得处理。将类别编号是一种常用的处理方法,比如把类别“电脑”,“手机”编号为0和1,可使用LabelEncoder函数。
作用
将n个类别编码为0~n-1之间的整数(包括0和n-1)
例子
假设对电子产品数据进行编码,数据可以分为两种情况:有NaN,无NaN
方法一:使用fit()函数及transform()函数
from sklearn import preprocessingdata=['电脑','手机','手机','手表']enc=preprocessing.LabelEncoder()
enc=enc.fit(['电脑','手机','手表'])#训练LabelEncoder,将电脑,手表,手机编码为0,1,2
data=enc.transform(data)#使用训练好的LabelEncoder对原数据进行编码,也叫归一化print(data)#[2 0 0 1]
方法二:使用fit_transform函数
from sklearn import preprocessingdata=['电脑','手机','手机','手表']enc=preprocessing.LabelEncoder()
data=enc.fit_transform(data)#训练LabelEncoder,将电脑,手表,手机编码为0,1,2print(data)#[2 0 0 1]
fit,transform,fit_transform区别看连接
python:sklearn标签编码(LabelEncoder)相关推荐
- python one hot编码_对python sklearn one-hot编码详解
one-hot编码的作用 使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点 将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类 ...
- OneHotEncoder独热编码和 LabelEncoder标签编码——机器学习
学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别. 首先了解机器学习中的特征类别:连续型特征和离散型特征 拿到 ...
- 独热编码(OneHotEncoder)和标签编码(LabelEncoder)
数据分类 我们在构建模型对数据进行训练之前,需要对数据进行特征工程,我们的数据可以分为连续型和离散型. 对于连续型数据,我们一般的做法是对其进行标准化或者归一化,之前写过一篇标准化和归一化的介绍,大家 ...
- python独热编码作用_关于sklearn独热编码
一.数值型类别变量 #简单来说 LabelEncoder 是对不连续的数字或者文本进行编号 from sklearn.preprocessing import LabelEncoder le = La ...
- python sklearn学习笔记大全(常见代码速查)
skleran是python中常见的机器学习包,整理下笔记.方便查询. 官方文档链接:sklearn官方英文文档 常见模型 from sklearn.linear_model import Linea ...
- python 分类变量编码_深度学习编码分类变量的3种方法——AIU人工智能学院
:数据科学.人工智能从业者的在线大学. 数据科学(Python/R/Julia) 作者 | CDA数据分析师 像Keras中的机器学习和深度学习模型一样,要求所有输入和输出变量均为数字. 这意味着,如 ...
- 机器学习之数据预处理——特征编码(标签编码,独热编码)
机器学习之数据预处理--特征编码 数据预处理--特征编码 离散数据的编码 标签编码 sklearn LabelEncoder(使用fit_transform函数) sklearn LabelEncod ...
- python+sklearn训练决策树分类模型(绘制学习曲线和验证曲线)
本文所用文件的链接 链接:https://pan.baidu.com/s/1RWNVHuXMQleOrEi5vig_bQ 提取码:p57s 关于决策树的初级应用,可以看我之前的文章: https:// ...
- python sklearn 回归案例:车流量预测
文件下载地址: 链接:https://pan.baidu.com/s/1e68J9gubRGc9WkRDPh97tQ 提取码:uxwj """回归案例 车流量预测根据已有 ...
最新文章
- usaco Money system
- 为基于类的策略选择突发数据量和超额突发数据量
- 线性代数 —— 矩阵与矩阵运算
- 【186天】黑马程序员27天视频学习笔记【Day15-上】
- appium+python自动化-adb shell模拟点击事件(input tap)
- CUDA——Windows上CUDA的安装教程
- Java基础练习之流程控制(四)
- Python书籍推荐:《Python编程之美:最佳实践指南》
- 新春活动策划案例(共31份)
- Google浏览器调试页面时设置分辨率
- Redies(一款高性能的数据库)
- 分数阶微积分_通知 | 上海大学理学院微积分小导师答疑第一期
- linpack环境搭建:Openmpi+Openblas+HPL安装教程
- matlab中字体修改,matlab——修改图中字体
- HTTP response codes
- 短视频平台api接口php源码
- phpmywind教程:单页信息调用说明【进阶篇一】
- 关于公众号的运营干货与常用的工具
- 数码管显示电路的设计
- 浅析M-lag技术(后附华为交换机配置命令)