one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])

print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

python one hot编码_对python sklearn one-hot编码详解相关推荐

  1. python面向对象难学_学不下去了!?详解Python面向对象核心概念,简历没跑了

    目前代码技能已经成了测试同学面试考核的刚需,对于测试开发来讲需求最大的是java和python两门语言,二者也都是面向对象语言.对于刚入门代码的同学来说面向对象相关的概念比较难于理解,而面向对象编程相 ...

  2. python 操作excel神器_【转】多图+代码 | 详解Python操作Excel神器openpyxl的各种操作!...

    转自:https://blog.csdn.net/weixin_41846769/article/details/108273349 前言 大家好,在之前的十几篇办公自动化系列文章中,我们大多是以真实 ...

  3. python符号格式化设置区间_Python 数值区间处理_对interval 库的快速入门详解

    使用 Python 进行数据处理的时候,常常会遇到判断一个数是否在一个区间内的操作.我们可以使用 if else 进行判断,但是,既然使用了 Python,那我们当然是想找一下有没有现成的轮子可以用. ...

  4. [Python从零到壹] 十一.数据分析之Numpy、Pandas、Matplotlib和Sklearn入门知识万字详解(1)

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  5. python硬件交互_对Python的交互模式和直接运行.py文件的区别详解

    对Python的交互模式和直接运行.py文件的区别详解 看到类似C:\>是在Windows提供的命令行模式,看到>>>是在Python交互式环境下. 在命令行模式下,可以执行p ...

  6. python怎么去掉视频字幕_利用Python实现字幕挂载(把字幕文件与视频合并)思路详解...

    其实超简单超简单!python好现成的库,一下子省略了好多步骤! 本文在Windows环境下!linux只是不需要手动输入imagicmagick的位置! 需要用到的环境 python(基本上只要不是 ...

  7. python编译器怎么运行不在路径中的py文件_对python当中不在本路径的py文件的引用详解...

    众所周知,如果py文件不在当前路径,那么就不能import,因此,本文介绍如下两种有效的方法: 方法1: 修改环境变量,在~/.bashrc里面进行修改,然后source ~/.bashrc 方法2: ...

  8. python类继承中构造方法_第8.3节 Python类的__init__方法深入剖析:构造方法与继承详解...

    第8.3节Python类的__init__方法深入剖析:构造方法与继承详解 一.    引言 上两节介绍了构造方法的语法及参数,说明了构造方法是Python的类创建实例后首先执行的方法,并说明如果类没 ...

  9. python跨函数调用变量_对python中不同模块(函数、类、变量)的调用详解

    首先,先介绍两种引入模块的方法. 法一:将整个文件引入 import 文件名 文件名.函数名( ) / 文件名.类名 通过这个方法可以运行另外一个文件里的函数 法二:只引入某个文件中一个类/函数/变量 ...

  10. python中的异常分类_列举 5 个 Python 中的异常类型以及其含义【面试题详解】

    今天爱分享给大家带来列举 5 个 Python 中的异常类型以及其含义[面试题详解],希望能够帮助到大家. BaseException +-- SystemExit +-- KeyboardInter ...

最新文章

  1. eBay:大数据和人工智能是2017年电商发展关键因素
  2. CTFshow 爆破 web23
  3. loj 1316(spfa预处理+状压dp)
  4. go vs python 对接外部web api_python--web--让python提供api服务--aiohttp-Go语言中文社区
  5. c语言运行后没生成exe,这个程序怎么运行?为什么显示没有exe??
  6. 福建高职计算机知识点,2013福建高职单招 计算机类专业 知识试题
  7. 安装rtx时报错因计算机中丢失lo,policy.3.1.IntervalZero.RTX64.dll
  8. ffmpeg vaapi 驱动问题
  9. 编程软件python-零基础学Python编程需要安装什么软件?
  10. 三个小白是如何在三个月内搭一个基于kaldi的嵌入式在线语音识别系统的
  11. 怎么多快好省地学习中文自然语言处理
  12. 一个OEIS数列的通式
  13. 几点思考-人生哲学,生活方式---ShinePans
  14. java工作经验总结
  15. 尾行注释转行上注释 正则表达式
  16. leetcode 1567 替换所有问号
  17. maven创建web项目
  18. linux 7进入目录的命令,centos7目录统计之du命令
  19. 企业微信管理客户如何管理?
  20. android手游直播怎么推流,安卓手机直播,Total Control手游投屏教程

热门文章

  1. Java8新特性 consumer
  2. VS2013中直接浏览网页显示“无法显示此页”的可能原因
  3. 时间序列(time serie)分析系列之时间序列特征(feature)7
  4. matlab8级量化信号,编程题-8级均匀PCM量化器-路过的朋友们,帮忙看下。 – MATLAB中文论坛...
  5. tar 打包压缩解压命令
  6. ssm毕设项目基于HTML5的流浪动物领养平台yww0b(java+VUE+Mybatis+Maven+Mysql+sprnig)
  7. 位置式 PID 算法、恩智浦杯智能车电机PID
  8. linux清空buff,linux 清理缓存buff/cache
  9. gearman java例子_GearMan Java版试用 02- 简单应用之Worker编写和说明
  10. Android实现加载(loading)图片旋转的三种方式