python one hot编码_对python sklearn one-hot编码详解
one-hot编码的作用
使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点
将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。
sklearn的一个例子
from sklearn import preprocessing
enc = preprocessing.OneHotEncoder()
enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数
print(enc.transform([[0,1,3]]).toarray())
print(enc.transform([[0,1,1]]).toarray())
上面代码enc.fit()里有一个4行3列的矩阵
1、每一列对应于一个样本的特征序列,即一个样本有三个特征
2、4行表明传入了4个样本
3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3
4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串
以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
python one hot编码_对python sklearn one-hot编码详解相关推荐
- python面向对象难学_学不下去了!?详解Python面向对象核心概念,简历没跑了
目前代码技能已经成了测试同学面试考核的刚需,对于测试开发来讲需求最大的是java和python两门语言,二者也都是面向对象语言.对于刚入门代码的同学来说面向对象相关的概念比较难于理解,而面向对象编程相 ...
- python 操作excel神器_【转】多图+代码 | 详解Python操作Excel神器openpyxl的各种操作!...
转自:https://blog.csdn.net/weixin_41846769/article/details/108273349 前言 大家好,在之前的十几篇办公自动化系列文章中,我们大多是以真实 ...
- python符号格式化设置区间_Python 数值区间处理_对interval 库的快速入门详解
使用 Python 进行数据处理的时候,常常会遇到判断一个数是否在一个区间内的操作.我们可以使用 if else 进行判断,但是,既然使用了 Python,那我们当然是想找一下有没有现成的轮子可以用. ...
- [Python从零到壹] 十一.数据分析之Numpy、Pandas、Matplotlib和Sklearn入门知识万字详解(1)
欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...
- python硬件交互_对Python的交互模式和直接运行.py文件的区别详解
对Python的交互模式和直接运行.py文件的区别详解 看到类似C:\>是在Windows提供的命令行模式,看到>>>是在Python交互式环境下. 在命令行模式下,可以执行p ...
- python怎么去掉视频字幕_利用Python实现字幕挂载(把字幕文件与视频合并)思路详解...
其实超简单超简单!python好现成的库,一下子省略了好多步骤! 本文在Windows环境下!linux只是不需要手动输入imagicmagick的位置! 需要用到的环境 python(基本上只要不是 ...
- python编译器怎么运行不在路径中的py文件_对python当中不在本路径的py文件的引用详解...
众所周知,如果py文件不在当前路径,那么就不能import,因此,本文介绍如下两种有效的方法: 方法1: 修改环境变量,在~/.bashrc里面进行修改,然后source ~/.bashrc 方法2: ...
- python类继承中构造方法_第8.3节 Python类的__init__方法深入剖析:构造方法与继承详解...
第8.3节Python类的__init__方法深入剖析:构造方法与继承详解 一. 引言 上两节介绍了构造方法的语法及参数,说明了构造方法是Python的类创建实例后首先执行的方法,并说明如果类没 ...
- python跨函数调用变量_对python中不同模块(函数、类、变量)的调用详解
首先,先介绍两种引入模块的方法. 法一:将整个文件引入 import 文件名 文件名.函数名( ) / 文件名.类名 通过这个方法可以运行另外一个文件里的函数 法二:只引入某个文件中一个类/函数/变量 ...
- python中的异常分类_列举 5 个 Python 中的异常类型以及其含义【面试题详解】
今天爱分享给大家带来列举 5 个 Python 中的异常类型以及其含义[面试题详解],希望能够帮助到大家. BaseException +-- SystemExit +-- KeyboardInter ...
最新文章
- eBay:大数据和人工智能是2017年电商发展关键因素
- CTFshow 爆破 web23
- loj 1316(spfa预处理+状压dp)
- go vs python 对接外部web api_python--web--让python提供api服务--aiohttp-Go语言中文社区
- c语言运行后没生成exe,这个程序怎么运行?为什么显示没有exe??
- 福建高职计算机知识点,2013福建高职单招 计算机类专业 知识试题
- 安装rtx时报错因计算机中丢失lo,policy.3.1.IntervalZero.RTX64.dll
- ffmpeg vaapi 驱动问题
- 编程软件python-零基础学Python编程需要安装什么软件?
- 三个小白是如何在三个月内搭一个基于kaldi的嵌入式在线语音识别系统的
- 怎么多快好省地学习中文自然语言处理
- 一个OEIS数列的通式
- 几点思考-人生哲学,生活方式---ShinePans
- java工作经验总结
- 尾行注释转行上注释 正则表达式
- leetcode 1567 替换所有问号
- maven创建web项目
- linux 7进入目录的命令,centos7目录统计之du命令
- 企业微信管理客户如何管理?
- android手游直播怎么推流,安卓手机直播,Total Control手游投屏教程
热门文章
- Java8新特性 consumer
- VS2013中直接浏览网页显示“无法显示此页”的可能原因
- 时间序列(time serie)分析系列之时间序列特征(feature)7
- matlab8级量化信号,编程题-8级均匀PCM量化器-路过的朋友们,帮忙看下。 – MATLAB中文论坛...
- tar 打包压缩解压命令
- ssm毕设项目基于HTML5的流浪动物领养平台yww0b(java+VUE+Mybatis+Maven+Mysql+sprnig)
- 位置式 PID 算法、恩智浦杯智能车电机PID
- linux清空buff,linux 清理缓存buff/cache
- gearman java例子_GearMan Java版试用 02- 简单应用之Worker编写和说明
- Android实现加载(loading)图片旋转的三种方式