pandas学习笔记:某一列字符类型转换为离散的数值标签;将某一列数值类型转换成独热码
文章目录
- 将字符串变成离散的数值
- 将离散的数值变量变成独热码
import pandas as pd
将字符串变成离散的数值
- 整个“性别”列只有男和女
df = pd.DataFrame({"性别":["男","女","女","女","男","男","男","男","男","女","女","男"]})
df
性别 | |
---|---|
0 | 男 |
1 | 女 |
2 | 女 |
3 | 女 |
4 | 男 |
5 | 男 |
6 | 男 |
7 | 男 |
8 | 男 |
9 | 女 |
10 | 女 |
11 | 男 |
- 将性别转换成可以用作数据分析的特征,把性别用离散值来表示
df["性别"] = pd.Categorical(df["性别"]).codes
df
性别 | |
---|---|
0 | 1 |
1 | 0 |
2 | 0 |
3 | 0 |
4 | 1 |
5 | 1 |
6 | 1 |
7 | 1 |
8 | 1 |
9 | 0 |
10 | 0 |
11 | 1 |
将离散的数值变量变成独热码
from keras.utils import to_categorical
y = to_categorical(df["性别"],num_classes=2)
y
array([[0., 1.],[1., 0.],[1., 0.],[1., 0.],[0., 1.],[0., 1.],[0., 1.],[0., 1.],[0., 1.],[1., 0.],[1., 0.],[0., 1.]], dtype=float32)
pd.concat([df,pd.DataFrame(y)],axis=1)
性别 | 0 | 1 | |
---|---|---|---|
0 | 1 | 0.0 | 1.0 |
1 | 0 | 1.0 | 0.0 |
2 | 0 | 1.0 | 0.0 |
3 | 0 | 1.0 | 0.0 |
4 | 1 | 0.0 | 1.0 |
5 | 1 | 0.0 | 1.0 |
6 | 1 | 0.0 | 1.0 |
7 | 1 | 0.0 | 1.0 |
8 | 1 | 0.0 | 1.0 |
9 | 0 | 1.0 | 0.0 |
10 | 0 | 1.0 | 0.0 |
11 | 1 | 0.0 | 1.0 |
pandas学习笔记:某一列字符类型转换为离散的数值标签;将某一列数值类型转换成独热码相关推荐
- Free Pascal 学习笔记 第五章 字符类型 Character Types
一.Char类型 一个字符一个字节,包含一个ASCII字符. Char类型通过将字符括在单引号中来指定字符常量,如'a' 'A' 二.WideChar 2个字节大小. 包含UTF-16编码的Unico ...
- MATLAB学习笔记04—MATLAB的字符与字符串类型
MATLAB学习笔记 第4章字符和字符串类型 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 MATLAB学习笔记 一.字符串属性示例 二.字符串数组的索引 三.字符串中的 ...
- Pandas学习笔记(一)
Pandas学习笔记一 Pandas数组读取 读取csv.tsv.txt文件 读取excel文件 读取mysql数据表 Pandas数据结构 创建Series的几种方法 根据标签查询Series数据 ...
- pandas学习笔记之DateFrame
pandas学习笔记之DateFrame 文章目录 pandas学习笔记之DateFrame 1.DateFrame的创建 1)认识DataFrame对象 2)由二维列表创建(默认index和colu ...
- 数据分析之pandas学习笔记(六)(层次化索引、重塑、轴向旋转、行列变换、合并表数据)
数据分析之Pandas学习笔记(六)(层次化索引.重塑.轴向旋转.行列变换.合并表数据) level层次化索引 unstack()与stack()进行重塑,即:行列索引变换 swaplevel()交换 ...
- [Pandas 学习笔记] - No.1 pandas学习笔记
pandas学习笔记 pandas是基于numpy开发出的数据分析包,用于高效地操作大型数据集.pandas的数据结构有三种 分别为 series,dataframe和panel,对应一维,二维,三维 ...
- pandas学习笔记:pandas.Dataframe.rename()函数用法
pandas学习笔记:pandas.Dataframe.rename()函数用法 pandas.Dataframe.rename()函数主要是用来修改Dataframe数据的行名和列名. 主要用到的参 ...
- 《流畅的python》学习笔记之python是什么类型的语言?
讨论类型时,最好考虑两条不同的坐标线! 强类型和弱类型 如果一门语言很少隐式转换类型,说明它是强类型语言.如果经常这么做,说明它是弱类型语言.其中,java,c++和python是强类型语言,php, ...
- pandas学习笔记之Series
pandas学习笔记之Series 文章目录 pandas学习笔记之Series pandas中Series的创建 1)用python中的列表list创建: 2)用numpy数组创建 3)用pytho ...
最新文章
- 基于ARM的GCC编译器,各版本arm-gcc区别与安装
- linux刷新磁盘_Linux内核Page Cache和Buffer Cache关系及演化历史
- keepalived+lvs(HA+LB)
- linux计划任务执行日志,linux中centos制定计划任务执行命令并且输出日志
- 接口传值后不起作用_聊一聊 API 接口测试
- SpringBoot视频教程
- 【不体系】布谷鸟过滤器
- 华为android强刷系统下载地址,华为P6S官方rom固件刷机包下载_华为P6S原版系统强刷升级包...
- 压测学习总结(5)——如何使用Jmeter 进行简单的并发操作
- iptables的详细介绍及配置方法
- python异常和错误的区别_python中错误和异常有什么区别
- excel 工作表保护密码破解代码
- Java整形位运算避免精度缺失,浮点数精度问题透析:小数计算不准确+浮点数精度丢失根源...
- SpringBoot+Quartz+数据库存储
- 博世如何通过创新加速成功孵化出人工智能养虾初创公司?
- DirectX9 SDK Samples(19) AntiAlias
- python 聚合_Python数据聚合
- MongoDB实验练习题
- php对接WPS开放平台word编辑demo
- linux监听端口命令