文章目录

  • 将字符串变成离散的数值
  • 将离散的数值变量变成独热码
import pandas as pd

将字符串变成离散的数值

  • 整个“性别”列只有男和女
df = pd.DataFrame({"性别":["男","女","女","女","男","男","男","男","男","女","女","男"]})
df
性别
0
1
2
3
4
5
6
7
8
9
10
11
  • 将性别转换成可以用作数据分析的特征,把性别用离散值来表示
df["性别"] = pd.Categorical(df["性别"]).codes
df
性别
0 1
1 0
2 0
3 0
4 1
5 1
6 1
7 1
8 1
9 0
10 0
11 1

将离散的数值变量变成独热码

from keras.utils import to_categorical
y = to_categorical(df["性别"],num_classes=2)
y
array([[0., 1.],[1., 0.],[1., 0.],[1., 0.],[0., 1.],[0., 1.],[0., 1.],[0., 1.],[0., 1.],[1., 0.],[1., 0.],[0., 1.]], dtype=float32)
pd.concat([df,pd.DataFrame(y)],axis=1)
性别 0 1
0 1 0.0 1.0
1 0 1.0 0.0
2 0 1.0 0.0
3 0 1.0 0.0
4 1 0.0 1.0
5 1 0.0 1.0
6 1 0.0 1.0
7 1 0.0 1.0
8 1 0.0 1.0
9 0 1.0 0.0
10 0 1.0 0.0
11 1 0.0 1.0

pandas学习笔记:某一列字符类型转换为离散的数值标签;将某一列数值类型转换成独热码相关推荐

  1. Free Pascal 学习笔记 第五章 字符类型 Character Types

    一.Char类型 一个字符一个字节,包含一个ASCII字符. Char类型通过将字符括在单引号中来指定字符常量,如'a' 'A' 二.WideChar 2个字节大小. 包含UTF-16编码的Unico ...

  2. MATLAB学习笔记04—MATLAB的字符与字符串类型

    MATLAB学习笔记 第4章字符和字符串类型 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 MATLAB学习笔记 一.字符串属性示例 二.字符串数组的索引 三.字符串中的 ...

  3. Pandas学习笔记(一)

    Pandas学习笔记一 Pandas数组读取 读取csv.tsv.txt文件 读取excel文件 读取mysql数据表 Pandas数据结构 创建Series的几种方法 根据标签查询Series数据 ...

  4. pandas学习笔记之DateFrame

    pandas学习笔记之DateFrame 文章目录 pandas学习笔记之DateFrame 1.DateFrame的创建 1)认识DataFrame对象 2)由二维列表创建(默认index和colu ...

  5. 数据分析之pandas学习笔记(六)(层次化索引、重塑、轴向旋转、行列变换、合并表数据)

    数据分析之Pandas学习笔记(六)(层次化索引.重塑.轴向旋转.行列变换.合并表数据) level层次化索引 unstack()与stack()进行重塑,即:行列索引变换 swaplevel()交换 ...

  6. [Pandas 学习笔记] - No.1 pandas学习笔记

    pandas学习笔记 pandas是基于numpy开发出的数据分析包,用于高效地操作大型数据集.pandas的数据结构有三种 分别为 series,dataframe和panel,对应一维,二维,三维 ...

  7. pandas学习笔记:pandas.Dataframe.rename()函数用法

    pandas学习笔记:pandas.Dataframe.rename()函数用法 pandas.Dataframe.rename()函数主要是用来修改Dataframe数据的行名和列名. 主要用到的参 ...

  8. 《流畅的python》学习笔记之python是什么类型的语言?

    讨论类型时,最好考虑两条不同的坐标线! 强类型和弱类型 如果一门语言很少隐式转换类型,说明它是强类型语言.如果经常这么做,说明它是弱类型语言.其中,java,c++和python是强类型语言,php, ...

  9. pandas学习笔记之Series

    pandas学习笔记之Series 文章目录 pandas学习笔记之Series pandas中Series的创建 1)用python中的列表list创建: 2)用numpy数组创建 3)用pytho ...

最新文章

  1. 基于ARM的GCC编译器,各版本arm-gcc区别与安装
  2. linux刷新磁盘_Linux内核Page Cache和Buffer Cache关系及演化历史
  3. keepalived+lvs(HA+LB)
  4. linux计划任务执行日志,linux中centos制定计划任务执行命令并且输出日志
  5. 接口传值后不起作用_聊一聊 API 接口测试
  6. SpringBoot视频教程
  7. 【不体系】布谷鸟过滤器
  8. 华为android强刷系统下载地址,华为P6S官方rom固件刷机包下载_华为P6S原版系统强刷升级包...
  9. 压测学习总结(5)——如何使用Jmeter 进行简单的并发操作
  10. iptables的详细介绍及配置方法
  11. python异常和错误的区别_python中错误和异常有什么区别
  12. excel 工作表保护密码破解代码
  13. Java整形位运算避免精度缺失,浮点数精度问题透析:小数计算不准确+浮点数精度丢失根源...
  14. SpringBoot+Quartz+数据库存储
  15. 博世如何通过创新加速成功孵化出人工智能养虾初创公司?
  16. DirectX9 SDK Samples(19) AntiAlias
  17. python 聚合_Python数据聚合
  18. MongoDB实验练习题
  19. php对接WPS开放平台word编辑demo
  20. linux监听端口命令

热门文章

  1. 涵盖从Java 5到Java 11所有重要特性,让Java学习不再难!
  2. 如何开启Windows远程访问服务
  3. 今天复习jsp(2)
  4. Facebook的俄勒冈机房
  5. 学测试必看!测试理论知识之测试基础
  6. [转载]打工辛酸路:我是一朵飘零的花之120
  7. python if语句使用
  8. 从 Neo4j 导入 Nebula Graph 实践见 SPark 数据导入原理
  9. postman linux 使用教程,Postman 使用方法详解
  10. htttp协议和chrome抓包工具