参考:https://blog.csdn.net/u010665216/article/details/78635664?utm_source=copy
https://blog.csdn.net/lujiandong1/article/details/52836051

pandas中有一种get_dummies的方法:

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False)

参数说明:

data : array-like, Series, or DataFrame
输入的数据
prefix : string, list of strings, or dict of strings, default None
get_dummies转换后,列名的前缀
columns : list-like, default None
指定需要实现类别转换的列名
dummy_na : bool, default False
增加一列表示空缺值,如果False就忽略空缺值
drop_first : bool, default False
获得k中的k-1个类别值,去除第一个

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

pandas中的get_dummies方法相关推荐

  1. 数据特征分析:相关性分析(Pandas中的corr方法)

    文章目录 1.图示初判 两个变量之间的相关性(散点图) 多变量之间的相关性(散点图矩阵) 2.Pearson相关系数 3.Spearman相关系数 分析连续变量之间的线性相关程度的强弱 介绍如下几种方 ...

  2. 读书记录——pandas中的分组方法groupby(一)

    pandas的group分组 1.第一个简单案例 1)数据和依赖包准别 import pandas as pd import numpy as np import random df = pd.Dat ...

  3. pandas中的get_dummies()

    pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, dr ...

  4. pandas中concat/append方法

    目录 concat方法 concat语法 concat代码​​ append方法 append语法 append代码 concat方法 concat⽅法类似于数据库中union all,在不同的轴方向 ...

  5. 小记pandas中DataFrame.dropna方法

    DateFrame对象中dropna方法可以删除空值 这里简单记录一下用法 import pandas as pd import pymysqlconn = pymysql.connect(host= ...

  6. pandas中的sample方法

    sample()函数

  7. pandas中的to_excel方法解析

  8. 20个经典函数细说 Pandas 中的数据读取与存储,强烈建议收藏

    作者 | 俊欣 来源 | 关于数据分析与可视化 大家好,今天小编来为大家介绍几个Pandas读取数据以及保存数据的方法,毕竟我们很多时候需要读取各种形式的数据,以及将我们需要将所做的统计分析保存成特定 ...

  9. dataframe groupby_详解pandas中的map、apply、applymap、groupby、agg.

    一.简介 pandas提供了很多方便简洁的方法,用于对单列.多列数据进行批量运算或分组聚合运算,熟悉这些方法后可极大地提升数据分析的效率,也会使得你的代码更加地优雅简洁. 本文就将针对pandas中的 ...

最新文章

  1. zip 的压缩原理与实现
  2. mysql猎豹_猎豹网校MySQL数据库
  3. php中怎么连接数据库中的表,php 连接 excel表格数据库数据-php中如何将execl的数据导入到数据库中...
  4. TIPS FOR LIVING AT CAMBRIDGE
  5. SQL Server Management Studio清除历史登陆记录
  6. it生命周期管理-资产管理
  7. centos 宝塔面版 运行 thinkjs
  8. BIM族库下载——Revit灯具族库
  9. ubuntu下vscode字体间距 空格间距太小 增大间距
  10. astah export sql mysql_Astah繪製UML圖形-入門篇
  11. 网络与信息安全-第三章-对称秘钥加密算法
  12. Win10右下角小图标怎么叠起来?
  13. 基于PyQt的分组工具
  14. Mybatis初学一个问题困扰一下午 The error may exist in com/.........
  15. 2021 百度网盘网页版 倍速播放技巧(亲测有效)
  16. YOLOX升级 | 阿里巴巴提出YOLOX-PAI,1ms内精度无敌,超越YOLOv6、PP-YOLOE
  17. 【Web前端学前体验】HTML+CSS 实战练习-Olay玉兰油官网
  18. 【iMessage苹果相册推】CSR邮箱必须与证书分属的AppID相同。 若是您可以在步伐中吸取令牌,则此步伐是成功的。
  19. 使用Python来做物联网,就是这么简单!
  20. 如何做事有条理以及做事有条理的好处

热门文章

  1. 一种基于电池电压计算电池电量的算法的分析总结
  2. HTTPS怎么避免中间人攻击
  3. <数据库> LEAD函数的用法 Leetcode 1709. 访问日期之间最大的空档期
  4. word整个表格首行缩进_教师计算机技术水平考核word题集(二)
  5. MySQL性能调优与架构设计(二)—— MySQL存储引擎简介
  6. Kotlin面向对象
  7. elasticsearch(二)---基本数据操作
  8. 23种设计模式(第三章结构型模式7种)
  9. win10 Windows图片浏览器缺失的解决办法
  10. 网关gateway服务端配置 1