文章目录

  • 数据处理
  • 直接赋值
  • apply
  • assign
  • 分条件赋值

  Pandas新增数据列方法主要有直接赋值、applyassign、分条件赋值这四种方法:

数据处理

  在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析。拿到数据之后先做一些简单的处理:

# 替换掉温度的后缀℃
df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype('int32')
df.loc[:, "yWendu"] = df["yWendu"].str.replace("℃", "").astype('int32')

直接赋值

  比如计算两列的差值(计算温差):

# 注意,df["bWendu"]其实是一个Series,后面的减法返回的是Series
df.loc[:, "wencha"] = df["bWendu"] - df["yWendu"]

apply

  df.apply方法是对某个轴应用了一个函数,传给这个对象是一个Series,这个Seriesindex要么是DataFrameindex(axis=0),要么是DataFramecolumns(axis=1)。

  实例:添加一列温度类型:如果最高温度大于33度就是高温;低于-10度是低温;否则是常温。

  使用.value_counts()查看温度类型的计数:

assign

  实例:将温度从摄氏度变成华氏度:

# 可以同时添加多个新的列
df.assign(yWendu_huashi = lambda x : x["yWendu"] * 9 / 5 + 32,# 摄氏度转华氏度bWendu_huashi = lambda x : x["bWendu"] * 9 / 5 + 32
)

分条件赋值

  按条件先选择数据,然后对这部分数据赋值新列。

  实例:高低温差大于10度,则认为温差大。

  上例中df['wencha_type'] = ''用到了Python中的广播机制。

Pandas系列(三)新增数据列相关推荐

  1. pandas基于dataframe字符串数据列不包含特定字符串来筛选dataframe中的数据行(rows where values do not contain substring)

    pandas基于dataframe字符串数据列不包含(not contains)特定字符串来筛选dataframe中的数据行(rows where values do not contain subs ...

  2. pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个dataframe(split dataframe based on column value threshold

    pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个子dataframe(split dataframe based on column value threshol ...

  3. pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring)

    pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring) 目录

  4. pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe)

    pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe) ...

  5. pandas对dataframe的数据列进行随机抽样(Random Sample of Columns)、使用sample函数进行数据列随机抽样

    pandas对dataframe的数据列进行随机抽样(Random Sample of Columns).使用sample函数进行数据列随机抽样 目录

  6. pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement)

    pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement) 目录

  7. pandas把dataframe的数据列转化为索引列实战:单列转化为索引、多列转化为复合索引

    pandas把dataframe的数据列转化为索引列实战:单列转化为索引.多列转化为复合索引 目录

  8. pandas新字段(数据列)生成、使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战

    pandas新字段(数据列)生成.使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战 pandas apply用法: pandas apply方法的作用原理 ...

  9. 学习ASP.NET Core Razor 编程系列三——创建数据表及创建项目基本页面

    原文:学习ASP.NET Core Razor 编程系列三--创建数据表及创建项目基本页面 学习ASP.NET Core Razor 编程系列目录 学习ASP.NET Core Razor 编程系列一 ...

  10. Pandas系列(三):数据清洗

    Pandas系列目录 文章目录 一. 简介 二. 思维导图 三. Pandas数据清洗 1. 空值.缺失值处理 1.1 空值.缺失值判断 1.2 空值处理 2. 异常数据替换 2.1 条件替换 2.2 ...

最新文章

  1. 关于机器学习模型的可解释性算法!
  2. 机会的度量:概率和分布
  3. hdu 1166 敌兵布阵 (线段树)
  4. oracle大对象实例_Oracle解析复杂json的方法实例详解
  5. mybatis配置文件形式
  6. leetcode--912--排序数组
  7. windows下cuda10.0+cudnn的配置
  8. 使用IDEA 开发一个安卓HelloWorld的步骤
  9. Mex HDU - 4747(递推, 思维)
  10. javaweb基于SSM框架的书籍小说在线阅读下载网站
  11. 【学习打卡 Free-Excel 】Task9 数据透视
  12. Thinkpad 蓝牙键盘 Fn 键处于锁定状态的解决方法
  13. 自然语言处理(NLP)入门(1)——前言
  14. error LNK2019: 无法解析的外部符号 XXXXXXXXX,该符号在函数XXX中被引用
  15. cocos2d-x 将js代码混淆成jsc
  16. git统计提交代码量
  17. 深度之眼Paper带读笔记GNN.05.TransE/H/R/D
  18. 1-50可复制到word文档外带圈的数生成方法
  19. win10系统更新1709版本后导致黑将S5笔记本人脸识别不能使用(摄像头不能打开)
  20. android u8220刷机

热门文章

  1. 【NLP新闻-2013.06.16】Representative Reviewing
  2. 3dmax9中文版注册机
  3. HCIE-RS面试--P/A协商(超详细!)
  4. h3c,nat网络地址转换
  5. CocosCreator2.3.1切换场景出现Failed to load scene ‘xxx‘ because ‘xxx‘ is already being loaded问题的解决方案
  6. 游戏筑基开发之测试篇(C语言)
  7. LNMP详解(四)——LNMP原理与简单部署
  8. Leetcode 刷题笔记(二十八) ——动态规划篇之子序列问题:连续子序列和不连续子序列
  9. Thread 类的属性和方法
  10. 小程序swiper效果高宽设置(微信小程序交流群:604788754)