Pandas系列(三)新增数据列
文章目录
- 数据处理
- 直接赋值
- apply
- assign
- 分条件赋值
Pandas
新增数据列方法主要有直接赋值、apply
、assign
、分条件赋值这四种方法:
数据处理
在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析。拿到数据之后先做一些简单的处理:
# 替换掉温度的后缀℃
df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype('int32')
df.loc[:, "yWendu"] = df["yWendu"].str.replace("℃", "").astype('int32')
直接赋值
比如计算两列的差值(计算温差):
# 注意,df["bWendu"]其实是一个Series,后面的减法返回的是Series
df.loc[:, "wencha"] = df["bWendu"] - df["yWendu"]
apply
df.apply
方法是对某个轴应用了一个函数,传给这个对象是一个Series
,这个Series
的index
要么是DataFrame
的index
(axis=0),要么是DataFrame
的columns
(axis=1)。
实例:添加一列温度类型:如果最高温度大于33
度就是高温;低于-10
度是低温;否则是常温。
使用.value_counts()
查看温度类型的计数:
assign
实例:将温度从摄氏度变成华氏度:
# 可以同时添加多个新的列
df.assign(yWendu_huashi = lambda x : x["yWendu"] * 9 / 5 + 32,# 摄氏度转华氏度bWendu_huashi = lambda x : x["bWendu"] * 9 / 5 + 32
)
分条件赋值
按条件先选择数据,然后对这部分数据赋值新列。
实例:高低温差大于10
度,则认为温差大。
上例中df['wencha_type'] = ''
用到了Python
中的广播机制。
Pandas系列(三)新增数据列相关推荐
- pandas基于dataframe字符串数据列不包含特定字符串来筛选dataframe中的数据行(rows where values do not contain substring)
pandas基于dataframe字符串数据列不包含(not contains)特定字符串来筛选dataframe中的数据行(rows where values do not contain subs ...
- pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个dataframe(split dataframe based on column value threshold
pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个子dataframe(split dataframe based on column value threshol ...
- pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring)
pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring) 目录
- pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe)
pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe) ...
- pandas对dataframe的数据列进行随机抽样(Random Sample of Columns)、使用sample函数进行数据列随机抽样
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns).使用sample函数进行数据列随机抽样 目录
- pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement)
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement) 目录
- pandas把dataframe的数据列转化为索引列实战:单列转化为索引、多列转化为复合索引
pandas把dataframe的数据列转化为索引列实战:单列转化为索引.多列转化为复合索引 目录
- pandas新字段(数据列)生成、使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战
pandas新字段(数据列)生成.使用np.where或者apply lambda函数结合if else生成新的字段,详解及实战 pandas apply用法: pandas apply方法的作用原理 ...
- 学习ASP.NET Core Razor 编程系列三——创建数据表及创建项目基本页面
原文:学习ASP.NET Core Razor 编程系列三--创建数据表及创建项目基本页面 学习ASP.NET Core Razor 编程系列目录 学习ASP.NET Core Razor 编程系列一 ...
- Pandas系列(三):数据清洗
Pandas系列目录 文章目录 一. 简介 二. 思维导图 三. Pandas数据清洗 1. 空值.缺失值处理 1.1 空值.缺失值判断 1.2 空值处理 2. 异常数据替换 2.1 条件替换 2.2 ...
最新文章
- 关于机器学习模型的可解释性算法!
- 机会的度量:概率和分布
- hdu 1166 敌兵布阵 (线段树)
- oracle大对象实例_Oracle解析复杂json的方法实例详解
- mybatis配置文件形式
- leetcode--912--排序数组
- windows下cuda10.0+cudnn的配置
- 使用IDEA 开发一个安卓HelloWorld的步骤
- Mex HDU - 4747(递推, 思维)
- javaweb基于SSM框架的书籍小说在线阅读下载网站
- 【学习打卡 Free-Excel 】Task9 数据透视
- Thinkpad 蓝牙键盘 Fn 键处于锁定状态的解决方法
- 自然语言处理(NLP)入门(1)——前言
- error LNK2019: 无法解析的外部符号 XXXXXXXXX,该符号在函数XXX中被引用
- cocos2d-x 将js代码混淆成jsc
- git统计提交代码量
- 深度之眼Paper带读笔记GNN.05.TransE/H/R/D
- 1-50可复制到word文档外带圈的数生成方法
- win10系统更新1709版本后导致黑将S5笔记本人脸识别不能使用(摄像头不能打开)
- android u8220刷机
热门文章
- 【NLP新闻-2013.06.16】Representative Reviewing
- 3dmax9中文版注册机
- HCIE-RS面试--P/A协商(超详细!)
- h3c,nat网络地址转换
- CocosCreator2.3.1切换场景出现Failed to load scene ‘xxx‘ because ‘xxx‘ is already being loaded问题的解决方案
- 游戏筑基开发之测试篇(C语言)
- LNMP详解(四)——LNMP原理与简单部署
- Leetcode 刷题笔记(二十八) ——动态规划篇之子序列问题:连续子序列和不连续子序列
- Thread 类的属性和方法
- 小程序swiper效果高宽设置(微信小程序交流群:604788754)