分割成一个包含两个元素列表的列

对于一个已知分隔符的简单分割(例如,用破折号分割或用空格分割).str.split() 方法就足够了 。 它在字符串的列(系列)上运行,并返回列表(系列)。

>>> import pandas as pd

>>> df = pd.DataFrame({'AB': ['A1-B1', 'A2-B2']})

>>> df

AB

0 A1-B1

1 A2-B2

>>> df['AB_split'] = df['AB'].str.split('-')

>>> df

AB AB_split

0 A1-B1 [A1, B1]

1 A2-B2 [A2, B2]

分割成两列,每列包含列表的相应元素

下面来看下如何从:分割成一个包含两个元素列表的列至分割成两列,每列包含列表的相应元素。

>>> df['AB'].str[0]

0 A

1 A

Name: AB, dtype: object

>>> df['AB'].str[1]

0 1

1 2

Name: AB, dtype: object

因此可以得到

>>> df['AB'].str.split('-', 1).str[0]

0 A1

1 A2

Name: AB, dtype: object

>>> df['AB'].str.split('-', 1).str[1]

0 B1

1 B2

Name: AB, dtype: object

可以通过如下代码将pandas的一列分成两列:

>>> df['A'], df['B'] = df['AB'].str.split('-', 1).str

>>> df

AB AB_split A B

0 A1-B1 [A1, B1] A1 B1

1 A2-B2 [A2, B2] A2 B2

补充知识:pandas某一列中每一行拆分成多行的方法

在处理数据过程中,常会遇到将一条数据拆分成多条,比如一个人的地址信息中,可能有多条地址,既有家庭地址也有工作地址,还有电话信息等等类似的情况,实际使用数据的时候又需要分开处理,这个时候就需要将这一条数据进行拆分成多条,以方便使用。

在pandas中如何对DataFrame进行相关操作呢,经查阅相关资料,发现了一个简单的办法,

info.drop(['city'], axis=1).join(info['city'].str.split(' ', expand=True).stack().reset_index(level=1, drop=True).rename('city'))

看起来非常之长,分开来看,流程如下:

将需要拆分的数据使用split拆分工具拆分,并使用expand功能拆分成多列

将拆分后的多列数据进行列转行操作(stack),合并成一列

将生成的复合索引重新进行reset保留原始的索引,并命名

将上面处理后的DataFrame和原始DataFrame进行join操作,默认使用的是索引进行连接

具体操作如下:

预操作:生成需要使用的DataFrame

# 用来生成DataFrame的工具

from pydbgen import pydbgen

myDB=pydbgen.pydb()

# 生成一个DataFrame

info = myDB.gen_dataframe(10,['name','phone','city','state'])

结果如下:

name

phone-number

city

state

0

Hannah Richard

810-859-7815

Irwinville

Louisiana

1

Ronald Berry

591-564-0585

Glen Ellen

Minnesota

2

Caitlin Barron

969-840-8580

Dubois

Oklahoma

3

Felicia Stephens

154-858-1233

Veedersburg

Alaska

4

Shelly Dennis

343-104-9365

Mattapex

Virginia

5

Nicholas Hill

992-239-1954

Moneta

Minnesota

6

Steve Bradshaw

164-081-7811

Ten Broeck

Colorado

7

Gail Johnston

155-259-9514

Wayan

Virginia

8

John Gray

409-892-4716

Darlington

Pennsylvania

9

Katherine Bautista

185-861-1677

McNab

Texas

假如现在我们要对city列进行进行拆分,按照空格拆分,转换成多行的数据,

第一步:拆分,生成多列

info_city = info['city'].str.split(' ', expand=True)

结果如下:

0

1

0

Irwinville

None

1

Glen

Ellen

2

Dubois

None

3

Veedersburg

None

4

Mattapex

None

5

Moneta

None

6

Ten

Broeck

7

Wayan

None

8

Darlington

None

9

McNab

None

可以看到已经将原始数据拆分成了2列,对于无法拆分的数据为None

第二步:行转列

info_city = info_city.stack()

结果如下:

0

0

Irwinville

1

0

Glen

1

Ellen

2

0

Dubois

3

0

Veedersburg

4

0

Mattapex

5

0

Moneta

6

0

Ten

1

Broeck

7

0

Wayan

8

0

Darlington

9

0

McNab

其中前面两列是索引,返回的是一个series,没有名字的series

第三步:重置索引,并命名(并删除多于的索引)

info_city = info_city.reset_index(level=1, drop=True)

结果如下:

0

Irwinville

1

Glen

1

Ellen

2

Dubois

3

Veedersburg

4

Mattapex

5

Moneta

6

Ten

6

Broeck

7

Wayan

8

Darlington

9

McNab

第四步:和原始数据合并

info_new = info.drop(['city'], axis=1).join(info_city)

结果如下:

name

phone-number

state

city

0

Hannah Richard

810-859-7815

Louisiana

Irwinville

1

Ronald Berry

591-564-0585

Minnesota

Glen

1

Ronald Berry

591-564-0585

Minnesota

Ellen

2

Caitlin Barron

969-840-8580

Oklahoma

Dubois

3

Felicia Stephens

154-858-1233

Alaska

Veedersburg

4

Shelly Dennis

343-104-9365

Virginia

Mattapex

5

Nicholas Hill

992-239-1954

Minnesota

Moneta

6

Steve Bradshaw

164-081-7811

Colorado

Ten

6

Steve Bradshaw

164-081-7811

Colorado

Broeck

7

Gail Johnston

155-259-9514

Virginia

Wayan

8

John Gray

409-892-4716

Pennsylvania

Darlington

9

Katherine Bautista

185-861-1677

Texas

McNab

需要特别注意的是,需要使用原始的连接新生成的,因为新生成的是一个series没有join方法,也可以通过将生成的series通过to_frame方法转换成DataFrame,这样就没有什么差异了

写了这么多,记住下面的就行了:

info.drop([‘city'], axis=1).join(info[‘city'].str.split(' ', expand=True).stack().reset_index(level=1, drop=True).rename(‘city'))

如果原数据中已经是list了,可以将info[‘city'].str.split(' ', expand=True)这部分替换成info[‘city'].apply(lambda x: pd.Series(x)),就可以达到相同的目的。

以上这篇Pandas实现一列数据分隔为两列就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

python分两列输出_python分两列输出相关推荐

  1. python求两数最大公因数_Python求两个数的最大公约数

    Python求两个数的最大公约数 一.求最大公约数算法: 1. 整数A对整数B进行取整, 余数用整数C来表示 举例: C = A % B 2. 如果C等于0,则C就是整数A和整数B的最大公约数 3. ...

  2. python 美化输出_python基础_格式化输出(%用法和format用法)

    目录 %用法 1.整数的输出 %o -- oct 八进制 %d -- dec 十进制 %x -- hex 十六进制 1 >>> print('%o' % 20)2 24 3 > ...

  3. python的print输出_python中的print()输出

    1.普通的输出: print(str)#str是任意一个字符串,数字・・・ 2.格式化输出: print('1,2,%s,%d'%('asd',4)) 1,2,asd,4 与C语言有点类似 3.其它: ...

  4. python多线程队列两组数据_python 多线程2-队列同步

    让我们考虑更复杂的一种场景:产品是各不相同的.这时只记录一个数量就不够了,还需要记录每个产品的细节.很容易想到需要用一个容器将这些产品记录下来. Python的Queue模块中提供了同步的.线程安全的 ...

  5. python计算长方形面积代码_Python计算两个矩形重合面积代码实例

    这篇文章主要介绍了Python 实现两个矩形重合面积代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 代码如下 计算两个矩形的重合面积 imp ...

  6. python 多个列表合并_Python对两个有序列表进行合并和排序的例子

    Python对两个有序列表进行合并和排序的例子 这篇文章主要介绍了Python对两个有序列表进行合并和排序的例子,最终代码经过不断优化,小编非常满意,需要的朋友可以参考下 假设有2个有序列表l1.l2 ...

  7. python两张图片融合_python实现两张图片的像素融合

    本文实例为大家分享了python实现两张图片像素融合的具体代码,供大家参考,具体内容如下 通过计算两张图片的颜色直方图特征,利用直方图对图片的颜色进行融合. import numpy as np im ...

  8. python打开文件匹配数据_python实现两个excel数据匹配,最终写入新的excel文件

    需求背景 表1有两列 表2包含表1不过缺少坐标字段 需要根据HID匹配两个表,把表1的坐标内容补充到表2 代码 import shutil import sys import xlwt import ...

  9. python整数保留两位小数_python保留两位小数

    基础 浮点数是用机器上浮点数的本机双精度(64 bit)表示的.提供大约17位的精度和范围从-308到308的指数.和C语言里面的double类型相同.Python不支持32bit的单精度浮点数.如果 ...

最新文章

  1. 编写递归下降语法分析器_Python3知识点流程控制、迭代器、生成器快速入门
  2. 第一讲,Python的安装(干货)
  3. django出现 CSRF cookie not set
  4. SAP ABAP ALV list background render
  5. 实验四报告 20135209潘恒 20135204郝智宇
  6. 如何让ClickOnce进行手动更新(含代码)
  7. 荣世达二代机器人_荣事达人工智能机器人到底有多帅?
  8. jTopo 功能完善
  9. 高项计算题2-三点估算(计划评审技术PERT),时差,投资回收期,贴现率,沟通渠道
  10. pc恶意程序木马分析 启动流程 逆向分析 数据解密
  11. Jlink V8 在 Keil MDK5.25 中无法正常烧写、调试程序的故障处理
  12. 随着计算机科学技术和互联网,计算机科学与技术发展趋势的几点思考
  13. $.closest()
  14. c语言中函数名可不可以由用户命名,C语言中变量名及函数名的命名规则与驼峰命名法...
  15. echarts饼图直观显示数值最实用的方式
  16. (文献随笔)肿瘤浸润的活化B细胞抑制结直肠癌的肝转移(Cell Report, 2022年8月30日)
  17. java BIO tcp服务端向客户端消息群发代码教程实战
  18. 怎么将英文网页整篇翻译成中文
  19. R语言实现常用多重比较方法
  20. BFT机器人带你走进智慧生活 ——探索遨博机器人i系列的多种应用

热门文章

  1. ThinkPHP自定义配置文件
  2. php商城系统文和答题_基于PHP的网上商城系统分析与设计
  3. 用CFileFind类实现的目录树遍历
  4. (转)《统一价值论》
  5. 华为手机最大屏是几英寸的_余承东:华为智慧屏将有三款,最大 75 英寸
  6. Linux学习笔记3(虚拟机安装ubuntu文件传输远程连接和控制)
  7. 使用5.0.0版本的cssbox将html文件转为图片文件,并解决字体显示问题
  8. BIGO实现二次盈利营收超YY直播,欢聚集团商业化还有多少想象空间?
  9. iOS 如何对音频、视频合成,配音、卡拉OK技术
  10. 计算机显示器显示无信号,电脑显示器显示无信号怎么解决