Pandas删除重复行数据
import pandas as pd
df=pd.DataFrame({'m':['dashuaige']*3+['dameinv']*4,'n':[1,1,2,3,3,4,5]})
df['x']=range(7)
print(df)print('删除完全重复:')
a=df.drop_duplicates()
print(a) #因为没有完全重复的行,所以没有删除。print('删除以 m 为标准的重复行,并保留第一次出现的值:')
b=df.drop_duplicates('m',keep='first')
print(b)print('删除以 m 、n 为标准的重复行,并保留最后一次出现的值:')
c=df.drop_duplicates(['m','n'],keep='last')
print(c)print('删除以 m 、n 为标准的重复行,都不保留:')
d=df.drop_duplicates(['m','n'],keep=False)
print(d)
m n x
0 dashuaige 1 0
1 dashuaige 1 1
2 dashuaige 2 2
3 dameinv 3 3
4 dameinv 3 4
5 dameinv 4 5
6 dameinv 5 6
删除完全重复:m n x
0 dashuaige 1 0
1 dashuaige 1 1
2 dashuaige 2 2
3 dameinv 3 3
4 dameinv 3 4
5 dameinv 4 5
6 dameinv 5 6
删除以 m 为标准的重复行,并保留第一次出现的值:m n x
0 dashuaige 1 0
3 dameinv 3 3
删除以 m 、n 为标准的重复行,并保留最后一次出现的值:m n x
1 dashuaige 1 1
2 dashuaige 2 2
4 dameinv 3 4
5 dameinv 4 5
6 dameinv 5 6
删除以 m 、n 为标准的重复行,都不保留:m n x
2 dashuaige 2 2
5 dameinv 4 5
6 dameinv 5 6
okokokok,不管你是dashuaige还是dameinv,以上就是我对删除重复行的理解,byby...
Pandas删除重复行数据相关推荐
- PostgreSQL 使用citd删除重复行
1. ctid的简单介绍: ctid是PostgreSQL表中的系统字段,表示数据行在它所在表内的物理位置.ctid的字段类型是oid.但是VACUUM FULL操作之后,经过回收数据块内的空闲空间, ...
- pandas使用drop_duplicates函数基于subset参数指定的数据列子集删除重复行、并设置keep参数保留重复行中的最后一个数据行
pandas使用drop_duplicates函数基于subset参数指定的数据列子集删除重复行.并设置keep参数保留重复行中的最后一个数据行 目录
- pandas删除数据行中的重复数据行、基于dataframe所有列删除重复行、基于特定数据列或者列的作何删除重复行、删除重复行并保留重复行中的最后一行、pandas删除所有重复行(不进行数据保留)
pandas删除数据行中的重复数据行.基于dataframe所有列删除重复行.基于特定数据列或者列的作何删除重复行.删除重复行并保留重复行中的最后一行.pandas删除所有重复行(不进行数据保留) 目 ...
- pandas处理数据代码:分组聚合、保留重复行、删除重复行
txt转csv import numpy as np import pandas as pdtxt=np.loadtxt('1216.txt')txtDF=pDataFrame(txt) txtDF. ...
- pandas删除重复数据
https://blog.csdn.net/weixin_42322206/article/details/127673480 1.pandas中重复索引问题 df = df[~df.index.du ...
- python如何清空excel表格_python 删除excel表格重复行,数据预处理操作
使用python删除excel表格重复行. # 导入pandas包并重命名为pd import pandas as pd # 读取Excel中Sheet1中的数据 data = pd.DataFram ...
- datagrid如何获取一行数据中的某个字段值_MySQL 如何查找删除重复行?
如何查找重复行 第一步是定义什么样的行才是重复行.多数情况下很简单:它们某一列具有相同的值.本文采用这一定义,或许你对"重复"的定义比这复杂,你需要对sql做些修改.本文要用到的数 ...
- pandas duplicated() 重复行标记与drop_duplicates()删除
pandas.DataFrame.duplicated DataFrame.duplicated(subset=None, keep='first') 返回表示重复行的布尔序列. Parameters ...
- pandas—删除某行或某列数据
首先,创建一个DataFrame格式数据作为举例数据. # 创建一个DataFrame格式数据 data = {'a': ['a0', 'a1', 'a2'],'b': ['b0', 'b1', 'b ...
最新文章
- linux非守护线程一直不释放,Linux pthread 和 java thread 的是 / 非守护线程的行为
- vscode 调试参数_如何通过vscode运行调试javascript代码
- Java 开发环境部署
- 构建适用于Oracle 11.2.0.x的Linux单数据库实例的DataGuard
- java多线程中的死锁情况读书笔记
- ELK详解(六)——Logstash部署与简单应用
- oracle练习之查询1(where等)
- 服务器上怎么安虚拟主机呀,上线虚拟主机产品步骤
- 计算机如何设置光驱启动,电脑如何设置光驱启动(含UEFI BIOS方法)?
- mac安装php+mysql数据库_Mac环境下Nginx+PHP+MySQL的安装与配置
- Excel合并单元格快捷键
- 专访AWR市场副总裁Sherry Hess:全面发力 深耕中国市场
- 关于C++、PHP和Swoole-韩天峰
- 动态规划 — 钢条切割问题
- 2020中国网络安全年会论文发布 知道创宇ZoomEye引领全球网空测绘
- flutter 吸顶效果
- 看看安卓开发者在APP推广路途中是如何被金山“恶霸”所“黑打”的!
- c语言输入一元二次方程三个系数,C语言程序 一元二次方程
- 从服务器收到意料之外的响应,WordPress出现“从服务器收到预料之外的响应。此文件可能已被成功上传。请检查媒体库或刷新本页。”错误的解决方法...
- Altium Designer输出GERBER文件与华秋DFM对比
热门文章
- 安卓开发fragment报错_Android应用开发之嵌套Fragments (Nested Fragments) 的使用及常见错误讲解...
- 弘辽科技:直通车成交率怎么算?成交率低怎么办?
- js实现将 图片转base64编码
- PyPI 仓库被曝多个 typosquatting 库,可触发供应链攻击
- 九星创客系统开发模式介绍
- 第七届信息技术应用水平大赛 复赛杂感
- SAP RAR+结果分析(RA)-拓展项目收入确认能力
- ESP8266-Arduino网络编程实例-ESP-MESH多设备节点通信
- Ecstore/BBC 后台权限
- Vue中methods与computed区别