话不多说,直接贴代码

import pandas as pd
import os
import time# 去重复
def drop_duplicates(df):# 完全重复则删除df = df.drop_duplicates()return dfdef merge_execl(merge_file_dir):# 要合并的execl目录dir_name = merge_file_dirdir_list = os.listdir(dir_name)timer = time.time()# df.drop_duplicates(subset, keep, inplace)new_data_col = ''new_data = ''for file in dir_list:# 如果是文件并且以csv结尾file_name = dir_name + '\\' + fileif os.path.isfile(file_name):if file_name.endswith('.csv'):new_file_name = dir_name + '\\' +  'new_file_{}.csv'.format(timer)df = pd.read_csv(file_name)df.to_csv(new_file_name, mode='a', index=False)# 打开csv文件去重复再次保存df = pd.read_csv(new_file_name, header=None)df = drop_duplicates(df)df.to_csv(new_file_name, header=False, index=False)# 合并xls文件elif file_name.endswith('.xls') or file_name.endswith('.xlsx'):new_file_name = dir_name + '\\' + 'new_file_{}.xls'.format(timer)df = pd.read_excel(file_name)if new_data_col == '':new_data_col = list(df.columns)if new_data == '':new_data = list(df.values)else:new_data += list(df.values)new_df = pd.DataFrame(data=new_data, columns=new_data_col)new_df = drop_duplicates(new_df)new_df.to_excel(new_file_name, index=False)if __name__ == '__main__':# 要合并execl文件夹file_dir_name = 'citibike'merge_execl(file_dir_name)

输出结果

  • 代码中脚本和需要合并的excel文件夹在统一目录下

python使用pandas合并excel文件并去重复相关推荐

  1. 使用python和xlwings合并excel文件

    使用python和xlwings合并excel文件 20年前读书时间考了一个C语言二级,许多年都没有使用过,现在工作上遇到一个合并汇总excel文件问题,找了一个新版pyhon,网络百度,自学2周,编 ...

  2. pandas python csv_python:pandas合并csv文件的方法(图书数据集成)

    数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析. 两张表:ReaderInformation.csv,ReaderRentRecode.csv ReaderInformatio ...

  3. Python使用pandas读取Excel文件数据和预处理小案例

    假设有Excel文件data.xlsx,其中内容为 现在需要将这个Excel文件中的数据读入pandas,并且在后续的处理中不关心ID列,还需要把sex列的female替换为1,把sex列的male替 ...

  4. Python使用Pandas读写EXCEL文件教程

    https://www.daehub.com/archives/9463.html 教程 开始之前,我们需要首先了解一下什么是Excel,这有助于理解之后教程中的内容. 什么是Excel Excel  ...

  5. python利用pandas合并excel表格代码_利用Python pandas对Excel进行合并的方法示例

    前言 在网上找了很多Python处理Excel的方法和代码,都不是很尽人意,所以自己综合网上各位大佬的方法,自己进行了优化,具体的代码如下. 博主也是新手一枚,代码肯定有很多需要优化的地方,欢迎各位大 ...

  6. Python使用pandas读取Excel文件多个WorkSheet的数据并绘制柱状图和热力图

    问题描述:在当前文件夹中有一个存放同一门课程两个班级同学成绩的Excel文件"学生成绩.xlsx",每个工作表中存放一个班级的成绩.编写程序,使用pandas读取其中的数据,然后绘 ...

  7. 利用pandas合并excel文件

    临时想要合并一些excel文件,发现用pandas还挺方便.但觉得速度有些慢,可以改进.先这样吧,:-D. # -*- coding: utf-8 -*- """ Cre ...

  8. python 使用pandas 读写excel文件

    现在本地创建一个excel表,以及两个sheet,具体数据如下: sheet1: sheet2: 读取excel文件 pandas.read_excel(io, sheet_name=0, heade ...

  9. python 将excel文件转换为txt文件_python利用pandas将excel文件转换为txt文件的方法

    python将数据换为txt的方法有很多,可以用xlrd库实现.本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件. 直接上代码: ''' function:将 ...

最新文章

  1. eas账号是什么意思_刚开始做抖音带货和好物推荐,如何布局抖音种草账号矩阵?...
  2. 怎么改善现有网站为xhtml+CSS
  3. 《机器人与数字人:基于MATLAB的建模与控制》——2.2节李群和李代数
  4. window 命令行大全
  5. Foundation框架中常用类的介绍
  6. Android自动伸展动画,android – 如何实现平滑的展开/折叠动画
  7. jzoj5223-B【矩阵乘法】
  8. Redis实现之整数集合
  9. php数组10000分割1000_PHP切割整数工具类似微信红包金额分配的思路详解
  10. 用户体验设计和精益设计的平衡之道
  11. Lec 15 Projections onto subspaces
  12. CCF201412-1 门禁系统(100分)【序列处理】
  13. C# 寻找数组中的最大子数组
  14. 【全文干货】python—函数详解(值得收藏的学习手册)
  15. 马哥2019python全套视频-马哥Python60集全套视频网盘链接免费分享
  16. 根据卫星星历在cesium画卫星轨迹
  17. 基于STM32的鱼塘远程监测系统
  18. 光流法的视频移动目标检测(matlab代码)
  19. 让 CAS 5.1.8 支持http,解决未认证授权服务错误提示问题
  20. 关于安装LINUX时找不到硬盘问题解决

热门文章

  1. undo歌词中文音译_求모세歌曲사랑인걸歌词中文音译?
  2. STM32F103PWM+重映射 小程序
  3. PTA L2-009 抢红包(25 分)
  4. Google guava之ListMultimap简介说明
  5. 分享三个例程:使用ESP32做一个实时语音对讲机,MQTT协议实现公网对讲,ESP32-CAM 上传图像数据到网络。并附上例程链接。
  6. python脚本根据mask掩码/像素数组裁剪图片
  7. 如何在微信小程序中生成二维码:一个最简单的案例就让你明白
  8. 姚希燕:男士脱发等级划分
  9. pythonscrapy爬虫ip代理池_在Scrapy中使用IP池或用户代理(python3)
  10. 读书笔记-精准努力-读这段话自身写照 读书改变命运