python 实现提取某列所有关键字 并通过关键字提取execl 所有行内容并输出
实现过程
1.files函数可读取当前目录的所有xls格式文件
2.dstfilename函数实现某列关键词获取并去重
3keywordsdeal函数实现文件的写入生成
4main函数实现对keywordsdeal函数出栈,实现内存清空。避免内容重复写入
下面时所有 代码片
。
// An highlighted block
import os
import xlwt
import xlrd##目的文件夹
filename = 'D:\\MyDocs\\dst.xls'##遍历函数
# def files(dirpath):
# for root, dirs, files in os.walk(dirpath):
# for name in files:
# yield os.path.join(root, name)def dstfilename():filename = 'D:\\MyDocs\\dst.xls'open(filename, 'r')data = xlrd.open_workbook(filename) # 读取源excel文件sheetnum = data.nsheets # 获取源文件sheet数目a = 0for m in range(0, sheetnum):table = data.sheets()[m]print(table)table.ncols # 获取列表的有效列数list = table.col_values(1, start_rowx=4, end_rowx=None) # 返回由该列中所有单元格的数据组成的列表b = []for i in list:if i not in b:a = a + 1b.append(i)for e in iter(b):yield edef keywordsdeal(keyword):jieguo = xlwt.Workbook(encoding="ascii") # 生成excelwsheet = jieguo.add_sheet('sheet name') # 生成sheety = 0 # 生成的excel的行计数#d = dstfilename()workbook = xlrd.open_workbook(filename) # 读取源excel文件sheetnum = workbook.nsheets # 获取源文件sheet数目for m in range(0, sheetnum):sheet = workbook.sheet_by_index(m) # 读取源excel文件第m个sheet的内容nrowsnum = sheet.nrows # 获取该sheet的行数for i in range(0, nrowsnum):data = sheet.row(i) # 获取该sheet第i行的内容for n in range(0, len(data)):aaa = str(data[n]) # 把该行第n个单元格转化为字符串,目的是下一步的关键字比对if aaa.find(keyword) > 0: # 进行关键字比对,包含关键字返回1,否则返回0y = y + 1for j in range(len(data)):wsheet.write(y, j, sheet.cell_value(i, j)) # 该行包含关键字,则把它所有单元格依次写入入新生成的excel的第y行jieguo.save('class//'+keyword + '.xls') # 保存新生成的Excelprint('end')
# except Exception as e:# print(e)# jieguo.save(dsf+'.xls') # 保存新生成的Excelif __name__ == '__main__':d = dstfilename()for keys in d:print(keys)keywordsdeal(keys)#函数出栈,内存释放
python 实现提取某列所有关键字 并通过关键字提取execl 所有行内容并输出相关推荐
- python csv文件和xlsx文件混杂时,提取指定列数据并合并
这篇文章是R语言 如何合并csv文件(批量读取csv文件)的姊妹篇.提供更为强大的功能. 解决的问题是提取csv文件和xlsx文件混杂时,文件合并问题.具体来说,下面的代码是提取指定列文本,简单清洗后 ...
- Python中通过索引名称提取数据loc()函数Python中通过行和列下标提取数据iloc()函数
[小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python中通过索引名称提取数据 loc()函数 Python中通过 ...
- ssis 列转换_SSIS中的术语提取转换
ssis 列转换 This article explores the Term extraction transformation in SSIS and its usage scenario. 本文 ...
- EXCEL 批量生成sheet表+生成超链接目录+某列按多条件去重罗列+提取单元格中的字母、数字
文章目录 前言 一.EXCEL 公式实现多个条件值匹配 二.EXCEL 工作薄下SHEET表太多时你可以这样做 1.生成多个相同表头的SHEET表 1.1.批量生成SHEET表 1.2.批量更改多个S ...
- 调用jsapi缺少参数appid_【Python学习笔记】18、函数的参数关键字参数
可变参数允许你传入0个或任意个参数,这些可变参数在函数调用时自动组装为一个tuple.而关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict.请看示例: de ...
- linux提取第一列且删除第一行(awk函数)
如下文件所示,只想提取红框中的内容,即进行提取第一列,且去除第一行的操作 则用到下列命令行: awk 'NR == 1 {next} {print $1}' file.txt > file_co ...
- python获取excel某一列所有值-Python读取Excel一列并计算所有对象出现次数的方法...
第一种方法 import pandas as pd from collections import Counter data = '参赛信息.xlsx' data = pd.read_excel('参 ...
- python读取excel指定列-Python读取excel指定列生成指定sql脚本的方法
需求 最近公司干活,收到一个需求,说是让手动将数据库查出来的信息复制粘贴到excel中,在用excel中写好的公式将指定的两列数据用update这样的语句替换掉. 例如: 有个A库,其中有两个A.01 ...
- python方法和函数的格式是完全一样的_【python基础语法】常用内置函数、关键字、方法和之间的区别(小结)...
'''关键字: False:bool数据类型 True:bool数据类型 None:表示数据的内容为空 and:逻辑运算符:与 or:逻辑运算符:或 not:逻辑运算符:非 in:身份运算符,判断变量 ...
最新文章
- Docker的使用(三:Docker Hub远程镜像管理)
- 戴尔新版bios设置中文_U盘快捷启动键查询 | BIOS按键查询
- maven 多模块项目:单独构建某个模块
- 【全球AI人才排行榜】美国第一,中国仅排名第7
- 打了断点为直接运行完_BBC主持人多次打断,香港大律师忍不住发飙
- randomized algorithms 有哪些_毛毯分类有哪些 毛毯的种类
- linux django web,Flask Django web实战
- jsf如何与数据库连接_JSF身份验证登录注销数据库示例
- 字体的基础知识:中文字体区分练习
- 魔兽争霸php文件怎么打开,魔兽争霸之PHP设计模式
- anaconda如何配置环境变量
- 流媒体 3——彩色数字图像基础
- “百度杯”CTF比赛 十一月场Fuzz
- OpenCV实现照片自动红眼去除
- 正三角形c语言编程,三角形 (C语言代码)
- 《人人都是首席质量官》vs “人人都是产品经理” 及心得
- 【Educoder作业】问题求解——while 循环
- python里的class定义类为什么括号有object
- mysql导入指定数据库_mysql命令行导入sql文件到指定数据库的方法
- LeetCode34--去掉最低工资和最高工资后的工资平均值、判断能否形成等差数列、重新排列字符串