Python查找文件夹下含有特定关键字的文档word 查找word中的关键词等
应用场景:我们学校搞综测会发放一个压缩包,里面含有各种活动的加分证明,想要快速且不遗漏的找到自己的名字的话,就可以来跑一下这个py啦!
环境:jupyter
要求:事先安装 pip install python-docx
代码修改处:文件存放根目录和要搜索的关键词
#coding=utf-8from docx import Documentimport os,sysdef search_word(filename,word):#打开文档document = Document(filename)#读取每段资料pa=document.paragraphs#拼接每一段的内容para_list = []for para in pa:para_list.append(para.text)#合并字符串file_text = ''.join(para_list)if word in file_text:print("find file for {}:".format(word))print(filename)process_list=[]
def get_process_files(root_dir):"""process all files in directory"""cur_dir=os.path.abspath(root_dir)file_list=os.listdir(cur_dir)for file in file_list:fullfile=cur_dir+"\\"+fileif os.path.isfile(fullfile):process_list.append(fullfile)elif os.path.isdir(fullfile):dir_extra_list=get_process_files(fullfile)return process_listdef find_files(root_dir,word):get_process_files(root_dir)print("总计文件数:{}".format(len(process_list)))for files in process_list:search_word(files, word)return
if __name__=='__main__':#此处修改自己存放文件位置和名字#文件根目录root_dir=r'D:\beizhai\study\大四\综测\【2021】XX学院综测公示文件'#要搜索的关键字word="beizhai"count=0try:find_files(root_dir,word)except:pass
Python查找文件夹下含有特定关键字的文档word 查找word中的关键词等相关推荐
- python查找文件夹下的文件,python 查找文件夹下所有文件 实现代码 -电脑资料
复制代码代码如下: def find_file_by_pattern(pattern='.*', base=".", circle=True): '''''查找给定文件夹下面所有 ...
- xml遍历文件夹vector_怎么统计指定文件夹下含有.xml格式的文件数目
如何统计指定文件夹下含有.xml格式的文件数目?如题 ------解决思路----------------------Directory.GetFiles(@"路径", " ...
- Python列出文件夹下某类文件名的方法
Python 列出文件夹下某类文件后缀 读某个文件夹下所有图片 利用os.listdir()和string.endswith()函数实现. 在进行视觉相关任务编程时, 常常需要读出文件夹下的图片.但有 ...
- python——删除文件夹下的所有文件和子文件夹(含代码)
使用python删除文件夹下的所有文件与子文件夹,需要使用到递归. 因为直接os.remove不能删除文件夹,os.rmdir不能删除含有文件的文件夹. 直接上代码: def deldir(dir): ...
- 查找文件夹下图片的数量
//查找文件夹下图片的数量\ private int getFiles(String string){int i=0;File file = new File(string);File[] files ...
- python读取文件夹下所有图片
python读取文件夹下所有图片 具体实现步骤 功能需求 说明 第一步:导入库 第二步:写读取函数 第三步:函数调用 结语 具体实现步骤 功能需求 读取一个文件夹中的所有图片,并将图像数据存储在一个文 ...
- Python 获取文件夹下所有文件
前言 使用Python获取文件夹下的所有文件时,存在多种方式. 1. os.listdir os.listdir:参数为文件夹路径,可以返回文件夹下的所有子文件夹.文件名称. 示例: import o ...
- shell脚本实现查找文件夹下重复的文件,并提供删除功能
Windows下有软件FindDupFile,可以搜索指定目录及其下子目录,列出所有内容完全相同的文件(文件名可能不同),然后由用户选择删除重复的文件. 然而shell脚本却可以使用几行的命令完成与此 ...
- python 遍历文件夹下所有mp3
python 遍历文件夹下所有mp3 #python import os import shutilg = os.walk('files')for path, d, files in g:for fi ...
最新文章
- 在运筹学中什么样的解决方案是最优的
- 树形dp——树的最远距离 hdu2196
- python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据、matplotlib可视化生成的仿真数据
- C++学习笔记5[函数]
- 计算机操作系统——页面置换算法
- 【微信】微信小程序 应用内的页面跳转在添加了tab以后就跳转不成功的问题解决...
- Android EditText中插入图片并响应点击事件
- 使用python对url编码解码
- 真壕!腾讯员工平均月薪 7 万!
- TIOBE 4 月编程语言排行榜:Python 持续升温,Perl 苦苦挣扎
- Swift 后端开发
- 第一个神经网络代码分享
- android页面布局 如何让中间的listview填充剩余部分_不使用css3:flex怎么实现一些常见的移动端布局...
- VS+VSS代码管理
- 【Weiss】【第03章】双链表例程
- 微信小程序,标签云效果:自定义颜色,并随机显示不同颜色
- 多种方式Map集合遍历
- WPFAvalonDock基本用法
- Qt5.12.6 + VS2019添加图片资源文件
- 获取文件夹下的文件,包含子文件夹并复制文件
热门文章
- 如何撰写“模型类“统计分析报告?
- 基于串口通信技术——让数码管显示的数据发送给电脑,电脑控制单片机外设——15单片机
- greenplum-gp-创建共享表-复制表-REPLICATED-分发策略
- vue form action post 方式提交
- 基站查询-基站定位资源
- UESTC 1642 老当益壮, 宁移白首之心? 欧拉回路、Fleury算法
- vc++网络安全编程范例(19)实现数字信封打包与拆解
- linux 不显示输入内容,ubuntu安装搜狗输入法不出现或是不显示输入法切换
- 【零基础学C语言】知识总结八:struct 结构体与 union 共用体
- 超体到底讲了什么,给你一篇真正的影评!