应用场景:我们学校搞综测会发放一个压缩包,里面含有各种活动的加分证明,想要快速且不遗漏的找到自己的名字的话,就可以来跑一下这个py啦!

环境:jupyter

要求:事先安装 pip install python-docx

代码修改处:文件存放根目录和要搜索的关键词

#coding=utf-8from docx import Documentimport os,sysdef search_word(filename,word):#打开文档document = Document(filename)#读取每段资料pa=document.paragraphs#拼接每一段的内容para_list = []for para in pa:para_list.append(para.text)#合并字符串file_text = ''.join(para_list)if word in file_text:print("find file for {}:".format(word))print(filename)process_list=[]
def get_process_files(root_dir):"""process all files in directory"""cur_dir=os.path.abspath(root_dir)file_list=os.listdir(cur_dir)for file in file_list:fullfile=cur_dir+"\\"+fileif os.path.isfile(fullfile):process_list.append(fullfile)elif os.path.isdir(fullfile):dir_extra_list=get_process_files(fullfile)return process_listdef find_files(root_dir,word):get_process_files(root_dir)print("总计文件数:{}".format(len(process_list)))for files in process_list:search_word(files, word)return
if __name__=='__main__':#此处修改自己存放文件位置和名字#文件根目录root_dir=r'D:\beizhai\study\大四\综测\【2021】XX学院综测公示文件'#要搜索的关键字word="beizhai"count=0try:find_files(root_dir,word)except:pass

Python查找文件夹下含有特定关键字的文档word 查找word中的关键词等相关推荐

  1. python查找文件夹下的文件,python 查找文件夹下所有文件 实现代码 -电脑资料

    复制代码代码如下: def find_file_by_pattern(pattern='.*', base=".", circle=True): '''''查找给定文件夹下面所有 ...

  2. xml遍历文件夹vector_怎么统计指定文件夹下含有.xml格式的文件数目

    如何统计指定文件夹下含有.xml格式的文件数目?如题 ------解决思路----------------------Directory.GetFiles(@"路径", " ...

  3. Python列出文件夹下某类文件名的方法

    Python 列出文件夹下某类文件后缀 读某个文件夹下所有图片 利用os.listdir()和string.endswith()函数实现. 在进行视觉相关任务编程时, 常常需要读出文件夹下的图片.但有 ...

  4. python——删除文件夹下的所有文件和子文件夹(含代码)

    使用python删除文件夹下的所有文件与子文件夹,需要使用到递归. 因为直接os.remove不能删除文件夹,os.rmdir不能删除含有文件的文件夹. 直接上代码: def deldir(dir): ...

  5. 查找文件夹下图片的数量

    //查找文件夹下图片的数量\ private int getFiles(String string){int i=0;File file = new File(string);File[] files ...

  6. python读取文件夹下所有图片

    python读取文件夹下所有图片 具体实现步骤 功能需求 说明 第一步:导入库 第二步:写读取函数 第三步:函数调用 结语 具体实现步骤 功能需求 读取一个文件夹中的所有图片,并将图像数据存储在一个文 ...

  7. Python 获取文件夹下所有文件

    前言 使用Python获取文件夹下的所有文件时,存在多种方式. 1. os.listdir os.listdir:参数为文件夹路径,可以返回文件夹下的所有子文件夹.文件名称. 示例: import o ...

  8. shell脚本实现查找文件夹下重复的文件,并提供删除功能

    Windows下有软件FindDupFile,可以搜索指定目录及其下子目录,列出所有内容完全相同的文件(文件名可能不同),然后由用户选择删除重复的文件. 然而shell脚本却可以使用几行的命令完成与此 ...

  9. python 遍历文件夹下所有mp3

    python 遍历文件夹下所有mp3 #python import os import shutilg = os.walk('files')for path, d, files in g:for fi ...

最新文章

  1. 在运筹学中什么样的解决方案是最优的
  2. 树形dp——树的最远距离 hdu2196
  3. python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据、matplotlib可视化生成的仿真数据
  4. C++学习笔记5[函数]
  5. 计算机操作系统——页面置换算法
  6. 【微信】微信小程序 应用内的页面跳转在添加了tab以后就跳转不成功的问题解决...
  7. Android EditText中插入图片并响应点击事件
  8. 使用python对url编码解码
  9. 真壕!腾讯员工平均月薪 7 万!
  10. TIOBE 4 月编程语言排行榜:Python 持续升温,Perl 苦苦挣扎
  11. Swift 后端开发
  12. 第一个神经网络代码分享
  13. android页面布局 如何让中间的listview填充剩余部分_不使用css3:flex怎么实现一些常见的移动端布局...
  14. VS+VSS代码管理
  15. 【Weiss】【第03章】双链表例程
  16. 微信小程序,标签云效果:自定义颜色,并随机显示不同颜色
  17. 多种方式Map集合遍历
  18. WPFAvalonDock基本用法
  19. Qt5.12.6 + VS2019添加图片资源文件
  20. 获取文件夹下的文件,包含子文件夹并复制文件

热门文章

  1. 如何撰写“模型类“统计分析报告?
  2. 基于串口通信技术——让数码管显示的数据发送给电脑,电脑控制单片机外设——15单片机
  3. greenplum-gp-创建共享表-复制表-REPLICATED-分发策略
  4. vue form action post 方式提交
  5. 基站查询-基站定位资源
  6. UESTC 1642 老当益壮, 宁移白首之心? 欧拉回路、Fleury算法
  7. vc++网络安全编程范例(19)实现数字信封打包与拆解
  8. linux 不显示输入内容,ubuntu安装搜狗输入法不出现或是不显示输入法切换
  9. 【零基础学C语言】知识总结八:struct 结构体与 union 共用体
  10. 超体到底讲了什么,给你一篇真正的影评!