【python】从Excel中提取数据并判断该数据是否含有特定的关键词
第一次在CSDN发布文章,初衷是为了记录的同时希望能帮到有需要的人与大家共同学习,不足之处还请大佬们多多指教,感谢~
参考链接有:【python】提取excel中的某一列数据_allan2222的博客-CSDN博客_python 提取某一列
先上代码:
import xlrd
import sysresult=[]#result用来存放关键词
with open('C:/Desktop/化学介质.txt','r',encoding='utf-8') as f:for line in f:result.append(list(line.strip('\n').split(',')))def extract(inpath):data = xlrd.open_workbook(inpath, encoding_override='utf-8')table = data.sheets()[0]#选定表nrows = table.nrows#获取行号ncols = table.ncols#获取列号for i in range(0, nrows):#第0行为表头alldata = table.row_values(i)#循环输出excel表中每一行,即所有数据name = alldata[0]#取出表中第1列数据,即事故名称text = alldata[1]#取出表中第2列数据,即事故案例原文print(name)for i in range(len(result)):#判断每个text中有没有关键字,如果有输出该关键字b = str(*result[i])c = b in textif c == 1:print(b)inpath = '事故.xls'#excel文件所在路径
extract(inpath)
代码讲解:
首先这个代码的目的是为了把事故案例中出现的危化品介质作为关键词找出来。由于事故案例有几百条并且每一条案例原文字数平均都是5k+,危化品数据有一千多条。所以将事故案例存进Excel的某一列中,每个事故案例放在一个单元格中,然后用记事本存放危化品(关键词),每一行只放一个危化品。
一行一行地遍历记事本中的关键词,用result来接收存放数据。(注意txt文件的路径及文本内容中的英文逗号)
python中判断text中是否含有指定字符串的关键字:in
【python】从Excel中提取数据并判断该数据是否含有特定的关键词相关推荐
- Python对Excel中具体某几列进行数据预处理
1.利用python读取Excel中.xls文件中所有数据 #encoding=utf-8 import xlrd import xlwt from xlwt import *fileName=&qu ...
- python:从excel中提取高频词生成词云
文章目录 0.快速修改使用 1.需要的库 2.代码逻辑 3.分块功能说明 3.1统计词频 3.2过滤 3.3生成词云 4.结果图 5.工程代码 作用是统计excel中出现频率较高的词汇,形成词云 0. ...
- excel中提取双引号之间的数据、提取括号中的数据
提取括号中间的数据 公式: =MID(A20,FIND("[",A20,1)+7,LEN(A20)-FIND("]",A20,1)+6) 实例: 提取双引号中间 ...
- python表格多列合并_python 合并excel表格数据-如何用python从excel中同时提取两个列的数据,并生成dict(用xlrd)...
用Python导出工程文件两个子页里的数据成为两个excel表格,但我想把它合并成个一个excel表格的两个sheet 可以采用一些操作Excel块去实现,比如xlrd.xlwt.openpyxl.x ...
- python 表格格式输出_利用python对excel中一列的时间数据更改格式操作
问题场景:需要将下列的交期一列的数据格式更改成2019/05/10 存货编码 尺寸 数量 交期 0 K10Y0190000X B140 200 2019-05-10 00:00:00 1 K10Y01 ...
- python从字符串中提取数字并转换为相应数据类型_python从PDF中提取数据的示例
01 前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都 ...
- python对excel数据更改_利用python对excel中一列的时间数据更改格式代码示例
本篇文章小编给大家分享一下利用python对excel中一列的时间数据更改格式代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 问题场景:需要将 ...
- python读取Excel中关联表格的数据(只要是同Excel中
来自CSDN-Mr熊 https://blog.csdn.net/qq_41030861/article/details/80515984 谁能告诉我前面这一堆都是什么啊... python读取Exc ...
- 用python对excel中一列的时间数据更改格式
用python对excel中一列的时间数据更改格式 问题场景:需要将下列的交期一列的数据格式更改成2019/05/10 存货编码 尺寸 数量 交期 0 K10Y0190000X B140 200 20 ...
- Python读取Excel中的数据
1.用xlrd包读取excel数据 import xlrddef read_excel():# 打开文件,xlrd.open_workbook(),函数中参数为文件路径,分为相对路径和绝对路径work ...
最新文章
- html如何扩大div,HTML – 如何让绝对div适合父宽度/填充?
- RTL8189疯涨还缺货怎么办,可以用ESP8089替代.
- 使用CArchive类进行序列化
- gh0st源码分析与远控的编写(四)
- C# 键盘特定键的代码描述
- heartbeat 非联网安装(通过配置本地yum文件库安装heartbeat)
- Xmind 8 pro 软件破解版
- python适合什么发型-下面不属于python特性的是( )。
- php 极光短信发送 api
- 计算机开机后黑屏鼠标显示桌面图标,电脑开机后黑屏只有一个鼠标箭头怎么办 电脑黑屏的解决方法...
- 基于django的轻量级CMS Mezzanine搭建笔记
- 签电子合同的流程是怎样的
- [万字长文] 图神经网络的解释性综述
- 如何投资股票型基金?什么时间买?买什么?
- 阿里云短信申请流程以及配置
- vcruntime140_1.dll缺失
- 【Java|Swing】关于JLabel换行
- 大数据风控AI竞赛总结
- Lanczos插值,最邻近插值,双线性二次插值,三次插值
- 2020你好,2020再见
热门文章
- 利用语音通讯接口开发语音会议系统指南
- dota2大魔导师出装java_DotA2新版本大魔导师拉比克使用心得_DotA2大魔导师拉比克怎么玩厉害_快吧游戏...
- 我的大学六年(单片机大师郭天祥原创)
- 邮件群发:如何实现邮箱姓名一对一发送
- mysql字符集 utf8 和utf8mb4 的区别
- Ubuntu18.04+Nvidia GTX 1650 显卡驱动安装
- 【经验】超全面:这份设计师晋升答辩指南 值得收藏!
- iOS NSString字符串截取方法
- 课课通c语言pdf,非常课课通 科学 七年级 下 配浙教版 最新升级版.pdf
- 3D建模需要学多久可以学会?自学能就业吗