python处理表格数据匹配-python爬取两个excel表里的相同数据并匹配输出
import xlrd
def extract(inpath):
data = xlrd.open_workbook(inpath, encoding_override="utf-8")
table = data.sheets()[0] # 选定表
nrows = table.nrows # 获取行号
ncols = table.ncols # 获取列号
all_info =[]
teacher = getnew(inpathnew)
print(teacher)
# print(nrows)
for i in range(0, nrows): # 第0行为表头
if i == 10:
break
else:
alldata = table.row_values(i) # 循环输出excel表中每一行,即所有数据
result = alldata[0] + "、" + alldata[1] + "、" + alldata[2] + "、" + alldata[3] + "、" + alldata[4] # 取出表中第二列数据
name = "刘诗诗"
data = name in result
if data:
index = i
same_name = name
#print(result)
def getnew(inpathnew):
data = xlrd.open_workbook(inpathnew, encoding_override="utf-8")
table = data.sheets()[0] # 选定表
nrows = table.nrows # 获取行号
ncols = table.ncols # 获取列号
all_info =[]
for i in range(1, nrows): # 第0行为表头
alldata = table.row_values(i) # 循环输出excel表中每一行,即所有数据
result = alldata
#result = alldata[0] + "、" + alldata[1] + "、" + alldata[2] + "、" + alldata[3] + "、" + alldata[4] + "、" + alldata[5] # 取出表中第二列数据
all_info.append(result)
print(all_info)
#all_info = (2, 5, 8, 10, 8, 12, 23, 3, 2, 3, 5)
import itertools
original_list = all_info
new_merged_list = list(itertools.chain(*original_list))
print(new_merged_list)
arr = new_merged_list
print(arr)
n = len(arr)
for i in range(0, n):
for j in range(i + 1, n):
if (arr[i] == arr[j]):
print("%s,%s" % (arr[i], arr[j]))
# # 定义列表
# l = ["a", "b", "c", "a", "b", "c", "a"]
# # 获取第一个"a"的下标
# index_one = l.index("a")
# # 从第一个"a"的下一个位置开始查找, 所以加1
# print(l.index("a", index_one + 1))
#return all_info
inpath = ("111.xlsx") # excel文件所在路径
inpathnew = ("222.xlsx") # excel文件所在路径
#extract(inpath)
getnew(inpathnew)
python处理表格数据匹配-python爬取两个excel表里的相同数据并匹配输出相关推荐
- python爬虫表格table_Python基于pandas爬取网页表格数据
以网页表格为例:https://www.kuaidaili.com/free/ 该网站数据存在table标签,直接用requests,需要结合bs4解析正则/xpath/lxml等,没有几行代码是搞不 ...
- python热词关系图_Python 爬取 热词并进行分类数据分析-[拓扑数据]
日期:2020.01.29 博客期:137 星期三 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] c.[拓扑数据](本期博客) d.[数 ...
- python爬虫----网易云音乐歌曲爬取并存入Excel
因为数据要存入Excel中,所以首要目标是找个办法将数据能够存入excel中 经过在网上一番搜索后,发现用python里的xlwt模块可以比较容易的解决 一.准备工作 1.安装xlwt模块: 可以看h ...
- Python无框架分布式爬虫,爬取范例:拼多多商品详情数据,拼多多商品列表数据
拼多多是中国领先的社交电商平台之一,是一家以"团购+折扣"为主要运营模式的电商平台.该平台上有海量的商品,对于商家和消费者来说都具有非常大的价值,因此,拼多多商品数据的采集技术非常 ...
- 教你轻松爬取全国40城5000+地铁站点数据!(附源码)
大家好,我是 辰哥~ 今天介绍一种新的 获取城市地铁站点数据的方法,而且不再只是北上广深四个城市,而是 全国开通地铁的城市. 对了,你觉得全国有多少个城市开通了地铁? 文末附源码 ▶正文 今天爬取数据 ...
- 小一教你轻松爬取全国40城5000+地铁站点数据!附源码和数据集
大家好,我是小一 上一篇文章讲了一个失败的数据分析案例,导致失败最最主要的原因就两个字:数据 有时候,爬虫爬到的数据是很珍贵.很稀缺,但是在实际项目最好还是多点谨慎,保证万无一失. 今天介绍一种新的 ...
- 爬虫实战—轻松爬取全国40城5000+地铁站点数据!附源码和数据集
原文链接:小一教你轻松爬取全国40城5000+地铁站点数据!附源码和数据集 大家好,我是小一 上一篇文章讲了一个失败的数据分析案例,导致失败最最主要的原因就两个字:数据 有时候,爬虫爬到的数据是很珍贵 ...
- 利用python爬虫(案例6+part14)--如何爬取科研数据
学习笔记 文章目录 Ajax动态加载网站数据抓取 动态加载的类型 那么该如何抓取数据? 如何得到JSON文件的地址? 观察JSON文件URL地址的查询参数 JSON格式数据转换成python字典 如何 ...
- 刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。
当下我们饮食起居基本上依靠微信,但微信不单单是1个即时通信软件,更像是仿真模拟的日常生活世界.你所处的微信朋友圈是咋样,慢慢地你的思想也会变的咋样.近几日在学习 itchat,并且写了1个网络爬虫,扒 ...
最新文章
- java简体(繁体)转换器
- 手机全部零件名称图片_机械制图零件测绘
- 拍拍网t恤DIY效果
- 词频统计-------------web版本
- 关于云计算最新趋势的讨论
- [css] 你知道什么是动态伪类吗?
- android高仿天天动听,Android仿天天动听歌曲自动滚动view
- 销售数据分析这么做,领导不重用你都难
- Qss设置属性不进Set函数
- mac 中的 zip 和 unzip 命令
- 苹果apple pay原理_Apple Pay的工作原理
- 使用FreeHttp强制登出微信公众号登陆状态(实现~原理)
- 用别人的githut账号在自己电脑上拉取代码问题
- 《南怀瑾讲述99个人生道理》——刘清海编著
- CentOS等保三级安全加固方案
- std::mismatch 用法
- 给你一碗孟婆汤,你会选择遗忘什么?
- [BZOJ4565][Haoi2016]字符合并(区间状压dp)
- VDI虚拟桌面基础架构
- sorted()排序详解
热门文章
- 论文评审最大流_为什么论文的审稿流程那么复杂?
- PDF阅读器中如何添加附件?
- [评委计分系统-双屏版]_唯一专业智能的PowerPoint评委打分展示系统闪亮登场!
- java 二维数组的定义及操作
- rcar-du 通过modetest命令测试DU驱动显示
- 带你读AI论文:NDSS2020 UNICORN: Runtime Provenance-Based Detector
- SPA项目开发之动态树+数据表格+分页
- CS8685 2x80W双声道大功率D类音频功放IC
- 好心情精神心理科:抑郁症,真的会让你变丑!
- AVFoundation 播放器实例