import xlrd

def extract(inpath):

data = xlrd.open_workbook(inpath, encoding_override="utf-8")

table = data.sheets()[0] # 选定表

nrows = table.nrows # 获取行号

ncols = table.ncols # 获取列号

all_info =[]

teacher = getnew(inpathnew)

print(teacher)

# print(nrows)

for i in range(0, nrows): # 第0行为表头

if i == 10:

break

else:

alldata = table.row_values(i) # 循环输出excel表中每一行,即所有数据

result = alldata[0] + "、" + alldata[1] + "、" + alldata[2] + "、" + alldata[3] + "、" + alldata[4] # 取出表中第二列数据

name = "刘诗诗"

data = name in result

if data:

index = i

same_name = name

#print(result)

def getnew(inpathnew):

data = xlrd.open_workbook(inpathnew, encoding_override="utf-8")

table = data.sheets()[0] # 选定表

nrows = table.nrows # 获取行号

ncols = table.ncols # 获取列号

all_info =[]

for i in range(1, nrows): # 第0行为表头

alldata = table.row_values(i) # 循环输出excel表中每一行,即所有数据

result = alldata

#result = alldata[0] + "、" + alldata[1] + "、" + alldata[2] + "、" + alldata[3] + "、" + alldata[4] + "、" + alldata[5] # 取出表中第二列数据

all_info.append(result)

print(all_info)

#all_info = (2, 5, 8, 10, 8, 12, 23, 3, 2, 3, 5)

import itertools

original_list = all_info

new_merged_list = list(itertools.chain(*original_list))

print(new_merged_list)

arr = new_merged_list

print(arr)

n = len(arr)

for i in range(0, n):

for j in range(i + 1, n):

if (arr[i] == arr[j]):

print("%s,%s" % (arr[i], arr[j]))

# # 定义列表

# l = ["a", "b", "c", "a", "b", "c", "a"]

# # 获取第一个"a"的下标

# index_one = l.index("a")

# # 从第一个"a"的下一个位置开始查找, 所以加1

# print(l.index("a", index_one + 1))

#return all_info

inpath = ("111.xlsx") # excel文件所在路径

inpathnew = ("222.xlsx") # excel文件所在路径

#extract(inpath)

getnew(inpathnew)

python处理表格数据匹配-python爬取两个excel表里的相同数据并匹配输出相关推荐

  1. python爬虫表格table_Python基于pandas爬取网页表格数据

    以网页表格为例:https://www.kuaidaili.com/free/ 该网站数据存在table标签,直接用requests,需要结合bs4解析正则/xpath/lxml等,没有几行代码是搞不 ...

  2. python热词关系图_Python 爬取 热词并进行分类数据分析-[拓扑数据]

    日期:2020.01.29 博客期:137 星期三 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] c.[拓扑数据](本期博客) d.[数 ...

  3. python爬虫----网易云音乐歌曲爬取并存入Excel

    因为数据要存入Excel中,所以首要目标是找个办法将数据能够存入excel中 经过在网上一番搜索后,发现用python里的xlwt模块可以比较容易的解决 一.准备工作 1.安装xlwt模块: 可以看h ...

  4. Python无框架分布式爬虫,爬取范例:拼多多商品详情数据,拼多多商品列表数据

    拼多多是中国领先的社交电商平台之一,是一家以"团购+折扣"为主要运营模式的电商平台.该平台上有海量的商品,对于商家和消费者来说都具有非常大的价值,因此,拼多多商品数据的采集技术非常 ...

  5. 教你轻松爬取全国40城5000+地铁站点数据!(附源码)

    大家好,我是 辰哥~ 今天介绍一种新的 获取城市地铁站点数据的方法,而且不再只是北上广深四个城市,而是 全国开通地铁的城市. 对了,你觉得全国有多少个城市开通了地铁? 文末附源码 ▶正文 今天爬取数据 ...

  6. 小一教你轻松爬取全国40城5000+地铁站点数据!附源码和数据集

    大家好,我是小一 上一篇文章讲了一个失败的数据分析案例,导致失败最最主要的原因就两个字:数据 有时候,爬虫爬到的数据是很珍贵.很稀缺,但是在实际项目最好还是多点谨慎,保证万无一失. 今天介绍一种新的 ...

  7. 爬虫实战—轻松爬取全国40城5000+地铁站点数据!附源码和数据集

    原文链接:小一教你轻松爬取全国40城5000+地铁站点数据!附源码和数据集 大家好,我是小一 上一篇文章讲了一个失败的数据分析案例,导致失败最最主要的原因就两个字:数据 有时候,爬虫爬到的数据是很珍贵 ...

  8. 利用python爬虫(案例6+part14)--如何爬取科研数据

    学习笔记 文章目录 Ajax动态加载网站数据抓取 动态加载的类型 那么该如何抓取数据? 如何得到JSON文件的地址? 观察JSON文件URL地址的查询参数 JSON格式数据转换成python字典 如何 ...

  9. 刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。

    当下我们饮食起居基本上依靠微信,但微信不单单是1个即时通信软件,更像是仿真模拟的日常生活世界.你所处的微信朋友圈是咋样,慢慢地你的思想也会变的咋样.近几日在学习 itchat,并且写了1个网络爬虫,扒 ...

最新文章

  1. java简体(繁体)转换器
  2. 手机全部零件名称图片_机械制图零件测绘
  3. 拍拍网t恤DIY效果
  4. 词频统计-------------web版本
  5. 关于云计算最新趋势的讨论
  6. [css] 你知道什么是动态伪类吗?
  7. android高仿天天动听,Android仿天天动听歌曲自动滚动view
  8. 销售数据分析这么做,领导不重用你都难
  9. Qss设置属性不进Set函数
  10. mac 中的 zip 和 unzip 命令
  11. 苹果apple pay原理_Apple Pay的工作原理
  12. 使用FreeHttp强制登出微信公众号登陆状态(实现~原理)
  13. 用别人的githut账号在自己电脑上拉取代码问题
  14. 《南怀瑾讲述99个人生道理》——刘清海编著
  15. CentOS等保三级安全加固方案
  16. std::mismatch 用法
  17. 给你一碗孟婆汤,你会选择遗忘什么?
  18. [BZOJ4565][Haoi2016]字符合并(区间状压dp)
  19. VDI虚拟桌面基础架构
  20. sorted()排序详解

热门文章

  1. 论文评审最大流_为什么论文的审稿流程那么复杂?
  2. PDF阅读器中如何添加附件?
  3. [评委计分系统-双屏版]_唯一专业智能的PowerPoint评委打分展示系统闪亮登场!
  4. java 二维数组的定义及操作
  5. rcar-du 通过modetest命令测试DU驱动显示
  6. 带你读AI论文:NDSS2020 UNICORN: Runtime Provenance-Based Detector
  7. SPA项目开发之动态树+数据表格+分页
  8. CS8685 2x80W双声道大功率D类音频功放IC
  9. 好心情精神心理科:抑郁症,真的会让你变丑!
  10. AVFoundation 播放器实例