Python3 从07版Excel获取pdf下载链接并下载pdf
昨天收到老陈的sb任务,让从一个Excel的文件里下载pdf文件,本以为手动下载就好了,然后打开一看600左右的链接,完了下载下来还要改名字,工作量太大,想的网上找一个程序用,但是发现自己不太懂编程,然后用的还是3,别人现成的是2,改来改去总是有问题,所以就自己参考别人的编了一个很low的半自动程序,也算是自己做的第一个程序,也同时是生活中用到第一个自己做的有用的程序,成就感满满,哈哈哈哈哈哈哈哈哈。不过这个程序优化的地方多了去了,只是自己现在学的还少,要搞起来还是有点小麻烦,过一阵子有空了,再优化一下,争取作为我第一个GitHub的开源。
- 要手动输入第几个sheet,可用循环改为自动,另外能做到每个sheet结束自动保存为一个文件夹就好了。
- 能做成一个小程序就更好了,输入文件夹名字放到指定目录下,自动搜索下载链接,并下载。
- 能实时记录下载到第几个就好了,万一中间出错就还得人工校对
#打开Excel
import xlrd
import requests
tarPath=r"C:\Users\Administrator\Desktop\laochen\新建文件夹"#保存路径data = xlrd.open_workbook("文件名.xls")
sheet = data.sheets()[2] #这里【】改变的是第几个sheet(从零开始)
nrows = sheet.nrows
print (nrows)
for rownum in range(2,523):#第一行是列名,所以从1开始即第二行读起title=sheet.cell(rownum,1).value#第二列的数据title=title.replace("/","")#替换不符合文件命名的字符link=sheet.cell(rownum,8).value#网址链接#print (link)fileName=title+'_'+str(rownum)+'.pdf' #保存的文件名#print (fileName)res = requests.get(link)playfile = open(fileName,'wb')playfile.write(res.content)print(res)try:res.raise_for_status()except Exception as exc:print("wrong")
Python3 从07版Excel获取pdf下载链接并下载pdf相关推荐
- 关于07版Excel的研究
07版Excel采用Xml打包的形式展现给世人,从此我们很方便地解析excel文件了 任意一款解压工具都可以解压开一个xlsx扩展名文件,如: WinRAR.exe x a.xls a\ 这样就把 ...
- link url下载php,php脚本生成google play url的下载链接,下载apk并自动反编译后获取android版本号...
php脚本生成google play url的下载链接,下载apk并自动反编译后获取android版本号 需求: get the offer tracking link follow the redi ...
- 小程序配置阿里云OSS下载文件,在请求头里配置生成强制下载链接,(拿到下载链接可以下载文件至本地)
小程序配置阿里云OSS下载文件,在请求头里配置生成强制下载链接,(拿到下载链接可以下载文件至本地)(Win10电脑开发环境)**这里只说明小程序端问题**<菜鸡总结大神勿喷!蟹蟹~> 大体 ...
- java如何从https下载链接中下载文件
java如何从https下载链接中下载文件 文章目录 java如何从https下载链接中下载文件 从https 下载文件会存在什么用的问题? 导入安全证书到jdk 下载文件 URL 获取inputSt ...
- 清理easyexcel导出07版Excel时产生的poi-sxssf-sheet*.xml临时文件
最新编辑 临时文件问题已经在官方2.x版本修复了,此文档不具有参考性了 事件起源 因为生产环境每天有大量的Excel文件导出,以前是导出03版,但是03版的每个sheet行数有限而且同样的数据文件本身 ...
- Xcode 11的问题及 Xcode 11 beta 1和beta 2 版下载链接, 官方下载后上传到百度网盘的.
Xode 11 beta 1和beta 2 版下载 链接:https://pan.baidu.com/s/1ZqWoDaIgUGzGdupPqHJIvQ 密码:q9gy 链接:https://pan. ...
- 主流浏览器最新版离线版安装包下载链接或下载方法
一.Google Chrome谷歌浏览器 Google Chrome是一款由Google公司开发的网页浏览器,该浏览器基于其他开源软件撰写,包括WebKit,目标是提升稳定性.速度和安全性,并创造出简 ...
- 【Python】自动化办公-outlook邮箱处理(获取邮箱附件)/通过下载链接自动下载
outlook邮箱处理-获取邮箱附件 #先引入outlook import win32com.client outlook = win32com.client.Dispatch("Outlo ...
- APP下载链接被微信封杀拦截屏蔽怎么解封在微信中直接点击下载链接直接下载app
微信链接为什么会显示已停止防封 微信作为一个社交平台,把控安全完整的生态社交圈,屏蔽一些问题域名无可厚非,但是不能采取一刀切的方式来进行处理. 导致不少没有问题的域名也被拦截,更多的是棋牌游戏类APP ...
最新文章
- 063_object标签
- 绿色运营,数据中心还得靠自动化
- c 普通的文本变成注释文本的快捷键_IntelliJ Idea 常用快捷键列表 (2019年总结)
- 使用代码创建BRF ruleset
- C#中利用委托实现多线程跨线程操作
- 综合日语第一册第十四课
- python 抓取微博评论破亿_如果利用Python分析14亿条数据!资深程序员手把手教你!过亿级!...
- 学期计算机教案,学年第2学期课程教案-计算机组成原理-陈立伟
- Django搭建登录注册功能
- CSS字体系列(CSS、HTML)
- 讨一个上海中上条件的老婆的成本 (zz)
- 华为云计算hcip证书有效期_华为认证云计算 V4.0认证
- Vue的倒计时插件(vue-flip-down)
- csv文件用excel打开中文乱码如何设置
- 信息技术应用现状的趋势
- 使用python实现图像对比度增强
- 递归中的引用传递和常引用传递
- gym101532 2017 JUST Programming Contest 4.0
- cn2.php中文,Python使用cn2an实现中文数字与阿拉伯数字的相互转换
- 西北乱跑娃 -- python发送html邮件