根据楼主的python改的。就没做成运行文件,代码如下:新手勿喷。#!/usr/bin/env python3# encoding: utf-8'''@author: zengyun@software: tool@application:@file: down.py@time: 2020/2/21 15:46@desc:'''importrequests,bs4

fromtqdm importtqdm

#获取文件名称和下载地址defget_soup(url):r =requests.get(url)r.encoding ='utf-8'#用utf-8解码文档rt =r.text

soup =bs4.BeautifulSoup(rt,'lxml')returnsoup

#创建文件夹defmkdir(path):#引入模块importos

#去除首位空格path =path.strip()#去除尾部\符号path =path.rstrip("\\")#判断路径是否存在#存在True#不存在FalseisExists =os.path.exists(path)#判断结果if notisExists:#如果不存在则创建目录#创建目录操作函数os.makedirs(path)print(path+'创建成功')return Trueelse:#如果目录存在则不创建,并提示目录已存在print(path+'目录已存在')return False#获取桌面路径defget_desktop():key =winreg.OpenKey(winreg.HKEY_CURRENT_USER,r'Software\Microsoft\Windows\CurrentVersion\Explorer\Shell Folders')returnwinreg.QueryValueEx(key,"Desktop")[0]#下载文件defget_pdf(savename,filename,url):response =requests.get(url,stream="TRUE")# stream=True的作用是仅让响应头被下载,连接保持打开状态,content_size =int(response.headers['Content-Length'])/1024#确定整个安装包的大小# pdf = response.contentpbar =tqdm(total=content_size,initial=0,unit='B',unit_scale=True,desc=filename)withopen(savename,'wb')asf:#下载文件forchunk inresponse.iter_content(chunk_size=1024):ifchunk:f.write(chunk)#更新文件大小pbar.update(1024)pbar.close()url ='https://bp.pep.com.cn/jc/index.html'#学科名称discipline0 ='人教版中小学电子教案'#学科主目录discipline1 =[]#学科一级目录discipline2 ={}#学科二级目录discipline =get_soup(url=url).find_all('div',"list_sjzl_jcdzs2020")#创建主目录mkdir(path=get_desktop()+"\\"+discipline0)fori indiscipline:discipline_class =i.find('div',"container_title_jcdzs2020")discipline_class_name =discipline_class.get_text()#创建一级目录mkdir(path=get_desktop()+"\\"+discipline0 +"\\"+discipline_class_name)#一级目录list# discipline1.append(discipline_class_name)fora ini.find_all('a'):value ='https://bp.pep.com.cn/jc'+a['href'][1:]key =a.get_text()discipline2[key]=value #创建字典#创建二级目录mkdir(path=get_desktop()+"\\"+discipline0 +"\\"+discipline_class_name +"\\"+key)textbook =get_soup(url=value).find_all('ul',"clearfix")fori intextbook:forj ini.find_all('li','fl js_cp'):save_name =get_desktop()+"\\"+discipline0 +"\\"+discipline_class_name +"\\"+key +'\\'+\

j.find('a')['title']+".pdf"h_url =j.find('a',"btn_type_dl")['href']d_url =value +h_url[2:]get_pdf(savename=save_name,filename=j.find('a')['title'],url=d_url)

小学python教材电子版_【python爬虫】中小学人教版教材下载 (调用IDM)相关推荐

  1. 部编版是什么版本_部编版教材和人教版教材的区别

    部编版教材和人教版教材的区别 期刊目录网2017-08-08 15:40关注() 部编版教材与人教版教材是我们常见的教学用教材.很多人不知道部编版教材和人教版教材到底是什么,评职称选择教材申请会比较麻 ...

  2. Python实现信息自动配对爬虫排版程序(附下载)

    授权自AI科技大本营(ID:rgznai100) 本文约2800字,建议阅读7分钟. 本文为你介绍Python实现信息自动配对爬虫排版程序. 公众号(DatapiTHU)后台回复"20200 ...

  3. python 病毒 基因_#Python#提取基因对应的蛋白质名

    提取基因对应的蛋白质官方名 最开始,是需要将基因跟其编码的蛋白质对应起来,找遍了各种数据库都没发现有相关的注释文件,Uniprot作为处理蛋白质的大佬,结果里都有,肯定有办法能够满足需求. 搜索TP5 ...

  4. python keyboard模块_[python] PyMouse、PyKeyboard用python操作鼠标和键盘

    1.PyUserInput 简介 PyUserInput是一个使用python的跨平台的操作鼠标和键盘的模块,非常方便使用.支持的平台及依赖如下: Linux - Xlib Mac - Quartz, ...

  5. 部编版是什么版本_一年级语文,人教版和部编版有什么区别?看了这个就知道了!...

    原标题:一年级语文,人教版和部编版有什么区别?看了这个就知道了! 很多人可能不知道人教版和部编版有什么区别 总的来说其实区别不是非常的大 接下来小编就给大家总结几点 小学一年级语文人教版和部编版的区别 ...

  6. 小学三年级计算机教程视频教学视频,人教版小学三年级数学上册教学视频

    教程介绍: 人教版小学三年级数学(上学期)同步课堂教学视频[全40讲].超清视频同步辅导,由数学网课教师小丽老师主讲,和课本完全同步. 1.1秒的认识 1.2时间单位的换算 1.3解决问题例2 2.1 ...

  7. python爬图片_网络爬虫经验:反爬和反反爬

    我想很多人入门python是图片爬虫,就是HTTP请求,保存一下图片,用python实现非常快.网上很多爬虫的教程就讲到这里,实际上很单一,看了跟没看没什么区别,都是找一下网页的规律,然后Beauti ...

  8. python龙虎榜数据_【爬虫】使用爬虫技术获取盘后龙虎榜

    原文来自:MindGo量化社区-[爬虫]使用爬虫技术获取盘后龙虎榜 [导语]本文是"爬虫"系列文章的第一篇.爬虫技术被广泛用于搜索引擎.数据采集等重要领域.搜索引擎提供海量搜索结果 ...

  9. python花瓣图_【爬虫】花瓣图片爬虫,Python图片采集下载源码

    #https://huaban.com/search/?q=纹理&category=industrial_design #by 微信:huguo00289 # -*- coding: UTF- ...

最新文章

  1. 【[SCOI2010]序列操作】
  2. Linux下程序崩溃dump时的 core文件的使用方法
  3. 公司用--页面表单提交用的key是拼接的,保存时action的写法,struts1
  4. Java类集框架 —— HashMap源码分析
  5. ML之NB:利用朴素贝叶斯NB算法(TfidfVectorizer+不去除停用词)对20类新闻文本数据集进行分类预测、评估
  6. ios php 表单提交图片上传,axios发送post请求提交图片表单步骤详解
  7. uva 11572 ——Unique Snowflakes
  8. html5头像裁剪,移动端 上传头像 并裁剪功能(h5)
  9. nginx过滤html输入,nginx屏蔽指定接口(URL)的操作方式
  10. awk入门-保护SSHD
  11. IDEA 编译时 报 “常量字符串过长” 解决办法
  12. Hibernate 与 Mybatis 如何共存?打破你的认知!
  13. bzoj 1861 treap
  14. Eclipse好用的翻译插件
  15. 02组团队项目-Alpha冲刺-1/6
  16. ctfshow XXE web373-web378 wp
  17. [HEOI 2013 day2] 钙铁锌硒维生素 (线性代数,二分图匹配)
  18. Android中的EditText输入银行卡号四位空一格
  19. 互联网提供的音频/视频服务类型
  20. java百万条数据导出到excel表格

热门文章

  1. win10推送_10大新特性,微软WIN10 五月大更新推送
  2. RecyclerView滚动到指定位置
  3. 南京理工大学机械考研考情与难度、参考书及上岸前辈备考经验指导
  4. ps入门 工具的使用
  5. 我的世界java三叉戟怎么得_《我的世界》1.13最新快照,“水鬼”的三叉戟究竟如何获得?...
  6. 【修真院PM小课堂】关于用户成长系统的分享
  7. lis25ba_真无线蓝牙耳机用到哪些类型的传感器?
  8. 口令是计算机软件吗,Foxmail中的POP3口令是什么?
  9. JSP页面之间传递中文参数的解决方法
  10. Java+vue生成报纸排版新闻页面