代码:

"""
python爬取ppt素材
所需模块:request  re
爬取网站:https://www.ypppt.com
"""
import requests
import re
url='https://www.ypppt.com/moban/'
headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36 Edg/105.0.1343.53'
}
response=requests.get(url=url,headers=headers)
response.encoding='utf-8'
#print(response.text)
ppt_info=re.findall('<a href="(.*?)" class="p-title" target="_blank">(.*?)</a>',response.text)
#print(ppt_info)
for index,title in ppt_info:ppt_id=index.split('/')[-1][:-5]index_url=f'https://www.ypppt.com/p/d.php?aid={ppt_id}'response_1=requests.get(index_url,headers)download_url=re.findall('<li><a href="(.*?)">下载地址1</a></li>',response_1.text)[0]ppt_content=requests.get(download_url,headers).content# with open('素材\\'+title+'.zip',mode='wb') as f:#     f.write(ppt_content)print(ppt_id,title)

结果:

【Python爬虫】爬取ppt素材相关推荐

  1. 在当当买了python怎么下载源代码-python爬虫爬取当当网

    [实例简介]python爬虫爬取当当网 [实例截图] [核心代码] ''' Function: 当当网图书爬虫 Author: Charles 微信公众号: Charles的皮卡丘 ''' impor ...

  2. python爬虫代码实例-Python爬虫爬取百度搜索内容代码实例

    这篇文章主要介绍了Python爬虫爬取百度搜索内容代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 搜索引擎用的很频繁,现在利用Python爬 ...

  3. python爬虫数据分析可以做什么-python爬虫爬取的数据可以做什么

    在Python中连接到多播服务器问题,怎么解决你把redirect关闭就可以了.在send时,加上参数allow_redirects=False 通常每个浏览器都会设置redirect的次数.如果re ...

  4. python爬虫爬取csdn博客专家所有博客内容

    python爬虫爬取csdn博客专家所有博客内容: 全部过程采取自动识别与抓取,抓取结果是将一个博主的所有 文章存放在以其名字命名的文件内,代码如下 #coding:utf-8import urlli ...

  5. python网易云_用python爬虫爬取网易云音乐

    标签: 使用python爬虫爬取网易云音乐 需要使用的模块 只需要requests模块和os模块即可 开始工作 先去网易云音乐网页版找一下你想要听的歌曲点击进去.按键盘F12打开网页调试工具,点击Ne ...

  6. 使用Python爬虫爬取网络美女图片

    代码地址如下: http://www.demodashi.com/demo/13500.html 准备工作 安装python3.6 略 安装requests库(用于请求静态页面) pip instal ...

  7. python如何爬取网站所有目录_用python爬虫爬取网站的章节目录及其网址

    认识爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模拟 ...

  8. 运用Python爬虫爬取一个美女网址,爬取美女图

    运用Python爬虫爬取一个美女网址,爬取美女图 要运用到的python技术: 导入库 1.request 发送请求,从服务器获取数据 2.BeautifulSoup 用来解析整个网页的源代码 imp ...

  9. Python爬虫|爬取喜马拉雅音频

    "GOOD Python爬虫|爬取喜马拉雅音频 喜马拉雅是知名的专业的音频分享平台,用户规模突破4.8亿,汇集了有声小说,有声读物,儿童睡前故事,相声小品等数亿条音频,成为国内发展最快.规模 ...

最新文章

  1. redis 系列25 哨兵Sentinel (高可用演示 下)
  2. Delphi XE2 之 FireMonkey 入门(35) - 控件基础: TFmxObject: 其它
  3. koa 接口返回数据_一文搞定 Koa 中间件实现原理
  4. Linux 下 ps 命令的使用详解
  5. Windows系统MySQL安装配置
  6. 初学Java Web(3)——第一个Servlet
  7. SAP WebClient UI页面标签的决定逻辑介绍
  8. pytorch简单框架
  9. 使用AWS Lambda,S3和AWS CloudFront进行动态内容缓存
  10. 使用图形芯片加速电子自动化设计应用程序
  11. php html转换数组,将html标签转换为php数组
  12. 计算机编程结束进程代码,M代码如何停止CNC编程的程序
  13. 要显示的8个字符已存放在以BUF开始的存储区单元中(称为显示缓冲区),依次送到LED显示器中显示。CPU通过P0口和P2口控制8位LED显示器,LED为共阴极显示器。
  14. linux查文件被哪些程序占用—fuser和lsof的使用
  15. c语言程序设计基础第三版答案,清华大学出版社-图书详情-《C语言程序设计上机指导与习题解答(第3版)》...
  16. cocos2dx-lua 骨骼动画spine使用心得(cocos2dx版本 3.17 spine版本3.6.53)
  17. 苹果ID登陆第三方有漏洞?硬核!Gartner报告腾讯云数据库增速国内第一;“小米快递”商标注册,这是要入局物流领域?...
  18. [BZOJ1488][HNOI2009]图的同构(dfs+置换群+数论+组合数学)
  19. 已拿offer热乎乎的蚂蚁金服面经分享,建议收藏(Java岗、附答案)
  20. Hack The Box——Tabby

热门文章

  1. Excel中批量添加超链接
  2. C语言头文件正确写法
  3. 一周极客热文:Java开发的10位牛人
  4. ubuntu安装eclipse报错问题集
  5. 谈谈我这样一个程序员的中年危机
  6. 关于SASBase认证考试(70真题+答案详解)中的其中一道题
  7. 1.1 网络安全的前景
  8. 关于静态代码块的执行顺序,很简单的一道题,应该所有人都会吧?
  9. 亲子拍拍v1.2.1官方iPhone版
  10. ScalaTest User Guide