# coding=utf-8

import requests

from lxml import etree

# 请求网页获取网页信息

responce = requests.get("https://ibaotu.com/shipin/")

# 整理网页文本对象

html = etree.HTML(responce.text)

# 定位网页元素位置

title_list = html.xpath('//span[@class="video-title"]/text()')

print(title_list)

src_list = html.xpath('//div[@class="video-play"]/video/@src')

print(src_list)

# 遍历数据,循环取文件名和链接地址

for tit, src in zip(title_list, src_list):

# 定义链接返回拼接数据

responce = requests.get("http:" + src)

# 定义文件名称和格式

file_name = tit + ".mp4"

print('保存视频文件: {}'.format(file_name))

# 文件已二进制方式写入文件名称,播放链接内容

with open(file_name, 'wb') as f:

f.write(responce.content)

from urllib import *

import requests

from lxml import etree

class Spider:

def geturl(self, url):

response = requests.get(url)

response.encoding = response.apparent_encoding

return response.text

# def download(self,url):

# response = requests.Request(url)

# return response.url

def getinfo(self, url):

html = etree.HTML(url)

tit1 = '//span[@class="video-title"]/text()'

tit = html.xpath(tit1)

src = html.xpath('//div[@class="video-play"]/video/@src')

return tit, src

def saveinfo(self,name,data):

for n,l in zip(name,data):

responce = requests.get("http:" + l)

file_name = n + ".mp4"

print("正在下载:{}".format(file_name))

with open(file_name, 'wb')as f:

f.write(responce.content)

def run(self,firsturl):

html = self.geturl(firsturl)

info = self.getinfo(html)

for date in zip(info):

name = info[0]

src = info[1]

self.saveinfo(name,src)

if __name__ == '__main__':

spider = Spider()

spider.run("https://ibaotu.com/shipin/")

python下载包图网图片_Python爬虫 包图网case相关推荐

  1. java怎么爬网易云_Python爬虫爬取网易云的音乐

    Python爬虫爬取网易云的音乐(学习笔记) 在开始之前,做一点小小的说明哈: 我只是一个python爬虫爱好者,如果本文有侵权,请联系我删除! 本文需要有简单的python爬虫基础,主要用到两个爬虫 ...

  2. python爬取动态网页图片_python爬虫之爬取动态加载的图片_百度

    运行坏境 python3.x 选择目标--百度 当我们在使用右键查看网页源码时,出来的却是一大堆JavaScript代码,并没有图片的链接等信息 因为它是一个动态页面嘛.它的网页原始数据其实是没有这个 ...

  3. python爬微博超话图片_Python爬虫:《庆余年》人物图谱和微博传播路径

    利用Python分析<庆余年>人物图谱和微博传播路径 庆余年电视剧终于在前两天上了,这两天赶紧爬取微博数据看一下它的表现. 庆余年 <庆余年>是作家猫腻的小说.这部从2007年 ...

  4. python基础教程网易云_Python爬虫教程:网易云音乐歌词

    开发工具 **Python版本:**3.5.4 相关模块: requests模块: bs4模块: win_unicode_console模块: jieba模块: matplotlib模块: xlwt模 ...

  5. python下载百度云盘中的数据_python爬虫:爬取百度云盘资料,保存下载地址、链接标题、链接详情...

    在网上看到的教程,但是我嫌弃那个教程写的乱(虽然最后显示我也没高明多少,哈哈),就随手写了一个 主要是嫌弃盘搜那些恶心的广告,这样直接下载下来,眼睛清爽多了. 用pyinstall 打包成EXE文件, ...

  6. python爬取文字和图片_python爬虫--xpath结合re同时爬取文字与图片

    还是老家的旅游网址:http://www.patour.cn/site/pananzxw/tcgl/index.html,将这些特产的图片及其介绍都爬取下来! 源码: 1 # -*- coding:u ...

  7. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  8. python爬虫beautifulsoup爬当当网_Python爬虫包 BeautifulSoup 递归抓取实例详解_python_脚本之家...

    Python爬虫包 BeautifulSoup  递归抓取实例详解 概要: 爬虫的主要目的就是为了沿着网络抓取需要的内容.它们的本质是一种递归的过程.它们首先需要获得网页的内容,然后分析页面内容并找到 ...

  9. python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例

    本例程使用urlib实现的,基于python2.7版本,采用beautifulsoup进行网页分析,没有第三方库的应该安装上之后才能运行,我用的IDE是pycharm,闲话少说,直接上代码! # -* ...

  10. python爬歌词生成词云图_Python爬虫摇滚网易云音乐歌词生成词云图

    我相信经过前三篇文章,大家已经学会了怎么下载歌词和歌曲了.看了我的文章后开始行动起来的应该都享受到音乐的福利了.问一个问题,当你疲惫时,你想提起精神来去工作或者看书,你会选择听什么歌曲让自己兴奋起来呢 ...

最新文章

  1. C++ OpenCV形态学操作--开闭操作,形态学梯度,顶帽,黑帽
  2. 数据结构——图:极大小连通子图、图的存储结构、图的遍历
  3. Spring Controller接收http传值
  4. 数据结构与算法之数组
  5. 网络被屏蔽了怎么办_预埋的网线不够长,怎么办?
  6. css没有border,你未必知道的CSS小知识:为什么没有人使用border-image
  7. spark代码连接hive_spark连接Hive
  8. 能搞垮你的不止是同行
  9. CentOS软件包管理之RPM
  10. 桌面圣诞树酷炫特效合集【含动态效果展示及网盘源码分享】
  11. 游戏服务器之生成Dump文件
  12. 【mybatis】基础环境搭建
  13. mysql自动去重_关于mysql自联去重的一些记录
  14. 车架号校验 php代码,VIN车辆识别代码查询
  15. python docx 图片_详解用 python-docx 创建浮动图片
  16. 谷粒学苑上传视频踩坑
  17. longest-common-prefix[最长公共子序列]
  18. 奥鹏西交计算机应用基础在线作业,20秋西交《计算机应用基础》在线作业【答案】...
  19. 联想台式计算机重装系统教程,联想台式机重装win7系统教程
  20. 智多星大数据分析云平台实践

热门文章

  1. 常用9款在线作图工具,总有一款适合你!
  2. java entry的用法_Java ZipEntry setComment()用法及代码示例
  3. honeyd蜜罐简易部署——ubuntu
  4. 使用百度EasyDL训练自己的图像识别模型
  5. 如何免费批量将caj转换成PDF
  6. 《整理的艺术》读书笔记
  7. Kali Linux2021安装搜狗输入法
  8. 广州IT销售菜鸟总结精华
  9. PS_01_基本操作
  10. Android release apk 签名流程