python下载包图网图片_Python爬虫包图网case

# coding=utf-8

import requests

from lxml import etree

# 请求网页获取网页信息

responce = requests.get("https://ibaotu.com/shipin/")

# 整理网页文本对象

html = etree.HTML(responce.text)

# 定位网页元素位置

title_list = html.xpath('//span[@class="video-title"]/text()')

print(title_list)

src_list = html.xpath('//div[@class="video-play"]/video/@src')

print(src_list)

# 遍历数据，循环取文件名和链接地址

for tit, src in zip(title_list, src_list):

# 定义链接返回拼接数据

responce = requests.get("http:" + src)

# 定义文件名称和格式

file_name = tit + ".mp4"

print('保存视频文件: {}'.format(file_name))

# 文件已二进制方式写入文件名称，播放链接内容

with open(file_name, 'wb') as f:

f.write(responce.content)

from urllib import *

import requests

from lxml import etree

class Spider:

def geturl(self, url):

response = requests.get(url)

response.encoding = response.apparent_encoding

return response.text

# def download(self,url):

# response = requests.Request(url)

# return response.url

def getinfo(self, url):

html = etree.HTML(url)

tit1 = '//span[@class="video-title"]/text()'

tit = html.xpath(tit1)

src = html.xpath('//div[@class="video-play"]/video/@src')

return tit, src

def saveinfo(self,name,data):

for n,l in zip(name,data):

responce = requests.get("http:" + l)

file_name = n + ".mp4"

print("正在下载:{}".format(file_name))

with open(file_name, 'wb')as f:

f.write(responce.content)

def run(self,firsturl):

html = self.geturl(firsturl)

info = self.getinfo(html)

for date in zip(info):

name = info[0]

src = info[1]

self.saveinfo(name,src)

if __name__ == '__main__':

spider = Spider()

spider.run("https://ibaotu.com/shipin/")

python下载包图网图片_Python爬虫包图网case相关推荐

java怎么爬网易云_Python爬虫爬取网易云的音乐
Python爬虫爬取网易云的音乐(学习笔记) 在开始之前,做一点小小的说明哈: 我只是一个python爬虫爱好者,如果本文有侵权,请联系我删除! 本文需要有简单的python爬虫基础,主要用到两个爬虫 ...
python爬取动态网页图片_python爬虫之爬取动态加载的图片_百度
运行坏境 python3.x 选择目标--百度当我们在使用右键查看网页源码时,出来的却是一大堆JavaScript代码,并没有图片的链接等信息因为它是一个动态页面嘛.它的网页原始数据其实是没有这个 ...
python爬微博超话图片_Python爬虫：《庆余年》人物图谱和微博传播路径
利用Python分析<庆余年>人物图谱和微博传播路径庆余年电视剧终于在前两天上了,这两天赶紧爬取微博数据看一下它的表现. 庆余年 <庆余年>是作家猫腻的小说.这部从2007年 ...
python基础教程网易云_Python爬虫教程：网易云音乐歌词
开发工具 **Python版本:**3.5.4 相关模块: requests模块: bs4模块: win_unicode_console模块: jieba模块: matplotlib模块: xlwt模 ...
python下载百度云盘中的数据_python爬虫：爬取百度云盘资料，保存下载地址、链接标题、链接详情...
在网上看到的教程,但是我嫌弃那个教程写的乱(虽然最后显示我也没高明多少,哈哈),就随手写了一个主要是嫌弃盘搜那些恶心的广告,这样直接下载下来,眼睛清爽多了. 用pyinstall 打包成EXE文件, ...
python爬取文字和图片_python爬虫--xpath结合re同时爬取文字与图片
还是老家的旅游网址:http://www.patour.cn/site/pananzxw/tcgl/index.html,将这些特产的图片及其介绍都爬取下来! 源码: 1 # -*- coding:u ...
python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下今天,试着爬取了煎蛋网的图片. 用到的包: ...
python爬虫beautifulsoup爬当当网_Python爬虫包 BeautifulSoup 递归抓取实例详解_python_脚本之家...
Python爬虫包 BeautifulSoup 递归抓取实例详解概要: 爬虫的主要目的就是为了沿着网络抓取需要的内容.它们的本质是一种递归的过程.它们首先需要获得网页的内容,然后分析页面内容并找到 ...
python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例
本例程使用urlib实现的,基于python2.7版本,采用beautifulsoup进行网页分析,没有第三方库的应该安装上之后才能运行,我用的IDE是pycharm,闲话少说,直接上代码! # -* ...
python爬歌词生成词云图_Python爬虫摇滚网易云音乐歌词生成词云图
我相信经过前三篇文章,大家已经学会了怎么下载歌词和歌曲了.看了我的文章后开始行动起来的应该都享受到音乐的福利了.问一个问题,当你疲惫时,你想提起精神来去工作或者看书,你会选择听什么歌曲让自己兴奋起来呢 ...

python下载包图网图片_Python爬虫包图网case

python下载包图网图片_Python爬虫包图网case相关推荐

最新文章

热门文章

python下载包图网图片_Python爬虫 包图网case

python下载包图网图片_Python爬虫 包图网case相关推荐

最新文章

热门文章

python下载包图网图片_Python爬虫包图网case

python下载包图网图片_Python爬虫包图网case相关推荐