python下载包图网图片_Python爬虫 包图网case
# coding=utf-8
import requests
from lxml import etree
# 请求网页获取网页信息
responce = requests.get("https://ibaotu.com/shipin/")
# 整理网页文本对象
html = etree.HTML(responce.text)
# 定位网页元素位置
title_list = html.xpath('//span[@class="video-title"]/text()')
print(title_list)
src_list = html.xpath('//div[@class="video-play"]/video/@src')
print(src_list)
# 遍历数据,循环取文件名和链接地址
for tit, src in zip(title_list, src_list):
# 定义链接返回拼接数据
responce = requests.get("http:" + src)
# 定义文件名称和格式
file_name = tit + ".mp4"
print('保存视频文件: {}'.format(file_name))
# 文件已二进制方式写入文件名称,播放链接内容
with open(file_name, 'wb') as f:
f.write(responce.content)
from urllib import *
import requests
from lxml import etree
class Spider:
def geturl(self, url):
response = requests.get(url)
response.encoding = response.apparent_encoding
return response.text
# def download(self,url):
# response = requests.Request(url)
# return response.url
def getinfo(self, url):
html = etree.HTML(url)
tit1 = '//span[@class="video-title"]/text()'
tit = html.xpath(tit1)
src = html.xpath('//div[@class="video-play"]/video/@src')
return tit, src
def saveinfo(self,name,data):
for n,l in zip(name,data):
responce = requests.get("http:" + l)
file_name = n + ".mp4"
print("正在下载:{}".format(file_name))
with open(file_name, 'wb')as f:
f.write(responce.content)
def run(self,firsturl):
html = self.geturl(firsturl)
info = self.getinfo(html)
for date in zip(info):
name = info[0]
src = info[1]
self.saveinfo(name,src)
if __name__ == '__main__':
spider = Spider()
spider.run("https://ibaotu.com/shipin/")
python下载包图网图片_Python爬虫 包图网case相关推荐
- java怎么爬网易云_Python爬虫爬取网易云的音乐
Python爬虫爬取网易云的音乐(学习笔记) 在开始之前,做一点小小的说明哈: 我只是一个python爬虫爱好者,如果本文有侵权,请联系我删除! 本文需要有简单的python爬虫基础,主要用到两个爬虫 ...
- python爬取动态网页图片_python爬虫之爬取动态加载的图片_百度
运行坏境 python3.x 选择目标--百度 当我们在使用右键查看网页源码时,出来的却是一大堆JavaScript代码,并没有图片的链接等信息 因为它是一个动态页面嘛.它的网页原始数据其实是没有这个 ...
- python爬微博超话图片_Python爬虫:《庆余年》人物图谱和微博传播路径
利用Python分析<庆余年>人物图谱和微博传播路径 庆余年电视剧终于在前两天上了,这两天赶紧爬取微博数据看一下它的表现. 庆余年 <庆余年>是作家猫腻的小说.这部从2007年 ...
- python基础教程网易云_Python爬虫教程:网易云音乐歌词
开发工具 **Python版本:**3.5.4 相关模块: requests模块: bs4模块: win_unicode_console模块: jieba模块: matplotlib模块: xlwt模 ...
- python下载百度云盘中的数据_python爬虫:爬取百度云盘资料,保存下载地址、链接标题、链接详情...
在网上看到的教程,但是我嫌弃那个教程写的乱(虽然最后显示我也没高明多少,哈哈),就随手写了一个 主要是嫌弃盘搜那些恶心的广告,这样直接下载下来,眼睛清爽多了. 用pyinstall 打包成EXE文件, ...
- python爬取文字和图片_python爬虫--xpath结合re同时爬取文字与图片
还是老家的旅游网址:http://www.patour.cn/site/pananzxw/tcgl/index.html,将这些特产的图片及其介绍都爬取下来! 源码: 1 # -*- coding:u ...
- python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- python爬虫beautifulsoup爬当当网_Python爬虫包 BeautifulSoup 递归抓取实例详解_python_脚本之家...
Python爬虫包 BeautifulSoup 递归抓取实例详解 概要: 爬虫的主要目的就是为了沿着网络抓取需要的内容.它们的本质是一种递归的过程.它们首先需要获得网页的内容,然后分析页面内容并找到 ...
- python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例
本例程使用urlib实现的,基于python2.7版本,采用beautifulsoup进行网页分析,没有第三方库的应该安装上之后才能运行,我用的IDE是pycharm,闲话少说,直接上代码! # -* ...
- python爬歌词生成词云图_Python爬虫摇滚网易云音乐歌词生成词云图
我相信经过前三篇文章,大家已经学会了怎么下载歌词和歌曲了.看了我的文章后开始行动起来的应该都享受到音乐的福利了.问一个问题,当你疲惫时,你想提起精神来去工作或者看书,你会选择听什么歌曲让自己兴奋起来呢 ...
最新文章
- C++ OpenCV形态学操作--开闭操作,形态学梯度,顶帽,黑帽
- 数据结构——图:极大小连通子图、图的存储结构、图的遍历
- Spring Controller接收http传值
- 数据结构与算法之数组
- 网络被屏蔽了怎么办_预埋的网线不够长,怎么办?
- css没有border,你未必知道的CSS小知识:为什么没有人使用border-image
- spark代码连接hive_spark连接Hive
- 能搞垮你的不止是同行
- CentOS软件包管理之RPM
- 桌面圣诞树酷炫特效合集【含动态效果展示及网盘源码分享】
- 游戏服务器之生成Dump文件
- 【mybatis】基础环境搭建
- mysql自动去重_关于mysql自联去重的一些记录
- 车架号校验 php代码,VIN车辆识别代码查询
- python docx 图片_详解用 python-docx 创建浮动图片
- 谷粒学苑上传视频踩坑
- longest-common-prefix[最长公共子序列]
- 奥鹏西交计算机应用基础在线作业,20秋西交《计算机应用基础》在线作业【答案】...
- 联想台式计算机重装系统教程,联想台式机重装win7系统教程
- 智多星大数据分析云平台实践