python爬取新闻标题存入文本_Python视频爬虫实现下载头条视频功能示例
本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:
一、需求分析
抓取头条短视频
思路:
分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式
视频链接:http://video.eastday.com/a/170612170956054127565.html
二、代码实现
# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's
"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0
成功下载可以播放~
希望本文所述对大家Python程序设计有所帮助。
python爬取新闻标题存入文本_Python视频爬虫实现下载头条视频功能示例相关推荐
- 爬虫python下载视频_Python视频爬虫实现下载头条视频功能示例
本文实例讲述了Python视频爬虫实现下载头条视频功能.分享给大家供大家参考,具体如下: 一.需求分析 抓取头条短视频 思路: 分析网页源码,查找解析出视频资源url(查看源代码,搜mp4) 对该ur ...
- Python爬取新闻标题及链接存至 Excel(含源码)
新闻网址: https://www.tsinghua.edu.cn/news.htm 本片文章实现爬取新闻标题和链接 将新闻标题及链接存储至 Excel 表 源码 # 清华新闻import panda ...
- python爬取微博数据存入数据库_Python爬取微博数据并存入mysql,excel中
寒假期间做微博数据统计,由于是部门要求,也没办法,自己又是一个懒人,直接用python实现吧.写的很粗糙,也很差,请大家别介意. 总的来说分成两个模块:一个爬取微博数据存入数据库,一个从数据库调取数据 ...
- python爬取微博数据存入数据库_Python爬取新浪微博评论数据,写入csv文件中
因为新浪微博网页版爬虫比较困难,故采取用手机网页端爬取的方式 操作步骤如下: 1. 网页版登陆新浪微博 2.打开m.weibo.cn 3.查找自己感兴趣的话题,获取对应的数据接口链接 4.获取cook ...
- python爬取新闻并归数据库_Python爬取数据并写入MySQL数据库操作示例
Python爬取数据并写入MySQL数据库的实例 首先我们来爬取 http://html-color-codes.info/color-names/ 的一些数据. 按 F12 或 ctrl+u 审查元 ...
- python爬虫scrapy爬取新闻标题及链接_python爬虫框架scrapy爬取梅花网资讯信息
原标题:python爬虫框架scrapy爬取梅花网资讯信息 一.介绍 本例子用scrapy-splash爬取梅花网(http://www.meihua.info/a/list/today)的资讯信息, ...
- python爬取新闻标题
1.本文以pycharm为编辑器,爬取搜狐新闻的网页信息 2.具体代码如下 import requests from bs4 import BeautifulSoup res =requests.ge ...
- python爬虫爬取新闻标题及链接_网络爬虫百度新闻标题及链接爬取
1.主题:百度新闻爬取 2. python代码: import requests from bs4 import BeautifulSoup def getHTMLText(url): try: r ...
- python爬取微博数据存入数据库_python爬取微博并且存入数据库
由于平时喜欢刷微博,追星,所以写了想要写一个爬取微博的爬虫,在老师的建议下选择从移动端爬取,因为移动端页面元素简洁,易于爬取.在看微博时发现有比移动端更加简单的一个版本....老年机版?就是分页式的. ...
最新文章
- 状态输出导航栏html,Vue实现导航栏效果(选中状态刷新不消失)_百厌_前端开发者...
- [Java]Thinking in Java 练习2.12
- 图解 Kafka,看本篇就足够啦
- Python ——模块
- vue中标签自定义属性的使用
- Go Web 编程--超详细的模板库应用指南
- Mysql orangepi_SSH远程登录香橙派Orange Pi Zero2开发板的操作方法
- 95-130-022-源码-source-基于socket的source源码分析SocketTextStreamFunction
- python字符串不可改变怎么理解_python的“不可变性”代表了什么?
- python日期转化利器arrow实践
- Arduino ESP32 最简单直接获取网络时间方法
- 熟悉Keil C51和STC-ISP下载烧录软件
- Android 项目必备(二十)-->NFC 的基本使用
- 状态监测与故障智能诊断技术在能源动力机械内燃机的应用
- 一些很好的python自动化办公方案(待整理到readthedocs中)
- 以后你肯定会用到的,25个常用Matplotlib图的Python代码,可以不会不能没有,建议收藏
- 教ai玩游戏_简单解释:DeepMind如何教AI玩视频游戏
- Excel对多个sheet页进行相同操作
- SpringBoot整合(四)整合Ehcache、Redis、Memcached、jetcache、j2cache缓存
- RDS Mysql Single-AZ和Multi-AZ性能差异