本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)

对该url发起请求,返回二进制数据

将二进制数据保存为视频格式

视频链接:http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

import requests

import re

import time

time1=time.time()

main_url = 'http://video.eastday.com/a/170612170956054127565.html'

resp = requests.get(main_url)

#没有这行,打印的结果中文是乱码

resp.encoding = 'utf-8'

html = resp.text

link = re.findall(r'var mp4 = "(.*?)";', html)[0]

link = 'http:'+link

dest_resp = requests.get(link)

#视频是二进制数据流,content就是为了获取二进制数据的方法

data = dest_resp.content

#保存数据的路径及文件名

path = u'C:/赵丽颖.mp4'

f = open(path, 'wb')

f.write(data)

f.close()

time2 = time.time()

print u'ok,下载完成!'

print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py

ok,下载完成!

总共耗时:3.20499992371s

Process finished with exit code 0

成功下载可以播放~

希望本文所述对大家Python程序设计有所帮助。

python爬取新闻标题存入文本_Python视频爬虫实现下载头条视频功能示例相关推荐

  1. 爬虫python下载视频_Python视频爬虫实现下载头条视频功能示例

    本文实例讲述了Python视频爬虫实现下载头条视频功能.分享给大家供大家参考,具体如下: 一.需求分析 抓取头条短视频 思路: 分析网页源码,查找解析出视频资源url(查看源代码,搜mp4) 对该ur ...

  2. Python爬取新闻标题及链接存至 Excel(含源码)

    新闻网址: https://www.tsinghua.edu.cn/news.htm 本片文章实现爬取新闻标题和链接 将新闻标题及链接存储至 Excel 表 源码 # 清华新闻import panda ...

  3. python爬取微博数据存入数据库_Python爬取微博数据并存入mysql,excel中

    寒假期间做微博数据统计,由于是部门要求,也没办法,自己又是一个懒人,直接用python实现吧.写的很粗糙,也很差,请大家别介意. 总的来说分成两个模块:一个爬取微博数据存入数据库,一个从数据库调取数据 ...

  4. python爬取微博数据存入数据库_Python爬取新浪微博评论数据,写入csv文件中

    因为新浪微博网页版爬虫比较困难,故采取用手机网页端爬取的方式 操作步骤如下: 1. 网页版登陆新浪微博 2.打开m.weibo.cn 3.查找自己感兴趣的话题,获取对应的数据接口链接 4.获取cook ...

  5. python爬取新闻并归数据库_Python爬取数据并写入MySQL数据库操作示例

    Python爬取数据并写入MySQL数据库的实例 首先我们来爬取 http://html-color-codes.info/color-names/ 的一些数据. 按 F12 或 ctrl+u 审查元 ...

  6. python爬虫scrapy爬取新闻标题及链接_python爬虫框架scrapy爬取梅花网资讯信息

    原标题:python爬虫框架scrapy爬取梅花网资讯信息 一.介绍 本例子用scrapy-splash爬取梅花网(http://www.meihua.info/a/list/today)的资讯信息, ...

  7. python爬取新闻标题

    1.本文以pycharm为编辑器,爬取搜狐新闻的网页信息 2.具体代码如下 import requests from bs4 import BeautifulSoup res =requests.ge ...

  8. python爬虫爬取新闻标题及链接_网络爬虫百度新闻标题及链接爬取

    1.主题:百度新闻爬取 2. python代码: import requests from bs4 import BeautifulSoup def getHTMLText(url): try: r ...

  9. python爬取微博数据存入数据库_python爬取微博并且存入数据库

    由于平时喜欢刷微博,追星,所以写了想要写一个爬取微博的爬虫,在老师的建议下选择从移动端爬取,因为移动端页面元素简洁,易于爬取.在看微博时发现有比移动端更加简单的一个版本....老年机版?就是分页式的. ...

最新文章

  1. 状态输出导航栏html,Vue实现导航栏效果(选中状态刷新不消失)_百厌_前端开发者...
  2. [Java]Thinking in Java 练习2.12
  3. 图解 Kafka,看本篇就足够啦
  4. Python ——模块
  5. vue中标签自定义属性的使用
  6. Go Web 编程--超详细的模板库应用指南
  7. Mysql orangepi_SSH远程登录香橙派Orange Pi Zero2开发板的操作方法
  8. 95-130-022-源码-source-基于socket的source源码分析SocketTextStreamFunction
  9. python字符串不可改变怎么理解_python的“不可变性”代表了什么?
  10. python日期转化利器arrow实践
  11. Arduino ESP32 最简单直接获取网络时间方法
  12. 熟悉Keil C51和STC-ISP下载烧录软件
  13. Android 项目必备(二十)-->NFC 的基本使用
  14. 状态监测与故障智能诊断技术在能源动力机械内燃机的应用
  15. 一些很好的python自动化办公方案(待整理到readthedocs中)
  16. 以后你肯定会用到的,25个常用Matplotlib图的Python代码,可以不会不能没有,建议收藏
  17. 教ai玩游戏_简单解释:DeepMind如何教AI玩视频游戏
  18. Excel对多个sheet页进行相同操作
  19. SpringBoot整合(四)整合Ehcache、Redis、Memcached、jetcache、j2cache缓存
  20. RDS Mysql Single-AZ和Multi-AZ性能差异

热门文章

  1. 外勤365显示服务器忙,外勤365产品培训FAQ.pdf
  2. spark DropDownList例子
  3. 30岁后你会站在哪里?
  4. 记录一个因变量遮蔽引起的“友尽”级bug
  5. [免费专栏] 汽车威胁狩猎之常用的几种威胁狩猎工具
  6. .p12 证书过期时间查询
  7. SIP语音环境中十大经典问题及解决办法
  8. 入行物联网工程方面的知识,我们应该学习些什么基础技术?
  9. 高级IO--select
  10. android之bundle是什么_什么是bundle