用python爬取视频及字幕_Python3爬取B站视频弹幕文字+视频
需要准备的环境:
1、一个B站账号,需要先登录,否则不能查看历史弹幕记录
2、联网的电脑和顺手的浏览器,我用的Chrome
3、Python3环境以及request模块,安装使用命令,换源比较快:
爬取步骤:
1.登录后打开需要爬取的视频页面,打开开发者工具台,Chrome可以使用F12快捷键,选择network监听请求
其中rolldate后面的数字表示该视频对应的弹幕号,返回的数据中timestamp表示弹幕日期,new表示数目
4.在查看历史弹幕中任选一天,查看,会发出新的请求
dmroll ,时间戳,弹幕号,表示获取该日期的弹幕,1507564800 表示2017/10/10 0:0:0
该请求返回xml数据
5.使用正则表达式获取所有弹幕消息,匹配模式
'(.*?)'
6.拼接字符串,将所有弹幕保存到本地文件即可
with open('content.txt', mode='w+', encoding='utf8') as f: f.write(content)
7.参考代码如下,将弹幕按照日期保存为单个文件...因为太多了...
8.最终效果
视频讲解
作者:阿豪boy
源自:developer.51cto.com/art/201801/562684.htm
声明:文章著作权归作者所有,如有侵权,请联系小编删除
用python爬取视频及字幕_Python3爬取B站视频弹幕文字+视频相关推荐
- 【板栗糖GIS】——如何下载哔哩哔哩的视频CC字幕为不带时间节点的纯文字
[板栗糖GIS]--如何下载哔哩哔哩的视频CC字幕为不带时间节点的纯文字 目录 1. 打开edge浏览器或谷歌浏览器 2. 安装油猴插件 3. 安装字幕插件 4. 打开哔哩哔哩视频播放页面,点击字幕 ...
- 视频加字幕软件哪个好用?视频教程添加文字怎么添加
大家是否经常会在社交媒体上分享自己的视频日常呢?这些视频会被很多人所浏览,而有些视频中的旁白语速过快,声音不清晰,如果没有文字显示的话,会让人不清楚到底在表达什么.并且给视频添加文字还可以让我们在公共 ...
- python英雄联盟脚本是什么_Python3爬取英雄联盟英雄皮肤大图实例代码
爬虫思路 初步尝试 我先查看了network,并没有发现有可用的API:然后又用bs4去分析英雄列表页,但是请求到html里面,并没有英雄列表,在英雄列表的节点上,只有"正在加载中" ...
- python和c 情侣网名_Python3 爬取网站收藏数超过70的 情侣网名
[Python] 纯文本查看 复制代码# coding=utf-8 # python 3.7 import urllib.request,urllib.error import re import t ...
- 用python爬取网易云评论_Python3爬取网易云音乐评论|python爬虫|python入门|python教程...
https://www.xin3721.com/eschool/pythonxin3721/ 本文转载至知乎ID:Charles(白露未晞)知乎个人专栏 下载W3Cschool手机App,0基础随时随 ...
- python爬取音乐源码_python3爬取咪咕音乐榜信息(附源代码)
1 """ 2 典型的分页型网站--咪咕音乐榜3 有时候运行会报错,有时候正常,原因不知道4 """ 5 importrequests6 f ...
- python中求差的函数_python3函数取差是什么?如何写代码?
我们在数学中进行加减运算,两个数相减就可以得到差.今天小编就带来一个新问题,函数取差.有的小伙伴会很困惑,函数是一群英文使用,又不是数字怎么还能进行取差呢?这里也算是学习python有趣的地方,函数取 ...
- python爬虫视频下载代码_Python3百行代码批量下载抖音视频|python爬虫|python入门|python教程...
https://www.xin3721.com/eschool/pythonxin3721/ 本文转载至知乎ID:Charles(白露未晞)知乎个人专栏 下载W3Cschool手机App,0基础随时随 ...
- 怎样用计算机合并视频,怎么合并视频和字幕 格式工厂视频字幕合并教程-电脑教程...
一般我们看到的视频都是由视频.字幕和声音组成,关于视频和声音的合并技巧,此前华强电子网也有过介绍.而对于视频和字幕合并,此前我们基本没怎么介绍过,那么怎么合并视频和字幕呢?对于一些专业的视频处理人士来 ...
最新文章
- 同步线程和进程间的通信
- SVN服务器从Windows迁移到Linux
- java中Class.getResource用法(用于配置文件的读取)
- WebDeploymentSetup使用乱码问题解决
- 天池在线编程 2020国庆八天乐 - 7 进制
- c++11特性move和forward区别
- json字符串、json对象、数组之间的转换
- Tyvj3308毒药解药题解
- 手机等第三方终端访问 WebStorm 页面
- 微型计算机原理与接口技术第五版pdf,微型计算机原理与接口技术(第5版)
- 怎样用比较器实现信号的衰减和饱和_高频小信号LC谐振放大器的设计思路与具体电路实现...
- python程序自动运行_定时后台运行Python程序
- Oracle数据库表空间数据文件最大容量以及存满时处理方法
- 24个基本指标精粹讲解(16)--DMA
- Fastjson漏洞修复参考
- 18、关于oracle 认证的几个问题
- JDT操作AST重构if块
- RAR文件格式-笔记
- python3 get爬取网页标题、链接和链接的数字ID
- 人民币纸币采用防伪油墨
热门文章
- DeepFaceLive AI实时换脸软件安装流程
- linux sqlplus显示乱码,scrt访问linux,sqlplus查询中文显示乱码
- Python以及Pycharm安装、汉化详细教程
- JAVA将HTML转化图片最靠谱的方法
- 为什么把鼠标箭头指向任务栏时箭头就没了,根本就不知道箭头在哪
- 如何使用oracle修改表字段长度
- 车型诊断框架的搭建系列_故障码(PCBU)库
- swift之视频播放AVKIT、AVPlayerViewController、音频录制和播放
- 纯小白尝试TensorFlow篇一:组装电脑
- Forrester权威专家告诉你:欺诈与反欺诈5日谈