需要准备的环境:

1、一个B站账号,需要先登录,否则不能查看历史弹幕记录

2、联网的电脑和顺手的浏览器,我用的Chrome

3、Python3环境以及request模块,安装使用命令,换源比较快:

爬取步骤:

1.登录后打开需要爬取的视频页面,打开开发者工具台,Chrome可以使用F12快捷键,选择network监听请求

其中rolldate后面的数字表示该视频对应的弹幕号,返回的数据中timestamp表示弹幕日期,new表示数目

4.在查看历史弹幕中任选一天,查看,会发出新的请求

dmroll ,时间戳,弹幕号,表示获取该日期的弹幕,1507564800 表示2017/10/10 0:0:0

该请求返回xml数据

5.使用正则表达式获取所有弹幕消息,匹配模式

'(.*?)'

6.拼接字符串,将所有弹幕保存到本地文件即可

with open('content.txt', mode='w+', encoding='utf8') as f: f.write(content)

7.参考代码如下,将弹幕按照日期保存为单个文件...因为太多了...

8.最终效果

视频讲解

作者:阿豪boy

源自:developer.51cto.com/art/201801/562684.htm

声明:文章著作权归作者所有,如有侵权,请联系小编删除

用python爬取视频及字幕_Python3爬取B站视频弹幕文字+视频相关推荐

  1. 【板栗糖GIS】——如何下载哔哩哔哩的视频CC字幕为不带时间节点的纯文字

    [板栗糖GIS]--如何下载哔哩哔哩的视频CC字幕为不带时间节点的纯文字 目录 1. 打开edge浏览器或谷歌浏览器 2. 安装油猴插件 3. 安装字幕插件 4. 打开哔哩哔哩视频播放页面,点击字幕 ...

  2. 视频加字幕软件哪个好用?视频教程添加文字怎么添加

    大家是否经常会在社交媒体上分享自己的视频日常呢?这些视频会被很多人所浏览,而有些视频中的旁白语速过快,声音不清晰,如果没有文字显示的话,会让人不清楚到底在表达什么.并且给视频添加文字还可以让我们在公共 ...

  3. python英雄联盟脚本是什么_Python3爬取英雄联盟英雄皮肤大图实例代码

    爬虫思路 初步尝试 我先查看了network,并没有发现有可用的API:然后又用bs4去分析英雄列表页,但是请求到html里面,并没有英雄列表,在英雄列表的节点上,只有"正在加载中" ...

  4. python和c 情侣网名_Python3 爬取网站收藏数超过70的 情侣网名

    [Python] 纯文本查看 复制代码# coding=utf-8 # python 3.7 import urllib.request,urllib.error import re import t ...

  5. 用python爬取网易云评论_Python3爬取网易云音乐评论|python爬虫|python入门|python教程...

    https://www.xin3721.com/eschool/pythonxin3721/ 本文转载至知乎ID:Charles(白露未晞)知乎个人专栏 下载W3Cschool手机App,0基础随时随 ...

  6. python爬取音乐源码_python3爬取咪咕音乐榜信息(附源代码)

    1 """ 2 典型的分页型网站--咪咕音乐榜3 有时候运行会报错,有时候正常,原因不知道4 """ 5 importrequests6 f ...

  7. python中求差的函数_python3函数取差是什么?如何写代码?

    我们在数学中进行加减运算,两个数相减就可以得到差.今天小编就带来一个新问题,函数取差.有的小伙伴会很困惑,函数是一群英文使用,又不是数字怎么还能进行取差呢?这里也算是学习python有趣的地方,函数取 ...

  8. python爬虫视频下载代码_Python3百行代码批量下载抖音视频|python爬虫|python入门|python教程...

    https://www.xin3721.com/eschool/pythonxin3721/ 本文转载至知乎ID:Charles(白露未晞)知乎个人专栏 下载W3Cschool手机App,0基础随时随 ...

  9. 怎样用计算机合并视频,怎么合并视频和字幕 格式工厂视频字幕合并教程-电脑教程...

    一般我们看到的视频都是由视频.字幕和声音组成,关于视频和声音的合并技巧,此前华强电子网也有过介绍.而对于视频和字幕合并,此前我们基本没怎么介绍过,那么怎么合并视频和字幕呢?对于一些专业的视频处理人士来 ...

最新文章

  1. 同步线程和进程间的通信
  2. SVN服务器从Windows迁移到Linux
  3. java中Class.getResource用法(用于配置文件的读取)
  4. WebDeploymentSetup使用乱码问题解决
  5. 天池在线编程 2020国庆八天乐 - 7 进制
  6. c++11特性move和forward区别
  7. json字符串、json对象、数组之间的转换
  8. Tyvj3308毒药解药题解
  9. 手机等第三方终端访问 WebStorm 页面
  10. 微型计算机原理与接口技术第五版pdf,微型计算机原理与接口技术(第5版)
  11. 怎样用比较器实现信号的衰减和饱和_高频小信号LC谐振放大器的设计思路与具体电路实现...
  12. python程序自动运行_定时后台运行Python程序
  13. Oracle数据库表空间数据文件最大容量以及存满时处理方法
  14. 24个基本指标精粹讲解(16)--DMA
  15. Fastjson漏洞修复参考
  16. 18、关于oracle 认证的几个问题
  17. JDT操作AST重构if块
  18. RAR文件格式-笔记
  19. python3 get爬取网页标题、链接和链接的数字ID
  20. 人民币纸币采用防伪油墨

热门文章

  1. DeepFaceLive AI实时换脸软件安装流程
  2. linux sqlplus显示乱码,scrt访问linux,sqlplus查询中文显示乱码
  3. Python以及Pycharm安装、汉化详细教程
  4. JAVA将HTML转化图片最靠谱的方法
  5. 为什么把鼠标箭头指向任务栏时箭头就没了,根本就不知道箭头在哪
  6. 如何使用oracle修改表字段长度
  7. 车型诊断框架的搭建系列_故障码(PCBU)库
  8. swift之视频播放AVKIT、AVPlayerViewController、音频录制和播放
  9. 纯小白尝试TensorFlow篇一:组装电脑
  10. Forrester权威专家告诉你:欺诈与反欺诈5日谈