java爬虫爬取B站弹幕
- 首先创建一个maven项目,并导入Jsoup包`
<dependencies><dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.3</version></dependency></dependencies>
- 去B站找到你想要爬弹幕的视频页面
右键点击查看网页源代码
按Ctrl + F输入cid 搜索
找到并复制cid的值
http://comment.bilibili.com/20746041.xml
将你获取的cid替换.com后面的数字,然后这个xml文件就是该视频的所有弹幕
- 接下来就是JAVA代码了
public class Demo {public static void main(String args[]) throws IOException {//获取整个页面Document document = Jsoup.connect("http://comment.bilibili.com/20746041.xml").get();//获取所有的d标签 也就是存放弹幕的标签 Elements d = document.getElementsByTag("d");//获取FileFile file = new File("D://卢本伟.txt");if(!file.exists()){file.createNewFile();}FileOutputStream fileOutputStream=new FileOutputStream(file);//遍历所有的d标签for(Element element: d){//获取每条弹幕换行并添加到txt文件中fileOutputStream.write((element.text()+"\r\n").getBytes());}fileOutputStream.close();}
}
是不是很简单
右键运行,然后打开路径对应的文件就像下面这样,就获取到整个视频的弹幕啦
L B W N B
java爬虫爬取B站弹幕相关推荐
- Java爬取B站弹幕 —— Python云图Wordcloud生成弹幕词云
一 . Java爬取B站弹幕 弹幕的存储位置 如何通过B站视频AV号找到弹幕对应的xml文件号 首先爬取视频网页,将对应视频网页源码获得 就可以找到该视频的av号aid=8678034 还有弹幕序号, ...
- 【Python】大数据挖掘课程作业1——使用爬虫爬取B站评论、弹幕与UP主的投稿视频列表
[Python]大数据挖掘课程作业1--使用爬虫爬取B站评论.弹幕与UP主的投稿视频列表 数据挖掘部分的基本目标是:对于指定的UP主,能够获取其投稿视频列表:对于指定的视频,能够获取其视频标签.评论( ...
- Python爬取B站弹幕方法介绍
Python爬取B站弹幕方法介绍 文章目录 Python爬取B站弹幕方法介绍 前言 寻找弹幕数据 编写爬虫 B站弹幕数量 新技术介绍 参考文章 前言 最近同学要做东西,需要用 B 站的视频对应的弹幕数 ...
- python接收弹幕_闲着没事,尝试一下用Python爬取B站弹幕呀~
原标题:闲着没事,尝试一下用Python爬取B站弹幕呀~ 前言 最近同学要做东西,需要用 B 站的视频对应的弹幕数据做分析,于是请我帮忙爬取 B 站视频的弹幕数据. 对于爬虫而言,我们需要找到对应数据 ...
- 萌新学习Python爬取B站弹幕+R语言分词demo说明
代码地址如下: http://www.demodashi.com/demo/11578.html 一.写在前面 之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这 ...
- python3网络爬虫--爬取b站用户投稿视频信息(附源码)
文章目录 一.准备工作 1.工具 二.思路 1.整体思路 2.爬虫思路 三.分析网页 1.分析数据加载方式 2.分词接口url 3.分析用户名(mid) 四.撰写爬虫 五.得到数据 六.总结 上次写了 ...
- python java 爬数据_如何用java爬虫爬取网页上的数据
当我们使用浏览器处理网页的时候,有时候是不需要浏览的,例如使用PhantomJS适用于无头浏览器,进行爬取网页数据操作.最近在进行java爬虫学习的小伙伴们有没有想过如何爬取js生成的网络页面吗?别急 ...
- Java爬虫 --- 爬取王者荣耀英雄图片
Java爬虫 - 爬取王者荣耀英雄图片 import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Docu ...
- 爬取B站弹幕制作词云图
大家好,我是天空之城,今天给大家带来,爬取B站弹幕制作词云图. 以下内容部分来自公众号数据分析与统计学之美,号主是大牛,有需要的加他. 首先打开一个b站视频https://www.bilibili.c ...
最新文章
- 数据挖掘如何分箱以及如何对每个箱子中的数据进行平滑处理
- Brainfuck解释器(C#)
- [机器学习-sklearn] KNN(k近邻法)学习与总结
- su自带模型库怎么打开_SU超强外挂!建筑模型一键生成,还能任意编辑
- [带权并查集] Jzoj P1503 体育场
- [Hive]Hive常用的优化方法
- hadoop搭建和指令
- poj 2442 Sequence
- URLDecoder.decode 过时
- 设计三极管放大电路有哪些技巧?尤其是假设
- 【锐捷交换机】清除密码
- 腾讯云通信IM集成踩坑记
- PTA-IP地址转换
- 微信小程序-API的Promise化
- 中国口腔医疗行业发展模式与投资战略规划分析报告2022-2028年版
- 光纤收发器怎么连?光纤收发器连接图解!
- 会声会影 2020 23.2.0.587 旗舰版
- 新玺配资:外围市场大跌 A股很难不受影响
- 末日搜索神器2.0发布
- Springboot 错误处理机制