1. 首先创建一个maven项目,并导入Jsoup包`
    <dependencies><dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.3</version></dependency></dependencies>
  1. 去B站找到你想要爬弹幕的视频页面

右键点击查看网页源代码
按Ctrl + F输入cid 搜索

找到并复制cid的值
http://comment.bilibili.com/20746041.xml
将你获取的cid替换.com后面的数字,然后这个xml文件就是该视频的所有弹幕

  1. 接下来就是JAVA代码了
public class Demo {public static void main(String args[]) throws IOException {//获取整个页面Document document = Jsoup.connect("http://comment.bilibili.com/20746041.xml").get();//获取所有的d标签   也就是存放弹幕的标签  Elements d = document.getElementsByTag("d");//获取FileFile file = new File("D://卢本伟.txt");if(!file.exists()){file.createNewFile();}FileOutputStream fileOutputStream=new FileOutputStream(file);//遍历所有的d标签for(Element element: d){//获取每条弹幕换行并添加到txt文件中fileOutputStream.write((element.text()+"\r\n").getBytes());}fileOutputStream.close();}
}

是不是很简单
右键运行,然后打开路径对应的文件就像下面这样,就获取到整个视频的弹幕啦

L B W N B

java爬虫爬取B站弹幕相关推荐

  1. Java爬取B站弹幕 —— Python云图Wordcloud生成弹幕词云

    一 . Java爬取B站弹幕 弹幕的存储位置 如何通过B站视频AV号找到弹幕对应的xml文件号 首先爬取视频网页,将对应视频网页源码获得 就可以找到该视频的av号aid=8678034 还有弹幕序号, ...

  2. 【Python】大数据挖掘课程作业1——使用爬虫爬取B站评论、弹幕与UP主的投稿视频列表

    [Python]大数据挖掘课程作业1--使用爬虫爬取B站评论.弹幕与UP主的投稿视频列表 数据挖掘部分的基本目标是:对于指定的UP主,能够获取其投稿视频列表:对于指定的视频,能够获取其视频标签.评论( ...

  3. Python爬取B站弹幕方法介绍

    Python爬取B站弹幕方法介绍 文章目录 Python爬取B站弹幕方法介绍 前言 寻找弹幕数据 编写爬虫 B站弹幕数量 新技术介绍 参考文章 前言 最近同学要做东西,需要用 B 站的视频对应的弹幕数 ...

  4. python接收弹幕_闲着没事,尝试一下用Python爬取B站弹幕呀~

    原标题:闲着没事,尝试一下用Python爬取B站弹幕呀~ 前言 最近同学要做东西,需要用 B 站的视频对应的弹幕数据做分析,于是请我帮忙爬取 B 站视频的弹幕数据. 对于爬虫而言,我们需要找到对应数据 ...

  5. 萌新学习Python爬取B站弹幕+R语言分词demo说明

    代码地址如下: http://www.demodashi.com/demo/11578.html 一.写在前面 之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这 ...

  6. python3网络爬虫--爬取b站用户投稿视频信息(附源码)

    文章目录 一.准备工作 1.工具 二.思路 1.整体思路 2.爬虫思路 三.分析网页 1.分析数据加载方式 2.分词接口url 3.分析用户名(mid) 四.撰写爬虫 五.得到数据 六.总结 上次写了 ...

  7. python java 爬数据_如何用java爬虫爬取网页上的数据

    当我们使用浏览器处理网页的时候,有时候是不需要浏览的,例如使用PhantomJS适用于无头浏览器,进行爬取网页数据操作.最近在进行java爬虫学习的小伙伴们有没有想过如何爬取js生成的网络页面吗?别急 ...

  8. Java爬虫 --- 爬取王者荣耀英雄图片

    Java爬虫 - 爬取王者荣耀英雄图片 import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Docu ...

  9. 爬取B站弹幕制作词云图

    大家好,我是天空之城,今天给大家带来,爬取B站弹幕制作词云图. 以下内容部分来自公众号数据分析与统计学之美,号主是大牛,有需要的加他. 首先打开一个b站视频https://www.bilibili.c ...

最新文章

  1. 数据挖掘如何分箱以及如何对每个箱子中的数据进行平滑处理
  2. Brainfuck解释器(C#)
  3. [机器学习-sklearn] KNN(k近邻法)学习与总结
  4. su自带模型库怎么打开_SU超强外挂!建筑模型一键生成,还能任意编辑
  5. [带权并查集] Jzoj P1503 体育场
  6. [Hive]Hive常用的优化方法
  7. hadoop搭建和指令
  8. poj 2442 Sequence
  9. URLDecoder.decode 过时
  10. 设计三极管放大电路有哪些技巧?尤其是假设
  11. 【锐捷交换机】清除密码
  12. 腾讯云通信IM集成踩坑记
  13. PTA-IP地址转换
  14. 微信小程序-API的Promise化
  15. 中国口腔医疗行业发展模式与投资战略规划分析报告2022-2028年版
  16. 光纤收发器怎么连?光纤收发器连接图解!
  17. 会声会影 2020 23.2.0.587 旗舰版
  18. 新玺配资:外围市场大跌 A股很难不受影响
  19. 末日搜索神器2.0发布
  20. Springboot 错误处理机制

热门文章

  1. linux C-kermit 安装使用
  2. CSS3动画animation认识和Animate.css的使用
  3. 小试ESP8266(一) 一只电阻, 几条语句, 摆脱深度睡眠反复重启的困扰
  4. 程序员常用的经典算法和OJ网站
  5. SuperMap iObjects C++之缓冲区
  6. JDBC防止SQL注入原理
  7. 2022年北京首店补贴及首店首发项目征集申报情况介绍,补贴200万
  8. 让用户无法在微信中举报的代码
  9. Java中按字母顺序对字符串字符进行排序的4种不同方法
  10. 转:Eric Lippert:阅读代码真的很难