环境介绍

python 3.8
pycharm
requests >>> pip install requests
pyecharts >>> pip install pyecharts

视频弹幕收集

请求数据

headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36'
}
for page in range(15, 1500, 30):url = f'https://mfm.XXXX.com/danmu?otype=json&target_id=7712618480%26vid%3Dg00423lkmas&session_key=0%2C0%2C0&timestamp={page}&_=1647931110703'response = requests.get(url=url, headers=headers)

获取数据 从一个字符串 变成了一个 字典 (容器)

json_data = response.json()

解析数据

for comment in json_data['comments']:commentid = comment['commentid']opername = comment['opername']content = comment['content']

保存数据

with open('弹幕.csv', encoding='utf-8-sig', mode='a', newline='') as f:csv_writer = csv.writer(f)csv_writer.writerow([commentid, opername, content])

运行代码,得到1W多条弹幕数据

词云可视化

导入数据

wordlist = []
data = pd.read_csv('弹幕.csv')['content']
data

词云图

a = [list(z) for z in zip(word, count)]
c = (WordCloud().add('', a, word_size_range=[10, 50], shape='circle').set_global_opts(title_opts=opts.TitleOpts(title="词云图"))
)
c.render_notebook()

弹幕全是“二刷”,这部剧有多好看?用Python收集用1.1W弹幕,做词云分析相关推荐

  1. 大江大河2弹幕数据之词云分析、情感极性分析、主题分析、共现网络分析

    最近,自己在疯狂追<大江大河2>这部剧,作为当下最热门的电视剧之一,这部电视剧深受观众的喜爱,自从播出以后就好评不断 它主要讲述了改革开放三十年,一代人奋斗向阳的故事,看完之后深受启发,特 ...

  2. 哔哩哔哩视频弹幕词云分析

    import requests import parsel import csv import timefor page in range(20,32):time.sleep(1)print('正在爬 ...

  3. Java爬取B站弹幕 —— Python云图Wordcloud生成弹幕词云

    一 . Java爬取B站弹幕 弹幕的存储位置 如何通过B站视频AV号找到弹幕对应的xml文件号 首先爬取视频网页,将对应视频网页源码获得 就可以找到该视频的av号aid=8678034 还有弹幕序号, ...

  4. opencv中的美图技巧(祛斑,词云,风格迁移,抠图,插图,修改背景,图片二维码)等着你的女朋友夸你吧

    个人ps 没掌握得怎么好,尝试用程序来完成ps的功能吧. 有斑点怎么办:祛斑. 只有一张城市白天图,像生成黑夜图怎么办,用风格迁移把. 人物抠图就不说啦吧. 没钱带女友旅游世界怎么办,我教你修改你背景 ...

  5. 萌新学习Python爬取B站弹幕+R语言分词demo说明

    代码地址如下: http://www.demodashi.com/demo/11578.html 一.写在前面 之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这 ...

  6. 爬取钉钉在B站卑微道歉视频弹幕,做成词云

    爬取钉钉在B站卑微道歉视频弹幕,做成词云|钉~ 听这美妙的声音 先看用户老爷们给出得评价 B弹幕爬取的方法 打开钉钉下跪视频 B站链接 然后进入控制台如图查看,打开控制台刷新下页面. 你就会在控制台看 ...

  7. Python生成中文词云图(二):不可指定词云特定的形状和颜色。

    Python生成中文词云图(二):不可指定词云特定的形状和颜色. 什么是词云? 首先,什么是词云呢?词云又叫文字云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关 ...

  8. python爬取b站弹幕分析_B站弹幕爬取原理解析(python)

    感谢 原理 概念 cid : 爬取弹幕需要的id号,可以由BV号通过API接口获得 步骤BV转cid 浏览器输入:https://api.bilibili.com/x/player/pagelist? ...

  9. 爬虫数据云词图片怎么做?小姐姐教你用python做B站弹幕爬虫,并进行数据分析生成词云

    hello大家好,我是你们的可爱丸,大家平时在B站看视频时有没有开弹幕的习惯呢?如果不把视频从头看到尾,那么多弹幕,我们怎么快速的知道大家都说了些什么并且持有什么观点呢? 今天小姐姐就教你做一个简单的 ...

最新文章

  1. 手机贷服务器维护升级,手机贷服务器升级
  2. win 常用网络命令
  3. 防止IE6出现BUG的十种常见解决方法
  4. 混沌与分叉python 实现
  5. python所有变量更新_PYTHON:使用python变量更新MULTIPLE COLUMNS
  6. 2009最后一天,为了期盼而祝福
  7. CV中的经典网络模型
  8. php 跟踪邮件,php – 电子邮件跟踪 – GMail
  9. 全球顶级金融机构Citadel:堡垒如何建成|精品投行系列二
  10. sendto()函数
  11. mysql导入(ibd文件)
  12. PAT乙级题解——1093 字符串A+B (20分)
  13. 淘宝客小程序制作(3)-API编写及部署
  14. 用nohup命令让Linux下程序永远在后台执行--zz牧云IT生活
  15. 运动装备品牌排行榜,运动爱好者必备好物分享
  16. PDF文件怎么插入空白页面
  17. JavaScript中getElementsByName
  18. UE5 官方案例Lyra 全特性详解 8.如何用配置表初始化角色数据
  19. 光通量发光强度照度亮度关系_照度、发光强度、光通量之间是什么关系
  20. 今天都到了2018年9月19日了

热门文章

  1. 广东2021年各地区高新技术企业申报时间统计
  2. Bolt 的 Flutter 路由管理实践(页面解耦,流程控制、功能拓展等)
  3. 图解:光缆终端盒、尾纤的作用和接法
  4. Web前端UI框架 JQuery WeUI
  5. 长尾词是什么?如何做长尾关键词排名?
  6. 面向对象设计思想-基本概念
  7. 将导入到Revit中的CAD图纸分解——炸开
  8. 纽约时报 | 新一代的智能机器人正在改变全球工业
  9. Android 属性动画(一)新手入门
  10. 功能测试的用例测试方法