弹幕全是“二刷”,这部剧有多好看?用Python收集用1.1W弹幕,做词云分析
环境介绍
python 3.8
pycharm
requests >>> pip install requests
pyecharts >>> pip install pyecharts
视频弹幕收集
请求数据
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36'
}
for page in range(15, 1500, 30):url = f'https://mfm.XXXX.com/danmu?otype=json&target_id=7712618480%26vid%3Dg00423lkmas&session_key=0%2C0%2C0×tamp={page}&_=1647931110703'response = requests.get(url=url, headers=headers)
获取数据 从一个字符串 变成了一个 字典 (容器)
json_data = response.json()
解析数据
for comment in json_data['comments']:commentid = comment['commentid']opername = comment['opername']content = comment['content']
保存数据
with open('弹幕.csv', encoding='utf-8-sig', mode='a', newline='') as f:csv_writer = csv.writer(f)csv_writer.writerow([commentid, opername, content])
运行代码,得到1W多条弹幕数据
词云可视化
导入数据
wordlist = []
data = pd.read_csv('弹幕.csv')['content']
data
词云图
a = [list(z) for z in zip(word, count)]
c = (WordCloud().add('', a, word_size_range=[10, 50], shape='circle').set_global_opts(title_opts=opts.TitleOpts(title="词云图"))
)
c.render_notebook()
弹幕全是“二刷”,这部剧有多好看?用Python收集用1.1W弹幕,做词云分析相关推荐
- 大江大河2弹幕数据之词云分析、情感极性分析、主题分析、共现网络分析
最近,自己在疯狂追<大江大河2>这部剧,作为当下最热门的电视剧之一,这部电视剧深受观众的喜爱,自从播出以后就好评不断 它主要讲述了改革开放三十年,一代人奋斗向阳的故事,看完之后深受启发,特 ...
- 哔哩哔哩视频弹幕词云分析
import requests import parsel import csv import timefor page in range(20,32):time.sleep(1)print('正在爬 ...
- Java爬取B站弹幕 —— Python云图Wordcloud生成弹幕词云
一 . Java爬取B站弹幕 弹幕的存储位置 如何通过B站视频AV号找到弹幕对应的xml文件号 首先爬取视频网页,将对应视频网页源码获得 就可以找到该视频的av号aid=8678034 还有弹幕序号, ...
- opencv中的美图技巧(祛斑,词云,风格迁移,抠图,插图,修改背景,图片二维码)等着你的女朋友夸你吧
个人ps 没掌握得怎么好,尝试用程序来完成ps的功能吧. 有斑点怎么办:祛斑. 只有一张城市白天图,像生成黑夜图怎么办,用风格迁移把. 人物抠图就不说啦吧. 没钱带女友旅游世界怎么办,我教你修改你背景 ...
- 萌新学习Python爬取B站弹幕+R语言分词demo说明
代码地址如下: http://www.demodashi.com/demo/11578.html 一.写在前面 之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这 ...
- 爬取钉钉在B站卑微道歉视频弹幕,做成词云
爬取钉钉在B站卑微道歉视频弹幕,做成词云|钉~ 听这美妙的声音 先看用户老爷们给出得评价 B弹幕爬取的方法 打开钉钉下跪视频 B站链接 然后进入控制台如图查看,打开控制台刷新下页面. 你就会在控制台看 ...
- Python生成中文词云图(二):不可指定词云特定的形状和颜色。
Python生成中文词云图(二):不可指定词云特定的形状和颜色. 什么是词云? 首先,什么是词云呢?词云又叫文字云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关 ...
- python爬取b站弹幕分析_B站弹幕爬取原理解析(python)
感谢 原理 概念 cid : 爬取弹幕需要的id号,可以由BV号通过API接口获得 步骤BV转cid 浏览器输入:https://api.bilibili.com/x/player/pagelist? ...
- 爬虫数据云词图片怎么做?小姐姐教你用python做B站弹幕爬虫,并进行数据分析生成词云
hello大家好,我是你们的可爱丸,大家平时在B站看视频时有没有开弹幕的习惯呢?如果不把视频从头看到尾,那么多弹幕,我们怎么快速的知道大家都说了些什么并且持有什么观点呢? 今天小姐姐就教你做一个简单的 ...
最新文章
- 手机贷服务器维护升级,手机贷服务器升级
- win 常用网络命令
- 防止IE6出现BUG的十种常见解决方法
- 混沌与分叉python 实现
- python所有变量更新_PYTHON:使用python变量更新MULTIPLE COLUMNS
- 2009最后一天,为了期盼而祝福
- CV中的经典网络模型
- php 跟踪邮件,php – 电子邮件跟踪 – GMail
- 全球顶级金融机构Citadel:堡垒如何建成|精品投行系列二
- sendto()函数
- mysql导入(ibd文件)
- PAT乙级题解——1093 字符串A+B (20分)
- 淘宝客小程序制作(3)-API编写及部署
- 用nohup命令让Linux下程序永远在后台执行--zz牧云IT生活
- 运动装备品牌排行榜,运动爱好者必备好物分享
- PDF文件怎么插入空白页面
- JavaScript中getElementsByName
- UE5 官方案例Lyra 全特性详解 8.如何用配置表初始化角色数据
- 光通量发光强度照度亮度关系_照度、发光强度、光通量之间是什么关系
- 今天都到了2018年9月19日了