点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

仰天大笑出门去,我辈岂是蓬蒿人。

昨天5.4青年节,朋友圈已经被《后浪》刷屏,相信大部分人都看过了小破站献给新一代的演讲(商业片)。

习惯性地打开了微博和知乎,想看一下别人的看法,想知道我是不是有些颓废而与这个社会格格不入?

当我打开了微博和知乎,我才发现《后浪》翻车了,原来我们都一样,都很难再感受到《后浪》中的激情和理想。在这里看着大家的评论和回答,就好像在看着自己过得生活,评论和回答太多,所以就直接爬了下来,然后上班的时候慢慢地看。

爬取的地址分别为:

  • 知乎回答:如何评价 B 站 2020 年五四青年节宣传短片《后浪》?

  • 人民日报微博“奔涌吧,后浪!这是#献给年轻一代的演讲#”下评论

  • bilibili献给新一代的演讲《后浪》弹幕

微博和b站的代码参见我之前的文章,知乎的话以后再详细讲解。

作为一名数据分析师就习惯把手头的数据分析一下,所以也就拿这些数据简单的进行了一下分析。

评论情感倾向

先调用百度AI来分析微博和b站的评论情感倾向。

知乎的回答字数过多,做情感分析肯定不准确,就没做分析。

from aip import AipNlp
""" 你的 APPID AK SK """
APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY '
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
text = "XXXXXXXX"
""" 调用词法分析 """
response = client.sentimentClassify(text)
# "sentiment":2,    //表示情感极性分类结果  0:负向,1:中性,2:正向
# "confidence":0.40, //表示分类的置信度
# "positive_prob":0.73, //表示属于积极类别的概率
# "negative_prob":0.27  //表示属于消极类别的概率
for info in response['items']:if info ['sentiment'] == 2:print("正向")if info ['sentiment'] == 0:print("负向")if info['sentiment'] == 1:print("中性")print("可信度:",info['confidence'])print("属于积极类别的概率是:",info['positive_prob'])print("属于消极类别的概率是:",info['negative_prob'])

需要注意的是,在各个平台评论最多的“奔涌吧,后浪!”,在百度AI中是个消极句子,需要特殊处理。

结果如下:

非常明显,b站的弹幕正向居多,而微博的评论负向居多。

词云

通过上文的情感分析,各家平台的用户对于《后浪》的态度各异,他们又是如何评价的呢?

统计评论和回答中的高频词,制作词云看一下吧。

from scipy.misc import imread
from wordcloud import WordCloud, ImageColorGeneratorisCN = 1 # 0:英文分词  1:中文分词
back_coloring_path = '浪花.jpg'          # 设置背景图片路径
text_path = 'reviews.txt'               # 设置要分析的文本路径
stopwords_path = 'stop_word.txt'        # 停用词词表
imgname1 = '词云图.png'  # 保存的图片名字1(只按照背景图片形状)
back_coloring = imread(back_coloring_path)     # 设置背景图片 wc = WordCloud(#font_path = font_path          # 设置字体font_path='C:\Windows\Fonts\simfang.ttf',#font_path='hanyiqihei.ttf',background_color = 'white',    # 设置背景颜色max_words = 3000,              # 设置显示的最大词数mask = back_coloring,          # 设置背景图片max_font_size = 200,           # 设置字体最大值min_font_size = 20,             # 设置字体最小值random_state = 42,             # 随机有N种配色方案width = 2000 , height = 1720 ,margin = 4 )
words = {}
for i in word_counts:words['{}'.format(i[0])] = i[1]wc.generate_from_frequencies(words)
# txt_freq例子为 { word1: fre1, word2: fre2,  word3: fre3,......,  wordn: fren }plt.figure()

b站

知乎

微博

知乎微博更多在围绕“现实”、“社会”、“房价”、“韭菜”之类的词汇,5.4青年节的这个时点,自然对于这类满满鸡汤的“励志视频”非常反感。

相反,在b站的用户看来,这是小破站在跨年晚会之后,再一次出圈并受到了主流媒体的认可,自然非常开心。


说说我个人的看法吧。

第一遍看的时候,被何冰老师的演讲给深深的折服,以青年宣言《后浪》为词,认可、赞美与寄语年轻一代。在UP主们的青春混剪中,属于年轻人的光芒正在闪耀。“你们有幸,遇见这样的时代,但时代更有幸,遇见这样的你们!”让我也在一瞬间热血沸腾,也有了想要转发的冲动,想让“前浪”看一下这就是我们“后浪”。就在想要点击转发的时候,我突然迟疑了,我现在还是“后浪”吗?

如果放在几年前,我想《后浪》中年轻人的模样就是我当年的模样,那个时候我在读大学,租住着全国最便宜的房子,吃着可口又便宜的饭菜,虽然兜里没有几个钱,但是我却的确可以像《后浪》中提到的,学一门语言,学一门手艺,喜欢摄影就去摄影,喜欢旅行就去旅行,这是我曾经的模样,也是在那时第一次接触到了B站,像打开一个新世界一样,于是顺理成章的成了小破站的粉丝。

但到了现在,我发现我可能很难在成为《后浪》中年轻人的模样,或者说是失去了好多选择的权利,看着弹幕中“奔涌吧!后浪!”,感觉自己可能只算的上是被后浪裹挟着的浮游,为了工作可能放弃了爱好,为了房子可能放弃了旅行,为了这个而又放弃了那个,选择的并不是我想要的选择,而是只剩下这个选择。

最终我没忍住,把后浪发给了一位比我年长的朋友,他发给我一个视频,可能这才是真的想说的吧。

视频:https://www.bilibili.com/video/BV1qa4y1i74i/


本文转自公众号【凸凹数据】

------------------- End -------------------

往期精彩文章推荐:

  • 手把手用Python教你如何发现隐藏wifi

  • 手把手教你用Python做个可视化的“剪刀石头布”小游戏

  • 手把手教你使用Python批量创建复工证明

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

在B站外,我用Python数据分析看到了另一批“后浪”!相关推荐

  1. 在B站外,我看到了另一批“后浪”!

    昨天5.4青年节,朋友圈已经被<后浪>刷屏,相信大部分人都看过了小破站献给新一代的演讲(商业片). 习惯性地打开了微博和知乎,想看一下别人的看法,想知道我是不是有些颓废而与这个社会格格不入 ...

  2. python数据分析买什么书_向大家介绍我的新书:《基于股票大数据分析的Python入门实战》...

    我在公司里做了一段时间Python数据分析和机器学习的工作后,就尝试着写一本Python数据分析方面的书.正好去年有段时间股票题材比较火,就在清华出版社夏老师指导下构思了这本书.在这段特殊时期内,夏老 ...

  3. 关于《后浪》的B站弹幕分析总结(四)——Python实现LDA内容主题挖掘及主题可视化

    目录 一.使用sklearn里面的LatentDirichletAllocation做主题挖掘 二.使用gensim的ldamodel做主题挖掘 三.如何将结果可视化 四.如何确定主题数 4.1 观察 ...

  4. 想知道B站献礼视频《后浪》大家都在讨论什么吗?

    五四青年节B站献礼视频,在五四青年节当天,小破站联合众多官方大V,为所有青年人献上了一份特殊的演讲,并且重金买下来最好的广告时段,并且在第二天,形成全网的疯狂讨论,咋一听这段描述,小破站这次真的太牛了 ...

  5. 关于《后浪》的B站弹幕分析总结(二)——jieba分词、常用词典、颜文字处理以及字符格式统一

    目录 一.你需要知道的几个常用词典 - **停用词典(停用词,颜文字,emoji)** - 否定词典,程度副词词典 - 情感极性词典,多维情感词典 二.统一字符.统一大小写.统一繁简体 - 统一字符 ...

  6. 关于《后浪》的B站弹幕分析总结(三)——怎么制作好看的交互式词云

    目录 一.对分词做词频统计 二.使用wordcloud展示词云 二.使用pyecharts绘制词云 三.使用词云制作工具 与本文相关内容链接: B站视频<[数说弹幕]我不小心看了后浪弹幕> ...

  7. B站疯传,年度数据分析+Python资料出炉,错过再等一年!

    在美国,数据分析师平均每年薪酬高达17.5万美元,而国内顶尖互联网公司,其薪酬可能要比同一个级别的其他职位高20%至30%,且颇受企业重视. ▲图片来源于职友集 由于市场的需求发展趋势,导致近几年数据 ...

  8. python全套数据分析课程_B 站疯传,堪称最强,一整套Python数据分析课程,学完月薪30K+!...

    2020魔幻之年,疫情下就业大受影响,很多岗位缩招,而数据分析相关工作岗位恋习Python(如数据分析师.数据挖掘师等岗位)却在增加.非专业数据分析岗位(如运营.市场.销售等岗位)也要求"数 ...

  9. python数据分析-《Python数据分析与数据化运营》电子版

    2019-01-04更新说明,更新到"3.13 本章小结"部分. ---------------------- 前 言 为什么要写这本书 读者对象 如何阅读本书 勘误和支持 致谢 ...

最新文章

  1. ActionBar右边菜单按钮的添加
  2. 无法直接启动带有“类库输出类型”的项目
  3. 【jzoj】2018.2.3NOIP普及组——D组模拟赛
  4. 飞信for linux,开源飞信 Openfetion for Linux
  5. 不使用输入框如何实现下拉_使用INFINITE AJAX SCROLL实现下拉加载效果
  6. Qt Creator怎样更改默认构建目录
  7. error: numpy/arrayobject.h No such file or directory解决方法
  8. 互联网智商测试:搜索引擎谁的“智商”更高?
  9. 程序设计原则之SOLID原则
  10. vs2003转为vs2010的问题
  11. c语言数组及其下标引用,C语言之数组下标引用与间接引用
  12. hdu2907 凸包+简单搜索
  13. KVM安装/libvirt没有启动成功找不到/var/run/libvirt/libvirt-sock
  14. postgresql java驱动_PostgreSQL的JDBC驱动和URL
  15. 基于Kafka-Zookeeper-Nginx-FIlebeat-MySQL的日志清洗分析平台搭建
  16. 非线性规划转化为线性规划问题(司守奎老师数模例题)-------数模学习笔记一
  17. Lenze伦茨变频器维修8400系列E84AVSCE4534VX0北京
  18. MFZ 杯 のDFS BFS总结
  19. 三级网络技术学习总结
  20. 如何找出阻止windows睡眠的原因或软件

热门文章

  1. Jpype 导入文件夹的所有jar包
  2. 施工员培训建筑八大员培训施工员建筑桩基工程施工技术的要点
  3. ThinkPHP5 RESTful API开发版本控制
  4. dir-816虚拟服务器,友讯DIR816路由器设置图文教程
  5. WindowsServer操作系统安全
  6. 计算机专业允许纹身吗,考事业单位有纹身没事吧??
  7. 【STM32F407】第8章 学习USB协议栈前要了解的基础知识
  8. oracle数据泵整库备份,详解oracle 12c通过数据泵expdp/impdp工具实现对数据备份、恢复...
  9. php循环volist,thinkphp volist三级循环
  10. 摄影技术入门知识及答疑 zz 强烈推荐