我用Python纪念了那些被烂片收割的智商税!
作者:徐麟,某互联网公司数据分析狮,个人公众号数据森麟(id:shujusenlin)
随着电影行业的蓬勃发展,越来越多的电影出现在了观众的视野中,丰富了大家的生活,好的电影也能让大家在放松自我的同时收获一些对人生的思考。
然而,也有那么一些“烂片”,让大家在看过之后“添堵”,后悔为这种“烂片”贡献票房,白白被收割了“智商税”,今天,我们就用Python来几年那些被烂片收割走的智商税。
这次的数据源也是大家的老朋友,被亲切地称之为“马蜂窝”的豆瓣网,现在有很多平台会对电影进行打分,包括了猫眼和淘票票,但是相较之下,豆瓣的评分更加全面,一些冷门的“烂片”只能在豆瓣中被大家挖掘出来。
诚然,豆瓣的评分会存在一些“文艺滤镜”,对文艺片比较宽容,对此我们认为,“豆瓣评分高的不一定是真的高,但是被豆瓣打了低分的是真的低”。此次选择的影片范围是2010年至今的国产影片:
最终获取到了3000多部电影的数据,代码如下:
首先要做的事情就是看一下豆瓣对国产电影的整体打分情况,以此确定之后对“烂片”的划分依据,首先看一下整体评分的柱形图:
可以看到豆瓣用户对国产片还是比较严格,大多数电影都是在6分一下,8分以上的电影可以说是“凤毛麟角”,因此后续对烂片的标准也要相应放低,下面看一下各个将分数向下取整后的统计数量:
2010年之后获得9分的国产电影只有一部,可以说是非常的不易,大家可以猜一下是哪部电影,看看是不是你心中的9分电影
下面为大家揭开谜底:
唯一一部获得9分的就是18年上映的《我不是药神》,未来也希望能有更多这样的优秀影片,而且这种期望也是有依据的,我们看一下每一年烂片和非烂片的占比:
可以看到从烂片和超级烂片占比在16年达到顶峰之后,从17年开始烂片占比在逐渐下降,相信未来烂片的占比也会逐渐下降
有了整体的综述后,我们确定了烂片和超级烂片的划分依据,将4分之下的影片划分为烂片,3分以下的影片划分为超级烂片,下面就分别来看看各自的人气榜:
可以看到在所有的影片中,人气TOP10的影片评分都还是不错,流浪地球,药神和哪吒也都在票房中有非常不错的表现,显然,这不是我们需要,我们下面就来看下烂片和超级烂片中的人气榜:
热烈恭喜《上海堡垒》凭借2.9分的评分和217110的评价数喜提两项人气榜的冠军,《爱情公寓》因为“大忽悠”式的营销也跻身榜单,不知道即将上映的《爱情公寓5》能否为这一系列挽回一些口碑
同样,我们来分别看下所有影片、烂片和超级烂片的票房排行,看看究竟是哪些“烂片”在疯狂收割着大家的智商税,首先看一下左右影片的票房榜:
排名第10的西虹市首富票房都已经到了25亿,可见票房市场发展之迅速,今年国庆档的两部影片《我和我的祖国》以及《中国机长》分列八九名,相信未来这份榜单会不断的发生变化。
《西虹市首富》同样以6.5分的评分在榜单中评分最低,看来《西虹市首富》已经成为了一个标杆,6.5分也是一部票房卖座影片的底线,下面进入重点了,看一下那些疯狂收割大家智商税的烂片和超级烂片:
烂片票房榜中的TOP10都超过了2.6亿,大闹天竺和爱情公寓更是分别收获了7.5亿和5.5亿的票房,疯狂收割着大家的智商税,相信未来随着大家对影片要求的提高,疯狂收割智商税的现象会逐渐减少
令人意想不到的是,就连超级烂片的TOP10都可以收割5000万以上的票房,更是有四部票房过亿,在此提醒大家“观影有风险,选片需谨慎”
一部烂片的诞生想必也离不开“演员”的努力,下面就来分别看看所出演电影平均分最高和最低的演员:
评分高的演员就无须赘述了,都是经过了市场和观众的挑战,但是目前还没有一位演员在主演影片数量超过5部之后,分数可以上7,诚然有一部分是因为豆瓣对国产的严格要求,但另一方面也在敦促电影人不断进步
下面看一下评分排在倒数的演员,首先看下BOTTOM10:
看到这份榜单,有种恍惚的感觉,确认这不是主持人或者相声、小品演员的榜单,我们不禁要问:大家有事吗?快乐家族更是“霸榜”,杜海涛凭借精湛的演技和出众的外形在榜单中独占鳌头,相信他未来会给大家带来更为“惊艳”的作品,吴亦凡也代表说唱歌手在榜单中出现,填补了榜单中歌手的空白。
由于过多的“跨界”演员出现在了榜单BOTTOM10中,导致很多大家心目中的演员没有上榜,于是我们继续看BOTTOM11-20,这份榜单似乎正常了一点,但是好多更加应该在电视剧中出现的名字也位列其中。
看来电影和电视剧还是有所区别,在电视剧中能够大放异彩的演员未必能在电影中有同样精彩的表现,考虑到电视剧演员们的加入,继续把榜单范围放大到BOTTOM21-30:
这份榜单终于正常了很多,很多大家心目中的“种子选手”都不负众望地出现在了榜单中,特别是黄晓明和Angelababy这对模范夫妻的上榜,进一步提高了榜单的公信力,未来也希望他们能够继续联袂为大家带来精彩作品,很多人可能会表示怀疑,对此我们的回复很简单:我不要你相信,我要我相信!
最后进入彩蛋环节,为大家带来豆瓣高分(2.1)获得8W+评价(chaping)的影片《纯洁心灵:逐梦演艺圈》的深度解读(tucao),由于影片过于精彩,想要光看全片的需要在优酷进行付费观看,想要体验被收割智商税的快感,不妨一试,后台回复“烂片”可以获取文章部分代码:
留言打卡第二季 DAY 41
今日的留言话题是尽情交流(吐槽)被烂片收割智商税的经历,关于留言打卡的规则可以参考,请按照昵称+天数(请以自己实际打卡的天数为准,如day1 or day2 or day3)+ 留言内容(不少于15字)的方式留言
我用Python纪念了那些被烂片收割的智商税!相关推荐
- 我用Python纪念了那些被烂片收割的智商税
前言 随着电影行业的蓬勃发展,越来越多的电影出现在了观众的视野中,丰富了大家的生活,好的电影也能让大家在放松自我的同时收获一些对人生的思考. 然而,也有那么一些"烂片",让大家在看 ...
- 还被python收智商税?做大数据的朋友告诉我月薪2w的方法
还被python收智商税?我有一在阿里和腾讯都做过大数据的朋友,告诉我月薪2w的方法. 不学python,你就是落后了:不学python,你就要被淘汰了:不学python,你就...,这简直太多了,搞 ...
- Python到底是智商税还是真有用?
我要是 Python,我一定得先坐地上哭给你看! Python 作为一门开源的编程语言,从它 ku cha 落地的时候它就是免费的,怎么来的智商税这么一说,明明是便宜到不要钱的良心语言. 我之前看过一 ...
- 学Python?别再交智商税了......
在知乎看到这样一个问题: 学Python到底是智商税还是真的有用,对于这个问题,我只能说: 我要是 Python,我一定得先坐地上哭给你看! Python 作为一门开源的编程语言,从它 ku cha ...
- 【python数据分析实战】国产烂片深度揭秘(3)——和什么国家更容易产生烂片?
1 数据筛选 1)首先完成的是选取字段中包含'中国大陆'的电影,这样自然就只剩下了中国大陆自己拍摄的电影以及合拍的电影 df_loc = df[['电影名称','制片国家/地区','豆瓣评分']][d ...
- 【python数据分析实战】国产烂片深度揭秘(2)——什么题材的电影烂片最多?
1 前期准备 import os os.chdir(r'C:\Users\86177\Desktop') import warnings warnings.filterwarnings('ignore ...
- 【python数据分析实战】国产烂片深度揭秘(4)——卡司数量与烂片的关系
卡司数量 卡司是一个中式英语,是英语cast的中文音译,意思是演员阵容, 是台湾和香港地区常用名词.英语"CLASS"的粤语拟音(类似于"的士""芝士 ...
- 【python数据分析实战】国产烂片深度揭秘(5)—— 不同导演每年的电影产量如何?
1 时间序列分析 也就是对不同导演电影上映的时间进行整理,就得要求两个字段的数据不能为空值,一个是导演字段,一个就是电影上映日期字段 1) 空白数据的清洗 df_year = df[(df['导演'] ...
- 【python数据分析实战】国产烂片深度揭秘(1)——以“豆瓣评分”为标准,看看电影评分分布,及烂片情况
1 前期准备 import os os.chdir(r'C:\Users\86177\Desktop') import warnings warnings.filterwarnings('ignore ...
最新文章
- 软考广东有哪几个考点
- 第十一篇 SpringBoot 2 x整合Swagger2
- python中文列名报错__mssql.MSSQLDatabaseException:(207,b“无效列名'Hello'。DBLib错误消息20018...
- android版usb转网线驱动,usb网线转换器驱动下载
- CAN总线标准及协议分析
- 广告视频投放展示平台 springboot+vue
- Inverting Generative Adversarial Renderer for Face Reconstruction
- 使用Tor以加密方式发送BCH
- Python基础入门篇【26】--python基础入门练习卷B
- python代码块符号_Python 中代码块是用下列()符号代表的。_学小易找答案
- 外网无法访问花生壳域名的解决方法
- #10015. 「一本通 1.2 练习 2」扩散(二分+最短路径)
- 移动通信网络规划:误码率
- tegra3 CPU auto hotplug和Big/little switch工作的基本原理
- 解决电脑插耳机声音外放
- 计算机计划实施800字,大学计划书范文800字3篇
- ARM NVIC GIC
- 高速电路设计基本概念之——IBIS和SPICE模型
- python实现商品管理系统_python编写商品管理
- 小红书竞品分析_小红书产品分析报告
热门文章
- stm8s单片机2位数码管显示_STM8S USB电压电流表制作 12864显示附单片机源码
- windows 屏幕分辩率多显示器问题
- r9 5900hx和i7 10870h哪个好
- ASP.NET关于引用bootstrap.css导致Gridview Header无法居中
- 黄淮学院和安阳工学院计算机,一本烂大街了?河南这六所二本高校硕士点都没有,却升入一本招生...
- 自行车组装各部位 扭力参考值
- 51nod 1679 连通率
- Tribon模型数据抽取之sx700.exe详解
- Tribonnbsp;Vitesse二次开发技术路线
- 解决 Ubuntu 连接不上外网,无法ping主机地址。