听闻“专出精品”的皮克斯,最近又出了一部能把人感动得一塌糊涂的动画电影。于是,上个星期趁着空闲,和朋友到影院买了学生票把片撸完。

--------------------------------------------------

说实话,看的过程中还是感觉到鼻子酸酸的,虽然是个汉子但是也是个有血有肉的汉子啊。能把死亡这样清新脱俗的看待,估计也只有墨西哥人了,能把这种死亡主题在银幕上表现得令人愉悦接受,感动涕零,估计也只有皮克斯了。也不枉费当年乔布斯对皮克斯的投资。

--------------------------------------------------

回来断断续续的抽空撸了爬虫,把豆瓣和时光网上排在前面的短评爬了下来,做了个非常简单的词频分析。(其实说得轻松,这过程不知调试了多少bug,看了多少回文档。)。

  • "看完电影走在路上想了想还在掉眼泪。片名是最大的泪点。遗像是亡灵返乡和思念的介质,电影是勾起回忆和创造彼岸世界的介质。"
  • “邻座的女孩哭倒在我怀里啊电影多么美妙!“
  • “老人不图儿女为家做多大贡献呀,一辈子不容易就图个团团圆圆。皮克斯替蔡国庆唱了回春晚。”

--------------------------------------------------

本次采集到的短评为豆瓣网的top500和时光网的最新270条。将采集到的文本进行分词,使用 结巴分词 自带的 tf-idf算法 接口进行关键词的识别,然后进行词频的统计、过滤。最后再手动进行个别词语的排除。反正.....好像“很厉害”就是了。

最后得到的关键词top20

通过观众的影评,基本可以知道这部影片的故事梗了:

皮克斯出品,展现墨西哥亡灵文化温情动画剧情好看,音乐动人,满是煽情套路,但还是把全世界观众感动哭成狗,重要的不是死亡,而是失去家人记忆遗忘,失去梦想,总之就是好看,年度最佳

这熟悉的味道让我想起了高中的时候,学校曾经组织过一场名为“让生命充满爱”的“大型演讲”,是的,主讲人就是前阵时间被扒的邹越,当时把台下的我们都感动得稀里哗啦的,那些家长来了的同学尤其哭得凶。

完了后该干嘛的还是干嘛去,网吧依然是那些熟悉的少年,教室里还是那几位常见的身影。

皮克斯和邹越,在我看来本质上都是一样的,都是抓住了我们每个人心里柔软的神经,家庭和亲情,永恒和遗忘,亲人和梦想。只不过一个是流窜于各大高中,靠着声嘶呐喊的本领。一个是闻名世界的动画公司,凭着对技术的执着,用高超的技巧讲述着不一样的故事。

但是,我们就是喜欢被感动,因为我们都是有家庭,有梦想的人,不是吗?

使用到的技术栈:

  • mongodb的远程连接存储
  • 数据导出到excel文件
  • 结巴分词,结巴分词的tf-idf算法接口
  • wordcloud词云制作

代码地址:

github.com/waiwen/spid…

欢迎关注我的公众号,将会同步更新。

看完《寻梦环游记》,我抓爬了700多条影评相关推荐

  1. 小石桥的祭祀活动与电影《寻梦环游记》

    今天看了电影<寻梦环游记>,感觉翻译的名字其实不是很准确,其实电影的内核,和寻梦,环游都没有太多的关系,反观英文的名字,叫做<Coco>也就是电影中祖母的名字: 在故事的背景里 ...

  2. 计算机桌面背景寻梦环游记,《寻梦环游记 》海报及原画欣赏

    原标题:<寻梦环游记 >海报及原画欣赏 Pixar新作<COCO/寻梦环游记>11月24日上映后立马好评刷爆屏幕,在豆瓣上的评分甚至高达9.3分. 除了暖心催泪的故事情节,皮克 ...

  3. 寻梦环游记:教你打造独特的职场标签

    下面这部电影,我陪着女儿去影院看了两遍: 它的情节既离奇又合情,非常值得玩味. 每到亡灵节,亡灵们会踏上一座万寿菊花瓣铺成的桥,走上回家的路. 然而,不是每个人都如此幸福,埃克托就没有回家的资格:在通 ...

  4. 看完《寻梦环游记》,40岁的我哭的像个小孩

    今天想谈谈感情的事情.比如谈个恋爱,和谁谈? 和大猩猩.亡灵,还是机器人? 别笑. 在电影世界中,一切皆有可能. 最感动人的情感不是在人类之间,而是在"非人类"之间. 正在热映的& ...

  5. 爬取一万条b站评论看《工作细胞》

    7月番<工作细胞>最终话在十一前放出.这部动漫在b站上评分高达9.7.除了口碑之外,热度也居高不下,更值得关注的是连很多平时不关注动漫的小伙伴也加入了追番大军.这次我们的目标是爬取b站上的 ...

  6. 基于selenium+scrapy爬取复仇者联盟4豆瓣影评数据

    基于selenium+scrapy爬取复仇者联盟4豆瓣影评数据 参考资料: 黑马程序员爬虫教程 静觅爬虫教程 mac下anaconda安装selenium+PhantomJS scrapy下载中间件结 ...

  7. 干货(附源代码) | 爬取一万条b站评论,分析9.7分的新番凭啥这么火?

    7月番<工作细胞>最终话在十一前放出.这部动漫在b站上评分高达9.7.除了口碑之外,热度也居高不下,更值得关注的是连很多平时不关注动漫的小伙伴也加入了追番大军.这次我们的目标是爬取b站上的 ...

  8. 刚毕业的大学夫妻,我含泪看完(转帖)精彩

    转自:5Q校园网 有点长,但是你不会后悔看这篇贴子的,只要看过了第一章,你就会把贴子看完的,我相信这一点! 这是一篇非常感人的爱情,我是从别的地方转来的,我不知道故事是真的还是假的,但是他确实感动的我 ...

  9. 据说看完这21个故事的人,30岁前都成了亿万富翁。你是下一个吗?

    1.甲去买烟,烟29元,但他没火柴,跟店员说:"顺便送一盒火柴吧."店员没给. 乙去买烟,烟29元,他也没火柴,跟店员说:"便宜一毛吧."最后,他用这一毛买一盒 ...

最新文章

  1. RPC 笔记(03)— gRPC 概念、安装、编译、客户端和服务端示例
  2. 零基础学习前端——html5
  3. NR 5G 安全架构概述
  4. 如何利用Delphi释放所占的内存
  5. android画布原理,Android触摸事件如何实现笔触画布详解
  6. 软件工程网络15个人作业3——案例分析
  7. 超分辨率分析(四)--Deep Image Prior
  8. 最近一个快要结束的项目的BUG分析
  9. 编写高可用Eureka Server
  10. Thinkphp仿众图网图片素材下载站源码+自适应手机端
  11. 如何做一个被领导喜欢的实施顾问
  12. Python 编码检测与编码转换
  13. 带你了解软件测试是做什么的
  14. 吴军,阅读与写作,06,如何突破阅读理解的瓶颈
  15. 训练赛20160406_华中OJ
  16. 【CodeForces727E/CF727E】Games on a CD (字符串哈希)
  17. 【Docker】Docker进阶(二)
  18. 滚动条 实现的细节代码 SCROLLINFO
  19. linux kernel --- checksum相关ip_summed和feature字段解释
  20. 中年失业怎么办?可怕的并不是没有工作,而是没有钱

热门文章

  1. 手机锂离子电池基本概念
  2. C# Linq中的Join使用
  3. 某P姓网站网页分析初探
  4. 520奇葩礼物大盘点,活着不好吗?
  5. vscode html文件自动补充html骨架失效
  6. HP BANK 与 HR BANK
  7. androidlib.java_Android Library和Android APP、Java Library的区别
  8. C++ switch 用法(由简入繁,不一样的文章)
  9. 结对测试工具PICT用户手册(4)——模型选项
  10. mysql数据库 主键