可视化 YouTube 对奥斯卡提名电影预告片的评论

已发表: 2018-03-24
目录显示
数据
受欢迎程度与获奖或提名没有直接关系
评论中使用的热门术语
《水形物语》得到了褒贬不一的评论:
奥斯卡提名可以改变观众对电影的看法
围绕“水的形状”的单词
词之间的关系——二元网络图
结论

距离第 90奥斯卡颁奖典礼仅几周时间,关于电影、演员和其他电影艺术家的热烈讨论还没有平息。 2018 年的奥斯卡颁奖典礼为许多当之无愧的艺术家及其作品带来了认可。 虽然关于某部电影是否值得提名的讨论似乎没有尽头,但我们更感兴趣的是使用数据为此事带来一些启示。

作为一家专注于大规模 Web 数据提取的数据解决方案公司,我们决定将用户生成的内容可视化,以了解观众的意图、情绪和行为。 虽然现在做出任何预测都为时已晚,但我们还是忍不住从奥斯卡提名电影的 YouTube 预告片中提取评论数据,以从评论中找出一些有趣的见解。

我们的目标是提出任何模式、冲突或见解,即使它们看似主观,并与这些电影的成功联系起来。

数据

在这项研究中,我们使用以下数据字段提取了对奥斯卡提名电影预告片的评论:

  • 用户别名
  • 时间戳
  • 评论文字
  • 喜欢
  • 有回复(真/假)
  • 回复数

数据提取于 2018 年 3 月 6 日完成。

受欢迎程度与获奖或提名没有直接关系

如果我们将其与高票房的热门超级英雄电影相比,奥斯卡提名电影预告片的评论数量相对较低。 敦刻尔克是唯一一个拥有超过 15,000 条评论的电影,但考虑到它是克里斯托弗·诺兰的电影,这是一个合理的例外。 然而,如果我们从大局来看,获得奥斯卡提名的电影并没有像人们预期的那样有很高的评论数。

获得 2018 年学院奖的《水形物语》有超过 5000 条评论(2017 年 12 月发布)。 由此,可以肯定地说,仅考虑其受欢迎程度,很难预测一部电影赢得奥斯卡奖的机会。

现在让我们对评论进行探索性分析,看看电影爱好者是写长评论还是短评论。 下面给出的是基于字符数(不包括空格)的评论长度的直方图。

我们可以看到,大多数评论的长度不超过 60 个字符。 请注意,由于频率较低,我们没有考虑超过 400 个字符的评论。 如果我们考虑所有评论,那么平均长度将达到 81 个字符。

评论中使用的热门术语

可视化观众如何看待不同的电影以及为不同电影弹出的独特元素会很有趣。 这是一张图表,显示了为每部奥斯卡提名电影发布的评论中最常用的词。

很明显,在《敦刻尔克》中,主导元素是来自 One Direction 的哈利和克里斯托弗·诺兰。 对于“走出去”,种族内涵非常明显。

我们将更详细地讨论《水形物语》,因为它获得了最佳影片奖。

《水形物语》得到了褒贬不一的评论:

虽然积极情绪在《水形物语》预告片的评论中占主导地位,但表达愤怒、厌恶和消极情绪等情绪的评论数量也接近。 这意味着并不是每个人都对预告片印象深刻,许多人甚至出于某种原因不喜欢它。 然而,这些似乎都没有影响这部电影的成功。

奥斯卡提名可以改变观众对电影的看法

2018 年 1 月 23 日,当第 90奥斯卡金像奖提名公布,《水形物语》以 13 项提名占据主导地位积极情绪急剧上升,积极情绪与消极情绪之间的差距扩大,这表明公众对电影的看法会受到奥斯卡提名和获奖的影响。

围绕“水的形状”的单词

我们创建了一个词云来查找“水形物语”预告片评论中最常出现的词。

最常见的词是 Abe、Hellboy、Bioshock、looks、like 和 love。 这显然意味着评论员正在将电影的生物或情节与地狱男爵电影(“Abe”角色)和生化奇兵游戏进行比较。 我们也可以看到,尽管这对夫妻属于两种完全不同的生活方式,但观众对电影中的爱情和浪漫元素还是相当好奇的。

词之间的关系——二元网络图

我们发现了评论中最常用的词; 但是,单词之间的潜在意图和关联又如何呢? 让我们尝试通过绘制二元组的网络图来揭示某些单词是如何连接的。

我们可以清楚地看到,这个故事与电影《地狱男爵》的前传有着强烈的联系。 也有一些“环太平洋”的参考——主要是因为这部电影的导演(吉列尔莫德尔托罗)导演了“环太平洋”的第一部分。 我们还可以看到,观众提到了电影的原始灵感,即《来自黑湖的生物》。 除此之外,故事中吃鸡蛋的部分也出现了。

结论

对于那些不断完善自己制作优秀电影的手艺的人来说,赢得奥斯卡奖是一件大事,这些电影每年都在设定更高的标准。 虽然我们无法发现这些奥斯卡提名电影预告片收到的反应之间存在任何关联,但我们可以清楚地看到观众和评论家对提名电影的积极情绪有所上升。 然而,我们希望这可能会引发一些关于某部电影是否值得提名的激烈讨论,或者至少可以阐明这件事的复杂性。