可視化 YouTube 對奧斯卡提名電影預告片的評論

已發表: 2018-03-24
目錄顯示
數據
受歡迎程度與獲獎或提名沒有直接關係
評論中使用的熱門術語
《水形物語》得到了褒貶不一的評論:
奧斯卡提名可以改變觀眾對電影的看法
圍繞“水的形狀”的單詞
詞之間的關係——二元網絡圖
結論

距離第 90奧斯卡頒獎典禮僅幾週時間,關於電影、演員和其他電影藝術家的熱烈討論還沒有平息。 2018 年的奧斯卡頒獎典禮為許多當之無愧的藝術家及其作品帶來了認可。 雖然關於某部電影是否值得提名的討論似乎沒有盡頭,但我們更感興趣的是使用數據為此事帶來一些啟示。

作為一家專注於大規模 Web 數據提取的數據解決方案公司,我們決定將用戶生成的內容可視化,以了解觀眾的意圖、情緒和行為。 雖然現在做出任何預測都為時已晚,但我們還是忍不住從奧斯卡提名電影的 YouTube 預告片中提取評論數據,以從評論中找出一些有趣的見解。

我們的目標是提出任何模式、衝突或見解,即使它們看似主觀,並與這些電影的成功聯繫起來。

數據

在這項研究中,我們使用以下數據字段提取了對奧斯卡提名電影預告片的評論:

  • 用戶別名
  • 時間戳
  • 評論文字
  • 喜歡
  • 有回复(真/假)
  • 回複數

數據提取於 2018 年 3 月 6 日完成。

受歡迎程度與獲獎或提名沒有直接關係

如果我們將其與高票房的熱門超級英雄電影相比,奧斯卡提名電影預告片的評論數量相對較低。 敦刻爾克是唯一一個擁有超過 15,000 條評論的電影,但考慮到它是克里斯托弗·諾蘭的電影,這是一個合理的例外。 然而,如果我們從大局來看,獲得奧斯卡提名的電影並沒有像人們預期的那樣有很高的評論數。

獲得 2018 年學院獎的《水形物語》有超過 5000 條評論(2017 年 12 月發布)。 由此,可以肯定地說,僅考慮其受歡迎程度,很難預測一部電影贏得奧斯卡獎的機會。

現在讓我們對評論進行探索性分析,看看電影愛好者是寫長評論還是短評論。 下面給出的是基於字符數(不包括空格)的評論長度的直方圖。

我們可以看到,大多數評論的長度不超過 60 個字符。 請注意,由於頻率較低,我們沒有考慮超過 400 個字符的評論。 如果我們考慮所有評論,那麼平均長度將達到 81 個字符。

評論中使用的熱門術語

可視化觀眾如何看待不同的電影以及為不同電影彈出的獨特元素會很有趣。 這是一張圖表,顯示了為每部奧斯卡提名電影發布的評論中最常用的詞。

很明顯,在《敦刻爾克》中,主導元素是來自 One Direction 的哈利和克里斯托弗·諾蘭。 對於“走出去”,種族內涵非常明顯。

我們將更詳細地討論《水形物語》,因為它獲得了最佳影片獎。

《水形物語》得到了褒貶不一的評論:

雖然積極情緒在《水形物語》預告片的評論中占主導地位,但表達憤怒、厭惡和消極情緒等情緒的評論數量也接近。 這意味著並不是每個人都對預告片印象深刻,許多人甚至出於某種原因不喜歡它。 然而,這些似乎都沒有影響這部電影的成功。

奧斯卡提名可以改變觀眾對電影的看法

2018 年 1 月 23 日,當第 90奧斯卡金像獎提名公佈,《水形物語》以 13 項提名佔據主導地位積極情緒急劇上升,積極情緒與消極情緒之間的差距擴大,這表明公眾對電影的看法會受到奧斯卡提名和獲獎的影響。

圍繞“水的形狀”的單詞

我們創建了一個詞云來查找“水形物語”預告片評論中最常出現的詞。

最常見的詞是 Abe、Hellboy、Bioshock、looks、like 和 love。 這顯然意味著評論員正在將電影的生物或情節與地獄男爵電影(“Abe”角色)和生化奇兵遊戲進行比較。 我們也可以看到,儘管這對夫妻屬於兩種完全不同的生活方式,但觀眾對電影中的愛情和浪漫元素還是相當好奇的。

詞之間的關係——二元網絡圖

我們發現了評論中最常用的詞; 但是,單詞之間的潛在意圖和關聯又如何呢? 讓我們嘗試通過繪製二元組的網絡圖來揭示某些單詞是如何連接的。

我們可以清楚地看到,這個故事與電影《地獄男爵》的前傳有著強烈的聯繫。 也有一些“環太平洋”的參考——主要是因為這部電影的導演(吉列爾莫德爾托羅)導演了“環太平洋”的第一部分。 我們還可以看到,觀眾提到了電影的原始靈感,即《來自黑湖的生物》。 除此之外,故事中吃雞蛋的部分也出現了。

結論

對於那些不斷完善自己製作優秀電影的手藝的人來說,贏得奧斯卡獎是一件大事,這些電影每年都在設定更高的標準。 雖然我們無法發現這些奧斯卡提名電影預告片收到的反應之間存在任何關聯,但我們可以清楚地看到觀眾和評論家對提名電影的積極情緒有所上升。 然而,我們希望這可能會引發一些關於某部電影是否值得提名的激烈討論,或者至少可以闡明這件事的複雜性。