2018 年發布的 PromptCloud 博客的熱門帖子
已發表: 2018-12-26我們已經在今年的暮光之城,這是我們回顧我們所創造的最佳時機。 此外,值得注意的是,在年度關閉期間,最佳名單確保人們不會錯過任何東西。
因此,本彙編為您提供了與我們博客上發布的網絡數據相關的 10 篇最受歡迎的文章。 如果有任何事情發生,這將為您提供幫助。
不浪費任何時間,讓我們跳進去。
酒店價格抓取與優化策略
我們為希望保持有競爭力的價格並同時保持盈利的連鎖酒店提供了一個有趣的解決方案。 我們談到了基於三個主要因素——需求預測、市場反應衡量、競爭分析——來設計定價策略。 所有這些因素都有幾個子因素,這些子因素將在考慮各種約束的同時進行價格建模。

最後,將這些模型與酒店業務的獨特賣點相結合,將揭示對客戶有吸引力的定價。
可視化 YouTube 對奧斯卡提名電影預告片的評論
在這篇文章中,我們在娛樂領域進行了一項有趣的研究,並專注於奧斯卡頒獎典禮,因為這就是周圍的話題。 我們從奧斯卡提名電影的預告片中提取 YouTube 評論並創建可視化。
以下是我們分析的內容:
- 基於評論數的電影受歡迎程度
- 評論長度分佈
- 評論中使用的熱門術語
- 情緒分析
- 詞之間的關係——二元網絡圖
- 一個詞云,可以在“水形物語”預告片的評論中找到最常出現的詞。

這是我們發現的:
- 電影的受歡迎程度與獲獎或提名沒有直接關係
- 《水形物語》得到了褒貶不一的評論
- 奧斯卡提名可以改變觀眾對電影的看法
如何說服你的老闆收集網絡數據
接下來,我們決定幫助您說服您的老闆收集網絡數據,以提高您公司的生產力和效率。 我們專注於你可以在你的武器庫中使用什麼,並提出了一些可靠的觀點。 你可以解釋你怎麼能——
- 使用數據更好地定位客戶。
- 將未使用的數據從責任轉換為有價值的資產。
- 推動創新。
- 促進決策。
- 提高整體效率。
全部使用來自網絡抓取的數據!
機器學習和網絡爬蟲不可避免的神聖婚姻
到了年中,當每個人都在吃任何上面寫著“機器學習”的蛋糕時,我們決定做這件作品。 我們首先討論了網絡抓取,然後討論了機器學習,然後我們實際上解釋瞭如何代替人類不斷提出新的抓取規則,而機器可以保持抓取器運行。

最初需要一段時間的訓練階段,當一個真正的人會保持刮板繼續運行並根據它的行為來獎勵或懲罰它以使其學習和重新學習。
人工智能是否有助於快時尚的發展?
快時尚是時尚零售商使用的一個當代術語,用於表達設計從時裝秀迅速轉變為捕捉當前流行趨勢。 而且,目前在時尚界,暗示趨勢的簡單算法已經過時了。 數據團隊和設計團隊正在使用先進的人工智能來微調產品——從尋找顏色和材料到條紋和配飾。 我們知道這一點,因為我們目前每天提供數百萬個時尚數據,為一些專注於時尚的 AI 供應商提供支持。

發現下一季顧客會喜歡什麼,結果證明是數學解決方案與設計師的創造力相結合的一個案例。

泰勒斯威夫特歌曲歌詞數據可視化與分析
數據分析可以應用於“音樂”等創意領域,以找出潛在的主題和多年來的變化趨勢。 因此,這項研究的重點是獲得無數獎項的泰勒斯威夫特。
對她的 94 首曲目進行了分析,以創建一些引人入勝的圖表和圖表。

這是一個簡短的總結:
- 探索性分析——我們根據單個曲目和專輯對字數進行了分析,對字數進行時間序列分析以及字數分佈。
- 文本挖掘——在這裡,我們使用我們探索的所有歌曲構建了一個詞云。 我們還創建了一個二元網絡並執行了不同類型的情感分析。
該數據集在Datastock中可供您使用!
您需要了解的有關抓取物聯網數據的知識
年度流行語之一是 IoT(物聯網),我們決定解釋這一領域的機遇。 雖然還不是流行的數據抓取環境,但網絡抓取可以幫助了解很多關於不同物聯網設備的信息——交互是如何發生的,哪些數據可能容易被黑客入侵等。爬取不同硬件設備提供的數據,以及因為它們的連接點可以為希望分析整個物聯網生態系統並創建更新、更高效的業務流程的人們提供巨大的機會。
GDPR 時代的網絡抓取——影響和機遇
由於隱私和數據安全問題,像 Facebook 和谷歌這樣的龐然大物受到掃描儀的影響,GDPR 或通用數據保護條例在歐洲生效。 這迫使許多公司改變運營程序、數據存儲和工作流程處理,在某些情況下,甚至對整個基礎設施進行大修。
然而,這個備受關注的立法機構也為 Web Scraping 領域帶來了許多打擊和機會。 在本文中,我們將深入探討哪些變化將對數據抓取公司和個人產生影響。
數據分析揭示了美國最恐怖的城市
在萬聖節這個月裡,我們決定和幽靈一起去寫一篇文章,根據他們有多少鬧鬼的地方來分析不同的美國城市。

我們創建了一個州級和城市級頻率圖表以及美國的熱圖,以確保您知道自己被嚇到的可能性有多大。 詞圖分析還有助於了解人們如何描述幽靈般的地方,以及哪些詞在描述這些地方時更常見。
為什麼 Web Scraping 是 API 的更好替代方案?
我們保留了年底最受爭議的文章之一(希望人們會因為節日氣氛而更加快樂)。 說到重點,如果您一直在使用 API,為了滿足您的數據需求,您一定知道使用它們是多麼容易; 您需要做的就是傳遞一些參數,然後您會得到一個 JSON/XML 作為響應,然後您就可以使用它了。

API 功能通常不會經常更改,即使確實發生了微小的更改,您也會收到相同的更新文檔。 那麼,它比 Web Scraping 更好嗎? 好吧,正如您可能聽說過的那樣,更容易並不總是更好。 閱讀這篇年終文章以了解更多信息。
這總結了您必須閱讀的 2018 年文章的摘要。 如果您想在此列表中從我們的博客中獲得其他文章,請發表評論!

