您的組織是否正遭受數據疲勞?

已發表: 2021-04-23
目錄顯示
保護自定義信息
替代數據嗜睡
擺脫數據疲勞

在金融界,投資經理一直在尋找新的信息來源,這將為創建 Alpha 提供以前未開發的來源。 這些數據源被稱為替代數據或數據疲勞。 數據是因為,嗯,信息。 替代方案,因為它們超出了典型的公司數據集。 冒著誇大陳詞濫調的風險,這就是觸發我們一直在尋求的“不公平優勢”的原因。

另類數據的市場仍然非常原始和新生。 該公司的支出逐年增加數倍。 一些更受歡迎的替代數據來源是信用卡交易、在線抓取的數據、來自手機的地理位置數據等。直觀地說,您可以說這些來源會因違反嚴重的隱私問題而受到關注。 因此,需要較少干擾的備用數據點。

儘管存在安全問題,替代數據市場目前正在蓬勃發展——預計 2020 年價值高達 3.5億美元,幾乎是 2016 年的 1.83 億美元的兩倍——但我們目睹了公司在 2019 年遭受替代數據疲勞。你問替代數據疲勞? 是的,它是不言自明的。 想起那句古老的格言,“新瓶裝舊酒”。 同一組數據集被​​重新打包並出售給同一組對沖基金經理,他們浪費了寶貴的時間來準備數據而不是分析數據。 屆時,市場上會出現新公司飽和:所有這些公司都將提供相同的競爭洞察力。

保護自定義信息

您可以採取一些基本的衛生命令步驟來避免替代數據疲勞。 第一步是確保您獲得定制的和特定於業務的信息,這些信息將推動您的業務向前發展。 如果您想輕鬆消除疲勞,那將是最大的區別。 由於對另類數據的興趣日益增長的影響,有許多研究公司提供最好的另類數據見解和/或向投資者、基金經理、旅行社和任何其他希望利用這一點的人出售另類數據集小馬。 想像一下相同的數據集,從同一數據集得出的相同見解,相同的可操作點基於 A 公司和 B 公司從相同數據集中得出的見解。只有一點點差異。 他們都完全不知道他們正在使用相同的信息來對付對方。

替代數據饋送可以是特定公司不認為“傳統”的任何內容。 線條真的越來越模糊。 當時被認為非常規的東西是當今最大的營銷決策驅動因素之一。 必須注意,對您來說被視為“替代品”的東西不應成為來年的行業標準。 這將意味著每個人都可以平等地訪問您花費大量精力整理的數據。

替代數據嗜睡

它是按原樣抓取和維護“主流”數據的任務。 花時間和精力去抓取、維護和處理大量的替代數據,絕對是與主要關注圈相切的。 那麼這裡的罪魁禍首是什麼? 是的,你猜對了。 昏睡。

替代數據集通常包含從大量來源和網站中提取的信息 數據抓取過程可能會使您無法分析發現和得出見解。 更不用說人為錯誤和重複的範圍增加了。 刮痧是第一步。 然後是標準化。 它必須採用“標準”格式才能有意義。 這是機器可以學習和自動化該過程的唯一方法。

現在我們已經有了適當的格式,接下來是繪製所收集數據的真正意圖。 你知道美式英語和英式英語有多麼不同嗎? 我們不是唯一覺得這很煩人的人。 例如,有兩種不同的方式可以寫入單個日期。 2021 年 5 月 27 日可以寫為 5/27/2021 或 27/5/2021,我們不必告訴您這種差異會對收集的數據產生何種影響。 因此,您必須收集、標準化、得出見解並做出戰略性業務決策。 用最少的人力。

擺脫數據疲勞

我們從不提及我們沒有解決方案的問題。 您可以從很多事情開始:

  • 自動化:這個很簡單。 我們剛剛解釋了看似無害的人為錯誤的影響。 通常情況下,抓取的數據會保留為獨立文件,然後手動集成。 就像數據的自動化標準化一樣,自動化集成過程大大減少了以勞動力為導向的工作所帶來的疲勞,並允許團隊將所有精力集中在數據分析上。 通過使用 API 準備數據以支持與內部業務系統的無縫集成並為分析目的創建強大的數據集,數據集成可以實現無人化。
  • 外包:將平凡的任務自動化總是有意義的。 尤其是在您需要一定程度的技術專長的情況下。 只需確保包含非競爭性排他性條款即可。 否則,您會在競爭對手手中找到相同的數據。 那會不會很糟糕。
  • 量身定制:如果您決定外包所有替代數據幫助,請與有能力為您的品牌創建自定義數據集的公司合作。 一刀切的方法在這裡行不通。 他們需要具備正確的網絡數據集成能力。 數據集成將網絡提取數據的整個生命週期視為一個單一的、有凝聚力的過程,重點是數據質量和控制。

通過提取自定義數據,還有無數其他方法可以絕對避免數據疲勞。 它很美。 跨社交媒體渠道、信用卡數據對您的評論部分進行情緒分析,以破解消費者的消費行為(儘管不受歡迎)。 使用衛星和/或監控圖像來計算停車場的汽車數量。 你只需要告訴你的網絡爬蟲服務提供商收集你需要的數據的確切性質。 就這些。 殺死疲勞。 你是為了更好的東西。