數據治理以及組織為什麼需要它?
已發表: 2021-01-27數據治理包括公司實現其數據管理目標所需的人員、流程、規則、法規、政策和標準。 雖然業務團隊通常負責並幫助創建所需的流程,但技術團隊幫助自動化這些流程並為它們注入活力。 在宏觀層面,它是政治話語和國際關係的一部分,而在微觀層面,它是公司規劃數據戰略的一部分。
數據治理原則
數據治理通常會考慮多種因素,例如:
一個)。 確保不同利益相關者的數據可訪問性
乙)。 數據所有權
C)。 添加更多數據源的新思路
d)。 確保數據安全並維護訪問控制
e)。 建立數據清理和數據處理管道
F)。 符合與數據訪問和存儲相關的規則和合規性要求
有效的數據治理可確保公司處理的數據的各個方面都通過一系列流程、製造者和檢查者、數據所有者和控制機制進行管理。 它還確保在多個團隊訪問和更新數據時保持數據的隱私性、完整性、可用性和清潔度。

今天的公司有機會從眾多來源收集大量數據。 他們可以使用物聯網技術從機器中獲取數據,也可以使用內部數據——即由客戶、客戶和流程生成的數據。 數據科學團隊還可以利用外部數據源並利用網絡抓取解決方案。

在處理來自多個來源的數據時,在匯總數據之前需要小心,並且公司需要檢查各個級別的數據驗證以將風險降到最低。 大量數據並不能自動確保公司的成功,這就是為什麼公司需要通過數據治理進行數據紀律。
任何公司的數據治理團隊通常包括關鍵垂直領域的成員,例如技術、業務、質量保證和合規性。 團隊 r 致力於關鍵要求,包括但不限於:
一個)。 政策審批
乙)。 創建數據諮詢小組
C)。 為所需數據產品分配所有者
d)。 數據更正和數據標準化
e)。 規則引擎或框架
F)。 數據基礎設施
數據治理團隊如何工作?


數據治理的要求通常從業務團隊開始。 例如,讓我們以一家向大學生提供小額貸款的公司為例。 對於這樣的企業,可能需要存儲申請貸款的人的某些財務數據。 需要以某種方式屏蔽信息,以使不同的團隊和成員對他們需要處理的數據點的訪問權限有限。
一旦業務團隊提出要求,就需要由合規團隊進行驗證。 這些更改應有助於公司在審計期間滿足其法定要求。 一旦將要求和驗證以及其他信息添加到其中,技術團隊通常會構建一個解決方案。
該解決方案將分為兩部分——a)需要編寫以屏蔽數據的實際代碼,b)在 AWS 等雲平台上所需的基礎設施設置。 構建更改後,需要由質量和保證團隊對其進行測試,並在上線之前由合規團隊重新驗證。
當多個團隊是單個解決方案的一部分時,主要障礙之一是術語。 對於電子商務公司來說,倉庫團隊可能認為當一個產品“發貨”時,就意味著它已經到達了倉庫,而交付團隊可能認為這個詞代表“out for delivery”。 需要定義通用術語,以使每個人在處理數據治理問題時都能保持一致。
數據治理與數據管理
數據治理和數據管理似乎是同義詞,但實際上並非如此。 然而,在大多數情況下,數據管理是數據治理的一部分。 數據管理處理與處理和存儲數據相關的不同方面。 這可能包括設置雲基礎設施並對其進行維護,同時控製成本。 它還涉及清理和處理來自多個來源的數據,以便訪問數據的人可以即插即用格式使用它。 數據管理團隊將每天處理一些特定的要求,例如:
一個)。 數據規範化和格式化
乙)。 使用階梯函數等服務的數據管道和 ETL 工作流
C)。 使用 AWS Glue 等服務進行數據編目
d)。 創建和更新一站式數據湖
另一方面,數據治理團隊將定義數據管理團隊在處理其任何項目時需要滿足的政策和合規性要求。 需要首先設計的數據流的基礎架構還需要符合數據治理團隊設定的標準。
簡而言之,數據治理團隊將為公司中與數據相關的所有內容設置流程和規則,而數據管理團隊通常會應用這些規則和流程並設置基礎設施要求。
數據治理的好處
數據治理在短期內可能難以實施,但它就像一棵結果樹,一旦建立,就會不斷產生結果。 它可以幫助提高數據科學和分析團隊的工作量,還有助於管理風險和保持合規性:
一個)。 數據治理到位後,您將擁有一套標準規則,任何從事數據科學項目並需要訪問公司數據流的人都可以遵循這些規則。 反過來,這將減少對多層次溝通和決策的需求
乙)。 有了既定的目標和要求,與數據管理相關的成本就會下降,而成本節約就會更高。 這尤其適用於當公司手頭有大量數據但有適當的存儲、歸檔和訪問方法時
C)。 數據驅動的活動將更加透明,這將使公司能夠更快地向利益相關者或審計師提供答案
d)。 有了適當的指導方針,公司可以瞄準更多的外部數據來源,以豐富當前的數據來源並創建更廣泛的市場研究
e)。 數據治理團隊可以為產品或技術可能面臨或合規團隊遇到的所有數據相關問題提供更快的解決方案
F)。 改進的監控和記錄機制將確保數據安全並使公司能夠獲得客戶的信任。 近年來,隨著全球發生多起數據黑客事件,數據安全可能是您失去所有客戶的原因,即使您的產品物超所值
鬥爭
數據治理的興起是由於公司在多次網絡攻擊和失去公眾信任後面臨的困境。 如今,此類外部違規行為、增加的法規和成本節約使得數據治理成為大公司和小公司涉足數據的必要條件。 加州消費者隱私法 (CCPA) 和通用數據保護條例 (GDPR) 等最近的法規增加了對基於預定義標準構建數據基礎設施的公司的激勵。
就像羅馬不是一天建成的一樣,創建一個數據治理團隊並構建整個公司遵循的框架可能在短期內並不可行。 這背後的原因是,您需要來自不同團隊的參與者聚集在一起,分析公司將使用的數據、數據流的來源、使用目的以及訪問數據。
網頁抓取和治理
由於網絡上幾乎無限量的可用信息和實時數據更新,網絡抓取是行業等外部數據的最大來源。 然而,對訴訟和合規要求的恐懼在使用網絡抓取作為數據源的道路上製造了障礙。 擁有一個標準化的數據治理規則手冊和一個可以在每次添加新源時提出“待辦事項列表”的團隊可以幫助您保持數據法則的正確性。
如果您喜歡閱讀此博客,我們相信您可能會喜歡閱讀Data Normalization 和 Data Structuring 之間的區別。 請務必在下面的評論部分中留下您寶貴的反饋。
