조직이 데이터 피로를 겪고 있습니까?
게시 됨: 2021-04-23금융 세계에서 투자 관리자는 Alpha를 만드는 데 이전에 미개척 소스를 제공할 새로운 정보 소스를 항상 찾고 있습니다. 바로 이러한 데이터 소스를 대체 데이터 또는 데이터 피로라고 합니다. 데이터는 정보이기 때문입니다. 일반적인 회사 데이터 세트를 넘어서기 때문에 대안입니다. 진부한 표현의 위험을 무릅쓰고 이것이 우리 모두가 계속 추구하는 '불공정한 이익'을 유발하는 것입니다.
대체 데이터에 대한 시장은 여전히 매우 미숙하고 초기 단계입니다 . 이를 지출하는 회사는 매년 몇 배로 증가하고 있습니다. 대체 데이터의 가장 인기 있는 소스 중 일부는 신용 카드 거래, 온라인에서 스크랩 한 데이터, 모바일의 지리적 위치 데이터 등이 있습니다. 직관적으로 이러한 소스는 심각한 개인 정보 보호 문제를 위반하는 레이더에 들어갈 수 있다고 말할 수 있습니다. 따라서 덜 방해가 되는 대체 데이터 포인트가 필요합니다.
보안 문제에도 불구하고 현재 대체 데이터 시장이 번창하고 있으며 2016년 1억 8,300만 달러의 거의 두 배인 2020년에 무려 3억 5,000만 달러의 가치가 있을 것으로 예상되는 동안 우리는 기업이 2019년에 대체 데이터 피로 로 고통받는 것을 목격했습니다. 대체 데이터 피로 가 무엇입니까? 예, 그것은 자명합니다. '새 병에 든 묵은 포도주'라는 속담이 떠오른다. 동일한 데이터 세트가 재포장되어 동일한 그룹의 헤지 펀드 매니저에게 판매되고 있습니다. 그때쯤이면 시장은 새로운 회사로 가득 차게 됩니다. 모든 회사는 동일한 경쟁력 있는 통찰력을 제공할 것입니다.
보안 사용자 지정 정보
대체 데이터 피로를 피하기 위해 취할 수 있는 몇 가지 기본적인 위생 주문 단계가 있습니다 . 첫 번째 단계는 비즈니스를 발전시킬 맞춤형 비즈니스 관련 정보를 확보하는 것입니다. 피로를 풀고 싶다면 이것이 큰 차별화 요소입니다. 대체 데이터에 대한 관심 증가의 영향으로 최고의 대체 데이터 통찰력을 제공하고 대안 데이터 세트를 투자자, 자금 관리자, 여행사 및 이를 이용하려는 모든 사람에게 판매하는 수많은 연구 회사가 있습니다. 조랑말. 동일한 데이터 세트, 동일한 데이터 세트에서 가져온 동일한 통찰력, 동일한 실행 가능한 포인트가 회사 A와 회사 B의 동일한 데이터 세트에서 가져온 통찰력을 기반으로 한다고 상상해 보십시오. 단 하나의 작은 차이만 있습니다. 그들은 서로에 대해 동일한 정보를 사용하고 있다는 사실을 전혀 인식하지 못합니다.
대체 데이터 피드는 특정 회사에서 '전통적인' 것으로 간주하지 않는 모든 것이 될 수 있습니다. 라인이 정말 흐려지고 있습니다. 당시에는 틀에 박힌 것으로 간주되었던 것이 오늘날 가장 큰 마케팅 의사 결정 요인 중 하나입니다. '대안'으로 간주되는 것이 다가오는 해에 업계 표준이 되어서는 안 된다는 점에 주의해야 합니다. 그것은 모든 사람이 당신이 많은 에너지 대조에 소비한 데이터에 동등하게 접근할 수 있음을 의미합니다.

대체 데이터 무기력
'주류' 데이터를 그대로 스크랩하고 유지하는 작업입니다. 많은 양의 대체 데이터를 스크랩하고 유지 관리하고 처리하는 데 시간과 에너지를 들이는 것은 주요 관심사에 절대적으로 접선입니다. 그렇다면 여기서 큰 범인은 무엇일까요? 네, 짐작하셨군요. 혼수.
대체 데이터 세트는 일반적 으로 과다한 소스 및 웹 사이트에서 가져온 정보로 구성됩니다. 데이터 스크래핑 프로세스 는 결과를 분석하고 통찰력을 얻는 데 방해가 될 수 있습니다. 인적 오류와 이중성의 증가된 범위는 말할 것도 없습니다. 스크래핑은 첫 번째 큰 단계입니다. 그런 다음 표준화합니다. 의미가 있으려면 '표준' 형식이어야 합니다. 이것이 기계가 프로세스를 학습하고 자동화할 수 있는 유일한 방법입니다.
이제 형식이 지정되었으므로 다음은 수집된 데이터의 진정한 의도를 그리는 것입니다. 미국식 영어와 영국식 영어가 어떻게 다른지 아십니까? 우리만 짜증나는 것이 아닙니다. 예를 들어, 단일 날짜를 기록할 수 있는 두 가지 별개의 방법이 있습니다. 2021년 5월 27일은 2021년 5월 27일 또는 2021년 5월 27일로 기록될 수 있으며 이러한 차이가 수집된 데이터에 어떤 영향을 미칠지 말할 필요는 없습니다. 따라서 긁어모아 표준화하고 통찰력을 얻고 전략적 비즈니스 결정을 내려야 합니다. 최소한의 인간 노력으로.
데이터 피로 제거
우리는 해결책이 없는 문제를 언급하지 않습니다. 다음과 같이 시작할 수 있습니다.
- 자동화: 이것은 생각할 필요가 없습니다. 우리는 겉보기에 무해해 보이는 인적 오류의 영향을 설명했습니다. 종종 스크랩된 데이터는 독립 실행형 파일로 남아 수동으로 통합됩니다. 데이터의 자동화된 표준화와 매우 유사하게 통합 프로세스를 자동화하면 노동 중심의 작업으로 인한 피로가 크게 줄어들고 팀이 데이터 분석에 대한 모든 노력을 집중할 수 있습니다. API로 데이터를 준비하여 내부 비즈니스 시스템과의 원활한 통합을 지원하고 분석 목적을 위한 강력한 데이터 세트를 생성함으로써 데이터 통합을 인간이 필요로 하지 않게 할 수 있습니다.
- 아웃소싱: 일상적인 작업을 자동화하는 것이 항상 합리적입니다. 특히 수준의 기술 전문성이 필요한 경우. 비경쟁 독점 조항을 포함해야 합니다. 그렇지 않으면 라이벌의 손에서 동일한 데이터를 찾을 수 있습니다. 그리고 그것은 불행이 될 것입니다.
- 맞춤형: 모든 대체 데이터 지원을 아웃소싱하기로 결정했다면 브랜드에 대한 맞춤형 데이터 세트를 생성할 수 있는 능력을 갖춘 회사와 협력하십시오. 획일적인 접근 방식은 여기에서 적합하지 않습니다. 올바른 웹 데이터 통합 기능이 필요합니다. 데이터 통합은 웹에서 추출한 데이터의 전체 수명 주기를 데이터 품질 및 제어에 중점을 둔 하나의 응집력 있는 프로세스로 취급합니다.
사용자 정의 데이터를 추출 하여 데이터 피로를 절대적으로 피하는 수많은 다른 방법이 있습니다. 그것은 아름다운. 소셜 미디어 채널 전반에 걸친 댓글 섹션의 감정 분석, 소비자 지출 행동을 해독하기 위한 신용 카드 데이터(그러나 눈살을 찌푸리게 함). 위성 및/또는 감시 이미지를 사용하여 주차장에 있는 자동차 수를 세는 것. 필요한 데이터의 정확한 특성을 수집하도록 웹 스크레이퍼 서비스 제공업체에 알리기만 하면 됩니다. 그게 다야. 피로를 죽이십시오. 당신은 더 나은 일을위한 것입니다.
