전자상거래를 위한 대체 데이터 – PromptCloud
게시 됨: 2019-05-27Alt 데이터 소스가 무엇인지부터 시작하겠습니다. 대체 데이터를 의미하며, 대체 데이터란 World Wide Web을 스크랩하여 얻은 다양한 형태의 데이터와 같은 비전통적인 데이터 소스를 의미합니다. 대체 데이터 데이터는 타겟 마케팅을 개선하는 데 사용되는 데이터 수집기 또는 검색 엔진 웹사이트에서 구매한 데이터일 수도 있습니다. 이러한 유형의 데이터는 구조화되거나 구조화되지 않을 수 있으며(더 가능성이 높음) 웹 링크, 텍스트 데이터, 데이터 테이블, 이미지, 비디오 등으로 구성될 수 있습니다.
대체 데이터 소스는 오늘날 우리가 사용할 수 있는 대부분의 데이터를 구성하며 많은 보고서 에 따르면 이 중 80%가 비정형 데이터입니다. 이전에는 이러한 형태의 데이터가 무시되었지만 경쟁이 치열해지고 더 많은 데이터를 확보해야 하므로 가능한 한 많은 데이터 소스를 사용해야 합니다.
데이터와 메트릭은 전자 상거래 부문의 중심에 있습니다.
대부분의 다른 비즈니스와 달리 전자 상거래 회사는 거의 항상 손실로 시작합니다. 이 시나리오의 이면에는 많은 고객 확보 비용, 설정 비용, 다양한 물류 파트너십에서 발생하는 비용, 웹 사이트 트래픽 감소 등이 있습니다. 그러나 초기 단계가 지나면 회사가 오랫동안 사업을 유지하려면 이익을 얻거나 최소한 손익분기점을 확보해야 합니다. 이것이 대부분의 회사가 데이터와 측정항목을 사용하여 웹사이트 트래픽을 늘리고 더 많은 전환을 얻는 이유입니다. 전통적인 데이터 소스와는 별도로 전자상거래를 위한 대체 데이터는 이러한 회사가 데이터 기반 비즈니스 결정을 더 잘 내리는 데 도움이 됩니다.
전자 상거래 회사의 데이터 소스는 무엇입니까?
전자 상거래 회사의 주요 데이터 소스 중 하나는 자체 웹 사이트의 트래픽에서 수집된 데이터입니다. 이 데이터는 여러 유형이 될 수 있습니다.
- 항상 함께 구매하는 상품 관련 데이터입니다. 이 정보는 웹사이트의 추천 엔진에서 더 나은 추천을 하는 데 사용될 수 있습니다.
- 구매한 제품을 구매자의 위치에 매핑하면 어떤 품목이 어떤 장소에서 판매 확률이 더 높은지 데이터를 수집할 수 있습니다. 이 정보는 다시 회사가 특정 제품을 특정 창고로 옮기도록 할 수 있습니다.
- 고객 연락처 정보는 이전 주문 내역에 따라 프로모션 이메일을 발송하는 데 사용할 수 있습니다.
- 웹사이트에서의 고객 행동을 분석하여 사용자가 웹사이트를 보다 쉽게 탐색할 수 있도록 모양과 느낌을 변경할 수 있습니다.
그러나 모든 회사가 Amazon만큼 크지 않고 다양한 사람들의 고객 특성에 대한 아이디어를 얻을 만큼 충분한 트래픽을 생성하지 않기 때문에 자신의 웹 사이트에서 생성된 데이터에만 의존하는 것은 실행 가능하지 않을 수 있습니다. 이것이 사람들이 수집 웹사이트에서 데이터를 구매하거나 웹에서 데이터를 스크랩하여 전자상거래 를 위한 대체 데이터를 찾는 이유입니다.
위에서 언급한 두 가지 옵션 중에서 웹을 스크랩하는 것이 더 좋고 저렴한 선택입니다. 원하는 데이터, 가져오고 싶은 데이터, 구성 방법 및 원하는 방식에 대해 더 많은 자유가 있기 때문입니다. 기존 비즈니스 프로세스와 함께 사용합니다. 애그리게이터에서 데이터를 구매하는 경우 기존 데이터 리포지토리에서만 선택하고 제공하는 형식의 데이터를 수락할 수 있습니다.
오늘날 사용되는 전자 상거래 의 대체 데이터는 무엇입니까 ?
오늘날 전자 상거래 사이트에서 사용되는 대체 데이터의 종류는 다양하며 가능성은 무한하지만 오늘날 사용되는 전자 상거래를 위한 가장 일반적인 대체 데이터 중 일부를 언급 했습니다.

- 이미지 – 이미지는 일반적으로 제품 이미지를 의미하며 전자 상거래 회사는 사용자가 항목에 대해 의심하지 않고 반품 가능성이 적도록 다양한 각도에서 더 나은 이미지를 얻기 위해 웹을 크롤링해야 하는 경우가 많습니다.
- 비디오 - 제품 페이지에는 이미지가 항상 필요하지만 기계 작동 방법이나 설치 방법 등을 보여줘야 하는 특정 항목의 비디오도 필요합니다. 이러한 제품의 경우 제품에 비디오가 있어야 합니다. 설명 페이지는 필수입니다. 이러한 비디오는 일반적으로 웹에서 스크랩됩니다.
- 그래프, 차트 및 메트릭 - 경쟁사에 중점을 둔 웹에서 수집한 그래프, 차트 및 기타 메트릭은 기업이 집중할 제품 라인업, 비축할 브랜드 등과 같은 중요한 결정을 내리는 데 도움이 될 수 있습니다.
- 주식 시장 데이터 - 회사가 비즈니스를 수행하는 방식과 직접적으로 연결되어 있지는 않지만 주식 시장 데이터, 특히 전자 상거래 부문에 속한 회사의 주식 시장 데이터는 전자 상거래 회사가 어떻게 하고 있는지에 대한 좋은 그림을 제공할 수 있으며 이 메트릭은 다음과 같을 수 있습니다. 증가할지, 더 많은 상점을 열지, 또는 물건을 안정적으로 유지할지 결정하는 데 사용됩니다.
- 제품 데이터(텍스트) - 제품의 기능, 사용 방법 및 나머지 제품과 구분되는 기능을 설명하는 텍스트 형식의 제품 세부 정보를 스크랩하여 재사용하여 고객이 항목에 대해 더 잘 이해할 수 있도록 합니다. 더 높은 고객 신뢰 수준을 통해 항목이 더 잘 판매되도록 합니다.
- 제품 데이터(테이블) - 중량, 전력량, 전력, 치수 등과 같은 제품과 관련된 속성 데이터는 일반적으로 테이블 형식으로 존재하며 이를 스크랩하는 것이 일반 텍스트 형식으로 제공되는 제품 데이터보다 어려울 수 있지만 중요성 더 높습니다.
- 소셜 미디어 데이터 - 전자 상거래 회사는 소셜 미디어 데이터를 스크랩하여 사람들이 더 많이 이야기하는 트렌드 해시 태그 또는 제품 및 브랜드를 찾습니다. 이를 통해 기업은 어떤 브랜드와 연결해야 하는지, 어떤 제품을 더 많이 광고할지, 더 많은 군중과 더 잘 연결하기 위해 광고에 무엇을 넣을지 결정할 수 있습니다.
- 전자 상거래 부문의 뉴스 데이터 - 한 번의 스캔들로 회사가 파산할 수 있으며 많은 사람들이 실제로 회사의 주가를 폭락시켰습니다. 이러한 상황에서 뉴스, 특히 전자 상거래 부문과 관련된 뉴스를 보는 것은 추가 데이터 포인트이므로 더 나은 이점을 제공하고 화재가 확산되지 않도록 상황을 통제하는 데 도움이 됩니다.
전자 상거래 기업 을 위한 대체 데이터 사용의 어려움
모든 것에는 대가가 따르며 대체 데이터 소스를 사용하여 비즈니스를 향상시키려면 이를 감수해야 합니다. 직면한 가장 일반적인 문제 중 일부는 다음과 같습니다.
- 비정형 데이터 - 비정형 데이터는 사용 가능한 대부분의 데이터와 크롤링하려는 대부분의 데이터를 구성합니다. 그러나 이를 정리하고 비즈니스 팀이 사용할 수 있는 형식으로 변환하는 것은 모든 다른 소스의 비정형 데이터를 처리하기 위해 별도의 스크립트를 작성해야 하기 때문에 어려운 일입니다.
- 웹사이트 구조 변경 - 특정 웹사이트에서 데이터를 스크랩하고 사용자 인터페이스가 밤새 변경되는 경우 변경 사항에 맞게 스크랩 엔진을 변경할 때까지 스크랩을 재개하지 못할 수 있습니다.
- 저작권 침해 문제- 특정 이미지 및 동영상은 저작권으로 보호될 수 있으므로 동영상 또는 이미지를 스크랩할 때 주의가 필요합니다.
- 데이터 청결 - 비즈니스를 수행할 때 데이터 청결은 필수입니다. 주로 평판이 데이터에 달려 있기 때문입니다. 그러나 온라인에 있는 많은 데이터는 인증되지 않았으며 증거도 없습니다. 예를 들어, 일부 데이터를 크롤링하여 판매 중인 휴대폰에 4Gb의 RAM이 있다는 것을 알 수 있지만 나중에 고객이 휴대폰에 2Gb의 RAM만 있다고 불평하고 잘못된 주장을 한다고 비난할 수 있습니다. 이러한 인스턴스를 줄이려면 항상 여러 소스에서 데이터를 크롤링하고 하나의 소스에서 다른 소스를 지원하는 것이 좋습니다.
- 더 긴 프로세스 - 데이터를 직접 스크랩하는 경우 요구 사항 수집에서 시작하여 웹 사이트 목록, 실제로 데이터를 스크랩하고 정리하고 필요한 형식으로 변환한 다음 기존 시스템에 연결하는 프로세스가 상당히 깁니다.
결론
비즈니스 프로세스에 도움이 되는 대체 데이터를 얻는 것은 시간이 걸리고 처음에는 힘들 수도 있지만 장기적으로 보면 확실히 성과가 있을 것입니다. 데이터를 활용하지 않는 것은 기회를 놓치는 것입니다. 데이터 스크래핑 팀을 구성하고 전자 상거래를 위한 대체 데이터를 크롤링, 정리 및 변환할 수 있는 형식으로 변환하는 것이 어렵다는 것을 이해하지만 사용할 수 있는 다른 옵션이 많이 있습니다. 그 중 하나는 PromptCloud에서 우리와 같은 서비스 제공업체의 도움을 받아 데이터 수집을 2단계 프로세스로 만드는 것입니다.
