R로 디지털 마케팅 개선 – R 툴킷 소개

게시 됨: 2022-07-14

디지털 마케팅 세계 내에서 프로세스의 자동화가 점점 더 대중화되고 있습니다. 그러나 모든 마케팅 프로세스에 도움이 되도록 설계된 특수 소프트웨어가 있는 것은 아닙니다. 해당 소프트웨어가 존재하더라도 비용이 많이 들 것입니다.

코딩이 처음에는 다소 압도적으로 보일 수 있지만 매우 간단한 코드를 사용하면 작업 시간을 절약할 수 있으므로 더 중요한 작업에 더 많은 시간을 할애할 수 있습니다. 보고에서 데이터 시각화, 예측, 기계 학습에 이르기까지 디지털 마케팅 세계에는 코딩에 대한 사용 사례가 많이 있습니다. 이 블로그에서는 디지털 마케팅에서 R의 몇 가지 사용 사례를 다루면서 각 코드 줄을 단계별로 살펴보겠습니다.

왜 Python 대신 R을 사용합니까?

이것은 대답하기 쉬운 질문이 아닙니다. 데이터 시각화 및 통계 분석을 위한 우수한 패키지가 있다고 생각하기 때문에 R을 좋아합니다. 그러나 내가 R을 사용하는 것을 권장하는 주된 이유는 디지털 마케팅에서 R의 첫 번째 사용 사례를 잘 보여 주는 Google 패키지 모음 때문입니다.

  1. 구글 패키지

Mark Edmondson은 백엔드 인증에 googleAuthR을 사용하는 교차 호환 패키지 모음을 만들었습니다. 이러한 패키지를 사용하면 Google 애널리틱스, Big Query, Search Console, 태그 관리자 및 Google Cloud Project와 같은 도구에 직접 연결하고 상호 작용할 수 있습니다.

구글 애널리틱스 –

Google Analytics(GA) 패키지는 플랫폼 외부에서 데이터에 액세스할 수 있도록 하므로 마케터에게 매우 유용합니다. 이 블로그에서는 이미 다른 블로그에서 googleAnalyticsR을 다루었으므로 이 패키지에 대해 너무 자세히 설명하지 않겠습니다. 자세한 내용은 googleAnalyticsR 소개 및 googleAnalyticsR과 함께 Google 트렌드 사용에 대한 내용을 참조하세요.

아래에 나와 있는 다른 많은 사용 사례에서 googleAnalyticsR 패키지를 통해 액세스한 GA 데이터를 사용합니다(예: 사용 사례 2를 참조하여 GA 세션 데이터를 합산하고 그룹화). 다음은 웹사이트에 대한 데이터를 가져오는 방법입니다. 보기 ID, 날짜 범위를 설정하고 계정에 연결하기만 하면 됩니다.

 set_view_ID <- #Enter GA View ID# Date1 <- #Set start date in YYYY-MM-DD format# Date2 <- #Set end date in YYYY-MM-DD format# set_date_range <- c(date1, date2) data <- google_analytics (set_view_ID, date_range = set_date_range, metrics = c("sessions","bounces"), dimensions = c("date","deviceCategory","source"), anti_sample = TRUE)

검색 콘솔 –

searchConsoleR 패키지를 사용하면 사이트 키워드에 대한 클릭, 노출 및 순위에 대한 정보를 쉽게 얻을 수 있습니다. 첫 번째 쿼리를 만드는 방법은 아래 예제 코드를 참조하세요. 사용 사례 3은 regexp를 사용하여 URL 목록에 대한 Search Console 데이터를 선택하는 방법을 보여줍니다.

 sc_data <- search_analytics("https://www.semetrical.com", "2021-01-01", "2021-12-31", c("query", "page"), dimensionFilterExp = c("device==DESKTOP","country==GBR"), searchType="web", rowLimit = 100) 

빅 쿼리 –

bigQueryR 패키지는 플랫폼과 쉽게 상호 작용할 수 있으므로 매우 강력합니다. 저는 현재 BigQuery에서 데이터를 업로드하고 읽는 방법에 대한 블로그를 작성하고 있습니다. 곧 공유할 LinkedIn을 주목해 주세요.

  1. 그룹 및 합계

dplyr 패키지를 사용하면 많은 데이터 조작을 쉽게 할 수 있습니다. sum 함수를 사용하면 데이터세트 내 특정 메트릭의 총계를 찾을 수 있습니다. 일일 세션을 보고 있고 데이터 세트에서 총 세션 수를 찾고 싶다고 가정합니다.

%>% 기호는 기본적으로 오른쪽의 함수를 왼쪽의 변수에 적용하고 있음을 알려줍니다.

 data %>% summarise(sum(sessions))

이제 각 장치에 대한 합계를 식별하려고 한다고 가정합니다. 여기에서 기능별 그룹화가 시작됩니다.

 data %>% group_by(deviceCategory) %>% summarise(sum(sessions))

이에 대한 다른 사용 사례는 월별 총계를 계산하는 것입니다. 'month' 열이 없는지 확인하십시오. 아래 코드에 표시된 substr 함수를 사용하여 쉽게 만들 수 있습니다. 여기서는 날짜에서 처음 7자를 가져옵니다. 1은 첫 번째 값에서 시작한다고 알려주고 7은 처음 7개 값을 선택하라고 알려줍니다.

 data$monthYear <- substr(data$date, 1, 7)

이제 장치 범주뿐만 아니라 월별로 데이터 세트를 그룹화할 수 있습니다.

 data %>% group_by(c(monthYear, deviceCategory) %>% summarise(sum(sessions))
  1. 정규 표현식

정규 표현식 문자열은 디지털 마케팅에서 자주 나타납니다. 더 큰 데이터 세트를 필터링하는 데 유용합니다. 사이트의 모든 URL에 대한 Search Console 클릭 및 노출 데이터가 있지만 방문 페이지 집합만 보고 싶다고 가정해 보겠습니다. 이 경우 '디지털 마케팅 R'에 대한 2개의 다른 블로그를 정규 표현식 문자열에 추가하여 해당 블로그에 대한 데이터만 표시했습니다.

 regexpString<- c("/using-google-analytics-api-with-r/|/using-ga-google-trends-api-with-r/") filteredData <- sc_data[grepl(regexpString,sc_data$page),] 
  1. 병합, rbind 및 cbind

다양한 소스에서 오는 데이터로 인해 마케터는 Excel의 VLOOKUP 또는 BigQuery의 JOIN 함수를 통해 지속적으로 데이터를 병합해야 합니다.

아래 예는 방문 페이지에서 GA 및 Search Console 데이터를 병합하여 SC의 자연 클릭과 비교하여 GA의 총 세션을 확인하여 방문 페이지에 대한 해당 검색어의 중요성을 나타내는 방법을 보여줍니다. ' 교통.

먼저 방문 페이지별로 그룹화하여 GA 세션을 합산합니다. 그런 다음 SC 데이터 세트에 새 열을 만들어 공백을 홈페이지 URL로 대체합니다(병합을 위한 GA 데이터 형식과 일치).

다음으로, 단순히 '병합' 기능을 적용하고 결합할 열을 지정합니다. 다른 조인에 대한 전체 설명을 보려면 데이터 재구성에 대한 이러한 프로그래밍 노트를 읽는 것이 좋습니다.

 ga_landingPages <- data %>% group_by(landingPagePath) %>% summarise(sum(sessions)) sc_data$landingPagePath <- gsub("https://www.semetrical.com","",sc_data$page) merged_data <- merge(sc_data, ga_landingPages, by = 'landingPagePath')
  1. 날짜 형식

컴퓨터가 날짜를 인식하지 못하는 것보다 더 짜증나는 일은 없습니다. lubridate 패키지는 날짜 기능을 적용할 때 절대적으로 놀라운 일을 합니다. API 또는 컴퓨터에 저장된 csv를 통해 데이터 세트를 읽을 때 날짜 열에 즉시 함수를 적용하여 문자나 요소 등이 아닌 날짜로 간주되도록 해야 합니다.

불행히도 날짜를 표시하는 방법은 무한히 많은 것 같습니다. 디지털 형식에서 가장 흔히 볼 수 있는 형식은 yyyy-mm-dd 또는 dd/mm/yyyy입니다. 사용 중인 데이터 세트와 현재 날짜를 표시하는 방법을 기반으로 아래의 관련 코드 줄을 시도하십시오. 그러면 R은 기본적으로 코드를 yyyy-mm-dd 형식으로 표시합니다.

 data$date <- as.Date(data$date, format = '%Y-%m-%d') data$date <- as.Date(data$date, format = '%d/%m/%Y')

요약

다양한 예를 다룬 후에 R을 사용하여 마케팅 효율성을 향상시키는 데 많은 이점이 있음을 확신할 수 있기를 바랍니다. 예제 코드는 시작하기에 충분해야 하지만 사용된 모든 패키지와 온라인 포럼에 대한 문서를 활용하십시오. 다루는 내용에 대해 질문이 있는 경우 저와 Analytics 팀에 언제든지 문의하십시오.