Улучшите свой цифровой маркетинг с помощью R — введение в ваш набор инструментов R

Опубликовано: 2022-07-14

Автоматизация процессов во вселенной цифрового маркетинга становится все более популярной. Однако не для каждого маркетингового процесса есть специализированное программное обеспечение, предназначенное для помощи вам. Даже если указанное программное обеспечение существует, готов поспорить, оно будет стоить дорого.

Хотя поначалу написание кода может показаться немного утомительным, очень простой код может сэкономить вам часы работы, позволяя посвятить больше времени более важным задачам. От отчетов до визуализации данных, от прогнозирования до машинного обучения — существует множество вариантов использования кодирования в мире цифрового маркетинга. В этом блоге я расскажу о некоторых случаях использования R в цифровом маркетинге, шаг за шагом пройдясь по каждой строке кода.

Почему R вместо Python?

Это не простой вопрос. Мне нравится R, потому что я думаю, что у него есть превосходные пакеты для визуализации данных и статистического анализа. Тем не менее, основная причина, по которой я рекомендую использовать R, связана с набором существующих пакетов Google, что прекрасно подводит нас к первому варианту использования R в цифровом маркетинге…

  1. пакеты Google

Марк Эдмондсон создал набор кросс-совместимых пакетов, которые используют googleAuthR для внутренней аутентификации. Эти пакеты позволяют подключаться и взаимодействовать напрямую с такими инструментами, как Google Analytics, Big Query, Search Console, Tag Manager и Google Cloud Project.

Гугл Аналитика -

Пакет Google Analytics (GA) чрезвычайно полезен для маркетологов, поскольку позволяет вам получать доступ к вашим данным за пределами платформы. В этом блоге я не буду вдаваться в подробности этого пакета, поскольку мы уже рассказывали о googleAnalyticsR в других блогах. Дополнительные сведения см. в разделах, посвященных введению в googleAnalyticsR и использованию Google Trends с googleAnalyticsR.

Во многих других случаях использования, показанных ниже, я буду использовать данные GA, доступ к которым был получен через пакет googleAnalyticsR (т. е. см. вариант использования 2 для суммирования и группировки данных сеансов GA). Вот как вы можете получить эти данные для своего веб-сайта — просто установите идентификатор просмотра, диапазон дат и подключитесь к своей учетной записи.

 set_view_ID <- #Enter GA View ID# Date1 <- #Set start date in YYYY-MM-DD format# Date2 <- #Set end date in YYYY-MM-DD format# set_date_range <- c(date1, date2) data <- google_analytics (set_view_ID, date_range = set_date_range, metrics = c("sessions","bounces"), dimensions = c("date","deviceCategory","source"), anti_sample = TRUE)

Консоль поиска –

Пакет searchConsoleR позволяет легко получать информацию о кликах, показах и позициях по ключевым словам вашего сайта. См. приведенный ниже пример кода о том, как сделать свой первый запрос. Вариант использования 3 показывает, как вы можете выбрать данные Search Console для списка URL-адресов с помощью регулярного выражения.

 sc_data <- search_analytics("https://www.semetrical.com", "2021-01-01", "2021-12-31", c("query", "page"), dimensionFilterExp = c("device==DESKTOP","country==GBR"), searchType="web", rowLimit = 100) 

Большой запрос —

Пакет bigQueryR чрезвычайно мощен, поскольку позволяет легко взаимодействовать с платформой. В настоящее время я пишу блог о том, как загружать и читать данные в BigQuery и из него — следите за моим LinkedIn, где я скоро поделюсь этим.

  1. Группа и сумма

С пакетом dplyr вы можете легко манипулировать данными. Функция суммы позволяет найти общее значение определенной метрики в вашем наборе данных. Предположим, вы просматриваете ежедневные сеансы и хотите найти общее количество сеансов в наборе данных.

Символы %>% , по сути, говорят вам, что вы применяете функцию справа к переменной слева.

 data %>% summarise(sum(sessions))

Теперь предположим, что вы хотите определить сумму для каждого устройства. Здесь на помощь приходит группировка по функциям.

 data %>% group_by(deviceCategory) %>% summarise(sum(sessions))

Другие варианты использования для этого будут вычислять ежемесячные итоги. Обратите внимание, что у нас нет столбца «месяц». Мы можем легко создать его с помощью функции substr, показанной в коде ниже. Здесь мы берем первые 7 символов из даты. 1 говорит нам, что мы начинаем с первого значения, а 7 говорит нам, что нужно выбрать первые 7 значений.

 data$monthYear <- substr(data$date, 1, 7)

Теперь мы можем сгруппировать набор данных не только по категории устройства, но и по месяцу.

 data %>% group_by(c(monthYear, deviceCategory) %>% summarise(sum(sessions))
  1. регулярное выражение

Строки регулярного выражения часто появляются в цифровом маркетинге. Они полезны для фильтрации больших наборов данных. Предположим, у вас есть данные о кликах и показах Search Console для каждого URL-адреса на вашем сайте, но вы хотите просматривать только набор целевых страниц. В этом случае я добавил 2 других блога о «цифровом маркетинге с R» в строку регулярного выражения, чтобы увидеть данные только для них.

 regexpString<- c("/using-google-analytics-api-with-r/|/using-ga-google-trends-api-with-r/") filteredData <- sc_data[grepl(regexpString,sc_data$page),] 
  1. Слияние, rbind и cbind

Поскольку данные поступают из разных источников, маркетологам постоянно приходится объединять данные, будь то с помощью функций ВПР в Excel или функций СОЕДИНЕНИЯ в BigQuery.

В приведенном ниже примере показано, как вы можете объединить данные GA и Search Console на целевых страницах, чтобы увидеть общее количество сеансов из GA по сравнению с обычными кликами из SC, чтобы у нас было представление о важности указанного поискового запроса для целевых страниц. ' движение.

Во-первых, мы группируем по целевой странице, чтобы суммировать сеансы GA. Затем мы создаем новый столбец в наборе данных SC, чтобы заменить все пробелы URL-адресом домашней страницы (чтобы соответствовать формату данных GA для нашего слияния).

Затем мы просто применяем функцию «слияния» и определяем, к какому столбцу мы присоединяемся. Я рекомендую прочитать эти заметки по программированию о преобразовании данных для полного объяснения различных объединений.

 ga_landingPages <- data %>% group_by(landingPagePath) %>% summarise(sum(sessions)) sc_data$landingPagePath <- gsub("https://www.semetrical.com","",sc_data$page) merged_data <- merge(sc_data, ga_landingPages, by = 'landingPagePath')
  1. Форматы даты

Нет ничего более неприятного, чем компьютер, который не распознает дату. Пакет lubridate творит чудеса при применении функций даты. При чтении набора данных через API или через файл csv, хранящийся на вашем компьютере, вы должны немедленно применить функцию к столбцу даты, чтобы убедиться, что он считается датой, а не символом или фактором и т. д.

К сожалению, кажется, что существует бесконечное количество способов отображения даты. Чаще всего в цифровом формате встречается либо гггг-мм-дд, либо дд/мм/гггг. На основе набора данных, который вы используете, и того, как он в настоящее время отображает дату, попробуйте соответствующую строку кода ниже. Затем R по умолчанию будет отображать ваш код в формате гггг-мм-дд.

 data$date <- as.Date(data$date, format = '%Y-%m-%d') data$date <- as.Date(data$date, format = '%d/%m/%Y')

Резюме

После рассмотрения различных примеров я надеюсь убедить вас в том, что использование R дает множество преимуществ для повышения эффективности вашего маркетинга. Примера кода должно быть достаточно, чтобы начать работу, но вы можете воспользоваться документацией по всем используемым пакетам и онлайн-форумам. Пожалуйста, не стесняйтесь обращаться ко мне и команде Analytics, если у вас есть какие-либо вопросы по рассматриваемому контенту.