使用 R 改进您的数字营销 – R 工具包简介
已发表: 2022-07-14数字营销领域内的流程自动化正变得越来越流行。 但是,并非每个营销流程都有专门为您提供帮助的软件。 即使存在所述软件,您也可以打赌它会花费很多。
虽然一开始编码可能看起来有点不堪重负,但一些非常简单的代码可以节省您的工作时间,使您能够将更多时间用于更重要的任务。 从报告到数据可视化,从预测到机器学习,数字营销领域有大量的编码用例。 在这篇博客中,我将介绍 R 在数字营销中的一些用例,同时逐步介绍每一行代码。
为什么选择 R 而不是 Python?
这不是一个容易回答的问题。 我喜欢 R,因为我认为它具有出色的数据可视化和统计分析软件包。 然而,我推荐使用 R 的主要原因是由于存在的 Google 软件包的集合,这使我们很好地了解了 R 在数字营销中的第一个用例……
- 谷歌包
Mark Edmondson 创建了一组使用 googleAuthR 进行后端身份验证的交叉兼容包。 这些软件包允许您直接与 Google Analytics、Big Query、Search Console、Tag Manager 和 Google Cloud Project 等工具进行连接和交互。
谷歌分析 -
Google Analytics (GA) 软件包对营销人员非常有用,因为它允许您在平台之外访问您的数据。 在这篇博客中,我不会详细介绍这个包,因为我们已经在其他博客中介绍了 googleAnalyticsR。 有关更多信息,请参阅 googleAnalyticsR 简介和将 Google 趋势与 googleAnalyticsR 结合使用。
在下面显示的许多其他用例中,我将使用通过 googleAnalyticsR 包访问的 GA 数据(即参见用例 2 来汇总和分组您的 GA 会话数据)。 您可以通过以下方式为您的网站获取这些数据——只需设置查看 ID、日期范围并连接到您的帐户。
set_view_ID <- #Enter GA View ID# Date1 <- #Set start date in YYYY-MM-DD format# Date2 <- #Set end date in YYYY-MM-DD format# set_date_range <- c(date1, date2) data <- google_analytics (set_view_ID, date_range = set_date_range, metrics = c("sessions","bounces"), dimensions = c("date","deviceCategory","source"), anti_sample = TRUE) 
搜索控制台 –
searchConsoleR 软件包可让您轻松获取有关您网站关键字的点击次数、印象数和排名的信息。 请参阅下面的示例代码,了解如何进行第一次查询。 用例 3 展示了如何使用正则表达式为 URL 列表选择 Search Console 数据。
sc_data <- search_analytics("https://www.semetrical.com", "2021-01-01", "2021-12-31", c("query", "page"), dimensionFilterExp = c("device==DESKTOP","country==GBR"), searchType="web", rowLimit = 100) 
大查询 –
bigQueryR 包非常强大,因为它可以让您轻松地与平台交互。 我目前正在写一篇关于如何向 BigQuery 上传数据和从 BigQuery 读取数据的博客——请关注我的 LinkedIn,我将很快分享。
- 分组和求和
使用 dplyr 包,您可以进行很多简单的数据操作。 sum 函数允许您在数据集中查找特定指标的总数。 假设您正在查看每日会话并希望找到整个数据集中的会话总数。
%>%符号本质上是在告诉您将右侧的函数应用于左侧的变量。
data %>% summarise(sum(sessions)) 
现在假设您要确定每个设备的总和。 这就是按功能分组的地方。
data %>% group_by(deviceCategory) %>% summarise(sum(sessions)) 
其他用例是计算每月总计。 注意我们没有“月”列。 我们可以使用下面代码中显示的 substr 函数轻松创建一个。 这里我们取日期的前 7 个字符。 1 告诉我们从第一个值开始,7 告诉我们选择前 7 个值。

data$monthYear <- substr(data$date, 1, 7)现在我们不仅可以按设备类别还可以按月份对数据集进行分组。
data %>% group_by(c(monthYear, deviceCategory) %>% summarise(sum(sessions)) 
- 正则表达式
正则表达式字符串经常出现在数字营销中。 它们对于过滤更大的数据集很有用。 假设您拥有网站上每个 URL 的 Search Console 点击次数和展示次数数据,但您只想查看一组着陆页。 在这种情况下,我在正则表达式字符串中添加了另外 2 个关于“使用 R 进行数字营销”的博客,以便仅查看它们的数据。
regexpString<- c("/using-google-analytics-api-with-r/|/using-ga-google-trends-api-with-r/") filteredData <- sc_data[grepl(regexpString,sc_data$page),] 
- 合并、rbind 和 cbind
由于数据来自各种来源,营销人员不得不不断地合并数据,无论是通过 Excel 中的 VLOOKUP 还是 BigQuery 中的 JOIN 函数。
下面的示例向您展示了如何合并登陆页面上的 GA 和 Search Console 数据,以查看来自 GA 的总会话与来自 SC 的自然点击的比较,以便我们了解所述搜索查询对登陆页面的重要性' 交通。
首先,我们按登录页面分组以总结 GA 会话。 然后我们在 SC 数据集中创建一个新列,用主页 URL 替换任何空白(以匹配我们合并的 GA 数据的格式)。
接下来,我们只需应用“合并”功能并指定我们要加入的列。 我建议阅读这些关于数据重塑的编程笔记,以获得对不同连接的完整解释。
ga_landingPages <- data %>% group_by(landingPagePath) %>% summarise(sum(sessions)) sc_data$landingPagePath <- gsub("https://www.semetrical.com","",sc_data$page) merged_data <- merge(sc_data, ga_landingPages, by = 'landingPagePath') 
- 日期格式
没有什么比电脑无法识别日期更令人沮丧的了。 lubridate 包在应用日期函数时绝对是个奇迹。 当通过 API 或存储在计算机上的 csv 读取数据集时,您应该立即将函数应用于日期列,以确保将其视为日期,而不是字符或因素等。
不幸的是,似乎有无数种显示日期的方法。 最常见的数字格式往往是 yyyy-mm-dd 或 dd/mm/yyyy。 根据您使用的数据集及其当前显示日期的方式,尝试下面的相关代码行。 然后,R 将默认以 yyyy-mm-dd 格式显示您的代码。
data$date <- as.Date(data$date, format = '%Y-%m-%d') data$date <- as.Date(data$date, format = '%d/%m/%Y')概括
在介绍了各种示例之后,我希望让您相信使用 R 来提高营销效率有很多好处。 示例代码应该足以让您入门,但请利用所有使用的包和在线论坛的文档。 如果您对所涵盖的内容有任何疑问,请随时与我本人和分析团队联系。
