Usando Regex (Expressões Regulares) no Marketing Digital
Publicados: 2021-11-30O que é uma expressão regular:
Uma Expressão Regular, ou Regex, é uma string de texto que nos permite gerenciar, combinar, filtrar e extrair texto.
O Regex é particularmente útil no marketing digital, onde geralmente é necessário extrair partes específicas de dados úteis de grandes conjuntos de dados.
A extração desses dados úteis pode ser uma tarefa complicada quando concluída manualmente, geralmente exigindo um tempo significativo. Com Regex, podemos usar fórmulas para simplificar e acelerar essas tarefas.
Embora o Regex possa parecer assustador ou intimidador no início, este blog deve demonstrar como o Regex pode ser simples e ajudar a incentivar outros profissionais de marketing a começar a eliminar e automatizar as partes mais chatas e demoradas da análise de dados.
Fichas Comuns:
Uma Expressão Regular consiste em tokens. Cada um desses tokens corresponde a um único caractere ou série de caracteres em seu conjunto de dados ou determina a posição em que um caractere deve estar. Podemos ver alguns exemplos dos tokens mais usados na tabela abaixo.
| Símbolo | Função |
| | | Alternar, ou/ou. “A|B” combina com “A” e “B”. |
| . | Corresponde a qualquer caractere único que não seja uma nova linha. |
| * | Corresponde a zero ou mais que. Portanto, “.*” corresponde a zero ou mais de qualquer caractere que não seja uma nova linha. |
| + | Corresponde a um ou mais de. Portanto, “.+” corresponde a um ou mais de qualquer caractere que não seja uma nova linha. |
| ? | Corresponde a zero ou uma vez. Então ".?" corresponde se houver zero ou um de qualquer caractere diferente de uma nova linha. |
| \ | Corresponde ao caractere a seguir literalmente. Então "\." corresponde apenas com “.” e nenhum outro personagem. |
| (…) | Os colchetes arredondados indicam um grupo de captura. Tudo dentro dos colchetes arredondados é capturado. |
| (?:…) | Colchetes arredondados seguidos por um “?:” denotam um grupo sem captura. Isso é semelhante a um grupo de captura, mas o conteúdo não é retido. |
| {…} | As chaves determinam quantas instâncias do token anterior você gostaria de corresponder. Por exemplo, "(a{1,3})" corresponderá entre 1 e 3 instâncias da letra "a". |
| […] | Os colchetes nos permitem definir intervalos ou diferentes caracteres ou tokens a serem correspondidos. Por exemplo, “[Az]” corresponde a qualquer letra maiúscula ou minúscula. |
| ^ | Um “^” corresponde ao início de uma string ou, quando usado entre colchetes, significa caracteres que não estão em um intervalo. Por exemplo, [^Az] não corresponderá a nenhuma letra maiúscula ou minúscula. |
| $ | Um “$” corresponde ao final de uma string. Por exemplo, “[Az]$” corresponderá a uma letra maiúscula ou minúscula quando for encontrado no final da string. |
| \s | “\s” corresponde a qualquer caractere de espaço em branco. |
| \S | “\S” corresponde a qualquer caractere que não seja espaço em branco. |
| \d | “\d” corresponde a qualquer caractere de dígito. |
| \D | “\D” corresponde a qualquer caractere que não seja dígito. |
| \W | “\w” corresponde a qualquer letra, dígito ou sublinhado. |
| \C | “\W” corresponde a qualquer coisa que não seja uma letra, dígito ou sublinhado. |
Exemplos de aplicativos úteis para Regex em marketing digital:
Sapo gritando
No Screaming Frog podemos realizar extrações personalizadas usando Regex. As extrações personalizadas nos permitem extrair toneladas de informações úteis de um site.
Alguns exemplos de dados que podemos extrair incluem; Endereços de e-mail, IDs de rastreamento, marcação de esquema, títulos de página, URLs e muito mais. Se você puder pensar nisso, provavelmente poderá usar o Regex para encontrá-lo!
Na imagem abaixo podemos ver um exemplo de um Regex usado para encontrar endereços de e-mail. Isso pode ser útil, pois ter endereços de e-mail em texto simples em seu site pode ser uma vulnerabilidade de segurança e resultar na extração de endereços de e-mail.

- A etapa 1 mostra o início do grupo de captura
- A etapa 2 corresponde a todas as letras maiúsculas, minúsculas ou sublinhados
- A etapa 3 nos diz que estamos procurando 1 ou mais instâncias da etapa 2
- O passo 4 combina com o @
- A etapa 5 corresponde a todas as letras maiúsculas, minúsculas ou sublinhados
- A etapa 6 nos diz que estamos procurando 1 ou mais instâncias da etapa 5
- A etapa 7 corresponde a um ponto, devemos usar um \ para que correspondamos literalmente ao ponto, e não ao “.” função
- A etapa 8 corresponde a quaisquer letras maiúsculas, minúsculas, sublinhados ou pontos
- A etapa 9 nos diz que estamos procurando entre 2 e 5 ocorrências da etapa 8
- A etapa 10 mostra o fechamento do grupo de captura
Se fizermos uma extração personalizada de rã gritando usando o site do Codefixer e executarmos um rastreamento, poderemos ver qualquer um dos endereços de e-mail que aparecem no site.


Google Analytics
O Google Analytics nos permite usar o Regex para vários aplicativos, como; filtragem de visualizações, criação de metas, criação de públicos, agrupamento de conteúdo e agrupamento de canais.
No exemplo abaixo, podemos ver um exemplo de Regex usado no Google Analytics para filtrar para mostrar apenas visualizações de página para blog ou páginas de estudo de caso. É certo que isso é um pouco exagerado, você poderia usar apenas (blog|case), mas isso dá uma demonstração melhor de como funciona.

- A etapa 1 mostra o início do grupo de captura
- Passo 2 significa que este deve ser o início da string
- A etapa 3 corresponde a um “/”. Usamos o “\” antes da barra para corresponder exatamente com esse caractere literalmente
- O passo 4 corresponde à palavra “blog”
- A etapa 5 corresponde a qualquer caractere, exceto uma nova linha, uma ou mais vezes
- O passo 6 significa que precisamos combinar com algo antes ou depois da barra vertical
- Passo 7 significa que este deve ser o início da string
- A etapa 8 corresponde a um “/”. Usamos o “\” antes da barra para corresponder exatamente com esse caractere literalmente
- O passo 9 corresponde à palavra “caso”
- A etapa 10 corresponde a qualquer caractere, exceto uma nova linha, uma ou mais vezes
- A etapa 11 mostra o fechamento do grupo de captura
Quando filtramos nossa visualização do Google Analytics, agora podemos ver que estamos vendo apenas visualizações de página para nossas páginas que estão no blog ou nas subpastas de estudos de caso.

Gerenciador de tags do Google
No Google Tag Manager, podemos usar Regex para acionar eventos do Google Analytics quando um usuário conclui uma ação.
Uma coisa que podemos rastrear usando o Gerenciador de tags do Google são os usuários que clicam em um número de telefone no site.
Ocasionalmente, em um site, o rastreamento de eventos simples, como cliques em números de telefone, pode ser complicado pela formatação ou variações do número de telefone que aparece no site.
Isso complica o processo de criar uma tag no Gerenciador de tags do Google para acionar um evento quando um número de telefone é clicado por não estar em um formato consistente, o que significa que não podemos simplesmente definir esse acionador para disparar quando o URL de clique contém “tel: 02890 923383”.
Digamos que temos os links dos números de telefone do Codefixer no site em três formas diferentes;
- tel:02890923383
- tel:028 90 923383
- tel:(+44) 2890 923383
Podemos usar o seguinte Regex para combinar com todos os três números de telefone acima.

- A etapa 1 mostra o início do grupo sem captura “(?:”
- A etapa 2 corresponderá a "tel:"
- A etapa 3 abre o primeiro grupo de captura
- A etapa 4 corresponde a “028” no início dos números de telefone, quando aplicável
- Etapa 5 significa “ou”, para que possamos combinar com o primeiro ou o próximo conjunto de caracteres
- O passo 6 corresponde a “(+44)”. O “\” é para escapar dos caracteres especiais +, (, e )
- A etapa 7 fecha o grupo de captura
- A etapa 8 corresponde se houver zero ou um caractere de espaço em branco
- A etapa 9 corresponde a qualquer caractere entre 0-9
- A etapa 10 corresponde se houver zero ou um caractere de espaço em branco
- A etapa 11 corresponde a 1 ou mais etapas anteriores e, finalmente, fecha o grupo sem captura
Como aprender Regex:
Embora o guia acima forneça uma introdução, alguns exemplos e aplicações práticas para Regex, serei o primeiro a admitir que não sou um especialista, e ler uma postagem de blog provavelmente não fará de você um especialista em tudo repentino.
A principal maneira de melhorar o Regex é arregaçar as mangas e praticar suas habilidades regularmente.
Como parte do meu papel como líder de PPC no Codefixer, comecei a usar Regex regularmente para simplificar e automatizar tarefas simples e, com o passar do tempo, comecei a usá-lo em situações mais complexas ou complicadas que ajudaram a melhorar minha compreensão e usa para Regex.
Há uma tonelada de recursos gratuitos fantásticos online para aprender Regex. Os três principais sites que achei mais úteis são:
- https://regex101.com/ – Um site fantástico para construir, testar e depurar seu Regex. Normalmente, sempre tenho uma guia aberta no meu navegador com o Regex101 aberto. Este é um salva-vidas absoluto quando você simplesmente não consegue descobrir como fazer algo!
- https://regexone.com – Regexone é um site com exercícios fáceis de seguir e informativos e agradáveis para ajudá-lo a aprender e usar o Regex. As tarefas começam bastante fáceis, mas progridem rapidamente para se tornarem mais desafiadoras. Ideal para iniciantes.
- https://www.sitepoint.com/learn-regex/ – Este blog do Sitepoint explica o Regex em termos muito simples e fáceis de entender. Embora você provavelmente não precise disso todos os dias, sempre terá um lugar na minha barra de favoritos como um ótimo recurso para iniciantes.
