Uso de expresiones regulares (regex) en marketing digital

Publicado: 2021-11-30

¿Qué es una expresión regular?

Una expresión regular, o Regex para abreviar, es una cadena de texto que nos permite administrar, unir, filtrar y extraer texto.

Regex es particularmente útil en marketing digital, donde a menudo es necesario extraer piezas específicas de datos útiles de grandes conjuntos de datos.

La extracción de estos datos útiles puede ser una tarea engorrosa cuando se completa manualmente, lo que a menudo requiere mucho tiempo. Con Regex, podemos usar fórmulas para simplificar y acelerar estas tareas.

Si bien Regex puede parecer desalentador o intimidante al principio, este blog debe demostrar cuán simple puede ser Regex y ayudar a alentar a otros especialistas en marketing a comenzar a eliminar y automatizar las partes más aburridas y que consumen más tiempo del análisis de datos.

Fichas comunes:

Una expresión regular consta de tokens. Cada uno de estos tokens coincide con un solo carácter o serie de caracteres dentro de su conjunto de datos o determina la posición en la que debe estar un carácter. Podemos ver algunos ejemplos de los tokens más utilizados en la siguiente tabla.

Simbólico Función
| Alternativo, o/o. "A|B" coincide con "A" y "B".
. Coincide con cualquier carácter único que no sea una nueva línea.
* Coincide con cero o más que. Entonces, ".*" coincide con cero o más de cualquier carácter que no sea una nueva línea.
+ Coincide con uno o más de. Entonces, ".+" coincide con uno o más de cualquier carácter que no sea una nueva línea.
? Coincide con cero o una vez. Asi que ".?" coincide si hay cero o uno de cualquier carácter que no sea una nueva línea.
\ Coincide con el siguiente carácter literalmente. Asi que "\." coincide solo con "." y ningún otro personaje.
(…) Los corchetes redondeados indican un grupo de captura. Se captura todo lo que está dentro de los corchetes redondeados.
(?:…) Los corchetes redondeados seguidos de un “?:” denotan un grupo sin captura. Esto es similar a un grupo de captura, pero el contenido no se conserva.
{…} Los corchetes determinan cuántas instancias del token anterior le gustaría hacer coincidir. Por ejemplo, "(a{1,3})" coincidirá entre 1 y 3 instancias de la letra "a".
[…] Los corchetes nos permiten definir rangos o diferentes caracteres o tokens para hacer coincidir. Por ejemplo, “[Az]” coincide con cualquier letra mayúscula o minúscula.
^ Un “^” coincide con el comienzo de una cadena, o cuando se usa dentro de corchetes significa caracteres que no están en un rango. Por ejemplo, [^Az] no coincidirá con ninguna letra minúscula o mayúscula.
ps Un “$” coincide con el final de una cadena. Por ejemplo, “[Az]$” coincidirá con una letra mayúscula o minúscula cuando se encuentre al final de la cadena.
\s “\s” coincide con cualquier carácter de espacio en blanco.
\S "\S" coincide con cualquier carácter que no sea un espacio en blanco.
\d “\d” coincide con cualquier carácter de dígito.
\D “\D” coincide con cualquier carácter que no sea un dígito.
\w “\w” coincide con cualquier letra, dígito o guión bajo.
\W "\W" coincide con cualquier cosa que no sea una letra, un dígito o un guión bajo.

Ejemplos de aplicaciones útiles para Regex en marketing digital:

Rana Gritando

En Screaming Frog podemos realizar extracciones personalizadas usando Regex. Las extracciones personalizadas nos permiten extraer toneladas de información útil de un sitio web.

Algunos ejemplos de datos que podemos extraer incluyen; Direcciones de correo electrónico, ID de seguimiento, Marcado de esquema, Títulos de página, URL y mucho más. Si se te ocurre, ¡probablemente puedas usar Regex para encontrarlo!

En la imagen a continuación, podemos ver un ejemplo de Regex utilizado para encontrar direcciones de correo electrónico. Esto puede ser útil, ya que tener direcciones de correo electrónico en texto sin formato en su sitio web puede ser una vulnerabilidad de seguridad y provocar que se raspen las direcciones de correo electrónico.

Extracción personalizada en Screaming Frog usando Regex

  1. El paso 1 muestra el comienzo del grupo de captura.
  2. El paso 2 coincide con letras mayúsculas, minúsculas o guiones bajos
  3. El paso 3 nos dice que estamos buscando 1 o más instancias del paso 2
  4. El paso 4 coincide con la @
  5. El paso 5 coincide con letras mayúsculas, minúsculas o guiones bajos
  6. El paso 6 nos dice que estamos buscando 1 o más instancias del paso 5
  7. El paso 7 coincide con un punto, debemos usar \ para que coincida con el punto literalmente, y no con el "." función
  8. El paso 8 coincide con letras mayúsculas, minúsculas, guiones bajos o puntos
  9. El paso 9 nos dice que estamos buscando entre 2 y 5 ocurrencias del paso 8
  10. El paso 10 muestra el cierre del grupo de captura.

Si hacemos una extracción personalizada de la rana que grita usando el sitio web de Codefixer y ejecutamos un rastreo, podemos ver cualquiera de las direcciones de correo electrónico que aparecen en el sitio web.

Extracción personalizada de Screaming Frog

Google analitico

Google Analytics nos permite usar Regex para una serie de aplicaciones como; filtrado de vistas, creación de objetivos, creación de audiencias, agrupación de contenido y agrupación de canales.

En el siguiente ejemplo, podemos ver un ejemplo de Regex utilizado en Google Analytics para filtrar y mostrar solo páginas vistas para blogs o páginas de estudios de casos. Es cierto que esto es un poco exagerado, podría usar (blog|case), pero esto brinda una mejor demostración de cómo funciona.

Regex en Google Analytics

  1. El paso 1 muestra el comienzo del grupo de captura.
  2. El paso 2 significa que este debe ser el comienzo de la cadena.
  3. El paso 3 coincide con un “/”. Usamos el "\" antes de la barra inclinada para que coincida exactamente con ese carácter literalmente
  4. El paso 4 coincide con la palabra “blog”
  5. El paso 5 coincide con cualquier carácter excepto una nueva línea una o más veces
  6. El paso 6 significa que debemos hacer coincidir algo antes o después de la barra vertical.
  7. El paso 7 significa que este debe ser el comienzo de la cadena.
  8. El paso 8 coincide con un “/”. Usamos el "\" antes de la barra inclinada para que coincida exactamente con ese carácter literalmente
  9. El paso 9 coincide con la palabra "caso"
  10. El paso 10 coincide con cualquier carácter excepto una nueva línea una o más veces
  11. El paso 11 muestra el cierre del grupo de captura.

Cuando filtramos nuestra vista de Google Analytics, ahora podemos ver que solo estamos viendo páginas vistas para nuestras páginas que están en las subcarpetas de blog o estudios de casos.

Administrador de etiquetas de Google

En Google Tag Manager, podemos usar Regex para activar eventos de Google Analytics cuando un usuario completa una acción.

Una cosa que podemos rastrear usando Google Tag Manager es que los usuarios hacen clic en un número de teléfono en el sitio web.

Ocasionalmente, en un sitio web, el seguimiento de eventos simples, como clics en números de teléfono, puede complicarse por el formato o las variaciones del número de teléfono que aparece en el sitio web.

Esto complica el proceso de poder crear una etiqueta en Google Tag Manager para activar un evento cuando se hace clic en un número de teléfono debido a que no tiene un formato coherente, lo que significa que no podemos simplemente configurar este activador para que se active cuando la URL de clic contiene “tel:02890 923383”.

Digamos que tenemos los enlaces de números de teléfono de Codefixer en el sitio web en tres formas diferentes;

  • teléfono:02890923383
  • teléfono:028 90 923383
  • tel:(+44) 2890 923383

Podemos usar el siguiente Regex para que coincida con los tres números de teléfono anteriores.

usando Regex en Google Tag Manager

  1. El paso 1 muestra el comienzo del grupo de no captura "(?:"
  2. El paso 2 coincidirá con "tel:"
  3. El paso 3 abre el primer grupo de captura
  4. El paso 4 coincide con "028" al comienzo de los números de teléfono donde esto es aplicable
  5. El paso 5 significa "o", por lo que podemos hacer coincidir con el primer o el siguiente conjunto de caracteres
  6. El paso 6 coincide con “(+44)”. El “\” es para escapar de los caracteres especiales +, (, y )
  7. El paso 7 cierra el grupo de captura.
  8. El paso 8 coincide si hay cero o un carácter de espacio en blanco
  9. El paso 9 coincide con cualquier carácter entre 0-9
  10. El paso 10 coincide si hay cero o un carácter de espacio en blanco
  11. El paso 11 coincide con 1 o más de los pasos anteriores y finalmente cierra el grupo de no captura

Cómo aprender expresiones regulares:

Si bien la guía anterior proporciona una introducción, algunos ejemplos y aplicaciones prácticas para Regex, seré el primero en admitir que de ninguna manera soy un experto, y leer una publicación de blog probablemente no lo convierta en un experto. un repentino

La forma principal de mejorar Regex es arremangarse y practicar sus habilidades regularmente.

Como parte de mi función como líder de PPC en Codefixer, comencé a usar Regex regularmente para simplificar y automatizar tareas simples y, a medida que avanzaba el tiempo, comencé a usarlo en situaciones más complejas o complicadas que me ayudaron a mejorar mi comprensión. y usos para Regex.

Hay un montón de fantásticos recursos gratuitos en línea para aprender Regex. Los tres principales sitios web que he encontrado más útiles son:

  • https://regex101.com/ : un sitio web fantástico para crear, probar y depurar su Regex. Por lo general, siempre tengo una pestaña abierta en mi navegador con Regex101 abierto. ¡Este es un salvavidas absoluto cuando simplemente no puedes entender cómo hacer algo!
  • https://regexone.com : Regexone es un sitio web con ejercicios divertidos, informativos y fáciles de seguir para ayudarlo a aprender y usar Regex. Las tareas comienzan con bastante facilidad, pero progresan rápidamente para volverse más desafiantes. Ideal para principiantes.
  • https://www.sitepoint.com/learn-regex/ : este blog de Sitepoint explica Regex en términos muy simples y fáciles de entender. Si bien es probable que no necesites esto todos los días, siempre tendrá un lugar en mi barra de marcadores como un gran recurso para principiantes.