Utilisation de Regex (expressions régulières) dans le marketing numérique

Publié: 2021-11-30

Qu'est-ce qu'une expression régulière :

Une expression régulière, ou Regex en abrégé, est une chaîne de texte qui nous permet de gérer, de faire correspondre, de filtrer et d'extraire du texte.

Regex est particulièrement utile dans le marketing numérique où il est souvent nécessaire d'extraire des éléments spécifiques de données utiles à partir de grands ensembles de données.

L'extraction de ces données utiles peut être une tâche fastidieuse lorsqu'elle est effectuée manuellement, nécessitant souvent un temps considérable. Avec Regex, nous pouvons utiliser des formules pour simplifier et accélérer ces tâches.

Alors que Regex peut sembler intimidant ou intimidant au premier abord, ce blog devrait démontrer à quel point Regex peut être simple et aider à encourager d'autres spécialistes du marketing à commencer à éliminer et à automatiser les parties les plus ennuyeuses et les plus chronophages de l'analyse des données.

Jetons communs :

Une expression régulière se compose de jetons. Chacun de ces jetons correspond à un seul caractère ou à une série de caractères dans votre ensemble de données ou détermine la position dans laquelle un caractère doit se trouver. Nous pouvons voir quelques exemples des jetons les plus couramment utilisés dans le tableau ci-dessous.

Jeton Fonction
| Alternative, soit/ou. « A|B » correspond à la fois à « A » et à « B ».
. Correspond à n'importe quel caractère unique autre qu'une nouvelle ligne.
* Correspond à zéro ou plus de. Donc ".*" correspond à zéro ou plus de n'importe quel caractère autre qu'une nouvelle ligne.
+ Correspond à un ou plusieurs. Donc ".+" correspond à un ou plusieurs caractères autres qu'une nouvelle ligne.
? Correspond à zéro ou une fois. Alors ".?" correspond s'il y a zéro ou un caractère autre qu'une nouvelle ligne.
\ Correspond littéralement au caractère suivant. Alors "\." correspond uniquement à "." et aucun autre personnage.
(…) Les parenthèses arrondies indiquent un groupe de capture. Tout ce qui est entre parenthèses arrondies est capturé.
(?:…) Les parenthèses arrondies suivies d'un " ? :" indiquent un groupe de non-capture. Ceci est similaire à un groupe de capture mais le contenu n'est pas conservé.
{…} Les accolades déterminent le nombre d'instances du jeton précédent que vous souhaitez faire correspondre. Par exemple, « (a{1,3}) » correspondra entre 1 et 3 instances de la lettre « a ».
[…] Les crochets nous permettent de définir des plages ou différents caractères ou jetons à faire correspondre. Par exemple, "[Az]" correspond à n'importe quelle lettre majuscule ou minuscule.
^ Un « ^ » correspond au début d'une chaîne ou, lorsqu'il est utilisé à l'intérieur de crochets, signifie des caractères qui ne se trouvent pas dans une plage. Par exemple, [^Az] ne correspondra à aucune lettre minuscule ou majuscule.
$ Un "$" correspond à la fin d'une chaîne. Par exemple, "[Az]$" correspondra à une lettre majuscule ou minuscule lorsqu'il se trouve à la fin de la chaîne.
\s "\s" correspond à n'importe quel caractère d'espacement.
\S "\S" correspond à n'importe quel caractère autre qu'un espace.
\ré "\d" correspond à n'importe quel caractère numérique.
\RÉ "\D" correspond à n'importe quel caractère non numérique.
\w "\w" correspond à n'importe quelle lettre, chiffre ou trait de soulignement.
\W "\W" correspond à autre chose qu'une lettre, un chiffre ou un trait de soulignement.

Exemples d'applications utiles pour Regex dans le marketing numérique :

Grenouille hurlante

Dans Screaming Frog, nous pouvons effectuer des extractions personnalisées à l'aide de Regex. Les extractions personnalisées nous permettent d'extraire des tonnes d'informations utiles d'un site Web.

Voici quelques exemples de données que nous pouvons extraire ; Adresses e-mail, identifiants de suivi, balisage de schéma, titres de page, URL et bien plus encore. Si vous pouvez y penser, vous pouvez probablement utiliser Regex pour le trouver !

Dans l'image ci-dessous, nous pouvons voir un exemple de Regex utilisé pour trouver des adresses e-mail. Cela peut être utile, car le fait d'avoir des adresses e-mail en texte brut sur votre site Web peut constituer une faille de sécurité et entraîner le grattage des adresses e-mail.

Extraction personnalisée sur Screaming Frog à l'aide de Regex

  1. L'étape 1 montre le début du groupe de capture
  2. L'étape 2 correspond à toutes les lettres majuscules, minuscules ou traits de soulignement
  3. L'étape 3 nous indique que nous recherchons 1 ou plusieurs instances de l'étape 2
  4. L'étape 4 correspond au @
  5. L'étape 5 correspond à toutes les lettres majuscules, minuscules ou traits de soulignement
  6. L'étape 6 nous indique que nous recherchons 1 ou plusieurs instances de l'étape 5
  7. L'étape 7 correspond à un point, nous devons utiliser un \ donc nous faisons correspondre le point littéralement, et non le "." fonction
  8. L'étape 8 correspond à toutes les lettres majuscules, minuscules, traits de soulignement ou points
  9. L'étape 9 nous indique que nous recherchons entre 2 et 5 occurrences de l'étape 8
  10. L'étape 10 montre la fermeture du groupe de capture

Si nous effectuons une extraction personnalisée de la grenouille hurlante à l'aide du site Web Codefixer et exécutons une analyse, nous pouvons alors voir l'une des adresses e-mail qui apparaissent sur le site Web.

Extraction personnalisée de Screaming Frog

Google Analytics

Google Analytics nous permet d'utiliser Regex pour un certain nombre d'applications telles que ; filtrage des vues, création d'objectifs, création d'audiences, regroupement de contenu et regroupement de canaux.

Dans l'exemple ci-dessous, nous pouvons voir un exemple de Regex utilisé sur Google Analytics pour filtrer afin d'afficher uniquement les pages vues pour les pages de blog ou d'étude de cas. Certes, c'est un peu exagéré, vous pouvez simplement utiliser (blog|case), mais cela donne une meilleure démonstration de son fonctionnement.

Regex dans Google Analytics

  1. L'étape 1 montre le début du groupe de capture
  2. L'étape 2 signifie que cela doit être le début de la chaîne
  3. L'étape 3 correspond à un "/". Nous utilisons le "\" avant la barre oblique pour correspondre exactement à ce caractère littéralement
  4. L'étape 4 correspond au mot "blog"
  5. L'étape 5 correspond à n'importe quel caractère sauf une nouvelle ligne une ou plusieurs fois
  6. L'étape 6 signifie que nous devons faire correspondre quelque chose avant ou après la barre verticale
  7. L'étape 7 signifie que cela doit être le début de la chaîne
  8. L'étape 8 correspond à un "/". Nous utilisons le "\" avant la barre oblique pour correspondre exactement à ce caractère littéralement
  9. L'étape 9 correspond au mot "cas"
  10. L'étape 10 correspond à n'importe quel caractère sauf une nouvelle ligne une ou plusieurs fois
  11. L'étape 11 montre la fermeture du groupe de capture

Lorsque nous filtrons notre vue Google Analytics, nous pouvons maintenant voir que nous ne voyons que les pages vues pour nos pages qui se trouvent dans les sous-dossiers du blog ou des études de cas.

Gestionnaire de balises Google

Sur Google Tag Manager, nous pouvons utiliser Regex pour déclencher des événements Google Analytics lorsqu'un utilisateur effectue une action.

Une chose que nous pouvons suivre à l'aide de Google Tag Manager est que les utilisateurs cliquent sur un numéro de téléphone sur le site Web.

Parfois, sur un site Web, le suivi d'événements simples tels que les clics sur un numéro de téléphone peut être compliqué par le formatage ou les variations du numéro de téléphone apparaissant sur le site Web.

Cela complique le processus de création d'une balise dans Google Tag Manager pour déclencher un événement lorsqu'un numéro de téléphone est cliqué car il n'est pas dans un format cohérent, ce qui signifie que nous ne pouvons pas simplement configurer ce déclencheur pour qu'il se déclenche lorsque l'URL de clic contient "tél:02890 923383".

Disons que nous avons les liens des numéros de téléphone Codefixer sur le site Web sous trois formes différentes ;

  • tél:02890923383
  • tél:028 90 923383
  • tél. :(+44) 2890 923383

Nous pouvons utiliser la Regex suivante pour correspondre aux trois numéros de téléphone ci-dessus.

utiliser Regex dans Google Tag Manager

  1. L'étape 1 montre le début du groupe de non-capture "(?:"
  2. L'étape 2 correspondra à "tel :"
  3. L'étape 3 ouvre le premier groupe de capture
  4. L'étape 4 correspond à "028" au début des numéros de téléphone, le cas échéant
  5. L'étape 5 signifie "ou", nous pouvons donc faire correspondre le premier ou le prochain ensemble de caractères
  6. L'étape 6 correspond à "(+44)". Le "\" sert à échapper les caractères spéciaux +, (, et )
  7. L'étape 7 ferme le groupe de capture
  8. L'étape 8 correspond s'il y a zéro ou un caractère d'espacement
  9. L'étape 9 correspond à n'importe quel caractère entre 0 et 9
  10. L'étape 10 correspond s'il y a zéro ou un caractère d'espacement
  11. L'étape 11 correspond à 1 ou plusieurs des étapes précédentes et ferme finalement le groupe de non-capture

Comment apprendre Regex :

Alors que le guide ci-dessus fournit une introduction, quelques exemples et des applications pratiques pour Regex, je serai le premier à admettre que je ne suis en aucun cas un expert, et la lecture d'un article de blog ne fera probablement pas de vous un expert de tous un soudain.

Le principal moyen d'améliorer Regex est de retrousser vos manches et de pratiquer vos compétences régulièrement.

Dans le cadre de mon rôle de responsable PPC dans Codefixer, j'ai commencé à utiliser régulièrement Regex pour simplifier et automatiser des tâches simples, et au fil du temps, j'ai commencé à l'utiliser dans des situations plus complexes ou compliquées qui m'ont aidé à améliorer ma compréhension. et utilise pour Regex.

Il existe une tonne de ressources gratuites fantastiques en ligne pour apprendre Regex. Les trois principaux sites Web que j'ai trouvés les plus utiles sont :

  • https://regex101.com/ – Un site Web fantastique pour créer, tester et déboguer votre Regex. J'ai généralement toujours un onglet ouvert sur mon navigateur avec Regex101 ouvert. C'est une bouée de sauvetage absolue lorsque vous ne savez tout simplement pas comment faire quelque chose!
  • https://regexone.com - Regexone est un site Web proposant des exercices faciles à suivre, informatifs et agréables pour vous aider à apprendre et à utiliser Regex. Les tâches commencent assez facilement, mais progressent rapidement pour devenir plus difficiles. Idéal pour les débutants.
  • https://www.sitepoint.com/learn-regex/ – Ce blog Sitepoint explique Regex en termes très simples et faciles à comprendre. Bien que vous n'en ayez probablement pas besoin tous les jours, il aura toujours une place dans ma barre de favoris comme une excellente ressource pour les débutants.