Utilizzo di Regex (espressioni regolari) nel marketing digitale

Pubblicato: 2021-11-30

Che cos'è un'espressione regolare:

Un'espressione regolare, o Regex in breve, è una stringa di testo che ci consente di gestire, abbinare, filtrare ed estrarre il testo.

Regex è particolarmente utile nel marketing digitale, dove spesso è necessario estrarre dati utili specifici da grandi set di dati.

L'estrazione di questi dati utili può essere un'attività ingombrante se completata manualmente, che spesso richiede molto tempo. Con Regex, possiamo utilizzare le formule per semplificare e accelerare queste attività.

Sebbene all'inizio Regex possa sembrare scoraggiante o intimidatorio, questo blog dovrebbe dimostrare quanto possa essere semplice Regex e aiutare a incoraggiare altri esperti di marketing a iniziare a eliminare e automatizzare le parti più noiose e dispendiose in termini di tempo dell'analisi dei dati.

Token comuni:

Un'espressione regolare è costituita da token. Ciascuno di questi token corrisponde a un singolo carattere o serie di caratteri all'interno del tuo set di dati o determina la posizione in cui deve trovarsi un personaggio. Possiamo vedere alcuni esempi dei token più comunemente usati nella tabella seguente.

Gettone Funzione
| Alternativo, o/o. “A|B” corrisponde sia con “A” che con “B”.
. Corrisponde a qualsiasi singolo carattere diverso da una nuova riga.
* Corrisponde a zero o più di. Quindi ".*" corrisponde a zero o più di qualsiasi carattere diverso da una nuova riga.
+ Corrisponde a uno o più di. Quindi ".+" corrisponde a uno o più caratteri diversi da una nuova riga.
? Corrisponde a zero o una volta. Così ".?" corrisponde se sono presenti zero o uno di qualsiasi carattere diverso da una nuova riga.
\ Corrisponde letteralmente al seguente carattere. Così "\." corrisponde con solo "." e nessun altro personaggio.
(…) Le parentesi arrotondate indicano un gruppo di acquisizione. Tutto all'interno delle parentesi arrotondate viene catturato.
(?:…) Le parentesi arrotondate seguite da un "?:" indicano un gruppo non di acquisizione. È simile a un gruppo di acquisizione ma il contenuto non viene mantenuto.
{…} Le parentesi graffe determinano quante istanze del token precedente desideri abbinare. Ad esempio, "(a{1,3})" corrisponderà tra 1 e 3 istanze della lettera "a".
[…] Le parentesi quadre ci consentono di definire intervalli o diversi caratteri o token da abbinare. Ad esempio, "[Az]" corrisponde a qualsiasi lettera maiuscola o minuscola.
^ Un "^" corrisponde all'inizio di una stringa o, se utilizzato all'interno di parentesi quadre, indica caratteri non compresi in un intervallo. Ad esempio [^Az] non corrisponderà a lettere minuscole o maiuscole.
$ Un "$" corrisponde alla fine di una stringa. Ad esempio, "[Az]$" corrisponderà a una lettera maiuscola o minuscola quando si trova alla fine della stringa.
\S "\s" corrisponde a qualsiasi carattere di spazio vuoto.
\S "\S" corrisponde a qualsiasi carattere diverso da spazi bianchi.
\d "\d" corrisponde a qualsiasi carattere di cifra.
\D "\D" corrisponde a qualsiasi carattere diverso da una cifra.
\w "\w" corrisponde a qualsiasi lettera, cifra o carattere di sottolineatura.
\W "\W" corrisponde a qualsiasi cosa diversa da una lettera, una cifra o un trattino basso.

Esempi di applicazioni utili per Regex nel marketing digitale:

Rana urlante

In Screaming Frog possiamo eseguire estrazioni personalizzate usando Regex. Le estrazioni personalizzate ci consentono di estrarre tonnellate di informazioni utili da un sito web.

Alcuni esempi di dati che possiamo estrarre includono; Indirizzi e-mail, ID di monitoraggio, markup dello schema, titoli di pagina, URL e molto altro. Se riesci a pensarci, probabilmente puoi usare Regex per trovarlo!

Nell'immagine qui sotto possiamo vedere un esempio di una Regex utilizzata per trovare indirizzi email. Questo può essere utile, poiché avere indirizzi e-mail in testo normale sul tuo sito Web può essere una vulnerabilità di sicurezza e causare lo scraping degli indirizzi e-mail.

Estrazione personalizzata su Screaming Frog usando Regex

  1. Il passaggio 1 mostra l'inizio del gruppo di acquisizione
  2. Il passaggio 2 corrisponde a tutte le lettere maiuscole, minuscole o trattini bassi
  3. Il passaggio 3 ci dice che stiamo cercando 1 o più istanze del passaggio 2
  4. Il passaggio 4 corrisponde a @
  5. Il passaggio 5 corrisponde a tutte le lettere maiuscole, minuscole o trattini bassi
  6. Il passaggio 6 ci dice che stiamo cercando 1 o più istanze del passaggio 5
  7. Il passaggio 7 corrisponde a un punto, dobbiamo usare un \ quindi abbiniamo il punto letteralmente e non il "." funzione
  8. Il passaggio 8 corrisponde a lettere maiuscole, minuscole, trattini bassi o punti
  9. Il passaggio 9 ci dice che stiamo cercando tra 2 e 5 occorrenze del passaggio 8
  10. Il passaggio 10 mostra la chiusura del gruppo di acquisizione

Se eseguiamo un'estrazione personalizzata della rana urlante utilizzando il sito Web Codefixer ed eseguiamo una scansione, possiamo vedere tutti gli indirizzi e-mail che appaiono sul sito Web.

Estrazione personalizzata della rana urlante

statistiche di Google

Google Analytics ci consente di utilizzare Regex per una serie di applicazioni come; filtrare le visualizzazioni, creare obiettivi, creare segmenti di pubblico, raggruppare i contenuti e raggruppare i canali.

Nell'esempio seguente possiamo vedere un esempio di Regex utilizzato su Google Analytics per filtrare per mostrare solo le visualizzazioni di pagina per blog o pagine di case study. Certo questo è un po' eccessivo, potresti semplicemente usare (blog|case), ma questo dà una migliore dimostrazione di come funziona.

Regex in Google Analytics

  1. Il passaggio 1 mostra l'inizio del gruppo di acquisizione
  2. Il passaggio 2 significa che questo deve essere l'inizio della stringa
  3. Il passaggio 3 corrisponde a "/". Usiamo il "\" prima della barra per abbinare esattamente quel carattere letteralmente
  4. Il passaggio 4 corrisponde alla parola "blog"
  5. Il passaggio 5 corrisponde a qualsiasi carattere tranne una nuova riga una o più volte
  6. Il passaggio 6 significa che dobbiamo abbinare qualcosa prima o dopo la barra verticale
  7. Il passaggio 7 significa che questo deve essere l'inizio della stringa
  8. Il passaggio 8 corrisponde a "/". Usiamo il "\" prima della barra per abbinare esattamente quel carattere letteralmente
  9. Il passaggio 9 corrisponde alla parola "caso"
  10. Il passaggio 10 corrisponde a qualsiasi carattere tranne una nuova riga una o più volte
  11. Il passaggio 11 mostra la chiusura del gruppo di acquisizione

Quando filtriamo la nostra visualizzazione di Google Analytics, ora possiamo vedere che stiamo vedendo solo le visualizzazioni di pagina per le nostre pagine che si trovano nel blog o nelle sottocartelle dei case study.

Google Tag Manager

Su Google Tag Manager possiamo utilizzare Regex per attivare gli eventi di Google Analytics quando un utente completa un'azione.

Una cosa che possiamo tracciare utilizzando Google Tag Manager è che gli utenti fanno clic su un numero di telefono sul sito web.

Occasionalmente, su un sito Web, il monitoraggio di eventi semplici come i clic sui numeri di telefono può essere complicato dalla formattazione o dalle variazioni del numero di telefono che appare sul sito Web.

Ciò complica il processo di creazione di un tag in Google Tag Manager per attivare un evento quando si fa clic su un numero di telefono perché non è in un formato coerente, il che significa che non possiamo semplicemente impostare questo attivatore in modo che si attivi quando l'URL del clic contiene “tel:02890 923383”.

Supponiamo di avere i collegamenti ai numeri di telefono di Codefixer sul sito Web in tre diverse forme;

  • tel:02890923383
  • tel:028 90 923383
  • tel:(+44) 2890 923383

Possiamo usare la seguente espressione regolare per abbinare tutti e tre i numeri di telefono sopra.

utilizzando Regex in Google Tag Manager

  1. Il passaggio 1 mostra l'inizio del gruppo non di acquisizione "(?:"
  2. Il passaggio 2 corrisponderà a "tel:"
  3. Il passaggio 3 apre il primo gruppo di acquisizione
  4. Il passaggio 4 corrisponde a "028" all'inizio dei numeri di telefono, ove applicabile
  5. Il passaggio 5 significa "o", quindi possiamo abbinare il primo o il successivo set di caratteri
  6. Il passaggio 6 corrisponde a "(+44)". Il "\" serve per evitare i caratteri speciali +, ( e )
  7. Il passaggio 7 chiude il gruppo di acquisizione
  8. Il passaggio 8 corrisponde se sono presenti zero o uno spazio vuoto
  9. Il passaggio 9 corrisponde a qualsiasi carattere compreso tra 0 e 9
  10. Il passaggio 10 corrisponde se sono presenti zero o uno spazio vuoto
  11. Il passaggio 11 corrisponde a 1 o più dei passaggi precedenti e alla fine chiude il gruppo di non acquisizione

Come imparare l'espressione regolare:

Sebbene la guida sopra fornisca un'introduzione, alcuni esempi e applicazioni pratiche per Regex, sarò il primo ad ammettere che non sono affatto un esperto e che leggere un post sul blog probabilmente non ti renderà un esperto di un improvviso.

Il modo principale per ottenere una Regex migliore è rimboccarsi le maniche e praticare regolarmente le proprie abilità.

Come parte del mio ruolo di PPC Lead in Codefixer, ho iniziato a usare Regex regolarmente per semplificare e automatizzare compiti semplici e, con il passare del tempo, ho iniziato a usarlo in situazioni più complesse o complicate che hanno contribuito a migliorare la mia comprensione e utilizza per Regex.

Ci sono un sacco di fantastiche risorse gratuite online per l'apprendimento di Regex. I tre principali siti web che ho trovato più utili sono:

  • https://regex101.com/ – Un fantastico sito Web per la creazione, il test e il debug di Regex. Di solito ho sempre una scheda aperta sul mio browser con Regex101 aperto. Questo è un vero toccasana quando non riesci proprio a capire come fare qualcosa!
  • https://regexone.com – Regexone è un sito Web con esercizi facili da seguire, informativi e divertenti per aiutarti a imparare e utilizzare Regex. Le attività iniziano abbastanza facilmente, ma progrediscono rapidamente per diventare più impegnative. Ideale per i principianti.
  • https://www.sitepoint.com/learn-regex/ – Questo blog di Sitepoint spiega Regex in termini molto semplici e di facile comprensione. Anche se probabilmente non ne avrai bisogno tutti i giorni, avrà sempre un posto nella mia barra dei segnalibri come un'ottima risorsa per i principianti.