Utilizarea Regex (Expresii regulate) în marketingul digital

Publicat: 2021-11-30

Ce este o expresie regulată:

O expresie regulată, sau pe scurt Regex, este un șir de text care ne permite să gestionăm, să potrivim, să filtram și să extragem text.

Regex este deosebit de utilă în marketingul digital, unde este adesea necesar să extragi anumite date utile din seturi mari de date.

Extragerea acestor date utile poate fi o sarcină greoaie atunci când este finalizată manual, necesitând adesea timp semnificativ. Cu Regex, putem folosi formule pentru a simplifica și accelera aceste sarcini.

În timp ce Regex poate părea descurajantă sau intimidantă la început, acest blog ar trebui să demonstreze cât de simplu poate fi Regex și să încurajeze alți agenți de marketing să înceapă eliminarea și automatizarea celor mai plictisitoare și consumatoare de timp ale analizei datelor.

Jetoane comune:

O expresie regulată constă din jetoane. Fiecare dintre aceste simboluri se potrivește cu un singur caracter sau cu o serie de caractere din setul dvs. de date sau determină poziția în care trebuie să fie un personaj. Putem vedea câteva exemple de jetoane cele mai frecvent utilizate în tabelul de mai jos.

Jeton Funcţie
| Alternativ, fie/sau. „A|B” se potrivește atât cu „A”, cât și cu „B”.
. Se potrivește cu orice caracter, altul decât o nouă linie.
* Se potrivește cu zero sau mai mult decât. Prin urmare, „.*” se potrivește cu zero sau mai multe caractere, altele decât o nouă linie.
+ Se potrivește cu unul sau mai multe decât. Așadar, „.+” se potrivește cu unul sau mai multe caractere, altele decât o nouă linie.
? Se potrivește zero sau o dată. Asa de ".?" se potrivește dacă există zero sau unul din orice alt caracter decât o nouă linie.
\ Se potrivește literalmente cu următorul caracter. Asa de "\." se potrivește doar cu „.” și fără alte personaje.
(...) Parantezele rotunjite indică un grup de captură. Tot ceea ce este cuprins între parantezele rotunjite este capturat.
(?:…) Parantezele rotunjite urmate de un „?:” indică un grup care nu este capturat. Acesta este similar cu un grup de captură, dar conținutul nu este reținut.
{…} Parantezele determină câte apariții ale simbolului anterior ai dori să se potrivească. De exemplu, „(a{1,3})” se va potrivi între 1 și 3 cazuri ale literei „a”.
[…] Parantezele pătrate ne permit să definim intervale sau diferite caractere sau jetoane care să fie potrivite. De exemplu, „[Az]” corespunde oricărei litere mari sau mici.
^ Un „^” se potrivește cu începutul unui șir sau, atunci când este folosit între paranteze drepte, înseamnă caractere care nu se află într-un interval. De exemplu, [^Az] nu se va potrivi cu nicio literă mică sau majuscule.
$ Un „$” se potrivește cu sfârșitul unui șir. De exemplu, „[Az]$” se va potrivi cu o literă mare sau minusculă atunci când se găsește la sfârșitul șirului.
\s „\s” se potrivește cu orice caracter de spațiu alb.
\S „\S” se potrivește cu orice caracter care nu are spațiu alb.
\d „\d” se potrivește cu orice caracter cifră.
\D „\D” se potrivește cu orice caracter fără cifre.
\w „\w” se potrivește cu orice literă, cifră sau liniuță de subliniere.
\W „\W” se potrivește cu orice altceva decât o literă, cifră sau liniuță de subliniere.

Exemple de aplicații utile pentru Regex în marketing digital:

Broasca care tipa

În Screaming Frog putem efectua extrageri personalizate folosind Regex. Extracțiile personalizate ne permit să extragem tone de informații utile de pe un site web.

Câteva exemple de date pe care le putem extrage includ; Adrese de e-mail, ID-uri de urmărire, Schema Markup, Titluri pagini, URL-uri și multe altele. Dacă vă puteți gândi la asta, probabil că puteți utiliza Regex pentru a-l găsi!

În imaginea de mai jos putem vedea un exemplu de Regex folosită pentru a găsi adrese de e-mail. Acest lucru poate fi util, deoarece a avea adrese de e-mail în text simplu pe site-ul dvs. poate fi o vulnerabilitate de securitate și poate duce la eliminarea adreselor de e-mail.

Extragere personalizată pe Screaming Frog folosind Regex

  1. Pasul 1 arată începutul grupului de captură
  2. Pasul 2 corespunde oricăror litere mari, litere mici sau litere de subliniere
  3. Pasul 3 ne spune că căutăm 1 sau mai multe instanțe ale pasului 2
  4. Pasul 4 se potrivește cu @
  5. Pasul 5 corespunde oricăror litere mari, minuscule sau litere de subliniere
  6. Pasul 6 ne spune că căutăm 1 sau mai multe instanțe ale pasului 5
  7. Pasul 7 se potrivește cu un punct, trebuie să folosim un \, astfel încât să potrivim cu punctul literal, și nu cu „.” funcţie
  8. Pasul 8 se potrivește cu orice litere mari, litere mici, litere de subliniere sau puncte
  9. Pasul 9 ne spune că căutăm între 2 și 5 apariții ale pasului 8
  10. Pasul 10 arată închiderea grupului de captură

Dacă facem o extragere personalizată a broaștei care țipă folosind site-ul Codefixer și rulăm o crawlere, atunci putem vedea oricare dintre adresele de e-mail care apar pe site.

Screaming Frog Extracție personalizată

Google Analytics

Google Analytics ne permite să folosim Regex pentru o serie de aplicații, cum ar fi; filtrarea vizualizărilor, crearea de obiective, crearea de segmente de public, gruparea conținutului și gruparea canalelor.

În exemplul de mai jos, putem vedea un exemplu de regex utilizat pe Google Analytics pentru a filtra pentru a afișa numai afișările de pagină pentru blog sau pagini de studiu de caz. Desigur, acest lucru este puțin exagerat, ați putea folosi doar (blog|caz), dar aceasta oferă o demonstrație mai bună a modului în care funcționează.

Regex în Google Analytics

  1. Pasul 1 arată începutul grupului de captură
  2. Pasul 2 înseamnă că acesta trebuie să fie începutul șirului
  3. Pasul 3 se potrivește cu „/”. Folosim „\” înainte de bară oblică pentru a se potrivi cu exact acel caracter
  4. Pasul 4 se potrivește cu cuvântul „blog”
  5. Pasul 5 se potrivește cu orice caracter, cu excepția unei linii noi de o dată sau de mai multe ori
  6. Pasul 6 înseamnă că trebuie să ne potrivim cu ceva înainte sau după bara verticală
  7. Pasul 7 înseamnă că acesta trebuie să fie începutul șirului
  8. Pasul 8 se potrivește cu „/”. Folosim „\” înainte de bară oblică pentru a se potrivi cu exact acel caracter
  9. Pasul 9 se potrivește cu cuvântul „caz”
  10. Pasul 10 se potrivește cu orice caracter, cu excepția unei linii noi, de una sau de mai multe ori
  11. Pasul 11 ​​arată închiderea grupului de captură

Când ne filtram vizualizarea Google Analytics, acum putem vedea că vedem numai vizualizări de pagină pentru paginile noastre care se află în subdosarele blog sau studii de caz.

Manager de etichete Google

Pe Google Tag Manager putem folosi Regex pentru a declanșa evenimente Google Analytics atunci când un utilizator finalizează o acțiune.

Un lucru pe care îl putem urmări folosind Google Tag Manager este ca utilizatorii să facă clic pe un număr de telefon de pe site.

Ocazional, pe un site web, urmărirea evenimentelor simple, cum ar fi clicurile pe numărul de telefon, poate fi complicată prin formatarea sau variațiile numărului de telefon care apar pe site.

Acest lucru complică procesul de a putea crea o etichetă în Google Tag Manager pentru a declanșa un eveniment atunci când se face clic pe un număr de telefon, deoarece nu este într-un format consecvent, ceea ce înseamnă că nu putem seta pur și simplu acest declanșator să se declanșeze atunci când adresa URL de clic conține „tel:02890 923383”.

Să presupunem că avem link-urile la numărul de telefon Codefixer pe site în trei forme diferite;

  • tel:02890923383
  • tel:028 90 923383
  • tel:(+44) 2890 923383

Putem folosi următoarele Regex pentru a se potrivi cu toate cele trei numere de telefon de mai sus.

folosind Regex în Google Tag Manager

  1. Pasul 1 arată începutul grupului de non-captură „(?:”
  2. Pasul 2 se va potrivi cu „tel:”
  3. Pasul 3 deschide primul grup de captură
  4. Pasul 4 se potrivește cu „028” la începutul numerelor de telefon unde este aplicabil
  5. Pasul 5 înseamnă „sau”, așa că ne putem potrivi cu primul sau următorul set de caractere
  6. Pasul 6 se potrivește cu „(+44)”. „\” este pentru a scăpa de caracterele speciale +, ( și )
  7. Pasul 7 închide grupul de captură
  8. Pasul 8 se potrivește dacă există zero sau un caracter de spațiu alb
  9. Pasul 9 se potrivește cu orice caracter între 0-9
  10. Pasul 10 se potrivește dacă există zero sau un caracter de spațiu alb
  11. Pasul 11 ​​se potrivește cu 1 sau mai mulți pași anteriori și în sfârșit închide grupul de non-captură

Cum să înveți Regex:

În timp ce ghidul de mai sus oferă o introducere, câteva exemple și aplicații practice pentru Regex, voi fi primul care să recunosc că nu sunt deloc un expert și că citirea unei postări pe blog probabil că nu te va face un expert în toate aspectele. subit.

Principala modalitate de a îmbunătăți regex este să-ți sufleci mânecile și să-ți exersezi abilitățile în mod regulat.

Ca parte a rolului meu de PPC Lead în Codefixer, am început să folosesc Regex în mod regulat pentru a simplifica și automatiza sarcini simple și, pe măsură ce timpul a progresat, am început să-l folosesc în situații mai complexe sau mai complicate, ceea ce mi-a ajutat la îmbunătățirea înțelegerii. și utilizări pentru Regex.

Există o mulțime de resurse fantastice gratuite online pentru a învăța Regex. Principalele trei site-uri web pe care le-am găsit cele mai utile sunt:

  • https://regex101.com/ – Un site web fantastic pentru construirea, testarea și depanarea Regex. De obicei, am întotdeauna o filă deschisă în browser cu Regex101 deschis. Acesta este o salvare absolută atunci când pur și simplu nu vă puteți da seama cum să faceți ceva!
  • https://regexone.com – Regexone este un site web cu exerciții ușor de urmărit și informative, plăcute, care vă ajută să învățați și să utilizați Regex. Sarcinile încep destul de ușor, dar progresează rapid pentru a deveni mai provocatoare. Ideal pentru incepatori.
  • https://www.sitepoint.com/learn-regex/ – Acest blog Sitepoint explică Regex în termeni foarte simpli și ușor de înțeles. Deși probabil că nu veți avea nevoie de acest lucru în fiecare zi, va avea întotdeauna un loc în bara mea de marcaje ca o resursă excelentă pentru începători.