Verwendung von Regex (reguläre Ausdrücke) im digitalen Marketing

Veröffentlicht: 2021-11-30

Was ist ein regulärer Ausdruck:

Ein regulärer Ausdruck, oder kurz Regex, ist eine Textfolge, mit der wir Text verwalten, abgleichen, filtern und extrahieren können.

Regex ist besonders nützlich im digitalen Marketing, wo es oft notwendig ist, bestimmte Teile nützlicher Daten aus großen Datensätzen zu extrahieren.

Das Extrahieren dieser nützlichen Daten kann eine mühselige Aufgabe sein, wenn sie manuell durchgeführt wird und oft viel Zeit in Anspruch nimmt. Mit Regex können wir Formeln verwenden, um diese Aufgaben zu vereinfachen und zu beschleunigen.

Während Regex auf den ersten Blick entmutigend oder einschüchternd wirken kann, soll dieser Blog zeigen, wie einfach Regex sein kann, und dazu beitragen, andere Vermarkter zu ermutigen, damit zu beginnen, die langweiligsten und zeitaufwändigsten Teile der Datenanalyse zu eliminieren und zu automatisieren.

Gemeinsame Token:

Ein regulärer Ausdruck besteht aus Tokens. Jeder dieser Token entspricht einem einzelnen Zeichen oder einer Reihe von Zeichen innerhalb Ihres Datensatzes oder bestimmt die Position, an der sich ein Zeichen befinden muss. Wir können einige Beispiele der am häufigsten verwendeten Token in der folgenden Tabelle sehen.

Zeichen Funktion
| Alternativ entweder/oder. „A|B“ stimmt sowohl mit „A“ als auch mit „B“ überein.
. Stimmt mit jedem einzelnen Zeichen außer einem Zeilenumbruch überein.
* Entspricht null oder mehr als. „.*“ stimmt also mit null oder mehr Zeichen außer Zeilenumbrüchen überein.
+ Entspricht einem oder mehreren als. „.+“ passt also zu einem oder mehreren beliebigen Zeichen außer einem Zeilenumbruch.
? Stimmt null oder einmal überein. So ".?" stimmt überein, wenn es null oder eins eines anderen Zeichens als eines Zeilenumbruchs gibt.
\ Stimmt buchstäblich mit dem folgenden Zeichen überein. So "\." Übereinstimmungen mit nur „.“ und keine anderen Charaktere.
(…) Abgerundete Klammern kennzeichnen eine Erfassungsgruppe. Alles innerhalb der runden Klammern wird erfasst.
(?:…) Abgerundete Klammern gefolgt von einem „?:“ kennzeichnen eine Non-Capture-Gruppe. Dies ähnelt einer Erfassungsgruppe, der Inhalt wird jedoch nicht beibehalten.
{…} Geschweifte Klammern bestimmen, wie viele Instanzen des vorherigen Token Sie abgleichen möchten. Beispiel: „(a{1,3})“ stimmt mit 1 bis 3 Vorkommen des Buchstabens „a“ überein.
[…] Mit eckigen Klammern können wir Bereiche oder verschiedene Zeichen oder Token definieren, die abgeglichen werden sollen. Beispielsweise entspricht „[Az]“ jedem Groß- oder Kleinbuchstaben.
^ Ein „^“ steht für den Beginn einer Zeichenfolge oder, wenn es in eckigen Klammern verwendet wird, für Zeichen, die sich nicht in einem Bereich befinden. Beispielsweise stimmt [^Az] nicht mit Klein- oder Großbuchstaben überein.
$ Ein „$“ entspricht dem Ende einer Zeichenfolge. Beispielsweise wird „[Az]$“ mit einem Groß- oder Kleinbuchstaben übereinstimmen, wenn er am Ende der Zeichenfolge gefunden wird.
\s „\s“ stimmt mit jedem Leerzeichen überein.
\S „\S“ stimmt mit jedem Nicht-Leerzeichen überein.
\d „\d“ stimmt mit jedem Ziffernzeichen überein.
\D „\D“ stimmt mit jedem Nicht-Ziffernzeichen überein.
\w „\w“ stimmt mit allen Buchstaben, Ziffern oder Unterstrichen überein.
\W „\W“ passt auf alles andere als einen Buchstaben, eine Ziffer oder einen Unterstrich.

Beispiele für nützliche Anwendungen für Regex im digitalen Marketing:

Schreiender Frosch

In Screaming Frog können wir benutzerdefinierte Extraktionen mit Regex durchführen. Benutzerdefinierte Extraktionen ermöglichen es uns, Tonnen von nützlichen Informationen von einer Website zu extrahieren.

Einige Beispiele für Daten, die wir extrahieren können, sind: E-Mail-Adressen, Tracking-IDs, Schema-Markup, Seitentitel, URLs und jede Menge mehr. Wenn Sie es sich vorstellen können, können Sie wahrscheinlich Regex verwenden, um es zu finden!

In der Abbildung unten sehen wir ein Beispiel für eine Regex, die zum Auffinden von E-Mail-Adressen verwendet wird. Dies kann nützlich sein, da E-Mail-Adressen im Klartext auf Ihrer Website eine Sicherheitslücke darstellen und dazu führen können, dass E-Mail-Adressen gelöscht werden.

Benutzerdefinierte Extraktion auf Screaming Frog mit Regex

  1. Schritt 1 zeigt den Beginn der Erfassungsgruppe
  2. Schritt 2 gleicht alle Großbuchstaben, Kleinbuchstaben oder Unterstriche ab
  3. Schritt 3 teilt uns mit, dass wir nach 1 oder mehreren Instanzen von Schritt 2 suchen
  4. Schritt 4 entspricht dem @
  5. Schritt 5 gleicht alle Großbuchstaben, Kleinbuchstaben oder Unterstriche ab
  6. Schritt 6 teilt uns mit, dass wir nach 1 oder mehreren Instanzen von Schritt 5 suchen
  7. Schritt 7 stimmt mit einem Punkt überein, wir müssen ein \ verwenden, damit wir wörtlich mit dem Punkt übereinstimmen, und nicht mit dem „.“ Funktion
  8. Schritt 8 entspricht allen Großbuchstaben, Kleinbuchstaben, Unterstrichen oder Punkten
  9. Schritt 9 sagt uns, dass wir nach 2 bis 5 Vorkommen von Schritt 8 suchen
  10. Schritt 10 zeigt das Schließen der Erfassungsgruppe

Wenn wir mithilfe der Codefixer-Website eine benutzerdefinierte Extraktion von Screaming Frog durchführen und einen Crawl ausführen, können wir alle E-Mail-Adressen sehen, die auf der Website erscheinen.

Screaming Frog Benutzerdefinierte Extraktion

Google Analytics

Google Analytics ermöglicht es uns, Regex für eine Reihe von Anwendungen zu verwenden, wie z. Filtern von Ansichten, Erstellen von Zielen, Erstellen von Zielgruppen, Gruppieren von Inhalten und Gruppieren von Kanälen.

Im folgenden Beispiel sehen wir ein Beispiel für Regex, der in Google Analytics verwendet wird, um zu filtern, um nur Seitenaufrufe für entweder Blog- oder Fallstudienseiten anzuzeigen. Zugegeben, das ist ein bisschen übertrieben, Sie könnten einfach (blog|case) verwenden, aber das gibt eine bessere Demonstration, wie es funktioniert.

Regex in Google Analytics

  1. Schritt 1 zeigt den Beginn der Erfassungsgruppe
  2. Schritt 2 bedeutet, dass dies der Anfang der Zeichenfolge sein muss
  3. Schritt 3 stimmt mit einem „/“ überein. Wir verwenden das „\“ vor dem Schrägstrich, um buchstäblich mit genau diesem Zeichen übereinzustimmen
  4. Schritt 4 stimmt mit dem Wort „Blog“ überein
  5. Schritt 5 stimmt mit jedem Zeichen außer einer neuen Zeile ein- oder mehrmals überein
  6. Schritt 6 bedeutet, dass wir mit etwas vor oder nach dem vertikalen Balken übereinstimmen müssen
  7. Schritt 7 bedeutet, dass dies der Anfang der Zeichenfolge sein muss
  8. Schritt 8 stimmt mit einem „/“ überein. Wir verwenden das „\“ vor dem Schrägstrich, um buchstäblich mit genau diesem Zeichen übereinzustimmen
  9. Schritt 9 stimmt mit dem Wort „Fall“ überein
  10. Schritt 10 stimmt mit jedem Zeichen außer einer neuen Zeile ein- oder mehrmals überein
  11. Schritt 11 zeigt das Schließen der Erfassungsgruppe

Wenn wir unsere Google Analytics-Ansicht filtern, können wir jetzt sehen, dass wir nur Seitenaufrufe für unsere Seiten sehen, die sich in den Unterordnern „Blog“ oder „Fallstudien“ befinden.

Google Tag-Manager

Auf Google Tag Manager können wir Regex verwenden, um Google Analytics-Ereignisse auszulösen, wenn ein Benutzer eine Aktion abschließt.

Eine Sache, die wir mit Google Tag Manager verfolgen können, ist, dass Benutzer auf eine Telefonnummer auf der Website klicken.

Gelegentlich kann auf einer Website die Verfolgung einfacher Ereignisse wie Klicks auf Telefonnummern durch Formatierung oder Variationen der auf der Website angezeigten Telefonnummer erschwert werden.

Dies erschwert die Erstellung eines Tags in Google Tag Manager, um ein Ereignis auszulösen, wenn auf eine Telefonnummer geklickt wird, da diese kein einheitliches Format hat. Das bedeutet, dass wir diesen Trigger nicht einfach so einstellen können, dass er ausgelöst wird, wenn die Klick-URL enthält „Tel.: 02890 923383“.

Nehmen wir an, wir haben die Codefixer-Telefonnummern-Links auf der Website in drei verschiedenen Formen;

  • Tel: 02890923383
  • Tel: 028 90 923383
  • Tel: (+44) 2890 923383

Wir können die folgende Regex verwenden, um sie mit allen drei oben genannten Telefonnummern abzugleichen.

Verwenden von Regex im Google Tag Manager

  1. Schritt 1 zeigt den Anfang der Non-Capture-Gruppe „(?:“
  2. Schritt 2 wird mit „tel:“ übereinstimmen.
  3. Schritt 3 öffnet die erste Erfassungsgruppe
  4. Schritt 4 stimmt mit „028“ am Anfang der Telefonnummern überein, wo dies zutrifft
  5. Schritt 5 bedeutet „oder“, sodass wir mit dem ersten oder dem nächsten Zeichensatz übereinstimmen können
  6. Schritt 6 stimmt mit „(+44)“ überein. Das „\“ dient als Escapezeichen für die Sonderzeichen +, (, und )
  7. Schritt 7 schließt die Erfassungsgruppe
  8. Schritt 8 stimmt überein, wenn kein oder ein Leerzeichen vorhanden ist
  9. Schritt 9 stimmt mit jedem Zeichen zwischen 0-9 überein
  10. Schritt 10 stimmt überein, wenn kein oder ein Leerzeichen vorhanden ist
  11. Schritt 11 stimmt mit einem oder mehreren der vorherigen Schritte überein und schließt schließlich die Nichterfassungsgruppe

So lernen Sie Regex:

Während der obige Leitfaden eine Einführung, einige Beispiele und praktische Anwendungen für Regex bietet, möchte ich als erster zugeben, dass ich keineswegs ein Experte bin, und das Lesen eines Blogbeitrags wird Sie wahrscheinlich nicht zu einem Experten machen plötzlich.

Der wichtigste Weg, um Regex zu verbessern, besteht darin, die Ärmel hochzukrempeln und Ihre Fähigkeiten regelmäßig zu üben.

Als Teil meiner Rolle als PPC-Leiter bei Codefixer habe ich begonnen, Regex regelmäßig zu verwenden, um einfache Aufgaben zu vereinfachen und zu automatisieren, und im Laufe der Zeit habe ich begonnen, es in komplexeren oder komplizierteren Situationen zu verwenden, die mir geholfen haben, mein Verständnis zu verbessern und verwendet für Regex.

Es gibt eine Menge fantastischer kostenloser Online-Ressourcen zum Erlernen von Regex. Die drei wichtigsten Websites, die ich am nützlichsten fand, sind:

  • https://regex101.com/ – Eine fantastische Website zum Erstellen, Testen und Debuggen Ihrer Regex. Ich habe normalerweise immer einen Tab in meinem Browser mit geöffnetem Regex101 geöffnet. Dies ist ein absoluter Lebensretter, wenn Sie einfach nicht genau wissen, wie Sie etwas tun sollen!
  • https://regexone.com – Regexone ist eine Website mit leicht verständlichen und informativen, unterhaltsamen Übungen, die Ihnen beim Erlernen und Verwenden von Regex helfen. Die Aufgaben beginnen recht einfach, werden aber schnell anspruchsvoller. Ideal für Anfänger.
  • https://www.sitepoint.com/learn-regex/ – Dieser Sitepoint-Blog erklärt Regex in sehr einfachen und leicht verständlichen Begriffen. Obwohl Sie dies wahrscheinlich nicht jeden Tag brauchen werden, wird es immer einen Platz in meiner Lesezeichenleiste als großartige Ressource für Anfänger haben.