Combinarea Google Analytics și Shopify: crearea unui depozit de date de comerț electronic în BigQuery

Publicat: 2023-02-15

Google Analytics este un instrument excelent care vă permite să înțelegeți comportamentul utilizatorilor celor care vă vizitează site-ul. În timp ce, Shopify este fantastic în a oferi o acoperire detaliată a performanței din perspectiva comerțului electronic. Ambele sunt grozave în ceea ce fac, dar vine un moment în care datele de la Shopify și Google Analytics (GA) izolate nu reușesc să ofere informațiile mai profunde pe care le-ați putea dori. În timp ce fiecare are capacitatea de a furniza informații puternice, există un nivel mult mai mare de perspectivă care poate fi obținut prin combinarea datelor.

În acest exemplu special, vom prezenta cum am realizat acest lucru pentru prietenii noștri de la Pooch & Mutt, o companie din Marea Britanie care produce hrană naturală și sănătoasă pentru câini. Am vrut să îmbunătățim statisticile prin luarea datelor colectate în Google Analytics și folosindu-le împreună cu datele de comerț electronic de la Shopify, precum și datele abonamentului de la Recharge și alăturându-le cu datele vechi de abonament de la Bold. Folosind această varietate de surse de date, am putea construi o imagine mai bogată și mai completă.

Acest blog va încerca să ofere o imagine de ansamblu asupra modului în care cumulăm aceste date și apoi să sublinieze procesele de gândire din spatele combinării acestora pentru a extrage și a vizualiza aceste perspective bazate pe date. Mai exact, vom explica cum am procedat pentru a răspunde la următoarele trei întrebări;

  1. Ce canale generează înscrieri la abonament?
  2. Combinații de coșuri dincolo de GA; care sunt cele mai populare coșuri pentru abonați și neabonați și care sunt cele mai profitabile?
  3. Cât timp și câte achiziții durează în medie până când un utilizator devine abonat?

Metodologie

Înainte de a răspunde la aceste întrebări, să discutăm mai întâi cum am colectat toate datele de pe platformele lor respective într-o locație centralizată și am construit un tabel pe care l-am putea folosi pentru a aduna aceste date.

Structură de date

Am ales să folosim BigQuery (BQ) pentru a centraliza datele datorită versatilității și capacității sale de a gestiona combinația de seturi de date. Diagrama de mai jos evidențiază conexiunile generale dintre date și modul în care acest lucru a fost realizat:

coase

Stitch este un instrument accesibil care vă permite să extrageți și să încărcați date în depozite de date pre-construite.

Ne-am conectat cu ușurință la Shopify și Recharge prin Stitch, unde am selectat pur și simplu tabelele pe care le doream. În acest caz, cele mai importante tabele sunt „clienți” și „abonamente” de la Recharge și „comenzi” de la Shopify.

Aceste informații sunt apoi sincronizate cu BQ la fiecare 6 ore prin procesul de programare automată Stitch.

Îndrăzneţ

Pentru datele istorice despre abonați, am efectuat un export final și l-am încărcat în BQ prin Foi de calcul Google.

Google Analytics

În timp ce Stitch poate fi folosit și pentru aceasta, am optat să folosim RStudio pentru a introduce aceste date în BQ. Dacă sunteți interesat să aflați mai multe despre cum puteți face acest lucru, puteți citi un blog al propriului nostru expert R Studio, Danny Smith, despre cum să utilizați GA API cu R.

Construirea unei mese principale

Odată ce am avut toate datele necesare în BQ, am putea începe să le combinăm. Pașii pe care i-am luat pentru a face acest lucru sunt următorii:

  1. Am combinat și aliniat datele vechi ale abonaților de la Bold cu datele actuale ale abonaților de la Recharge.
  2. Apoi am extras datele de comerț electronic din GA care includ ID-uri de comandă (de exemplu, SPFYXXXXXX), împreună cu sursa, mediul și canalul.
  3. Am creat coloane noi pe baza tabelelor de date GA și a abonaților sindicalizați înainte de a ne alătura datelor despre comenzile Shopify. În acest caz, unele dintre aceste coloane suplimentare au inclus;
    1. Identificatorul de abonat „activ”.
    2. Data inițială a abonamentului
    3. Sursa, mijlocul și canalul comenzii
    4. Prima sau repetați comanda clientului
  4. Apoi, am selectat câmpurile relevante din datele comenzii Shopify cărora am dorit să le asociem la aceste date noi. Câteva exemple cheie sunt;
    1. Număr de înregistrare client
    2. Comanda ID
    3. Data comandă
    4. SKU
    5. Cantitatea articolului
    6. Pretul articolului
    7. Prețul total al comenzii
    8. Cod de reducere
    9. Suma de reducere
    10. Etichetă (folosită ca metodă suplimentară pentru a clasifica abonații față de neabonați)
  5. Etapa finală aici a fost crearea altor câteva coloane suplimentare pentru a trata mai ușor rândurile duplicate pentru diferite articole în aceeași ordine;
    1. Avgitemprice
    2. Reducere medie
    3. Starea abonatului (etichete + dacă sunt prezente în tabelul Bold & Recharge)

Apoi am programat această interogare să ruleze o dată pe zi și am folosit rezultatul ca tabel principal pentru interogări suplimentare. Acest lucru a însemnat că nu a trebuit să rulăm interogarea completă de mai multe ori, deoarece este un tabel static care se actualizează numai atunci când este programat, mai degrabă decât de fiecare dată când se face o solicitare prin tabloul de bord Looker Studio.

Perspective

Acum că am acoperit metodologia și am subliniat pașii luați pentru a obține toate datele de care avem nevoie, putem trece la discutarea modului în care am folosit aceste date pentru a răspunde întrebărilor noastre.

Ce canale generează înscrieri la abonament?

  1. Pentru a calcula acest lucru, ne-am uitat la primele comenzi plasate de clienți, folosind câmpul pe care l-am creat în tabelul principal care returnează fie „Primul” fie „Repetare” în funcție de data primei comenzi.
  2. Folosind coloanele suplimentare privind gruparea canalelor și starea abonaților din tabelul principal, putem analiza primele comenzi de persoane care au devenit abonați, fie la prima achiziție, fie la achiziție repetată, și canalului căruia i-au fost atribuite în Google Analytics. .
  3. Înlăturând pasul de a ne uita doar la abonați, am putut vedea și ce canale generează în mod predominant primele achiziții.

Combinații de coșuri dincolo de GA; care sunt cele mai populare coșuri pentru abonați și neabonați și care sunt cele mai profitabile?

  1. Folosind funcția STRING_AGG, am putut combina diferitele produse din comenzi unice într-un singur rând, separate prin „ | '. Acest lucru creează în esență un coș pentru fiecare comandă.
  2. Împreună cu aceste informații, am însumat veniturile pentru fiecare dintre aceste articole ca „Total coș”, cu scopul de a avea un rând pe comandă cu toate informațiile relevante.
  3. Desigur, există o mulțime de variații între produse (aromă, dimensiune, etc.), așa că am adăugat o coloană care a eliminat această variație pentru a analiza combinațiile de coș de produse de bază.
  4. Apoi am folosit „ROW_NUMBER() OVER (PARTITION BY Transaction_ID) AS Identifier” pentru a atribui valori secvențiale fiecărei comenzi. Acesta a fost apoi folosit ca filtru în tabloul de bord pentru a izola rândurile individuale care încă mai conțineau toate informațiile.

Cât timp și câte achiziții durează în medie până când un utilizator devine abonat?

  1. Folosind tabelul nostru principal, am extras toate ID-urile clienților despre care știam că au fost abonați și am luat data primului lor abonament.
  2. Apoi am luat data minimă a comenzii și am folosit funcția DATE_DIFF pentru a calcula diferența dintre aceste date în „zile”.
  3. Ultimul pas a inclus canalul și numărul mediu de zile înainte de a se abona, ceea ce a rezultat într-un tabel care arată numărul mediu de zile înainte ca clienții să devină de obicei abonați.
  4. Pentru a calcula numărul mediu de comenzi plasate de clienți înainte de a deveni abonați, am împărțit pur și simplu numărul de ID-uri unice de comandă la numărul de ID-uri unice de client în cazul în care aceștia erau „Abonați” și aveau date de comandă mai mici decât data minimă a abonamentului.

Acestea sunt doar câteva exemple la nivel de suprafață ale vizualizărilor pe care le-am generat folosind aceste rapoarte. Cu datele, există posibilități nesfârșite – alte exemple din acest proiect includ analizarea valorii pe durata de viață a clienților din diferite perspective și evaluarea utilizării codurilor de reducere și a impactului acestora pe parcursul vieții clienților. Cu aceste informații, ele pot fi folosite pentru a completa deciziile de afaceri. De exemplu, știind că sunt necesare în medie 3 comenzi înainte de a deveni abonat, puteți căuta să distribuiți oferte și stimulente care încurajează clienții să devină abonați după 2 achiziții. Rezultatele acestui lucru pot fi măsurate ulterior.

rezumat

Acest studiu de caz demonstrează potențialul pentru informații incredibil de valoroase bazate pe date care pot fi obținute prin combinarea mai multor surse de date, de la GA la Shopify și nu numai. Odată ce această infrastructură este creată, poate fi întreținută dinamic și utilizată pentru a raporta numeroase aspecte diferite ale afacerii.

Dacă întrebările la care am răspuns în acest blog sunt similare cu cele care v-ar putea interesa pentru propria afacere, ne puteți contacta completând formularul nostru de contact.