Close

Co je BigQuery

15. 2. 2024

Google BigQuery je rychlá a levná databáze od Googlu, která běží v rámci Google Cloud platform.

Logo Google BigQuery

A právě přítomnost v ekosystému Googlu je ideální pro její využití při práci s online marketingovými daty.

GA4 a BigQuery

Google Analytics 4 mají možnost si zdarma naměřená data do BigQuery přesouvat. Stačí si GA4 a BigQuery propojit. Funguje to tak, že GA4 vytvoří v BigQuery vždy za předchozí den tabulku s naměřenými daty. Existuje i druhý typ exportu pro přenos dat už v průběhu dne, ale ten je specifický.

Výhodou tohoto propojení je, že pak v BigQuery máš všechna naměřená data a můžeš nad nimi stavět reporty. Již tě tak nebude trápit omezená retence dat, thresholding či kardinalita reportů.

Nevýhodou ovšem je, že v BigQuery máš jen surová data. Takže i prosté zjištění zdroje návštěvy je potřeba si dopočítat. Též musíš řešit atribuční modelování či napojení dat z Google Ads. V exportu z GA4 totiž máme jen gclid parametry a nevidíme tak ani informaci o kampani z Google Ads, která návštěvu přivedla.

Z těchto důvodů tak práce s GA4 daty v BigQuery není nijak lepší či nadřazená práci s daty v rozhraní či Looker Studiu. Jde o další pohled na data, který má v některých případech opodstatnění a smysl, jindy je zbytečný.

Ukázka GA4 dat v BigQuery

K čemu využít BigQuery v online marketingu

Realita je taková, že většina malých a středních webů BigQuery vůbec nepotřebuje. U svých klientů se snažím vždy hledat nejlevnější a udržitelnou cestu a tak dost často stačí Google tabulky a pár skriptů.

Pokud už je ale dat velké množství a nebo je potřeba data složitěji přepočítávat a kombinovat s jinými datovými zdroji, pak už BigQuery či jiná databáze přijde vhod.

Nejčastěji tak Google BigQuery využívám v těchto případech:

GA4 vzorkují

Pokud do GA4 měříš velké množství interakcí či má web vysokou návštěvnost, začne rozhraní GA4 při vytváření některých typů reportů vzorkovat (samplovat). Ve výsledku tak reporty zjednodušeně řečeno netvoří nad všemi daty, ale jen nad jejich částí. A to je občas pro použitelnost reportu problém.

V tom případě je řešením nastavit si export GA4 dat do BigQuery a reporty pak stavět nad nimi.

Nedostupnost detailních dat v GA4 po 14 měsících

GA4 uchovávají detailní data o návštěvnosti pouze 14 měsíců. Říká se tomu retence dat. Po této době tak nelze dělat detailní analýzy v sekci průzkumy.

Neznamená to, že by z GA4 po 14 měsících data zmizela. Napočítané agregované přehledy tam zůstávají i dál, ale problém nastane, když se pak chceš podívat na něco, co v agregovaných tabulkách není.

Reportovací tabulky pro Looker Studio

V případě složitější práce s daty se často nasazuje tzv. ETL proces. Ten spočívá ve vytažení dat ze zdrojových systémů, jejich transformaci a následném uložení pro další zpracování či reportování.

Pro provoz ETL procesu se využívají nástroje jako Keboola či součásti Google Cloud Platform a BigQuery pak slouží jako jedna z možností, kam výsledná data levně uložit.

A výhodou BigQuery pak je, že se snadno napojí na Looker Studio, kde data vizualizuješ. Načítání Looker Studia je pak nad daty z BigQuery velmi rychlé a cenově rozumné.

Pokud o něco takového máš zájem, dej mi vědět.

Záloha a zpracování větších dat ze Search Console

Google Search Console je mocný nástroj pro SEO specialisty. Jeho rozhraní má ovšem své limity a tak je někdy efektivnější si data vytáhnout právě do BigQuery a nad nimi pak dělat analýzy či reporty vlastní.