Co znamenají uživatelé v Google Analytics
V přehledech Google Analytics 4 velmi brzo narazíš na metriku uživatelé.
Dle názvu by se dalo soudit, že jde o počet unikátních lidí, kteří web navštívili. Bohužel tomu tak ale není zcela přesně.
Jak GA4 uživatele poznávají
Identifikace jednotlivých uživatelů v GA4 může probíhat několika způsoby. To, který se použije, nastavuješ v sekci Identita pro přehledy.
Založené na zařízení
Nejprimitivnější metoda se jmenuje Založené na zařízení, což je trochu nešťastný překlad. Anglické Device-based je mnohem výstižnější a napovídá, že do každé zařízení, konkrétněji každý prohlížeč a ještě přesněji každá cookie, se považuje za jednoho uživatele.
Když přijdeš poprvé na web, tak Google Analytics uloží do prohlížeče malý soubor cookie s unikátním tzv. Client-ID. A při odeslání každé další události se nejprve podívá, zda je cookie již uložená a pokud ano, použije Client-ID z ní.
Tato cookie má životnost dva roky, takže když se na web vrátíš za tři týdny, stále tam je a GA opět odešlou tvé původní Client-ID. Díky tomu GA poznají, že jde o další návštěvu od tebe.
Jenže v zájmu ochrany soukromí některé prohlížeče tyto cokies promazávají. Smazat jej mohou i samotní uživatelé nebo nejdou uložit kvůli chybějícímu souhlasu v cookies liště.
Navíc cookies jsou mezi prohlížeči nepřenosné. Pokud tento článek navštívíš na počítači a zároveň si jej otevřeš v mobilu, uvidím to ve statistikách jako dva uživatele.
Pozorováno
O něco chytřejší metoda, která bere do úvahy cookies, ale ještě k nim přidává User ID a Google signály.
User ID je tvůj identifikátor uživatele, který Analytics prozradíš. Například když se ti uživatele na webu přihlásí a ty poznáš, že to je Jan Novák s tvým interním ID 1234, tak do Analytics pošleše user_id s hodnotou 1234. Když se pak Jan Novák přihlásí i na mobilu, opět pošleš toto ID. Díky tomu pak Google Analytics dokáží propojit chování na počítači i na mobilu do jednoho GA uživatele.
Nevýhodou tohoto řešení však je, že je potřeba uživatele nějak poznat, nejčastěji přihlášením. A pak je potřeba ještě user_id správně implementovat. S tím kdyžtak mohu pomoci.
Google signály fungují tak, že pokud Google dokáže nějak poznat, že návštěva pochází od jednoho člověka, tak jeho chování v GA datech propojí. Například pokud tento blog procházím na svém stolním počítači, kde jsem v Chromu přihlášen jako František Rajtmajer a pak si jej otevřu i na Android telefonu, kde jsem opět přihlášený jako František Rajtmajer, Google to o mně ví a moje chování propojí.
Díky této identitě pro přehledy se nám tak čísla o uživatelích zpřesňují. Nevýhodou ovšem je, že v některých případech v zájmu ochrany soukromí začne Google v Analytics některá data skrývat, říká se tomu thresholding.
Smíšené
Tato metoda přidává navíc ještě behaviorální modelování. Čili Google zapojí strojové učení a pokusí se dopočítat díry v datech, např. vlivem neuděleného souhlasu v cookies liště.
Díky tomu tak máme ještě více dat. Ovšem nevýhodou je, že je to blackbox, takže je otázkou, zda těmto datům věřit. A též zde platí omezení vlivem thresholdingu.
Jakou identitu pro přehledy vybrat
To není tak jednoznačné. Pro každý web a dokonce pro každou analýzu může být vhodnější něco jiného. Můj osobní přístup však je, že nechávávm výchozí hodnotu Smíšené a v případě potřeby se přepínám na Založené na zařízení.