Analytika, model událostí a reporting
Analytika není kód, ale datový model. Taxonomie událostí vzniká před implementací, číslo v reportu je vždy podhodnocené a nástroj zaměřený na soukromí není kompromis, ale jiná výměna.
Tým spustí web, zapne GA4 a pro jistotu i enhanced measurement, ať se „sbírá všechno". Za čtvrt roku má v účtu padesát vlastních událostí typu button_click_3, klik_hlavicka a udalost_2. Daty přetéká. A když přijde otázka „přivádí nám newsletter čtenáře, co se vracejí?", nikdo ji z těch dat nesestaví. Ne proto, že by chybělo měření. Proto, že nikdo předem neřekl, co je vlastně potřeba měřit.
To je nejčastější selhání analytiky a nemá technickou příčinu. Avinash Kaushik, který rozšířil plán měření jako rámec, pojmenoval kořen jasně. Za neúspěchem kampaní nestojí kreativa ani lidé, ale nedostatek strukturovaného přemýšlení o skutečném účelu kampaně. Analytika se chová jako kód, ale je to datový model. A datový model se navrhuje shora, ne sbírá zdola.
Tahle kapitola není návod, kam kliknout v GA4. Je o tom, jak rozhodnout, co měřit, proč je naměřené číslo systematicky nižší než realita, a kdy je rozumnější vyměnit GA4 za nástroj, který data nepřenáší přes Atlantik. Jednovětou definici pojmů jako událost, KPI nebo souhlas má společný slovník.
Plán měření: shora dolů, ne sledování zdola
Než někdo nasadí jedinou událost, existuje dokument, ze kterého teprve události plynou. Google doporučuje Kaushikův pětistupňový model a ten jde důsledně shora dolů.
Začíná u business objectives, tří až pěti, ne víc. Z nich vyplývají goals, digitální strategie, jak objective naplnit. Ke goals se navěsí KPIs, čísla, která pohyb k cíli ukazují. KPI dostane target, konkrétní hodnotu, proti které se měří. A celé se to láme na segmenty, protože průměr přes všechny návštěvníky nikdy neřekne, co se děje uvnitř.
Teprve na konci téhle řady se ptáš „jaká událost tohle KPI naplní?". Událost je poslední krok, ne první. Proto udalost_2 nikdy nedá odpověď, vznikla bez otázky.
Tenhle plán je zároveň zdroj výchozího stavu. První číslo, proti kterému pak provoz měří, vzniká v discovery jako momentka „odkud jsme vyšli". Plán měření je rámec, do kterého discovery tu momentku zasadí, a analytika ji pak provozuje dál.
GA4: čtyři druhy událostí a slovník, který drží taxonomii
GA4 stojí celé na událostech. Žádná zobrazení stránek jako samostatná entita, žádné samostatné návštěvy, všechno je událost s parametry. Události se dělí do čtyř skupin a rozdíl mezi nimi rozhoduje o tom, kolik práce a kolik chyb tě čeká.
Automaticky sbírané přijdou samy, nic nenastavuješ. Enhanced measurement se zapíná přepínačem ve streamu a přidá scroll, výstupní prokliky, vyhledávání na webu, video a stažení souborů. Jeden přepínač, a teče další várka dat. Recommended events jsou předdefinovaná jména s předepsanými parametry: login, sign_up, search, generate_lead, purchase, view_item. Google je sám neposílá, ale čeká je, a podle skupiny webu jich nabízí jiný balík: 14 pro každou property, 14 pro online prodej, 6 pro lead generation, 10 pro hry. Custom events jsou tvoje vlastní, když žádné recommended nesedí.
Recommended events mají jeden smysl. Google sám trvá na taxonomii před vlastní invencí. Místo udalost_klik chce generate_lead, protože předepsané jméno odemyká budoucí reporty a funkce. Když si vymyslíš vlastní, vyžaduje další kontext, aby dávalo smysl, a ten kontext nikdo nedodá. Pravidlo zní: nejdřív sáhni po recommended jménu, vlastní událost až když nic nesedí.
A protože jména a parametry jsou sdílený jazyk mezi marketingem a analytikou, patří do slovníku událostí a parametrů. Marketing vlastní vznik a pojmenování UTM, analytika jejich čtení a reporting, a aby se to potkalo, musí být konvence pojmenování UTM součástí téhož slovníku. Bez ní black-friday a Black-Friday vyrobí v reportu dva řádky.
Limity, na které se naráží potichu
GA4 má tvrdé stropy a nehlásí se, dokud nepřetečou. Na jednu událost jde 25 parametrů. Jméno události i parametru smí mít 40 znaků, hodnota parametru 100 (s výjimkami: page_title 300, page_referrer 420, page_location 1000). Property unese 25 user properties a 100 slotů na custom dimensions a metrics dohromady. Jeden uživatel smí za den vyslat 100 000 událostí.
Sto slotů zní jako dost, dokud je nezačneš pálit neuváženě. Pomáhá event-scoped custom dimension: jeden parametr nahlásíš napříč všemi událostmi z jednoho slotu, místo aby každá událost ujídala vlastní. Dřív se sloty rozhazovaly po jednom a docházely.
„Conversions" jsou teď „key events" a není to kosmetika
Do března 2024 GA4 i Google Ads mluvily o „conversions", jenže každý je počítal jinak. Stejné slovo, jiné číslo, a tým z toho hádal, které platí. Google to 27. března 2024 rozsekl přejmenováním. V GA4 se konverze jmenují key events a slovo „conversion" zůstalo jen Google Ads. Migrace proběhla sama, nic se nepřenastavovalo.
Po změně GA4 rozlišuje tři pojmy a stojí za to je nezaměnit. Event je jakákoli naměřená akce. Key event je událost, kterou jsi prohlásil za důležitou, protože naplňuje cíl z plánu měření. Conversion je metrika v Google Ads. Okrasná metrika jako počet zobrazení stránek není key event. Key event je odeslaný formulář, dokončené čtení, přihlášení k newsletteru, něco, co posouvá obchodní cíl.
Číslo, které vidíš, je vždycky podhodnocené
Teď ten obrat, který výchozí důvěru v GA4 obrátí naruby. Report neukazuje, kolik lidí na webu bylo. Ukazuje, kolik jsi jich směl změřit.
Mezi návštěvou a měřením stojí banner souhlasu. Při rovnocenných tlačítkách accept a reject odmítá cookies 50 až 70 % lidí. V Německu a Francii akceptuje méně než čtvrtina. Pro obsahový web s evropským publikem to znamená, že GA4 čísla jsou systematicky nižší a kanál „Direct/Unassigned" nafouknutý, protože odmítnutá návštěva se buď neměří vůbec, nebo se nedá přiřadit ke zdroji. Vrací se tím UTM problém z marketingu: část návštěvnosti zmizí z reportu ne kvůli značení, ale kvůli odmítnutému souhlasu.
Google na to má Consent Mode s modelováním chování: chování odmítnuvších dopočítá ML model. Jenže dopočítat není změřit, a model má práh. Potřebuje aspoň 1000 denních uživatelů s uděleným souhlasem ze sedmi z posledních 28 dní. Při 50% akceptaci to znamená kolem 2000 návštěv denně. Malý obsahový web ten práh nesplní, takže nedostane modelování, jen díru. A i nad prahem zůstává slepé místo, při 40% opt-outu může zůstat zhruba 12 % konverzí nepřiřazených nebo špatně přiřazených.
Z toho plyne jedno: GA4 číslo není pravda o provozu, je to spodní odhad. A pro malý web je ten odhad tím horší, čím evropštější je publikum.
Soukromější měření není kompromis, je to jiná výměna
Odbočka k alternativám se tu nedá obejít, vyrostla z předchozí sekce. Když odmítnutý souhlas požírá data a malý web z modelingu nic nedostane, nabízí se nástroj, který banner vůbec nepotřebuje.
Důvod není jen datový, je i právní. Rakouský úřad pro ochranu dat v lednu 2022 a francouzský CNIL v únoru 2022 shodně rozhodly, že použití Google Analytics porušuje GDPR: data tečou do USA, kde podléhají dohledu podle FISA 702, a Standard Contractual Clauses ani „supplementary measures" od Googlu to nezachrání. Vzešlo to ze 101 stížností NOYB po pádu Privacy Shield (Schrems II, červenec 2020) a stejná rozhodnutí padla v Itálii, Dánsku, Finsku, Norsku a Švédsku. Právní výklad téhle situace, včetně toho, co změnil EU-US Data Privacy Framework z roku 2023, vede právo, soukromí a souhlas. Pro analytiku stačí závěr. GA4 nese přenosové riziko a riziko souhlasu, které nástroj bez cookies odstraní.
Pak je tu výkon. Skript Plausible váží asi 2,5 KB gzip, GA4 kolem 135 KB, dvaapadesátkrát víc. S GTM a cookie bannerem překročí balík GA4 285 KB. Analytika bez cookies navíc banner nemusí nahrát vůbec, což je přímý zápočet pro Core Web Vitals: lehčí web, žádný blokující skript souhlasu.
Ale není to zadarmo, je to volba. Plausible je lehký, bez cookies, open-source, hostovaný v EU a bez banneru, jenže záměrně nepřebírá složitost modelu GA4. Jednodušší znamená míň funkcí, pro e-shop se složitým funnelem může být málo. Matomo je nejbližší náhrada GA4 funkce za funkci, dává plné vlastnictví dat, nesampluje a umí importovat historická GA data. Matomo hostované na vlastní infrastruktuře v režimu bez cookies a s anonymizací IP je z hlediska práva nejčistší volba. Žádná cookie neznamená žádný spouštěč souhlasu podle čl. 5(3) ePrivacy, žádné osobní údaje znamenají soulad s GDPR.
Měření bez cookies ale není automatický soulad. Matomo CNIL-exemption má tvrdé podmínky: účel jen měření návštěvnosti pro vydavatele, žádné křížení ani sdílení třetím stranám, anonymizace IP, životnost cookie max 13 měsíců, retenční doba max 25 měsíců. Spadne jediná podmínka a souhlas je zase povinný. Výměna tedy zní: GA4 dává hloubku za cenu rizika a ztráty dat, Plausible jednoduchost a soulad za cenu funkcí, Matomo vlastnictví a soulad za cenu vlastního provozu.
Reporting: přehled, který dovolí zeptat se „proč"
Měřicí plán, události a key events jsou na nic, když z nich nevznikne čtení, podle kterého se rozhoduje. A tady se láme rozdíl mezi reportem a dashboardem.
GA4 nabízí dvě roviny. Explorations jsou na hypotézy a hlubší rozbor, „proč nám v dubnu spadly leady?". Looker Studio je na průběžný monitoring a týmové dashboardy. Jeho výhoda je spojování zdrojů: GA4 události, útrata v Google Ads, imprese ze Search Console i CRM do jednoho pohledu. Search Console drží data 16 měsíců, GA4 ve výchozím nastavení jen 2 (lze zvednout na 14, a omezení se týká jen Explorations, ne standardních reportů), takže výchozí stavy mají různý horizont a dashboard je musí srovnat.
Použitelný dashboard nejen ukazuje čísla, ale dovolí rozkliknout diagnózu: výběry metrik a dimenzí, ne statické PDF. A nesmí se číst jako jeden průměr. Obsahový web potřebuje segmentaci podle typu stránky, protože článek, landing page a detail se chovají úplně jinak a průměr přes ně je lež. To předpokládá, že obsahový model typy stránek vůbec rozlišuje. Bez segmentace podle typu stránky dashboard ukazuje průměr, který neplatí nikde.
Organická data dashboard tahá ze Search Console, ze stejného zdroje jako SEO a Core Web Vitals. A když se web spouští nebo migruje, události a dashboardy se opatří poznámkou a procházejí kontrolou při přepnutí, což řeší spuštění a migrace. Poznámka u spuštění je to, co za půl roku vysvětlí skok v grafu.
Aparát se škáluje, otázka ne
„Plán měření, slovník událostí, segmentace, dashboard, to je aparát pro velkou firmu, my máme web a pět cílů." I web s pěti cíli potřebuje měřicí plán. Rozdíl je v objemu událostí, ne v nutnosti se ptát. Malý web nevyčerpá 100 000 událostí na uživatele a nedosáhne na behavioral modeling, ale otázka „měřím to, co rozhoduje, a věřím tomu číslu?" platí pro pět cílů stejně jako pro pět set. Co se neškáluje, je právě ta otázka, a na ni žádný přepínač v GA4 neodpoví za tebe.
Praktický checklist
- Existuje plán měření navázaný na cíle (objectives → goals → KPIs → targets → segments).
- Existuje slovník událostí a parametrů, sdílený s marketingem, včetně konvence pojmenování UTM.
- Události používají recommended jména, vlastní až když žádné nesedí.
- Key events jsou navázané na cíle, ne na okrasné metriky.
- Banner souhlasu se počítá jako zdroj ztráty dat, ne jako vyřešená položka.
- Reporting je segmentovaný podle typu stránky, ne jeden průměr.
- Dashboard dovolí rozkliknout diagnózu (Looker Studio), ne statické PDF.
- Spuštění dostane poznámku a události i dashboardy projdou kontrolou při přepnutí.
Typické chyby
- Měřit „všechno". Padesát událostí bez obchodního významu = reporty, podle kterých nelze rozhodovat.
- Vlastní jména místo recommended.
udalost_klik_2neodemkne žádný report;generate_leadano. - Brát GA4 číslo jako pravdu. Je to spodní odhad; 50–70 % odmítá cookies, DE/FR pod 25 % akceptuje.
- Spoléhat na behavioral modeling. Malý web nesplní práh 1000 uživatelů/den a nedostane nic.
- Reporting bez segmentace typů stránek. Průměr přes článek, landing page a detail neplatí nikde.
- Zaměňovat marketingové a produktové metriky. Zobrazení stránky není key event.
Zdroje
- Avinash Kaushik — Web Analytics 101: definice, goals, metrics, KPIs, targets (pětistupňový plán měření).
- Google Analytics Help — About events, Set up events, Enhanced measurement, Recommended events (čtyři druhy eventů, balíky po skupinách).
- GA4 developer guide — events (event-based model, recommended vs. custom).
- Google Analytics Help — GA4 limity (25 parametrů, 40/100 znaků, 25 user properties, 100 slotů, 100 000 eventů/den) a event-scoped custom dimensions.
- Google Analytics Help, Search Engine Land — přejmenování Conversions → Key events (27. 3. 2024, důvod a migrace).
- nicelookingdata, Momentic — GA4 data retention (default 2 měsíce, max 14, jen Explorations).
- WilmerHale, IAPP — rakouský DPA a CNIL: GA porušuje GDPR (čl. 44, FISA 702, Schrems II, 101 stížností NOYB).
- Secure Privacy, Plausible — ztráta dat z banneru souhlasu (50–70 % odmítá, DE/FR < 25 %).
- Google Analytics Help, Complianz — Consent Mode behavioral modeling (práh 1000/den ze 7 z 28 dní, slepé místo ~12 %).
- Plausible — vs. Google Analytics, vs. Matomo, script size (~2,5 KB vs. ~135 KB), lightweight analytics.
- Matomo — podmínky CNIL výjimky a konfigurace bez cookies a bez souhlasu.
- Coupler.io, Looker Studio templates — GA4 Explorations vs. Looker Studio dashboard, drill-down, spojování zdrojů.
Tahle kapitola je čtecí konec řetězu, který zbytek wiki rozehrává. Pojmy definuje slovník, výchozí stav a první měřicí plán vznikají v discovery. UTM tvoří a pojmenovává marketing a distribuce, analytika je čte; organická data sdílí se SEO a Core Web Vitals ze Search Console. Segmentace reportingu stojí na obsahovém modelu, konfigurace nástroje musí projít právem, soukromím a souhlasem a události se opatří poznámkou a testují při spuštění a migraci.