Znalostní wiki OKF
rust / analytika
Kapitola

Analytika, model událostí a reporting

Analytika není kód, ale datový model. Taxonomie událostí vzniká před implementací, číslo v reportu je vždy podhodnocené a nástroj zaměřený na soukromí není kompromis, ale jiná výměna.

rustanalytikaplán měřeníGA4model událostíkey eventsMatomoPlausiblesouhlasdashboardyNaposledy aktualizováno 14. června 2026

Tým spustí web, zapne GA4 a pro jistotu i enhanced measurement, ať se „sbírá všechno". Za čtvrt roku má v účtu padesát vlastních událostí typu button_click_3, klik_hlavicka a udalost_2. Daty přetéká. A když přijde otázka „přivádí nám newsletter čtenáře, co se vracejí?", nikdo ji z těch dat nesestaví. Ne proto, že by chybělo měření. Proto, že nikdo předem neřekl, co je vlastně potřeba měřit.

To je nejčastější selhání analytiky a nemá technickou příčinu. Avinash Kaushik, který rozšířil plán měření jako rámec, pojmenoval kořen jasně. Za neúspěchem kampaní nestojí kreativa ani lidé, ale nedostatek strukturovaného přemýšlení o skutečném účelu kampaně. Analytika se chová jako kód, ale je to datový model. A datový model se navrhuje shora, ne sbírá zdola.

Tahle kapitola není návod, kam kliknout v GA4. Je o tom, jak rozhodnout, co měřit, proč je naměřené číslo systematicky nižší než realita, a kdy je rozumnější vyměnit GA4 za nástroj, který data nepřenáší přes Atlantik. Jednovětou definici pojmů jako událost, KPI nebo souhlas má společný slovník.

Plán měření: shora dolů, ne sledování zdola

Než někdo nasadí jedinou událost, existuje dokument, ze kterého teprve události plynou. Google doporučuje Kaushikův pětistupňový model a ten jde důsledně shora dolů.

Začíná u business objectives, tří až pěti, ne víc. Z nich vyplývají goals, digitální strategie, jak objective naplnit. Ke goals se navěsí KPIs, čísla, která pohyb k cíli ukazují. KPI dostane target, konkrétní hodnotu, proti které se měří. A celé se to láme na segmenty, protože průměr přes všechny návštěvníky nikdy neřekne, co se děje uvnitř.

Teprve na konci téhle řady se ptáš „jaká událost tohle KPI naplní?". Událost je poslední krok, ne první. Proto udalost_2 nikdy nedá odpověď, vznikla bez otázky.

Tenhle plán je zároveň zdroj výchozího stavu. První číslo, proti kterému pak provoz měří, vzniká v discovery jako momentka „odkud jsme vyšli". Plán měření je rámec, do kterého discovery tu momentku zasadí, a analytika ji pak provozuje dál.

GA4: čtyři druhy událostí a slovník, který drží taxonomii

GA4 stojí celé na událostech. Žádná zobrazení stránek jako samostatná entita, žádné samostatné návštěvy, všechno je událost s parametry. Události se dělí do čtyř skupin a rozdíl mezi nimi rozhoduje o tom, kolik práce a kolik chyb tě čeká.

Automaticky sbírané přijdou samy, nic nenastavuješ. Enhanced measurement se zapíná přepínačem ve streamu a přidá scroll, výstupní prokliky, vyhledávání na webu, video a stažení souborů. Jeden přepínač, a teče další várka dat. Recommended events jsou předdefinovaná jména s předepsanými parametry: login, sign_up, search, generate_lead, purchase, view_item. Google je sám neposílá, ale čeká je, a podle skupiny webu jich nabízí jiný balík: 14 pro každou property, 14 pro online prodej, 6 pro lead generation, 10 pro hry. Custom events jsou tvoje vlastní, když žádné recommended nesedí.

Recommended events mají jeden smysl. Google sám trvá na taxonomii před vlastní invencí. Místo udalost_klik chce generate_lead, protože předepsané jméno odemyká budoucí reporty a funkce. Když si vymyslíš vlastní, vyžaduje další kontext, aby dávalo smysl, a ten kontext nikdo nedodá. Pravidlo zní: nejdřív sáhni po recommended jménu, vlastní událost až když nic nesedí.

A protože jména a parametry jsou sdílený jazyk mezi marketingem a analytikou, patří do slovníku událostí a parametrů. Marketing vlastní vznik a pojmenování UTM, analytika jejich čtení a reporting, a aby se to potkalo, musí být konvence pojmenování UTM součástí téhož slovníku. Bez ní black-friday a Black-Friday vyrobí v reportu dva řádky.

Limity, na které se naráží potichu

GA4 má tvrdé stropy a nehlásí se, dokud nepřetečou. Na jednu událost jde 25 parametrů. Jméno události i parametru smí mít 40 znaků, hodnota parametru 100 (s výjimkami: page_title 300, page_referrer 420, page_location 1000). Property unese 25 user properties a 100 slotů na custom dimensions a metrics dohromady. Jeden uživatel smí za den vyslat 100 000 událostí.

Sto slotů zní jako dost, dokud je nezačneš pálit neuváženě. Pomáhá event-scoped custom dimension: jeden parametr nahlásíš napříč všemi událostmi z jednoho slotu, místo aby každá událost ujídala vlastní. Dřív se sloty rozhazovaly po jednom a docházely.

„Conversions" jsou teď „key events" a není to kosmetika

Do března 2024 GA4 i Google Ads mluvily o „conversions", jenže každý je počítal jinak. Stejné slovo, jiné číslo, a tým z toho hádal, které platí. Google to 27. března 2024 rozsekl přejmenováním. V GA4 se konverze jmenují key events a slovo „conversion" zůstalo jen Google Ads. Migrace proběhla sama, nic se nepřenastavovalo.

Po změně GA4 rozlišuje tři pojmy a stojí za to je nezaměnit. Event je jakákoli naměřená akce. Key event je událost, kterou jsi prohlásil za důležitou, protože naplňuje cíl z plánu měření. Conversion je metrika v Google Ads. Okrasná metrika jako počet zobrazení stránek není key event. Key event je odeslaný formulář, dokončené čtení, přihlášení k newsletteru, něco, co posouvá obchodní cíl.

Číslo, které vidíš, je vždycky podhodnocené

Teď ten obrat, který výchozí důvěru v GA4 obrátí naruby. Report neukazuje, kolik lidí na webu bylo. Ukazuje, kolik jsi jich směl změřit.

Mezi návštěvou a měřením stojí banner souhlasu. Při rovnocenných tlačítkách accept a reject odmítá cookies 50 až 70 % lidí. V Německu a Francii akceptuje méně než čtvrtina. Pro obsahový web s evropským publikem to znamená, že GA4 čísla jsou systematicky nižší a kanál „Direct/Unassigned" nafouknutý, protože odmítnutá návštěva se buď neměří vůbec, nebo se nedá přiřadit ke zdroji. Vrací se tím UTM problém z marketingu: část návštěvnosti zmizí z reportu ne kvůli značení, ale kvůli odmítnutému souhlasu.

Google na to má Consent Mode s modelováním chování: chování odmítnuvších dopočítá ML model. Jenže dopočítat není změřit, a model má práh. Potřebuje aspoň 1000 denních uživatelů s uděleným souhlasem ze sedmi z posledních 28 dní. Při 50% akceptaci to znamená kolem 2000 návštěv denně. Malý obsahový web ten práh nesplní, takže nedostane modelování, jen díru. A i nad prahem zůstává slepé místo, při 40% opt-outu může zůstat zhruba 12 % konverzí nepřiřazených nebo špatně přiřazených.

Z toho plyne jedno: GA4 číslo není pravda o provozu, je to spodní odhad. A pro malý web je ten odhad tím horší, čím evropštější je publikum.

Soukromější měření není kompromis, je to jiná výměna

Odbočka k alternativám se tu nedá obejít, vyrostla z předchozí sekce. Když odmítnutý souhlas požírá data a malý web z modelingu nic nedostane, nabízí se nástroj, který banner vůbec nepotřebuje.

Důvod není jen datový, je i právní. Rakouský úřad pro ochranu dat v lednu 2022 a francouzský CNIL v únoru 2022 shodně rozhodly, že použití Google Analytics porušuje GDPR: data tečou do USA, kde podléhají dohledu podle FISA 702, a Standard Contractual Clauses ani „supplementary measures" od Googlu to nezachrání. Vzešlo to ze 101 stížností NOYB po pádu Privacy Shield (Schrems II, červenec 2020) a stejná rozhodnutí padla v Itálii, Dánsku, Finsku, Norsku a Švédsku. Právní výklad téhle situace, včetně toho, co změnil EU-US Data Privacy Framework z roku 2023, vede právo, soukromí a souhlas. Pro analytiku stačí závěr. GA4 nese přenosové riziko a riziko souhlasu, které nástroj bez cookies odstraní.

Pak je tu výkon. Skript Plausible váží asi 2,5 KB gzip, GA4 kolem 135 KB, dvaapadesátkrát víc. S GTM a cookie bannerem překročí balík GA4 285 KB. Analytika bez cookies navíc banner nemusí nahrát vůbec, což je přímý zápočet pro Core Web Vitals: lehčí web, žádný blokující skript souhlasu.

Ale není to zadarmo, je to volba. Plausible je lehký, bez cookies, open-source, hostovaný v EU a bez banneru, jenže záměrně nepřebírá složitost modelu GA4. Jednodušší znamená míň funkcí, pro e-shop se složitým funnelem může být málo. Matomo je nejbližší náhrada GA4 funkce za funkci, dává plné vlastnictví dat, nesampluje a umí importovat historická GA data. Matomo hostované na vlastní infrastruktuře v režimu bez cookies a s anonymizací IP je z hlediska práva nejčistší volba. Žádná cookie neznamená žádný spouštěč souhlasu podle čl. 5(3) ePrivacy, žádné osobní údaje znamenají soulad s GDPR.

Měření bez cookies ale není automatický soulad. Matomo CNIL-exemption má tvrdé podmínky: účel jen měření návštěvnosti pro vydavatele, žádné křížení ani sdílení třetím stranám, anonymizace IP, životnost cookie max 13 měsíců, retenční doba max 25 měsíců. Spadne jediná podmínka a souhlas je zase povinný. Výměna tedy zní: GA4 dává hloubku za cenu rizika a ztráty dat, Plausible jednoduchost a soulad za cenu funkcí, Matomo vlastnictví a soulad za cenu vlastního provozu.

Reporting: přehled, který dovolí zeptat se „proč"

Měřicí plán, události a key events jsou na nic, když z nich nevznikne čtení, podle kterého se rozhoduje. A tady se láme rozdíl mezi reportem a dashboardem.

GA4 nabízí dvě roviny. Explorations jsou na hypotézy a hlubší rozbor, „proč nám v dubnu spadly leady?". Looker Studio je na průběžný monitoring a týmové dashboardy. Jeho výhoda je spojování zdrojů: GA4 události, útrata v Google Ads, imprese ze Search Console i CRM do jednoho pohledu. Search Console drží data 16 měsíců, GA4 ve výchozím nastavení jen 2 (lze zvednout na 14, a omezení se týká jen Explorations, ne standardních reportů), takže výchozí stavy mají různý horizont a dashboard je musí srovnat.

Použitelný dashboard nejen ukazuje čísla, ale dovolí rozkliknout diagnózu: výběry metrik a dimenzí, ne statické PDF. A nesmí se číst jako jeden průměr. Obsahový web potřebuje segmentaci podle typu stránky, protože článek, landing page a detail se chovají úplně jinak a průměr přes ně je lež. To předpokládá, že obsahový model typy stránek vůbec rozlišuje. Bez segmentace podle typu stránky dashboard ukazuje průměr, který neplatí nikde.

Organická data dashboard tahá ze Search Console, ze stejného zdroje jako SEO a Core Web Vitals. A když se web spouští nebo migruje, události a dashboardy se opatří poznámkou a procházejí kontrolou při přepnutí, což řeší spuštění a migrace. Poznámka u spuštění je to, co za půl roku vysvětlí skok v grafu.

Aparát se škáluje, otázka ne

„Plán měření, slovník událostí, segmentace, dashboard, to je aparát pro velkou firmu, my máme web a pět cílů." I web s pěti cíli potřebuje měřicí plán. Rozdíl je v objemu událostí, ne v nutnosti se ptát. Malý web nevyčerpá 100 000 událostí na uživatele a nedosáhne na behavioral modeling, ale otázka „měřím to, co rozhoduje, a věřím tomu číslu?" platí pro pět cílů stejně jako pro pět set. Co se neškáluje, je právě ta otázka, a na ni žádný přepínač v GA4 neodpoví za tebe.

Praktický checklist

Typické chyby

Zdroje

Tahle kapitola je čtecí konec řetězu, který zbytek wiki rozehrává. Pojmy definuje slovník, výchozí stav a první měřicí plán vznikají v discovery. UTM tvoří a pojmenovává marketing a distribuce, analytika je čte; organická data sdílí se SEO a Core Web Vitals ze Search Console. Segmentace reportingu stojí na obsahovém modelu, konfigurace nástroje musí projít právem, soukromím a souhlasem a události se opatří poznámkou a testují při spuštění a migraci.