Porovnání demografických dat z Yahoo! Web Analytics a NetMonitoru
Tento článek vyšel původně na blogu Dennise Mortensena, který pracuje jako Director of Data Insights v Yahoo!
Je to již přes rok, co Dennis na svém blogu oznámil příchod Yahoo! Web Analytics 9.5 a jednou z hlavních novinek nové verze byly demografické údaje jako je pohlaví a věk. Dennis je špičkový expert na webovou analytiku a ve svém videu ukázal několik způsobů, jak taková data využít. Pokud jste se ještě s prostředím Yahoo! Web Analytics nesetkali, doporučuji vám před čtením následujícího článku toto video shlédnout.
Nicméně několik analytiků z evropských zemí po tomto oznámení zpochybnilo schopnost Yahoo! poskytovat relevantní data tam, kde Yahoo! Search nemá téměř žádný podíl na trhu, jako například v Česku. Berte to pouze jako orientační údaj, ale v praxi vidím, že pro české weby s návštěvností několika málo tisíc návštěvníků může Yahoo! opravdu poskytnout relevantní data se spolehlivostí 80 %, pro weby s návštěvností nad 50 tisíc návštěvníků pak se spolehlivost blížící se až k hranici 95 %.
Schopnost Yahoo! shromažďovat demografická data vyplývá z faktu, že tato data pocházejí z Yahoo! ID, které potřebujete k používání široké škály webových aplikací od Yahoo!, zejména Yahoo! Mail a webu pro sdílení fotografií Flickr, který je populární prakticky ve všech zemích světa, a tak je pravděpodobně i zdrojem většiny českých návštěvníků s Yahoo! ID.
Pro mne, a doufám, že i pro mnohé z vás, to tedy již není otázka jen o tom, zda Yahoo! může poskytnout demografické údaje o návštěvnících vašeho webu, protože odpověď je jednoznačně ano. Tou skutečnou otázkou je, zda můžeme těmto údajům věřit, využít je pro analýzu chování v jednotlivých demografických segmentech, a přijímat rozhodnutí na základě těchto informací.
Proto jsem se rozhodl prozkoumat demografické údaje, specificky pohlaví, které Yahoo! Web Analytics poskytuje, a srovnat je s daty z NetMonitoru, což je oficiální platforma pro měření návštěvnosti internetu v České republice, na jejímž základě se formuje poptávka na místním trhu online médií a reklamy.
Srovnání jsem prováděl na webu Okoun.cz (tradiční diskusní fórum fungující od roku 2001). Veškerá data jsou uváděna za období 4 měsíců od listopadu 2009 do února 2010.
Srovnání Yahoo! Web Analytics a NetMonitoru v číslech a grafech
Než se ponoříme do detailních čísel, je nutné zdůraznit, že všechny druhy demografických měření (snad s výjimkou oficiálního sčítání lidu) jsou založeny na nějaké statistické aproximaci. Podstatou je, že pokud máme dostatečně velký vzorek, který vykazuje stejné vlastnosti jako celková populace, postačí nám analyzovat data ze vzorku s tím, že jakékoliv závěry z analýzy budou pravděpodobně platné pro celou populaci. Z toho plyne, že chybová odchylka z takového měření je silně závislá na kvalitě vzorku a míra spolehlivosti je tím nižší, čím větší je velikost populace a čím menší je velikost vzorku.
Tolik k teorii, zde je podíl mužů a žen mezi návštěvníky webu dle Yahoo! Web Analytics a NetMonitoru.
Z grafu vyplývá docela jasně, že zatímco data z Yahoo! ukazují zhruba 70 % mužů v celém časovém úseku, data NetMonitoru pro mužské návštěvníky kolísají v rozmezí 55 % – 65 %. Rozdíl mezi těmito dvěma systémy měření se tedy pohybuje v rozmezí do 15 procentních bodů.
Použíté metriky jsou však odlišné. Zatímco Yahoo! Web Analytics pracuje s jedinečnými návštěvníky (Unique Visitors, což ve skutečnosti znamená cookies), NetMonitor uvádí reálné uživatele (Real Users).
NetMonitor – metodika
Nechci zde zacházet do velkých podrobností, takže jen v kostce: NetMonitor je nasazen na přibližně 95 % českého internetu (z hlediska návštěvnosti, nikoliv počtu internetových stránek), a tak může rozlišovat mezi dobrými cookies (tj. cookies s vymezenou minimální životností) a špatnými cookies (pod prahem definované životnosti). Počet reálných uživatelů je následně odvozen z počtu dobrých cookies, počtu zobrazených stránek s těmito dobrými cookies a celkového počtu zobrazených stránek. Tato kalkulace odvozuje počet skutečných návštěvníků (reálných uživatelů) a má za cíl eliminovat nepřesnosti vzniklé mazáním cookies.
Demografické údaje v NetMonitoru jsou shromažďovány z panelu pomocí dvou metod: user-centric software (páteř panelu, ověřené údaje, cca 1/3 panelu) a site-centric pop-up dotazníky (méně spolehlivé údaje, které lze jen těžko ověřit, cca 2/3 panelu).
Dobře, pojďme se teď podívat na celkový počet unikátních návštěvníků a reálných uživatelů tak, aby bylo možné posoudit rozdíl v poměru pohlaví, jak je uvedeno výše a vyvodit určité závěry.
Rozdíly v celkové návštěvnosti webu ponechme stranou, jedná se o různé metriky. Co je zde důležitější, je relativní velikost vzorku. Je zcela zřejmé, že Yahoo! má k dispozici značné množství dat. Ve skutečnosti je jich v tomto konkrétním případě třikrát více v porovnání s NetMonitorem. Webové stránky s převážně mezinárodní návštěvností mohou mít tento vzorek ještě větší – viděl jsem, že až 10 % celkové návštěvnosti může být identifikováno demografickými daty.
Důvěryhodnost demografických dat v Yahoo! Web Analytics
Žádné údaje nejsou 100% přesné, ale lze předpokládat, že NetMonitor vyvinul větší úsilí v rozvoji správné metodiky pro místní trh – a tak jejich údaje o celkovém rozdělení pohlaví by měly být blíže k pravdě. Pro reportování základních čísel a přilákání reklamních zadavatelů proto doporučuji využít NetMonitor, který poskytuje bohaté a ověřené demografické údaje, které lze snadno porovnat s jinými servery.
Tam, kde demografická data z Yahoo! Web Analytics nejsou příliš přesná, pokud jde o celkové počty, je rozdíl pravděpodobně způsoben tím, že Yahoo! nemá své služby lokalizované v českém jazyce. To ve výsledku posouvá data ve vzorku od běžné populace uživatelů internetu v České republice ve prospěch pokročilejších uživatelů.
Screenshot níže je toho důkazem. Česká republika se řadí k několika málo zemím na světě, kde Google není jedničkou mezi vyhledávači. Jedničkou je Seznam, ale pokročilí uživatelé obvykle dávají přednost Google. Z reportu Search Engines můžete vidět, že návštěvníci, kteří jsou identifikováni na základě jejich Yahoo! ID, používají převážně Google.

Nicméně, demografická data z Yahoo! stále představují velkou hodnotu pro majitele webových stránek, kteří se snaží lépe pochopit a komunikovat se svými zákazníky. Je skutečně možné použít tato data pro identifikaci segmentů a detailní analýzu jejich chování ve srovnání s ostatními segmenty.
Níže uvedený graf dokládá, že data o pohlaví návštěvníků jsou velmi blízko realitě. Okoun.cz má množství různých témat kde můžete diskutovat a samozřejmě, některé z nich jsou zaměřeny čistě na mužské zájmy a některé naopak. Graf znázorňuje popularitu jednotlivých diskusních skupin jako podíl individuálních diskuzních skupin na celkovém počtu zobrazených stránek návštěvníky-muži a návštěvnicemi-ženami.

Následující tabulka pak shrnuje 10 nejnavštěvovanějších diskusí mezi ženami.

Závěr
Demografická data chyběla ve webové analytice po dlouhé roky, přestože v tradičním marketingu hrála demografická segmentace vždy ohromnou roli. A je právě na čase, abychom objevili její hodnotu i ve webové analytice.
Demografická data v Yahoo! Web Analytics nereprezentují přesně celkovou populaci na českém internetu, ale zdají se být velmi přesná pro mnoho návštěvníků, které lze identifikovat prostřednictvím Yahoo! ID. Můj závěr proto je, že tyto cenné demografické údaje mohou být skutečně využity v segmentaci a analýze návštěvníků vašich webových stránek. Obzvlášť pak v kombinaci s daty o chování návštěvníků, kampaních a prodejích, které nejsou k dispozici v NetMonitoru.
Jak se vám líbí myšlenka využití demografických dat pro segmentaci a analýzu chování návštěvníků vašeho webu? Víte, zda vaše marketingové kampaně cílí na správnou cílovou skupinu? Víte, zda mají na vašem eshopu vyšší konverzní poměr muži nebo ženy? Napadá vás, jak tato data využít pro optimalizaci webu? Zapojte se do diskuze pod článkem.
Související články:
Komentáře k tomuto článku již byly uzavřeny. Komentovat se dají pouze aktuální články.
Blog o optimalizaci obchodní výkonnosti webu a webové analytice od firmy Optimics.
Přihlašte se do našeho e-mailového magazínu a každý měsíc obdržíte užitečné články a studie přímo do vaši schránky!





Nějak se mi nezdá, že by měla diskuze o Radku Hulánovi takové zastoupení mezi ženami.. ale možná mu křivdím :)
Shodou okolností jsem chvilku po přečtení tohoto článku našel v RSS čtečce zprávu o statistikách implementovaných do (Google) DoubleClick Ad Planner. Také se snaží začlenit do statistik demografická data. Pro české weby jsou zatím výsledky chabé, směr vývoje je ale jasný.
Radek Hulán je holt pojem :)