Porovnání demografických dat z Yahoo! Web Analytics a NetMonitoru

Tento článek vyšel původně na blogu Dennise Mortensena, který pracuje jako Director of Data Insights v Yahoo!

Je to již přes rok, co Dennis na svém blogu oznámil příchod Yahoo! Web Analytics 9.5 a jednou z hlavních novinek nové verze byly demografické údaje jako je pohlaví a věk. Dennis je špičkový expert na webovou analytiku a ve svém videu ukázal několik způsobů, jak taková data využít. Pokud jste se ještě s prostředím Yahoo! Web Analytics nesetkali, doporučuji vám před čtením následujícího článku toto video shlédnout.

Nicméně několik analytiků z evropských zemí po tomto oznámení zpochybnilo schopnost Yahoo! poskytovat relevantní data tam, kde Yahoo! Search nemá téměř žádný podíl na trhu, jako například v Česku. Berte to pouze jako orientační údaj, ale v praxi vidím, že pro české weby s návštěvností několika málo tisíc návštěvníků může Yahoo! opravdu poskytnout relevantní data se spolehlivostí 80 %, pro weby s návštěvností nad 50 tisíc návštěvníků pak se spolehlivost blížící se až k hranici 95 %.

Schopnost Yahoo! shromažďovat demografická data vyplývá z faktu, že tato data pocházejí z Yahoo! ID, které potřebujete k používání široké škály webových aplikací od Yahoo!, zejména Yahoo! Mail a webu pro sdílení fotografií Flickr, který je populární prakticky ve všech zemích světa, a tak je pravděpodobně i zdrojem většiny českých návštěvníků s Yahoo! ID.

Pro mne, a doufám, že i pro mnohé z vás, to tedy již není otázka jen o tom, zda Yahoo! může poskytnout demografické údaje o návštěvnících vašeho webu, protože odpověď je jednoznačně ano. Tou skutečnou otázkou je, zda můžeme těmto údajům věřit, využít je pro analýzu chování v jednotlivých demografických segmentech, a přijímat rozhodnutí na základě těchto informací.

Proto jsem se rozhodl prozkoumat demografické údaje, specificky pohlaví, které Yahoo! Web Analytics poskytuje, a srovnat je s daty z NetMonitoru, což je oficiální platforma pro měření návštěvnosti internetu v České republice, na jejímž základě se formuje poptávka na místním trhu online médií a reklamy.

Srovnání jsem prováděl na webu Okoun.cz (tradiční diskusní fórum fungující od roku 2001). Veškerá data jsou uváděna za období 4 měsíců od listopadu 2009 do února 2010.

Srovnání Yahoo! Web Analytics a NetMonitoru v číslech a grafech

Než se ponoříme do detailních čísel, je nutné zdůraznit, že všechny druhy demografických měření (snad s výjimkou oficiálního sčítání lidu) jsou založeny na nějaké statistické aproximaci. Podstatou je, že pokud máme dostatečně velký vzorek, který vykazuje stejné vlastnosti jako celková populace, postačí nám analyzovat data ze vzorku s tím, že jakékoliv závěry z analýzy budou pravděpodobně platné pro celou populaci. Z toho plyne, že chybová odchylka z takového měření je silně závislá na kvalitě vzorku a míra spolehlivosti je tím nižší, čím větší je velikost populace a čím menší je velikost vzorku.

Tolik k teorii, zde je podíl mužů a žen mezi návštěvníky webu dle Yahoo! Web Analytics a NetMonitoru.

Podíl mužů a žen v celkové návštěvnosti

Z grafu vyplývá docela jasně, že zatímco data z Yahoo! ukazují zhruba 70 % mužů v celém časovém úseku, data NetMonitoru pro mužské návštěvníky kolísají v rozmezí 55 % – 65 %. Rozdíl mezi těmito dvěma systémy měření se tedy pohybuje v rozmezí do 15 procentních bo­dů.

Použíté metriky jsou však odlišné. Zatímco Yahoo! Web Analytics pracuje s jedinečnými návštěvníky (Unique Visitors, což ve skutečnosti znamená cookies), NetMonitor uvádí reálné uživatele (Real Users).

NetMonitor – metodika

Nechci zde zacházet do velkých podrobností, takže jen v kostce: NetMonitor je nasazen na přibližně 95 % českého internetu (z hlediska návštěvnosti, nikoliv počtu internetových stránek), a tak může rozlišovat mezi dobrými cookies (tj. cookies s vymezenou minimální životností) a špatnými cookies (pod prahem definované životnosti). Počet reálných uživatelů je následně odvozen z počtu dobrých cookies, počtu zobrazených stránek s těmito dobrými cookies a celkového počtu zobrazených stránek. Tato kalkulace odvozuje počet skutečných návštěvníků (reálných uživatelů) a má za cíl eliminovat nepřesnosti vzniklé mazáním cookies.

Demografické údaje v NetMonitoru jsou shromažďovány z panelu pomocí dvou metod: user-centric software (páteř panelu, ověřené údaje, cca 1/3 panelu) a site-centric pop-up dotazníky (méně spolehlivé údaje, které lze jen těžko ověřit, cca 2/3 panelu).

Plný popis metodiky najdete zde

Dobře, pojďme se teď podívat na celkový počet unikátních návštěvníků a reálných uživatelů tak, aby bylo možné posoudit rozdíl v poměru pohlaví, jak je uvedeno výše a vyvodit určité závěry.

Celková návštěvnost
Relativní velikost vzorku

Rozdíly v celkové návštěvnosti webu ponechme stranou, jedná se o různé metriky. Co je zde důležitější, je relativní velikost vzorku. Je zcela zřejmé, že Yahoo! má k dispozici značné množství dat. Ve skutečnosti je jich v tomto konkrétním případě třikrát více v porovnání s NetMonitorem. Webové stránky s převážně mezinárodní návštěvností mohou mít tento vzorek ještě větší – viděl jsem, že až 10 % celkové návštěvnosti může být identifikováno demografickými da­ty.

Důvěryhodnost demografických dat v Yahoo! Web Analytics

Žádné údaje nejsou 100% přesné, ale lze předpokládat, že NetMonitor vyvinul větší úsilí v rozvoji správné metodiky pro místní trh – a tak jejich údaje o celkovém rozdělení pohlaví by měly být blíže k pravdě. Pro reportování základních čísel a přilákání reklamních zadavatelů proto doporučuji využít NetMonitor, který poskytuje bohaté a ověřené demografické údaje, které lze snadno porovnat s jinými servery.

Tam, kde demografická data z Yahoo! Web Analytics nejsou příliš přesná, pokud jde o celkové počty, je rozdíl pravděpodobně způsoben tím, že Yahoo! nemá své služby lokalizované v českém jazyce. To ve výsledku posouvá data ve vzorku od běžné populace uživatelů internetu v České republice ve prospěch pokročilejších uživatelů.

Screenshot níže je toho důkazem. Česká republika se řadí k několika málo zemím na světě, kde Google není jedničkou mezi vyhledávači. Jedničkou je Seznam, ale pokročilí uživatelé obvykle dávají přednost Google. Z reportu Search Engines můžete vidět, že návštěvníci, kteří jsou identifikováni na základě jejich Yahoo! ID, používají převážně Google.

Search Engines report

Nicméně, demografická data z Yahoo! stále představují velkou hodnotu pro majitele webových stránek, kteří se snaží lépe pochopit a komunikovat se svými zákazníky. Je skutečně možné použít tato data pro identifikaci segmentů a detailní analýzu jejich chování ve srovnání s ostatními segmenty.

Níže uvedený graf dokládá, že data o pohlaví návštěvníků jsou velmi blízko realitě. Okoun.cz má množství různých témat kde můžete diskutovat a samozřejmě, některé z nich jsou zaměřeny čistě na mužské zájmy a některé naopak. Graf znázorňuje popularitu jednotlivých diskusních skupin jako podíl individuálních diskuzních skupin na celkovém počtu zobrazených stránek návštěvníky-muži a návštěvnicemi-ženami.

Relativní popularita diskuzních fór

Následující tabulka pak shrnuje 10 nejnavštěvo­vanějších diskusí mezi ženami.

Nejpopulárnější ženská diskuzní fóra

Závěr

Demografická data chyběla ve webové analytice po dlouhé roky, přestože v tradičním marketingu hrála demografická segmentace vždy ohromnou roli. A je právě na čase, abychom objevili její hodnotu i ve webové analytice.

Demografická data v Yahoo! Web Analytics nereprezentují přesně celkovou populaci na českém internetu, ale zdají se být velmi přesná pro mnoho návštěvníků, které lze identifikovat prostřednictvím Yahoo! ID. Můj závěr proto je, že tyto cenné demografické údaje mohou být skutečně využity v segmentaci a analýze návštěvníků vašich webových stránek. Obzvlášť pak v kombinaci s daty o chování návštěvníků, kampaních a prodejích, které nejsou k dispozici v NetMonitoru.

Jak se vám líbí myšlenka využití demografických dat pro segmentaci a analýzu chování návštěvníků vašeho webu? Víte, zda vaše marketingové kampaně cílí na správnou cílovou skupinu? Víte, zda mají na vašem eshopu vyšší konverzní poměr muži nebo ženy? Napadá vás, jak tato data využít pro optimalizaci webu? Zapojte se do diskuze pod článkem.

Související články:

Post to Twitter  Post to Facebook  Zapište si naše články do RSS čtečky!

Komentáře čtenářů (3)

1 Jan Zdarsa | 29.6.2010 10.34

Nějak se mi nezdá, že by měla diskuze o Radku Hulánovi takové zastoupení mezi ženami.. ale možná mu křivdím :)


2 Michal Janík | 3.7.2010 16.33

Shodou okolností jsem chvilku po přečtení tohoto článku našel v RSS čtečce zprávu o statistikách implementovaných do (Google) DoubleClick Ad Planner. Také se snaží začlenit do statistik demografická data. Pro české weby jsou zatím výsledky chabé, směr vývoje je ale jasný.


3 RubberDuck | 27.7.2010 20.22

Radek Hulán je holt pojem :)

Komentáře k tomuto článku již byly uzavřeny. Komentovat se dají pouze aktuální články.

O blogu

Blog o optimalizaci obchodní výkonnosti webu a webové analytice od firmy Optimics.

Více o firmě a autorech

RSS článků
Newsletter

Přihlašte se do našeho e-mailového magazínu a každý měsíc obdržíte užitečné články a studie přímo do vaši schránky!

Více

Krátce z Twitteru Sledujte nás na Twitteru

Sledujte nás na Twitteru