NoGA project (SIDN fonds)
by Marnix Dessing
Een belangrijk deel van web analytics is het verzamelen van gebruiks data op de website. Er bestaan hiervoor verschillend technieken, die werken vanaf verschillende invalshoeken en hierdoor verschillende voor en nadelen hebben.
In [1] en [3] worden vier schillende technieken om click stream data te verzamelen beschreven.
Web logs, vooral access logs, kunnen gebruikt worden om website statistieken per webserver te verzamelen[1, 2, 3].
Voordelen | Nadelen |
---|---|
Data eigendom (transporteerbaar) | Incompleet beeld van de data (bijv. geen uitgaande links) |
Veel volwassen en gratis tools beschikbaar (bijv. de ELK stack) | Bezoeker / gebruiker identificatie is lastig te realiseren |
Alle verkeer naar de website wordt afgevangen (ook browsers zonder JS of content blocking) | Alle requests naar de website (inclusief assets) |
De data bron is makkelijk toegankelijk | Caching kan de integriteit van data aantasten |
Een web beacon heeft vaak de vorm van een 1x1 transparante pixel die wordt gelade op een webpagina of in een email. Het laden van een dit plaatje geeft de hosting partij van de pixel informatie (op basis van bijv. een access log). Maar geavanceerder gebruik incorporeert vaak URL parameters in de html src van de pixel om zo extra informatie door te sturen. Bijvoorbeeld een username of de pagina titel. De techniek wordt veel gebruikt bij ad providers.[1, 3]
Voordelen | Nadelen |
---|---|
Lage complexiteit | Blocking van pixels (door browser) |
Data verzamelen / sturen via URL parameters | Standaard geblokeerd in veel email clients |
Niet domein gebonden (bijv. door cookies) | Data verzamelen mogelijk, maar minder geavanceerd dan in een JS tracker |
Blocking van third-party cookies (door browser) |
JavaScript tags worden uitgevoerd binnen de browser en sturen gebruiks statistieken naar het data verzamel endpoint (bijv. Matomo of Google Analytics). De functionaliteit is niet gelimiteerd tot een enkel request maar kan worden uitgebreid tot meer events (bijv. producten in of uit de winkelwagen) of reguliere intervallen[1, 2, 3]. Dit is de techniek de meeste web analytics tools gebruiken, bijvoorbeeld: Google Analytics, Matomo, Adobe Analytics Open web analytics.
Voordelen | Nadelen |
---|---|
Eenvoudig te implementeren | JavaScript moet uitgevoerd worden in de browser |
Geen toegang tot logs nodig | Site taxonomie is altijd duidelijk uit de metadata |
Caching is geen probleem omdat de call vanuit JS komt | Server-side data is onzichtbaar (bijv. sessie data) |
Controle over de data die verzameld wordt | File downloads worden vaak niet geregistreerd |
Minder afhankelijk van technical website staff (Enkel een script) | Javascript kan impact hebben op de performance van de site |
Innovatie vind vooral plaats binnen deze techniek | |
Tracking over meedere domeinen |
Packet sniffing is het server-side inspecteren van elk netwerk paket. Zo kunnen verschillende statistieken gerelateerd aan web analytics worden bijgehouden.[1, 3]
Voordelen | Nadelen |
---|---|
Site wordt niet aangepast | Extra laag hardware en software |
Enkel 1st party cookies nodig | Privacy & versleuteling |
Alle data kan worden geïnspecteerd | Caching blijft een probleem vormen |
Duur (apparatuur en resources) |
Naast tracking mechanismes die worden gebruikt in de web analytics tools, moeten karakteristieken van een implementatie ook in overweging worden genomen, bijvoorbeeld kosten, belang van de gebruiker etc.
De volgende punten m.b.t. web analytics zijn belangrijk volgens[1]:
[1] Kaushik, Avinash. Web analytics: an hour a day. John Wiley & Sons, 2007.
[2] Booth, Danielle, and Bernard J. Jansen. “A review of methodologies for analyzing websites.” Web technologies: Concepts, methodologies, tools, and applications. IGI Global, 2010. 145-166.
[3] Waisberg, Daniel, and Avinash Kaushik. “Web Analytics 2.0: empowering customer centricity.” The original Search Engine Marketing Journal 2.1 (2009): 5-11.