Hvor sikre er trafikmålinger?

Trafikmåling - hvor mange mennesker har set en given side - er en forholdsvis usikker affære på nettet. Den eneste trøst er, at målinger uden for nettet er meget værre.

Det er i dag den 21. september 2006. I løbet af de sidste 21 dage er der blevet vist 108.000 sider på vertikal.dk. De bare ikke blevet set af så mange mennesker. Ifølge vores fortrinlige trafikanalyseprogram er de 52.000 sider blevet set af mennesker, og resten, 56.000, af maskiner.

Det bekymrer vi os ikke stort om her. Men ude på den annoncesælgende del af nettet er trafikanalyse en stor ting. For her spiller antallet af brugere, viste sider og antal klik på annoncer en stor rolle.

Det er snyd det hele? <

Tirsdag den 12. september blev jeg ringet op af en journalist fra gratisavisen Dato [Wayback-link]. Han var i gang med en historie om usikkerheden af trafikmåling på nettet.

Jeg underholdt med det gamle annonce-mundheld "Jeg ved at halvdelen af mit annoncebudget er spildt. Jeg ved bare ikke hvilken halvdel." og trøstede med, at det på nettet trods alt var bedre. Her har man historisk gode muligheder for at måle brugen af ens sider og annoncer.

Jeg nævnte set og uset trafik og anslog at usikkerheden på disse tal på dårlige dage nærmer sig de 15%.

Vi diskuterede usikkerheden ved trafikmålinger, måder at måle på, måder at snyde på og annoncemarkedet generelt. Jeg fortalte om Googles 500 millioner kroners tilbagebetaling til annoncører, der har været udsat for klik-snyd [Wayback-link] og om hvordan forliget ikke er baseret på eksakte målinger, men et skøn.

Det blev så til ammunition i denne historie (der tilsyneladende også optrådte på forsiden):

Overskriften er ikke rimelig, og det minder lidt om brødnid fra et papirmedie, der også er ude at kæmpe hårdt om annoncekronerne.

Trafik og trafikanalyse <

Hver gang en side bliver skibet afsted, skriver webserveren om det i en logfil.

Her er et godt eksempel på hvordan sådan et notat om en afskibet side ser ud.

217.61.183.126 - - [21/Sep/2006:10:30:19 +0200] "GET /a208 HTTP/1.0" 200 25320 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"

Logfilerne er mange mb store og består udelukkende af disse nært uforståelige linjer.

Heldigvis har jeg et trafikanalysprogram, der kan gøre disse enorme datamængder forståelige. Det laver søjler, lagkagediagrammer og utrolig meget andet.

Det ser også på hvem, der læser siderne. Ovenfor er det sandsynligvis en Windows XP-bruger med browseren Firefox. Mange af de besøgende identificerer sig dog på anden måde. Fx. denne her:

66.249.66.109 - - [21/Sep/2006:01:39:11 +0200] "GET /fjernarbejde/ [Wayback-link] HTTP/1.1" 404 12169 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html [Wayback-link])"

Googlebot er et program, der kopierer hjemmesider og sender dem tilbage til Google til yderligere analyse.

Det har vores trafikanalyseprogram godt fat i. Så den deler trafikken til vertikal.dk op "Set trafik", der hvor der må formodes at være en menneskelig læser, og "Uset trafik", der hvor vi regner med, at det er et program, der har set siden.

Det meste trafik er uset
Går jeg og tror, at mennesker har set på 108.000 sider på vertikal.dk de sidste 20 dage, kan jeg godt tro om. Ifølge analyseprogrammet er de 52.000 sider set af mennesker og de 56.000 sider set af maskiner.

Tallet er i øvrigt ikke perfekt. Nogle robotter snyder og kalder sig for MSIE 6.0. Diverse hacking-forsøg giver også sidevisninger - men det er meget tvivlsomt om noget menneske sidder og ser på siderne.

Mit personlige gæt er at usikkerheden på set/uset-tallene er omkring 15%.

FDIM svarer igen <

En række danske hjemmesider tjener penge på annoncer ved at kaste sådan cirka brugbare tal efter annoncørerne. Cirka 80% af dem er medlem af FDIM, Foreningen af Danske Internet-medier. FDIM-medlemmerne bruger samme trafikmålesystem og udgiver en fælles statistik på toplister [Wayback-link].

FDIM blev fortørnede over Dato-artiklen og gik i kødet på artiklen under overskriften Fem fejl i dato-artikel om netannoncering [Wayback-link]. På sin vis er det rimeligt, for artiklen er for kioskbaskeragtig. Vel kan medierne fuske med trafikmålingerne, men de gør det næppe så meget, at det gør noget, og FDIM er faktisk nogenlunde til at forklare om usikkerhederne ved deres målinger henne på deres side med regelsæt [Wayback-link], definitioner</J og <J http://fdim.dk/?vis=page&ID=41 [Wayback-link] (alle sjusser sig frem; de gode offentliggør deres antagelser og matematiske modeller).

FDIMs fortørnethed vækkede Job-Support til dåd med en fin kommentar til FDIM-fortolkningerne af måleresultaterne [Wayback-link]. På Job-Support er der tilsyneladende en berettiget interesse i at det bliver gjort helt klart hvordan FDIM-tallene for konkurrenten Job-Index opgøres.

Den diskussion er dog nok mest af interesse for annoncesælgere og deres foreninger.

Hvad angår artiklen i Dato synes jeg kun, at jeg er blevet næsten-fejlciterret én gang. "Annoncemedier er sat i verden for at puste tallet op" er faktisk ikke præcis, hvad jeg mener. Medier er sat i verden for at tjene penge, informere, underholdede og så videre. Annonceafdelinger er sat i verden for at lokke fleste mulige annoncører til at betale den højst mulige pris for at få adgang til medier.

Intet nyt her.

Bare se på Dato.

Vi brænder for vore annoncører <

Dato er, efter mit bedste skøn, primært sat i verden for at en annonceafdeling kan love annoncører adgang til "købestærke, beslutningskompetente, urbane, veluddannede læsere".... Hvis disse altså befinder sig et sted i Amager Strandpark tidligt om morgenen og kan læse sodsværtede annoncer:
Adskillige vognlæs af gratisaviserne 24timer og Dato er i de sidste 14 dage blevet brændt af på stranden i stedet for at blive smidt gennem brevsprækkerne i de københavnske husstande.

Det er dagbladet Information, der kan afsløre, at der hver eneste morgen de seneste 14 dage er kørt mellem en og tre varevogne ind i Amager Strandpark. Her har de losset store partier gratisaviser af ved en bålplads og efterfølgende sat aviserne i brand.

DR 15. september 2006 [Wayback-link] (måske mere på overskrift.dk [Wayback-link]).

Men hvem ved? Det kan jo være at Datos annonceafdeling er lige så frisk med at fortælle om deres afbrændings-korrektionfaktor som FDIM er med deres forskellige korrektionsfaktorer.

Trafikanalyse er møgspændende! <

Her i vertikal.dk bruger vi ret meget tid på trafikanalyse. Ikke fordi vi skal sælge annoncer. Men fordi
  • Det er spændende. Vores konverteringsrate er cirka 0,5 promille. Hver gang 2000 mennesker har været forbi, har vi en kunde. Det er hvad man får ud af at have nogle hundrede artikler online.
  • Vi har kunder der gerne vil have analyseret deres trafik og, som oftest, vil have en bid søgemaskineoptimering oveni.
  • Det er nok for meget at sige, at Trafikanalyse er smuk. Men når man nu er naturvidenskabligt uddannet, er det nu herligt at lege med grafer og meget store tal i ny og næ.

En bette video <