Råd om trafikanalyse

Hits er et begreb, der er fuldkommen ubrugeligt, når man skal vurdere besøgstallene på et websted. Der skal langt mere avancerede begreber og langt mere sofistikerede målinger til.

I World Wide Webs barndom var det begrebet hits, der dominerede. Jo flere hits desto bedre. Det er til dels også sandt, men dog så langt fra den fulde sandhed, at hittallet er næsten ubrugeligt. Et hit er en udefinerbar størrelse, som man ikke kan bruge til noget som helst, og da slet ikke til at kræve penge for bannerannoncer eller imponere chefen eller konkurrenterne med.

Til det formål skal man bruge en avanceret trafik- eller brugeranalyse. Denne artikel forsøger at forklare begreberne indenfor trafikanalyse.

Nogle begreber <

Der benyttes en række termer om brugere og trafik, som dækker over bestemte forhold. Her er de forsøgt forklaret. De fleste bruges på engelsk, men der er ingen grund til ikke at oversætte dem

Om siderne
Sidevisninger
Pages, Page Impressions - antallet af websider, der er vist frem
Adresser
URL's - antallet af entydige URL'er der er vist
Tid på siden
Page Duration - hvor længe brugerne bruger på en enkelt side
Hits
Hits - antallet af filer, der er sendt til brugerne, alt inklusive
Filer
Files - antallet af filer, der ikke er websider men for eksempel mp3-filer

Om brugerne
Unikke brugere
Unique Visitors, Unique Users - antallet af enkelte brugere
Besøg eller bruger sessions
User Sessions, Visitor Sessions, Visits - antallet af besøg, som er én bruger, men godt kan være flere sider
Indgangs- og udgangssider
Entry & Exit Pages - hvilke sider brugerne kommer ind til og forlader fra
Adfærdsanalyse
Path Analysis - brugernes vej gennem systemet
Frekvens
Frequency - hvor ofte brugere vender tilbage

Om demografien
Unikke værter
Unique Hosts - hvilke værter brugerne kommer fra
Referenter
Referrals - hvilke websider brugerne kommer fra (hvis nogen)
Udbredelse
Reach - hvordan dækningen er i en bestemt gruppe brugere
Tekniske oplysninger
browser, OS, skærmopløsning

Tre veje <

Man kan i princippet gå tre veje for at få en analyse af brugernes adfærd:
  • loganalyse
  • intern måling
  • ekstern måling

Den første benytter sig af den log som alle webservere kan lave for ethvert websted. Mange har en log, men er ikke klar over det — eller ved ikke hvordan de kommer til den eller hvordan den bruges.

De to sidste er i princippet ens, men adskiller sig på at den første kører på samme server som webstedet mens den sidste kører et andet sted, og formodentlig foretages af et firma, der har specialiseret sig i det.

Loganalyse <

Antallet af 'gammeldags' hits får man ved at tælle hvor mange filer der er sendt ud. De figurerer i logfilen med hver sin linie. Antal hits er altså antal linier i loggen, som repræsenterer en succesfuld afsendelse af en fil. Problemet er at alle filer genererer en loglinie — også alle billeder. Selv om man så bort fra dem og blot tæller HTML-filer er det stadig ikke helt tilstrækkeligt.
Det ligger nemlig langt mere raffinerede data gemt i loggen, og skal man have dem frem, må man analysere loggen.
Til det formål bruger man et loganalyseprogram. Der findes en masse af slagsen, og ofte er der allerede installeret et på serveren. Programmet genererer med jævne intervaller — for det meste dagligt — en rapport i HTML-format, som man kan løbe igennem for at få et overblik over, hvad loggen gemmer. De præsenterer deres oplysninger i form at skemaer, hitlister, grafer og meget andet, som kan hjælpe med til at vise brugen af webstedet.

Kendte programmer i kategorien er WebTrends [Wayback-link], Webalizer [Wayback-link] og HTTPAnalyze [Wayback-link].

De mest avancerede kan desuden trække meget komplekse sammenhænge ud af loggen, for eksempel en del information om brugeradfærd.
Læs meget mere om loganalyse i denne artikel med råd om loganalyse.

Skræddersyede målinger <

For at få flere detaljer skal man have et system, der måler på hver eneste side og hver eneste bruger. Systemet skal samle kolossale mængder af data, og kunne præsentere dem for folkene bag webstedet på en måde, som skaber overblik.

Hvis man allerede har et system, der genererer webstedet, bør dette system kunne skabe en statistik, som man kan analysere. Eksisterende sider kan også modificeres til at lavere disse data, for eksempel ved at kalde et særligt målemodul på alle sider.
En anden mulighed er at købe eksterne tjenester, der kan gøre det samme, næsten uden at siderne modificeres. RedSheriff [Wayback-link] er et eksempel på en ekstern tjeneste. RedSheriff kan levere en meget komplet statistik med stort set alle brugbare oplysninger.

Eget system eller købe ude? <

Hvorvidt man skal købe eller udvikle er et spørgsmål og temperament og økonomi. Hvis ens system allerede har faciliteter, bør man forske i dem. Er systemet specialudviklet, er der masser af muligheder for at udvikle videre — det er kun et spørgsmål om fantasi og penge. Hvis systemet er en færdig hyldevare, er der måske ikke så mange muligheder for at ændre det. Så må man klare sig med hvad man har, hvilke er ganske godt i mange systemer, eller overveje det eksterne system.
Tjenester købt ude er ikke nødvendigvis billige, men kan måske alligevel være en fordel i forhold til specialudvikling.

Hvis man laver selv <

Ved at lave sit eget målesystem kan man dog få et mere detaljeret billede og en langt mere målrettet og brugbar information om brugernes adfærd. Alle disse informationer er afhængige af at man har et dynamisk, scriptbaseret system med mulighed for at samle data op i en database.
Den enkleste måling er at lade siderne tæller sig selv. Det vil sige, at en side fører en tæller frem, hver gang den indlæses. Dermed får man et fint indtryk af hvor mange brugere, der har læst den, men oplysningen er dog næppe tilstrækkelig.
Er man avanceret opdaterer man tælleren, når brugeren forlader siden, og registrerer, hvor længe brugeren har været på siden. Man kan også registrere klik, så man ved hvor brugerne klikker sig hen, for eksempel hvilke eksterne henvisninger de vælger. Men skal man virkelig kende sine brugeres adfærd, skal man arbejde med User sessions og cookies.

En bruger <

Hvis man skal lave virkelig god statistik skal man entydigt identificere den enkelte bruger. Det gøres ved hjælp af cookies og user sessions.
Cookies skrives til brugernes maskine ved første besøg, og rummer en entydig kode for den pågældende bruger. En cookie kan også rumme andre informationer, for eksempel et loginnavn, indstillinger og andet. Når brugeren vender tilbage kan denne cookie læses, og systemet kan altså genkende brugeren.
User sessions er en funktion på serveren. Hver bruger der kommer ind på webstedet tildeles et særligt besøgsnummer, som er unikt. Så længe brugeren stadig surfer rundt gemmes et spor, som fortæller, hvad brugeren klikker på. Sporingen ophører når brugeren forlader webstedet eller har været inaktiv i en bestemt periode, som typisk ligger omkring 30 minutter.

Hvad vi kan finde ud af <

Når en bruger er inde på webstedet kan vi automatisk finde ud af en del information om pågældende. Browseren efterlader nemlig en række oplysninger til serveren. Vi kender for eksempel:
IP-nummer - hvilket IP-nummer og dermed domæne, brugeren kommer fra
Referrer - hvilken side brugeren klikkede sig ind fra — hvis nogen
Browser - type, version, operativsystem og faciliteter
Skærmopløsning - hvor stor en skærm brugeren arbejder på

Mange af disse informationer kan være brugbare i arbejdet med at udforme siderne. Kendskabet til brugernes muligheder sætter nogle grænser op. Således viser en analyse for en meget stor, dansk nettjeneste, at omrking halvdelen af brugerne bruger en 800*600 punkters skærm, næsten lige så mange en på 1024*768 og resten noget lidt større. Det nytter altså ikke at lave hele webstedet til opløsninger, der er højere end 800*600 punkter.
Se hvad man kan finde ud af om din browser hos Forbrugersikkerhed [Wayback-link]

Minedrift <

Et godt trafikmålingssystem ophober virkelig meget information. Og hvis man skal have noget udbytte af denne information, skal der laves et system i systemet, der kan analysere og præsentere den. Dette går ofte under begrebet data mining fordi man borer i sine data for at finde guldet.
Nogle eksempler på anderledes og meget brugbar information, der kan komme fra data mining:

Hvilke søgeord ledte folk efter, da de fandt vores websted?
Denne analyse kan fortælle hvad det er for ord og begreber, der fører brugerne til ens websted. Hvis disse ord er relevante og viser vejen, men der ikke er så godt dækket på webstedet, så er det måske på tide, at få dækket dem?

Hvad er de almindeligste begyndelsessider for de besøgende?
Brugernes typiske startside er utroligt vigtig at kende. Hvis de kommer direkte ind på en artikel, er der så tilstrækkeligt med veje videre til at give dem appetit på mere?

Hvor ofte besøger søgemaskinernes robotter vores websted?
Denne information er af stor vigtighed for bedømmelsen af ens succes i søgemaskinerne. Hvis ikke robotterne kommer forbi med passende mellemrum holdes siderne ikke opdateret — og hvis de slet ikke kommer, kommer siderne slet ikke i søgemaskinerne!

Hvad er den enkelte brugers adfærd?
Følg en række brugere gennem systemet. Side X, så mange sekunder - Side Y, så mange sekunder - Side Z, så mange sekunder - ud! Er brugen som forventet? Læser folk sidste afsnit i serien? Følger folk "læs-mere-her" henvisningerne? Ser folk på de store udgaver af billederne? Hvad gør de mest? Hvor giver de tabt?