Sådan finder vi tallene

En kort beretning om hvordan vi finder tallene i vores hyppigheds- og popularitetsundersøgelse

Det er ikke den store kunst, når Vertikals automatiske analyse checker hvor hyppig et websted er i søgemaskinerne.

Nøgleordene er kendskab til søgemaskinerne, logik og lidt snedig programmering.

Meta betyder oven på <

Vi metacrawler simpelthen søgeresultaterne. Meta betyder oven på, og det vi gør er at vi lader et program på serveren udføre en søgning på søgemaskinerne. I stedet for at vise resultatet i en browser, så lader vi et program modtage de data, som søgemaskinerne sender til os.

Vi lader faktisk som om vi er en Internet Explorer 5 — det bilder vi søgemaskinen ind. Den returnerer godvilligt et resultat, som er mage til det, du selv vill få, hvis du udførte søgningen.

Analysér, analysér <

Når resultatet er i hus, så analyserer vi det. Det sker ved at alle HTML-koder fjernes, ohvorefter vi finder det sted, hvor tallene for søgningen står. Det mønster, der kendetegner hver enkelt søgemaskinen, kendes af vores program.

Når disse oplysninger er fundet, skal vi blot filtrere tallene fra. Det sker ved lidt banal strengmanipulation.

Nu er resultaterne klar til at blive præsenteret, og programmet kører videre til den næste søgemaskine.

Mange gange <

Analysen foretages mange gange. Vælger man at checke alle de fire søgemaskiner vi i øjeblikket har valgt at tage med, så skal vi ud på nettet otte gange i alt for at lave analysen. Vi tager nemlig én tur med www. og én tur uden for alle de URL'er, der checkes.

Derfor kan analysen også tage sin tid.