Nøgleord, taksonomier, folksonomier

Måder at organisere indhold på så det giver mening og er nemt at bruge

Vi her på Vertikal har altid hylet "nøgleord", så det pev i ørene på vores kunder.

Nøgleord er en langt mere logisk måde at stykke ting sammen på end kategorier. Det har vi pointeret gang på gang i artikler som Brugerne tænker i nøgleord - tanker uge 15/2004 og Hvad hulen er nøgleordsnavigation?.

Men selv nøgleord kommer af og til til kort. Ikke mindst når der er rigtig mange af dem.

Men det er der heldigvis løsninger på.

1 - 100 - mange <

Hvor mange er så mange nøgleord?
Tja, de 91 nøgleord som vi har lige nu på Vertikal er jo ikke noget, der vælter læsset. Det kan de fleste overskue, og selv om vi sætter dem op på en rigtig moderigtig og tidssvarende Web-2.0-agtig måde ligesom de kan på Flickr [Wayback-link] eller del.icio.us [Wayback-link], så er de stadig til at overskue.


Bliv ikke bange! Det er bare vores sædvanlige nøgleord, der er sat op med skriftstørrelse efter deres popularitet. Det samme liste som den her, men i en moderne indpakning.

Men hvad hvis vi havde 200 nøgleord? Så var der problemer med næsten enhver form for repræsentation af ordene. Og havde vi 2000, så måtte vi virkelig finde på noget nyt på grund af uoverskueligheden. En plamage som ovenfor var utænkelig, og selv en liste ville stort set være ubrugelig.

Et ord, flere betydninger <

Udover antallet af ord, som kan give en vis uoverskuelighed, er der andre problemer.
Synonymer - flere ord der betyder det samme - giver problemer. Det modsatte, altså ét ord, der betyder flere forskellige ting, eller har forskellige betydninger i forskellige sammenhænge er næsten endnu værre.

Det skal eksemplificeres.

Kan en kok stege stege i Stege? <

Lad os antage at vi skal lave en hjemmeside henvendt til kokke. Den skal handle om råvarer, opskrifter, køkkentøj, restaurationsdrift og hvad man ellers kan forestille sig at kokke kan interessere sig for.

Hvis vi tager et ord som stege, der kan optræde mange gange på sådan en hjemmeside, så kan man hurtigt skabe vanskeligheder hvis forfatterne til tre artikler mærker deres artikel med nøgleordet stege.

Atiklerne hedder:
"Korrekt udskæring af en kalv" - stege som i en steg
"Kunsten at langtidsstege" - stege som i at stege
"Sydsjællandske lokalmejerier" - stege som i byen Stege

Søger kokken på stege, ser han måske følgende:
Stege
- Udskæring af stege
- Modning af stege
- Langtidsstegning
- Stegning i wok
- Stege, Møn, Region Sydsjælland


Set på en anden led kan stege optræde under Modning
- Stege
- Vildt
- Frugt
- Oste


eller under Region Sydsjælland
- Næstved
- Præstø
- Stege
- Nakskov
- Maribo

Ordtræ <

Et meget lille udvalg af ord sat op i et stamtræ.
EmneNøgleordSynonymer
metoder stege stege
braisere
sautere
brase
grille
riste
koge koge
porchere
dampe
kød stege stege
bøffer bøffer
hakket kød hakket kød
fars
regioner Sydsjælland Stege
Maribo
Næstved
Nakskov
Præstø
Nordsjælland Hornbæk
Helsingør
Hillerød

Synonymer <

Og det kunne jo være at én af forfatterne ikke kalder det at stege, men er lidt frankofil og sauterer. En anden har været på dansk kro, og der braser man, mens en tredje braiserer.

I bund og grund er det det samme ord (kokke må have mig undskyldt), men der er altså mange forskellige måder at sige og stave det på.

Vores system skal altså ikke bare kunne se forskel på stege, stege og Stege, men også være klar over at den første udgave er identisk med ordene sautere, brase og braisere.

Det er ikke nogen triviel opgave, rent teknisk, men absolut muligt.

Ordenes stamtræ <

Når nøgleordene skal organiseres, lægges de ind i et træ, hvor der kan være mange ens ord, som har forskellige tilhørsforhold, som illustreret i vedstående skema.

Her ses en taksonomi med tre niveauer: emne, ord og synomymer.

Emnerne er en form for samlende kategorier, som bruges til at grovinddele ordene. Disse ord bruges ikke til opmærkning, men kun for at skabe overblik. Det vil i øvrigt ikke være unormalt at der er overlap eller fuldkommen sammenfald mellem disse emner og hjemmesidens eventuelle overordnede kategorier.

Nøgleordene er de egentlige nøgleord. Det er dem, der bruges af redaktørerne til at mærke artikler op med, og dem som er samlende for de forskellige emner, som artiklerne omhandler.

Synonymerne er blot andre ord der kan repræsentere de samme begreber som ordene. Disse synonymer er der dels for at give redaktørerne en forståelse af hvad nøgleordet egentlig dækker og dels for at være nyttige i for eksempel søgninger, hvor brugernes forskellige betegnelser for det samme nøgleord kan listes op. En søgning på et synonym kan så føre brugeren til det nøgleord, som bruges i systemet.

Man kunne forestille sig et niveau mere, nemlig former, hvori forskellige staveformer og bøjninger af ordene kunne findes. Her ville man kunne dække ental, flertal, bestemt form, ubestemt form og så videre. Ja, man ville endda kunne dække fejlstavede ord — alt sammen igen af hensyn til søgningen.

Hil bibliotekarerne! <

Manglen på disciplin er nøgleordenes største fjende. Hvis man lader brugere eller redaktører oprette nøgleord som det passer dem, så vokser listen med nøgleord, og der vil dukke ord op, som
  1. allerede findes i en anden form
  2. ikke er rigtige nøgleord
  3. dobbeltdækker f.eks. kategorier

Lad mig udbygge dette en smule.
  1. synomymer er gode eksempler på at ord allerede eksisterer. Det er vigtigt at man vælger stamformen (nøgleordet i skemaet ovenfor), og ikke tilføjer et nyt ord, som betydningsmæssigt er identisk.
  2. meget generelle og brede ord giver normalt ingen mening som nøgleord. I vores kokke-eksempel er ord som madlavning, køkken og kok ikke særligt brugbare. De vil stort set kunne sættes på alle artikler i systemet.
  3. eksempler på dobbeltdækning kunne være kategorier, forfatternavne eller andet, som allerede er omfattet af en anden del af CMS'ets systematik. Optræder en artikel for eksempel i sektionen Debat, er der ingen grund til at mærke den med et nøgleord der hedder Debat.

For at få styr på denne potentielle kakafoni af nøgleord, skal man have en nøgleordsredaktør, hvis ansvar det er at holde styr på alle ordene, luge dobbeltdækninger ud, oprette synonymer og i det hele taget styre listen.

Pågældende skal have en grundliggende forståelse for nøgleordsbegrebet, et godt kendskab til emnerne og god sproglig forståelse.

Bibliotikarer er normalt gode nøgleordsredaktører.

Andre om folksonomier <

Vi er selvfølgelig ikke de eneste, der har skrevet om folksonomier.
Clay Shirky skriver som altid klogt og læseværdigt. Her er det artiklen Folksonomy på Corante [Wayback-link]

På User Interface Engeneering skriver Joshua Porter om Folksonomies: A User-Driven Approach to Organizing Content [Wayback-link]

Begge artikler påpejer som jeg gør det problemtatiske i folksonomier. Vel er de trendy, vel er de sexede, men de praktiske problemer overskygger ofte det smarte.

Brugerne til magten <

Man kan også vælge en helt anden vinkel på nøgleordssystemet og lade brugerne eller redaktørerne oprette nøgleord som de vil.

Frem for at vælge i en liste, så får de lov bare at taste nogle passende ord ind i et eller flere felter, og systemet kondenserer dem så ned og tilføjer dem til sin centrale liste af nøgleord.

Dette kaldes ofte for folksonomier — et ikke særligt korrekt ordspil på taksonomier. Folksonomier er nemlig ikke taksonomisk strukturerede, men blot en lang liste af ord, hvor emner, nøgleord, synonymer og former er blandet i et misk-mask.

Folksonomier er lidt af en trend for tiden — et buzzword — og bruges på nogle af de hedeste brugerdrevne hjemmesider såsom billeddelingstjenesten <b [Wayback-link] (der kalder ordene tags), lyddelingstjenesten <b [Wayback-link] (der også kalder dem tags [Wayback-link]) eller bogmærkedelingstjenesten <b [Wayback-link] der minsandten også kalder deres nøgleord for tags.

Hver af disse tjenester og mange andre lader brugerne, som lægger nye henholdsvis billeder, lyde og URL'er ind på siderne, mærke disse op med helt valgfrie nøgleord eller tags. Da der er mange brugere på siderne vokser listen med tags meget hurtigt, og da der ikke er styring på hvilke ord der bruges, så opstår der let et mildt kaos.

Tjenesterne har dog mange brugere og mange brugere har en tilbøjelighed til at trække listen af ord hen mod det normale. Vi tænker trods alt ret ens, og derfor så former listerne med de mest populære ord sig efterhånden nogenlunde fornuftigt.

De løbske nøgleord <

Flickr er en billeddatabase på en lidt anden måde. Brugerne deler billeder med hinanden og os andre, og der er godt nok mange billeder. Jeg kan ikke finde oplysninger om antallet, men skal vi gætte på hundredtusindvis?

Brugerne, der lægger billeder ind, mærker dem selv op med nøgleord. Tagger dem, som det hedder på Flickr. Denne tagging giver en sammenhæng mellem billeder, der ellers ikke hænger sammen.

Men problemet med at lade tusindvis af brugere skabe nøgleord efter behov, er at det er netop hvad de gør. De tilføjer nye nøgleord hele tiden, og ikke altid nogle, der giver mening eller lever op til det ædle mål med systemet.

Desuden bruger de forskellige stavemåder, former og synonymer for det samme, med det resultat, at der alligevel ikke er sammenhæng mellem begreberne.

Skal billeder af festlige begivenheder nu tagges med party [Wayback-link], partypix [Wayback-link], partypics?

Folk opfinder selvfølgelig også selv ord og begreber.
Hvad med billeder af topv9999 [Wayback-link] eller dilo [Wayback-link]?

Man behøver såmænd ikke have en åben folksonomi så Flickr for at få det problem. Selv betroede redaktører som dem på IMDB kan rode i tingene, og ikke rigtigt blive enige om, hvordan man bedst markerer at en film er en samurai-film.

Nøgleordsdisciplin <

Vi på Vertikal er store tilhængere af nøgleordsopmærkning. Det giver normalt langt mere mening en kategorisering. Det ene udelukker i øvrigt ikke det andet.

Men vi ser ikke folksonomier som det helt store, praktiske værktøj med mindre man er meget moderne eller enormt velbesøgt.

Et lille antal mennesker vil let kunne nøgleordsopmærke til højre og venstre, mens et stort antal mennesker vil garantere for en hvis lødighed. Se for eksempel Wikipefia. Det enorme antal bidragydere holder styr på tingene.

Amazonificerede nøgleord <

Idé: Hvad hvis man lod brugerne skabe sammenhængen mellem nøgleord, som de kan skabe sammenhængen mellem artikler eller varer med en recommendation engine?

Det kunne faktisk være ganske perspektivrigt. Jeg er ganske begejstret for amazonifincering, og tanken om henvisninger i stil med "læsere der læste artikler om "søgemaskineoptimering" læste også artikler om "loganalyse" og "nøgleord".

Og den slags er slet ikke svært at lave. Blot man har styr på sit CMS, så kan det snildt udbygges med opsamling af brugerdata og lidt datamining til at lave de relevante links.

Amazonificerede nøgleord... det har en god smag i munden...

Manden bag <

Jeg fandt lige den her mens jeg fór omkring på nettet.
Angiveligt skulle det være Thomas Vander Wal der oprindeligt fandt på ordet. Hans hjemmeside er da også overstrøet med allehånde trendy ord og begreber som infoclouds, tag clouds, folksonomy, keyword taxonomy. Alle hans indlæg om folksonomies kan findes her [Wayback-link]. Men han har skam også en personlig infocloud om folksonomier [Wayback-link]. Der er mange kloge ord om folksonomier, smalle og brede og fine grafer. Han har set lyset må man sige...

Vi sælger skamløst viden og assistance vedrørende