1 - 100 - mange <
Hvor mange er så mange nøgleord?
Tja, de 99 nøgleord som vi har lige nu på Vertikal er jo ikke noget, der vælter læsset. Det kan de fleste overskue, og selv om vi sætter dem op på en rigtig moderigtig og tidssvarende Web-2.0-agtig måde ligesom de kan på
Flickr 🏛️ eller
del.icio.us 🏛️, så er de stadig til at overskue.
Bliv ikke bange! Det er bare vores sædvanlige
nøgleord, der er sat op med skriftstørrelse efter deres popularitet. Det samme liste som
den her, men i en moderne indpakning.
Men hvad hvis vi havde 200 nøgleord? Så var der problemer med næsten enhver form for repræsentation af ordene. Og havde vi 2000, så måtte vi virkelig finde på noget nyt på grund af uoverskueligheden. En plamage som ovenfor var utænkelig, og selv en liste ville stort set være ubrugelig.
Et ord, flere betydninger <
Udover antallet af ord, som kan give en vis uoverskuelighed, er der andre problemer.
Synonymer - flere ord der betyder det samme - giver problemer. Det modsatte, altså ét ord, der betyder flere forskellige ting, eller har forskellige betydninger i forskellige sammenhænge er næsten endnu værre.
Det skal eksemplificeres.
Kan en kok stege stege i Stege? <
Lad os antage at vi skal lave en hjemmeside henvendt til kokke. Den skal handle om råvarer, opskrifter, køkkentøj, restaurationsdrift og hvad man ellers kan forestille sig at kokke kan interessere sig for.
Hvis vi tager et ord som stege, der kan optræde mange gange på sådan en hjemmeside, så kan man hurtigt skabe vanskeligheder hvis forfatterne til tre artikler mærker deres artikel med nøgleordet stege.
Atiklerne hedder:
"Korrekt udskæring af en kalv" - stege som i en steg
"Kunsten at langtidsstege" - stege som i at stege
"Sydsjællandske lokalmejerier" - stege som i byen Stege
Søger kokken på stege, ser han måske følgende:
Stege
- Udskæring af stege
- Modning af stege
- Langtidsstegning
- Stegning i wok
- Stege, Møn, Region Sydsjælland
Set på en anden led kan stege optræde under Modning
- Stege
- Vildt
- Frugt
- Oste
eller under Region Sydsjælland
- Næstved
- Præstø
- Stege
- Nakskov
- Maribo
Ordtræ <
Et meget lille udvalg af ord sat op i et stamtræ.
Emne | Nøgleord | Synonymer |
metoder |
stege |
stege braisere sautere brase grille riste |
koge |
koge porchere dampe |
kød |
stege |
stege |
bøffer |
bøffer |
hakket kød |
hakket kød fars |
regioner |
Sydsjælland |
Stege Maribo Næstved Nakskov Præstø |
Nordsjælland |
Hornbæk Helsingør Hillerød
|
Synonymer <
Og det kunne jo være at én af forfatterne ikke kalder det at stege, men er lidt frankofil og sauterer. En anden har været på dansk kro, og der braser man, mens en tredje braiserer.
I bund og grund er det det samme ord (kokke må have mig undskyldt), men der er altså mange forskellige måder at sige og stave det på.
Vores system skal altså ikke bare kunne se forskel på stege, stege og Stege, men også være klar over at den første udgave er identisk med ordene sautere, brase og braisere.
Det er ikke nogen triviel opgave, rent teknisk, men absolut muligt.
Ordenes stamtræ <
Når nøgleordene skal organiseres, lægges de ind i et træ, hvor der kan være mange ens ord, som har forskellige tilhørsforhold, som illustreret i vedstående skema.
Her ses en taksonomi med tre niveauer: emne, ord og synomymer.
Emnerne er en form for samlende kategorier, som bruges til at grovinddele ordene. Disse ord bruges ikke til opmærkning, men kun for at skabe overblik. Det vil i øvrigt ikke være unormalt at der er overlap eller fuldkommen sammenfald mellem disse emner og hjemmesidens eventuelle overordnede kategorier.
Nøgleordene er de egentlige nøgleord. Det er dem, der bruges af redaktørerne til at mærke artikler op med, og dem som er samlende for de forskellige emner, som artiklerne omhandler.
Synonymerne er blot andre ord der kan repræsentere de samme begreber som ordene. Disse synonymer er der dels for at give redaktørerne en forståelse af hvad nøgleordet egentlig dækker og dels for at være nyttige i for eksempel søgninger, hvor brugernes forskellige betegnelser for det samme nøgleord kan listes op. En søgning på et synonym kan så føre brugeren til det nøgleord, som bruges i systemet.
Man kunne forestille sig et niveau mere, nemlig former, hvori forskellige staveformer og bøjninger af ordene kunne findes. Her ville man kunne dække ental, flertal, bestemt form, ubestemt form og så videre. Ja, man ville endda kunne dække fejlstavede ord — alt sammen igen af hensyn til søgningen.
Hil bibliotekarerne! <
Manglen på disciplin er nøgleordenes største fjende. Hvis man lader brugere eller redaktører oprette nøgleord som det passer dem, så vokser listen med nøgleord, og der vil dukke ord op, som
- allerede findes i en anden form
- ikke er rigtige nøgleord
- dobbeltdækker f.eks. kategorier
Lad mig udbygge dette en smule.
- synomymer er gode eksempler på at ord allerede eksisterer. Det er vigtigt at man vælger stamformen (nøgleordet i skemaet ovenfor), og ikke tilføjer et nyt ord, som betydningsmæssigt er identisk.
- meget generelle og brede ord giver normalt ingen mening som nøgleord. I vores kokke-eksempel er ord som madlavning, køkken og kok ikke særligt brugbare. De vil stort set kunne sættes på alle artikler i systemet.
- eksempler på dobbeltdækning kunne være kategorier, forfatternavne eller andet, som allerede er omfattet af en anden del af CMS'ets systematik. Optræder en artikel for eksempel i sektionen Debat, er der ingen grund til at mærke den med et nøgleord der hedder Debat.
For at få styr på denne potentielle kakafoni af nøgleord, skal man have en nøgleordsredaktør, hvis ansvar det er at holde styr på alle ordene, luge dobbeltdækninger ud, oprette synonymer og i det hele taget styre listen.
Pågældende skal have en grundliggende forståelse for nøgleordsbegrebet, et godt kendskab til emnerne og god sproglig forståelse.
Bibliotikarer er normalt gode nøgleordsredaktører.
Brugerne til magten <
Man kan også vælge en helt anden vinkel på nøgleordssystemet og lade brugerne eller redaktørerne oprette nøgleord som de vil.
Frem for at vælge i en liste, så får de lov bare at taste nogle passende ord ind i et eller flere felter, og systemet kondenserer dem så ned og tilføjer dem til sin centrale liste af nøgleord.
Dette kaldes ofte for
folksonomier — et ikke særligt korrekt ordspil på taksonomier. Folksonomier er nemlig ikke taksonomisk strukturerede, men blot en lang liste af ord, hvor emner, nøgleord, synonymer og former er blandet i et misk-mask.
Folksonomier er lidt af en trend for tiden — et buzzword — og bruges på nogle af de hedeste brugerdrevne hjemmesider såsom
billeddelingstjenesten <b 🏛️ (der kalder ordene
tags),
lyddelingstjenesten <b 🏛️ (der også kalder dem
tags 🏛️) eller
bogmærkedelingstjenesten <b 🏛️ der minsandten også kalder deres nøgleord for
tags.
Hver af disse tjenester og mange andre lader brugerne, som lægger nye henholdsvis billeder, lyde og URL'er ind på siderne, mærke disse op med helt valgfrie nøgleord eller tags. Da der er mange brugere på siderne vokser listen med tags meget hurtigt, og da der ikke er styring på hvilke ord der bruges, så opstår der let et mildt kaos.
Tjenesterne har dog mange brugere og mange brugere har en tilbøjelighed til at trække listen af ord hen mod det normale. Vi tænker trods alt ret ens, og derfor så former listerne med de mest populære ord sig efterhånden nogenlunde fornuftigt.
De løbske nøgleord <
Flickr er en billeddatabase på en lidt anden måde. Brugerne deler billeder med hinanden og os andre, og der er godt nok mange billeder. Jeg kan ikke finde oplysninger om antallet, men skal vi gætte på hundredtusindvis?
Brugerne, der lægger billeder ind, mærker dem selv op med nøgleord. Tagger dem, som det hedder på Flickr. Denne tagging giver en sammenhæng mellem billeder, der ellers ikke hænger sammen.
Men problemet med at lade tusindvis af brugere skabe nøgleord efter behov, er at det er netop hvad de gør. De tilføjer nye nøgleord hele tiden, og ikke altid nogle, der giver mening eller lever op til det ædle mål med systemet.
Desuden bruger de forskellige stavemåder, former og synonymer for det samme, med det resultat, at der alligevel ikke er sammenhæng mellem begreberne.
Skal billeder af festlige begivenheder nu tagges med
party 🏛️,
partypix 🏛️,
partypics?
Folk opfinder selvfølgelig også selv ord og begreber.
Hvad med billeder af
topv9999 🏛️ eller
dilo 🏛️?
Man behøver såmænd ikke have en åben folksonomi så Flickr for at få det problem. Selv betroede redaktører som dem på IMDB kan rode i tingene, og ikke rigtigt blive enige om, hvordan man bedst
markerer at en film er en samurai-film.
Nøgleordsdisciplin <
Vi på Vertikal er store tilhængere af nøgleordsopmærkning. Det giver normalt langt mere mening en kategorisering. Det ene udelukker i øvrigt ikke det andet.
Men vi ser ikke folksonomier som det helt store, praktiske værktøj med mindre man er meget moderne eller enormt velbesøgt.
Et lille antal mennesker vil let kunne nøgleordsopmærke til højre og venstre, mens et stort antal mennesker vil garantere for en hvis lødighed. Se for eksempel Wikipefia. Det enorme antal bidragydere holder styr på tingene.
Amazonificerede nøgleord <
Idé: Hvad hvis man lod brugerne skabe sammenhængen mellem nøgleord, som de kan skabe
sammenhængen mellem artikler eller varer med en
recommendation engine?
Det kunne faktisk være ganske perspektivrigt. Jeg er ganske begejstret for amazonifincering, og tanken om henvisninger i stil med "læsere der læste artikler om "søgemaskineoptimering" læste også artikler om "loganalyse" og "nøgleord".
Og den slags er slet ikke svært at lave. Blot man har styr på sit CMS, så kan det snildt udbygges med opsamling af brugerdata og lidt datamining til at lave de relevante links.
Amazonificerede nøgleord... det har en god smag i munden...
Manden bag <
Jeg fandt lige den her mens jeg for omkring på nettet.
Angiveligt skulle det være Thomas Vander Wal der oprindeligt fandt på ordet. Hans hjemmeside er da også overstrøet med allehånde trendy ord og begreber som infoclouds, tag clouds, folksonomy, keyword taxonomy.
Alle hans indlæg om folksonomies kan findes her 🏛️. Men han har skam også en
personlig infocloud om folksonomier 🏛️. Der er mange kloge ord om folksonomier, smalle og brede og fine grafer. Han har set lyset må man sige...