Nøgleord og metainformation

En forsvarstale at bryde med den hierarkiske kategorisering - aka den intelligente brugers bedste navigationsværktøj

På barrikaderne for nøgleordene! <

Denne præsentation er lavet som en kort forsvarstale for destruktureringens fortræffeligheder.

Den viser eksempler på anvendelsen og argumenterer for og imod brugen af nøgleord, metainformation og granulering — dog mest for.

Tre emner <

Vi skal se på tre emner:
  1. Nøgle- eller emneord

  2. Metainformation

  3. Granulering

Nøgleord er en gammel opfindelse <

Bibliotekerne har forlængst bevist at nøgleord er det helt rigtige.

Tag en bog — vi bruger altid Nietches Ecce Homo — og placér den rent fysisk i en reol på biblioteket.

Er den en levnedsskildring? Ja!
Er den filosofi? Ja!
Er den tysk historie? Ja!
Er den skønlitteratur? Ja!
Er den en masse andre ting? Sic!

Men hvor skal den så stå på hylderne?

Vi stiller den under levnedsskildringer og tilføjer en række emneord til bogen.

Dermed giver vi brugere, der leder efter den som andet end en levnedsskrildring, mulighed for at finde den.

Ananova <

Det britiske nyhedssite Ananova [Wayback-link] bruger nøgleord til at støtte en traditionel navigationsstruktur. De tilbyder altid "læs mere om..." nederst på siderne, og det kan bringe læseren på tværs i systemet.

Denne historie om en hest, der skal være senator [Wayback-link] følges af en række henvisninger til lignende historier gennem nøgleord.

Her er nøgleordene
animal tales
horses
sporting quirkies
.

De kan føre læseren helt på tværs i systemet og give anderledes relationer mellem historier.

Ananova har mange nøgleord — se for eksempel sportsnøgleordene [Wayback-link] — men de er det op i et hierarki. Det letter overblikket.

GFF <

Jeg er partner på et projekt, der løb løbsk og blev en uventet succes [Wayback-link].

Her er alle siderne lavet manuelt (statisk HTML — gør det aldrig!), og vi havde mistet overblikket (for ikke at tale om hvad læserne havde...).

Løsningen var en kategorisering [Wayback-link] og nøgleordstilknytning [Wayback-link] til artiklerne, som nu gør navigeringen meget nemmere og styringen af artikler meget bedre.

Nu kan man finde alle referenceartikler [Wayback-link], begynderartikler [Wayback-link], artikler om flueliner eller kasteteknik [Wayback-link].

Desuden er artikler mærket af med nøgleord nu udstyret med henvisninger til lister med andre artikler om samme emner på tværs af den kategoriopdeling, der ellers er den almindeligste relation mellem artikler.

Se for eksempel denne artikel om en rejse til Belize [Wayback-link], som henviser til de emner, den handler om for eksempel boganmeldelser.

IMDB <

Den store filmdatabase IMDB bruger også nøgleord. her kan man søge efter film med bestemte temaer eller egenskaber gennem nøgleordene.

Man kan for eksempel se, at Mel Gibson overraskende nok er mest associeret med independent film [Wayback-link].

IMBD afslører dog også svaghederne i systemet. Man skal være anal med at udstyre sine tekster med nøgleord, ellers går det galt. En liste med alle film med nøgleordet samurai'era [Wayback-link] rummer således ikke en eneste Kurosawa-film endskønt at han lavede adskillige af slagsen, hvilket man kan forsikre sig om ved at lede efter samurai under Kurosawas film [Wayback-link].

Dette eksempel afslører også en anden svaghed: for mange nøgleord svækker systemet. Hvorfor både samurai, samurai'era, samurai-boy, samurai-spirit og samurai-warrior? Det skaber blot inkonsistens og forvirring.

Et hierarki eller en taxonomisk opbygning kunne delvis løse problemet.

Vertikal <

På Vertikal har vi også nøgleord. Vi bruger dem til at binde stof sammen, som ikke har nogen strukturel plads i et system.

Læserne får således ikke henvisninger rundt i et hierarki — op til en overordnet kategori og ned i en anden gren — men kun relevante henvisninger på tværs i indholdet.

Nøgleord og kategorier <

Tre af de viste systemer rummer alle både nøgleord og kategorier i mere traditionel forstand.

Brugerne er meget vant til at tænke i kategorier — tænk bare på et nyhedssite uden sektioner som sport, indland, udland og så videre. Det er den måde vi har lært at tænke på.

Men nettet bryder med nødvendigheden af disse hierearkiske strukturer. Vi beibeholder dem dog for brugernes skyld, men benytter samtidig andre metoder til at binde indholdet sammen på tværs.

På Global FlyFisher er kategorierne blot et skelet, som artiklerne hænges op på. En artikel kan i princippet hænge lige så mange steder man vil, og kategorierne er altså en slags strukturnøgleord.

På Vertikal har vi helt afskaffet kategorierne og bruger kun nøgleord. Det er fordi vi gerne vil være anderledes.

Taxonomi <

Ved at opdele nøgleordene i et hierarki — lave en taxononisk opdeling — opnår man flere fordele, især hvis man har mange nøgleord.

Taxonomi kunne i tilfældet samurai være:
Japan
  Samurai
    Dreng
    Kriger
    Åra
    Ånd


Man ville da tilknytte nøgleordet eller hierarkiet Japan-Samurai-Kriger til artiklen, og dermed få bedre styr på de løbske nøgleord. Samtidig ville den Kriger være en anden Kriger end i artiklen om korstogsridderen, som ville høre til i hierarkiet Middelalder-Korstog-Kriger.

Den sidstnævnte Kriger kunne dog sagtens være den samme Kriger som findes i hierarkiet Kristendom-Korstog-Kriger.

Vi ser altså at hierarket — ligesom nøgleordene selv i forhold til kategorier — mere er en relationsoversigt end et egentligt klassisk træstruktureret hierarki.

Sådanne relationer på tværs i systemet kaldes ofte associative relationer.

Synonymer <

Nøgleord bør samtidig virke som "synonymgeneratorer", for eksempel ved søgning. Bruger vi nøgleordet Kriger i rækken Kristendom-Korstog-Kriger, bør det betyde, at systemet ved at nøgleordet Kristendom-Korstog-Ridder også er aktuelt her.

Det kan for eksempel udnyttes ved en søgning, som selvfølgelig bør søge i nøgleordsfelterne og de relevante synonymer også.

De rigtige ord <

Når man laver sin nøgleordsliste, gælder det om ikke at gå amok, og tilføje alle ord og begreber som nøgleord.

Hvis der bliver for mange ord, der dækker det samme, udvander man nøgleordssystemets gavn. Det handler om at finde generelle, overordnede begreber, som er dækkende og brede nok til at rumme flere aspekter af det emne, de henviser til og alligevel er præcise og nemme at tolke.

Gode nøgleord er:
  • processer og hændelser
    - flytning
    - immigration
    - hjemrejse

  • persontyper eller -grupper
    - rygsækrejsende
    - asylansøger
    - flygtning


  • Dårlige nøgleord er:
  • navne (for det meste)
    - Peter Jensen
    - Boulevard St. Germain

  • upræcise begreber
    - rejse
    - ansøgning
    - udland

  • ord med mange betydninger eller ord der bruges i mange forskellige sammenhænge
    - ambassade
    - skat

  • Meget præcise begreber
    - green card
  • De stærke kombinationer <

    For brugerne er muligheden for at kombinere nøgleord en stærk mulighed for at stykke god information sammen.

    Ordene "sygdom", "hjemtransport" og "tilskud" kombineret i et nøgleordssystem giver færre og mere præcise resultater end en søgning på "tilskud til hjemtransport ved sygdom".

    Søgninger bliver nemlig enten meget præcise, og udelukker derfor mange resultater eller det modsatte, hvor de så medtager alt om alle ord.

    Ved opslag eller søgning via nøgleord, ledes man på vej af den redaktionelle vurdering, der er lagt i tilknytningen af ordene.

    Listen vokser <

    Man kan i princippet lade nøgleordslister vokse frem ad to veje:

  • En redaktør eller redaktion kan lave den og brugerne kan vælge fra den

  • Denne metode egner sig til komplekse systemer med et hierarki af mange nøgleord, hvor mange mennesker skal redigere. Her handler det om kontrol og systematik.

  • Brugerne kan selv tilføje. Tilføjede ord bliver til rådighed for alle.

  • Denne model egner sig til mindre systemer med et enkelt niveau af relativt få nøgleord, som vedligeholdes af få mennesker med et godt indblik i emneområdet. Det handler om inspirtation og intuition.

    I begge tilfælde vokser listen voldsomt i starten, men vil så stabilisrere sig og derefter ikke udvides i nær samme takt.

    Altså... <

    Nøgleord er smarte fordi de kvalificerer på tværs af stive strukturer, som under ingen omstændigheder kan afspejle den måde vi allesammen ser verden på.

    Nogen ser på historierne efter ordnen sport, politik, underholdning andre ser på den efter indenrigs og udenrigs og andre igen ser på historierne efter om der er noget om sex i dem.

    Vi kan som formidlere vælge vores favoritstruktur, men tilbyde læserne en anden måde at strukturere på.

    Hårdt arbejde <

    Det er hårdt arbejde at tilføje nøgleord til en tekst.

    Man skal være omhyggelig.
    Man skal tænke sig om.
    Man skal begrænse sig.

    Men tiden investeret kommer mangefold igen for læserne — fuldkommen som ved alle andre former for skrivning og redigering.

    Som et PS bør det selvfølgelig nævnes af faciliteter som disse sjældent er standard i CMS'er, og man derfor ofte vil være afhængig af specialudvikling.

    Den skjulte information <

    Metainformation er ikke bare META-tags, men langt mere raffineret information om informationen.

    Nøgleord er et eksempel på metainformation, men genre eller stilbeskrivelse kunne også være det.

    Traditionel metainformation <

    Metainformation er altså information, der ikke nødvendigvis kommer til udtryk på siden som klartekst.

    Traditionel metainformation omfatter typisk felter som

    • forfatter
    • oprettelse
    • historik
    • senest redigeret
    • kategorisering
    • publiceringsinformation

    Holdbarhed, underholdningsværdi, originalitet <

    I vores eget meget eksperimentelle publiceringssystem arbejder vi også med metainformation.

    Vi kan tilknytte nogle sære egenskaber til vores tekster, for eksempel

    1. Originalitet
    2. Provokation
    3. Holdbarhed
    4. Kvalitet
    5. Underholdning

    Desuden kan vi knytte en værdi kaldet Karakter til teksten, og fortælle systemet om det er et argument, en konklusion, en indledning eller én af en række andre typer tekst.

    En kort, en lang <

    På Vertikal har vi også mulighed for at lave en kort udgave af den samme artikel — helt automatisk.

    I nogle artikler er der således mærket af, at visse afsnit skal med i en kompakt udgave af artiklen, som brugerne så kan vælge at se. Den er en kondenseret udgave af en artikel, som vi måske har vurderet kan være noget lang at gnave sig igennem for visse læsere.

    Nye strukturer <

    Som med nøgleordene giver metainformation muligheden for nogle helt andre vinkler.

    Mit favoriteksempel er en database over dyr [Wayback-link].

    Foruden levested, vingefang og antal unger, foreslog jeg at man skulle registrere "nuttethed", "ulækkerhed" og andre mere abstrakte informationer.

    Ideen var efter min mening god, men blev forkastet.

    Børnene, der skulle bruge systemet, ville dog helt sikkert synes bedre om listen med "de ti mest ulækre dyr" end om emnet "vandhullets dyr".

    Det ene ville ikke udelukke det andet, men lærerne opfattede den (ikke overraskende) som upassende — ikke politisk korrekt, så at sige.

    Flere målgrupper, mange oplysninger <

    Danske-dyr.dk er også et eksempel på en andre anvendelser af metadata, nemlig målretning mod flere forskellige målgrupper og inddatering af enorme mængder af ekstra information med henblik på fremtidig udnyttelse.

    Således findes alle tekster i en let og en svær udgave. På hjemmesiden kan man så skifte mellem de to med et klik. En del information er fælles, en del er separat for de to udgaver.

    Desuden er der registreret et astronomisk antal oplysninger om hvert dyr — størrelser, tilhørsforhold, udnyttelse, relationer til andre dyr. Alt dette er et stort arbejde at strukturere og inddatere, men en stor fordel at have, når der er brug for det.

    Hårdt arbejde <

    Det overrasker nok ikke at det også er hårdt arbejde at tilføje metainformation.

    Der skal tænkes i nye baner og alle informationer skal mærkes med deres værdier på nogle veldefinerede skalaer.

    Men atter kan vi fastslå at tiden investeret her kommer mange gange igen.

    Atter bør det også tilføjes, at vi her virkelig er ude på overdrevet hvad angår standardfaciliteter. Jo mere kreativ, eksperimenterende og anderledes man vil være, desto mere støder man på CMS'ernes grænser.

    Opgaver <

    Løs de uddelte opgaver. Der er cirka et kvarters tid til at tænke i.

    Du kan se opgaverne her i Word-format, hvis du ikke har dem.

    Læserne snyder! <

    Opdeling af tekster er en sidste måde et nedbryde strukturer på og tilbyde læserne at læse artiklerne som de vil — hvilket sjældent er som de er skrevet.

    Læserne er nogle illoyale selvherskere, der gør hvad de vil! Især på nettet.

    De er komplet ligeglade med den smukke struktur og det dejlige forløb, som journalisten har lagt ind i teksten.

    Det gør som de vil de skarn!

    De skimmer
    De springer
    De begynder ikke ved begyndelsen
    De springer til andre artikler — ja, endog andre sites

    Det er nettets natur...

    Del op <

    Hvis vi skal gøre det rart for læserne at læse på den måde, så skal vi også skrive på den måde.

    Og første trin er en granulering — en opdeling.

    Teksten skal brydes ned i dele, som hver især er en lille, selvstændig enhed.

    Vi har en meget lang artikel om emnet, der faktisk handler om sig selv, og viser hvad vi mener. Den hedder Det nye tekstparadigme.

    Flere udgaver <

    Opdeling behøver ikke være i sekvens. Den kan også være parallel.

    Mit bedste eksempel er førnævnte lette og svære udgave af samme tekst.

    På danske-dyr.dk skrives alle tekster i en let og en svær udgave, der henvender sig til forskellige klassetrin. På grågåsen kan man nemt skifte fra svær [Wayback-link] til let [Wayback-link].
    Bemærk at alle detaljer: skrift, spaltebredde og selv billedtekster skiftes ud. Der findes simpelthen masser af ekstra information, som kan danne en let udgave.

    Danske-dyr.dk benytter i øvrigt også derudover kolossale mængder af metainformation, for eksempel om hvem der æder hvem, hvor dyrene findes, deres størrelser og meget andet.

    Hårdt arbejde <

    Det bør ikke komme bag på nogen: det er hårdt arbejde at granulere.

    Faktisk er det nok den hårdeste af vores tre discipliner, fordi den ikke kræver at vi blot tilføjer information til vores skriverier, men at vi konstruerer dem helt anderledes, og derfor skal lave grundigt om på vores vaner.

    Vi — forfatterne, journalisterne, skribenterne — og vores dovenskab og modvilje er nok den største hindring for at stof på nettet bliver præsenteret på en mere netvenlig måde.

    Vi sælger skamløst viden og assistance vedrørende