23. maj 2014

Søgeresultater skal være relevante

Foredrag

Dansk Bibliotekscenter vil hjælpe biblioteksbrugere til at få bedre søgeresultater i bibliotek.dk, og om et par måneder lancerer de et forsøg med ”relevansrankering”.

Det vigtigste skal stå først

Kirsten Larsen kommer fra DBC, hvor hun arbejder som product owner på bibliotek.dk. Hun er inviteret til at holde en forelæsning for studerende på IVA om rankering i relation til bibliotek.dk, og hun har lovet at tage de studerende med helt ind i maskinrummet. Men hvad er relevansrankering?

-Det drejer sig ganske enkelt om, at jeg gerne vil have, at det, man leder efter, står først. Relevansrankering er et subjektivt begreb. Derfor må vores mål være, at flere brugere oftere får det, de leder efter, højere op i resultatfeltet, forklarer Kirsten Larsen.

Google arbejder ud fra kommercielle kriterier, og ofte vil de tre første links i en søgning være købelinks, som nogen har betalt sig til at få højere op. DBC lægger vægt på, at deres system er åbent og gennemskueligt, og at folk selv kan vælge ud fra hvilke kriterier, de søger og få posterne sorteret. Den nye grænseflade på bibliotek.dk bliver baseret på open source og har været i drift siden november 2013.

Du vælger selv, hvad der er relevant for dig

-Vi vil gerne give folk mulighed for at vælge hvordan posterne sorteres: enten ud fra det mest populære, eller det nyeste eller måske det ældste. Nogle gange kan det være mest belejligt at vælge noget, der svarer til ens profil og andre gange måske det stik modsatte, for nu vil man lige præcis læse noget nyt, man ikke plejer, fortæller Kirsten Larsen. Men det sværeste er det, man populært kalder relevansrankering, fordi relevans er subjektivt.

Relevansalgoritmer er typisk en blanding af, hvor ordet står, hvor mange gange det optræder og hvor hyppigt det er i databasen. Men hvordan kan søgesystemet gætte sig frem til, hvad folk leder efter? Arbejdsidéen har været at tjekke i hvilke indekser, brugerens søgeord optræder hyppigst, og så vælge den rankeringsmetode, der passer bedst til det. Lad os tage et par eksempler. "Mit liv som papegøje": disse ord står hyppigst i titelfeltet, altså vælges en rankeringsalgoritme, som er god til titler. "Klimamodeller": dette ord står hyppigst i emnefeltet, altså vælges en rankeringsalgoritme, der er god til emner. DBC udfører et stort antal testsøgninger og bedømmer relevansen af fundene. Så har de et testmateriale som kan bruges til at bedømme rankeringsalgoritmerne.

-Jeg regner med, vi sætter systemet i drift på bibliotek.dk til efteråret for at prøve det af. Vi laver det som en del af vores fælles services, så de biblioteker, der bruger DBC’s brønd og webservices kan gå ind og bruge det, vi udvikler, hvis de har lyst, slutter Kirsten Larsen.

Relevansrankering på IVA

På IVA arbejder man med relevansrankering i faget Informationsarkitektur og –søgning, og det var underviserne fra dette fag, der havde taget kontakt til Kirsten Larsen fra DBC.

DBC's hovedopgave er at drive og udvikle den bibliografiske og systemmæssige infrastruktur til bibliotekerne i Danmark:
•   Udarbejde den danske nationalbibliografi og en brugerrettet bibliotekskatalogisering.
•   Drive og udvikle DanBib, som er folke-, uddannelses- og forskningsbibliotekernes fælleskatalog, og som understøtter det fælles lånesamarbejde mellem bibliotekerne.
•   Drive og videreudvikle bibliotek.dk, der er borgernes fælles indgang til alle danske udgivelser og til de danske bibliotekers samlinger.

-Vi beskæftiger os teoretisk med at definere relevansbegrebet og ser i den forbindelse på, hvorledes forskellige informationsvidenskabelige teoretikere har forsøgt at definere, hvad relevans egentlig er, fortæller Jeppe Nicolaisen. -Tidligere var den herskende opfattelse, at relevans i overvejende grad er forankret i mere psykologisk orienterede teorier, men i dag er der en langt større forståelse for de sociale og kulturelle faktorer, der påvirker relevansbedømmelsen. Mennesker med forskellig socio-kulturel baggrund ser ofte forskelligt på relevansen af samme dokument, tekst, eller hvad det nu måtte dreje sig om. Relevansrankeringer er derfor ikke objektive, men er altid forankret i, eller udtryk for, en subjektiv og socio-kulturelt forankret forståelse. Kirsten Larsens forelæsning om DBC's arbejde med relevansrankering var et rigtig godt eksempel på det. Hun viste hvordan de i praksis arbejder på at udvikle en (faktisk flere) algoritme(r) til netop at sortere fundne poster efter relevans, og hun gjorde det meget klart, at der er mange forskellige parametre at "skrue" på i den proces.

Jeppe Nicolaisen forsker ikke selv i relevansrankeringer, men han kan alligevel sagtens genkende elementer fra DBC's projekt i sin egen forskning.

Indsæt dit billede her...

Jeppe Nicolaisen-Jeg arbejder primært med forskningsanalyse og bibliometri. Jeg har blandt andet udviklet et alternativt mål for evaluering af videnskabelige tidsskrifter (kaldet 'the reference return ratio'). Det er et alternativ til den velkendte Journal Impact Factor (JIF). Arbejdet med dette alternative mål var i høj grad et arbejde med at "skrue" på forskellige parametre, der kan siges at måle forhold omkring kvalitet, og så løbende teste effekten af denne "skruen", for så til sidst at ende op med et endeligt bud på et alternativt mål.

Efter forelæsningen meldte en række studerende fra IVA sig til at være testpersoner og arbejde med relevansrankering i praksis.

Af Bodil Christensen

Institut for Kommunikation

Søgeresultater skal være relevante

Det vigtigste skal stå først

Du vælger selv, hvad der er relevant for dig

Relevansrankering på IVA