Mange har fått grønne streker når de skriver i Word, men få kjenner historien bak.
– Arbeidet har vært både gøy og vanskelig, sier UiO-professor Janne Bondi Johannessen.
I en artikkel på hjemmesiden til Det humanistiske fakultet ved Universitetet i Oslo forteller hun om et språkforskningsprosjekt som har fått praktisk nytteverdi for alle.
De grønne strekene i Word er historien om forskning de fleste har merket resultatene av, men nok ikke kjent historien bak.
Hver gang Microsoft Word gjør oss oppmerksomme på en sannsynlig grammatisk feil i det vi har skrevet, er det en frukt av mange års grunnforskning ved UiOs tekstlaboratorium, ledet av Janne Bondi Johannessen.
Det var et finsk firma som var mellomledd mellom Microsoft og Tekstlaboratoriets professor Janne Bondi Johannessen og senioringeniør ved laboratoriet Kristin Hagen. Det var et oppdrag de fikk utenfra, men oppdragsforskning var det likevel slett ikke, understreker de to. Forskningen var nemlig allerede gjort.
– Det eneste vi trengte å gjøre, var å operasjonalisere den på en måte som kunne brukes i akkurat denne sammenhengen, sier de. Det tok noen måneder. Forskningen derimot har gått over mange år, sier Johannessen.
De grønne strekene i Microsoft Word er blant de tydeligste sporene som Tekstlaboratoriet har etterlatt seg utenfor akademia.
Det hele begynte med at Johannessen og andre for hele 20 år siden startet det såkalte taggerprosjektet – et prosjekt tilknyttet Norges forskningsråd. En tagger er et avansert digitalt analyseverktøy.
Målet med prosjektet var ubeskjedent: å utvikle et automatisk verktøy som både kunne identifisere ord, klassifisere dem og analysere dem i forhold til hverandre, i setninger. Resultatet er nå, etter flere oppdateringer, kjent som Oslo-Bergen-taggeren (OBT).
Det er ikke et lite stykke språkteknologisk innovasjon det er snakk om. Taggeren er den beste i sitt slag og har en treffsikkerhet på 96,5 %, helt uten menneskelig hjelp.
Les hele artikkelen på UiO Det humanistiske fakultets hjemmeside.