Det er årsmøte i den samiske foreninga. Referenten er usikker på hvilket språk hun skal velge. Ikke alle medlemmene behersker samisk. Skal hun skrive på norsk, selv om mesteparten av innleggene er på samisk, men med tolking? Lærereren i samiskklassen skriver informasjon om fjellturen til foreldrene. Han vet at et par av ungene har en forelder som ikke behersker samisk, kanskje er det de som skal lese brevet. Skal han la være å skrive på samisk, og heller skrive på norsk? På Facebookgruppa for samiske klær skrives det en kommentar på samisk til et bilde som et samisktalende medlem har lagt ut. Flere ikke-samisktalende klager over at de føler seg ekskludert. Det blir en het diskusjon om bruk av samisk språk, og det ender med at administator gir opp og legger ned hele gruppa.

Disse eksemplene er tenkte hendelser, men de har alle relevans til virkeligheta. Det som skjer er resultatet av to ulike samfunnstendenser: Med en ny språkpolitikk blir samisk i større grad enn før tatt i bruk i skrift, og med den digitale revolusjonen blir en større del av den private samtalen flyttet ut i det offentlige rommet. Der vi før sto ansikt til ansikt med dem vi snakket med, skriver vi nå mer og mer til hverandre, på sosiale fora. Det som før var en diskusjon mellom en gruppe mennesker på samme sted og samme språk, blir nå til en offentlig diskusjon for alle som forumets lesere. Samiskspråklige må dermed alltid regne med lesere som ikke kan samisk, og mange velger da også å skrive på norsk. Noen skriver likevel på samisk. Dette fører norskspråklige opp i en ny situasjon: De blir eksponert for samisk, et språk de ikke forstår.

Mange har reagert på dette med høylydte protester, og krevd å få lese innleggene på norsk. Vi har dermed fått den absurde situasjonen at Facebook-grupper med samiske temaer i praksis har fått en streng politikk for å bruke bare norsk, og dermed kan gruppene i praksis heller ikke inkludere samer i Finland som ikke er dyktige i norsk.

Maskinoversetting som svar

Svaret vårt på hvordan alle skal kunne delta, men samtidig uten å utelukke bruk av samisk, er å tilby maskinoversetting - et dataprogram som gjør at norskspråklige skal kunne lese en oversettelse av den samiske teksten til norsk. Ved UiT har vi laga et slikt program, http://jorgal.uit.no. Her kan du få nettsider og dokumenter oversatt fra nordsamisk til norsk. Ikke alle nettsider slipper oss til, Facebook har f.eks. ei sperre som gjør at programmet vårt ikke kan oversette sidene i sin helhet, men derimot er det altså mulig å kopiere de samiske innleggene over i vinduet på jorgal.uit.no-sida og oversette der. Et slikt program bør også finnes for sør- og lulesamisk, og vi har planer om dette.

Samisk kan ikke “komme på Google translate”, det er rett og slett for lite parallelltekster mellom samisk og andre språk til at det er mulig å bruke Google sin teknologi. I steden bruker vi en grammatisk metode, som ikke er avhengig av så mye tekst, og som er mer tro mot originalen enn det Google er, men som gir mindre flytende norsk.

Bruk av maskinoversetting vil også få følger for den samiskspråklige skribenten. Tekster skrevet med en høyst personlig rettskriving eller uten samiske bokstaver er vanskeligere for datamaskinen, og sjansen for å bli misforstått, eller ikke forstått i det hele tatt, vil øke betraktelig. Vi kan til en viss grad gjøre programmet mer robust til å takle slik input, men det er tidkrevende.

Hvorfor ikke fra norsk til samisk?

Så vil noen kanskje spørre hvorfor vi ikke tilbyr et maskinoversettingsprogram fra norsk til samisk. Det gjør vi nemlig ikke, og det er gode grunner til det.

Maskinoversettelsesprogrammer kan brukes på to måter: For å forstå en tekst som er skrevet på et språk du ikke kan, eller for å produsere en tekst på et annet språk enn den var skrevet på. Programmet vårt er laga for å forstå samisk. Brukeren godtar at resultatet ikke er flytende norsk, fordi det uansett er bedre enn den uforståelige samiske originalen. Alle som prøver programmet vil se at resultatet er forståelig norsk, men ingen ville drømme om å publisere det uredigert, f.eks. som ei bok.

Fra norsk til samisk er situasjonen en helt annen. Mange vil svært gjerne publisere noe på samisk (på hjemmesider, som gratulasjoner…), men de kan ikke samisk. Hvis vi hadde laget et program som oversatte fra norsk til samisk, ville resultatet ha vært en samisk som er minst like dårlig som den norsken vi er i stand til å lage nå. Norsk og samisk er grammatisk sett svært ulike, og det er vanskelig å få til god samisk på grunnlag av norsk. Et slikt program vil føre til publisering av en hel masse svært dårlig samisk. En situasjon der mesteparten av all samisk publisert på internett kommer fra våre program fortoner seg som et mareritt. Det ville rett og slett ha ødelagt den samiske skriftkulturen.

I Norge vil alle samiskspråklige lesere foretrekke å lese den norskspråklige originalen framfor en dårlig, maskinoversatt versjon. Til forskjell fra de enspråklige norskspråklige kan nemlig de samiskspråklige velge hvilket språk de leser teksten på.

Det bør være mulig å bruke samisk, også i det offentlige rommet, der teksten alltid risikerer å bli lest av noen som ikke kan språket. Å komme ditt er målet vårt.