Maskinöversättning

Quo vadis, MT?

14 dec, 2019

Mycket prat är det om maskinöversättning i dessa tider, och ännu mer skrivs det om tekniken. Men vad är det egentligen som händer på området? Mats Dannewitz Linder återkommer här med en spaning mot framtiden.

/ Foto: iStock.

Förutsägelser om maskinöversättning finns det gott om. Precis som man på massor av ställen kan läsa om hur efterfrågan på översättningar växer alldeles enormt på grund av globalisering, digitalisering, internet osv. Modeord som ”Content” surrar i luften, ”connected translation” likaså – be mig inte förklara, men läs denna artikel. Och man kan se påståenden som ”den globala marknaden för maskinöversättning förväntas uppgå till 980 miljarder dollar år 2022”. Eller om efterredigering: ”I en nyligen gjord undersökning menade nästan hälften av deltagarna att det pågår en enorm ökning av antalet kunder som vill ha mänsklig efterredigering.” (Å andra sidan visar det sig att antalet svarande i undersökningen var 85 stycken …)

Så: kannstöperierna är många. Huruvida marknaden och efterfrågan på våra tjänster verkligen växer så som det påstås, eller om det främst rör sig om förhållandena i andra delar av världen eller om att massor av företag använder maskinöversättning utan mänsklig inblandning – ja, det vet egentligen bara den enskilda översättaren. Här ska jag i stället försöka ge en bild av vad du som översättare möjligen kan vänta dig av framtiden, om du är intresserad av att utnyttja maskinöversättning som en resurs – antingen som extra hjälpmedel eller som underlag för just efterredigering.

För det första verkar det faktiskt vara så att även om ”neural MT” (NMT) gör stora framsteg och kan användas för allt fler språkkombinationer så är det fortfarande statistisk MT (SMT) som är den mest utnyttjade resursen. Det beror på sådant som att den är lättare att hantera (NMT kräver enorma datamängder och mycket tid), det finns redan mycket data att tillgå, och det går förhållandevis snabbt att lägga till nya språk. Allt är alltså inte NMT även om det kan synas så.

För det andra så ligger det uppenbarligen en viss sanning i att marknaderna och efterfrågan växer – frågan är bara var och inom vilka språkområden. Men det kan alltså vara idé att se sig om och kanske försöka hitta nya specialiseringar.

“De som jobbar med sådana här saker är inga dumhuvuden.”

Och för det tredje är det allt fler som poängterar det som bl.a. Björn Olofsson, jag själv och en guru som Jost Zetzsche upprepade gånger har understrukit: den översättare som inte redan är tillfredsställd med sin arbetssituation och är trygg med att den kommer att vara lika bra de kommande tio åren bör inte vara rädd för den snabba tekniska utvecklingen utan i stället försöka sätta sig in i och utnyttja den.

Lite mer konkret kan vi vänta oss bland annat följande – och här tänker jag använda det förkättrade uttrycket AI, artificiell intelligens, för den teknik som är på gång (och då menar jag inte NMT, för det är ändå tveksamt hur ”intelligent” den tekniken kan anses vara).

– Översättningsföretagen kan komma att använda AI för att hitta den översättare som är bäst lämpad för ett visst jobb.

– Möjligen kan AI också användas för att få till stånd någon sorts ”dynamisk prissättning”, både gentemot kunden och gentemot frilansöversättaren. Vad gäller just prissättning så är det en hel del på gång på området efterredigeringsjobb (post-editing). Språktjänstföretaget Synergium (numera med huvudkontor i Stockholm) har börjat tillämpa betalning per timme av frilansöversättarna men samtidigt debitering per ord av kunderna – det gör man genom att tillämpa en ”arbetsmätmetod” från TAUS som heter DQF (Dynamic Quality Framework) och som man anser ger bra underlag både för rättvis betalning och för långsiktig produktivitetsberäkning. Och företaget Acolad använder egna MT-motorer som man har kvalitetsgraderat; där betalas översättaren som vanligt för träffar i översättningsminnet ner till 75 procent; för övriga segment används MT, och då betalas enligt den kvalitetsgradering som företaget har tilldelat MT-motorn. Vi kan nog räkna med att få se många fler modeller för detta knepiga område.

– Säkerligen kan AI bli till nytta för översättningsföretagets projekthantering. Men med tiden kan AI också tänkas bli användbar för frilansöversättaren genom att ge en bild av hur hen arbetar och på så sätt bidra till ett kanske både roligare och effektivare arbetssätt.

– Vad vi inte kan vänta oss på länge är AI för ”automatisk efterredigering” av maskinöversatta texter – däremot kanske vi får se AI förbättra MT-resultaten och därigenom underlätta vårt arbete (om vi alltså befattar oss med sådant).

Själv skulle jag önska mig en AI-tillämpning som gör det möjligt att i förväg bedöma en MT-motors förmåga med avseende på ett visst jobb, eller åtminstone på förslagen till översättning av enskilda segment (t.ex. med procenttal i stil med vad vi ser för de förslag som hämtas från översättningsminnen). Men dit är nog vägen lång, även om Memsource säger sig ha skapat en metod för detta – om det verkligen vore sant, borde väl den metoden användas för att under processen modifiera måltexten i enlighet med kvalitetsgraderingens resultat.

Än så länge handlar alltså kvalitetsbedömning av MT-motorer främst om efterhandsbedömning i förhållande till en s.k. referensöversättning, där den mest kända metoden är BLEU (Bilingual Evaluation Understudy). Men sådana metoder är ju arbetskrävande och kan framför allt inte tillämpas i förväg, på en oöversatt text. Dock tycks man hålla på att utveckla ett lovande verktyg, MEWR (Machine Translation Evaluation without Reference Texts), för automatisk kvalitetsbedömning av MT-översatta texter som bygger på bedömning av hur måltexten förhåller sig till källtexten vad gäller ”trogenhet”, flyt och ”övergripande kvalitet”. Man påstår sig redan ha nått lovande resultat vid jämförelse med mänsklig bedömning av samma texter.

Detta påminner om en metod som redan i dag används av åtminstone en MT-leverantör, ModernMT. Där säger man sig nämligen fokusera på källdokumentet i dess helhet vid maskinöversättningen; det låter lite kryptiskt men jag föreställer mig att det kan innebära bl.a. enhetlig terminologi (vilket ju NMT definitivt inte garanterar).

Min egen önskelista, som jag ska avsluta med, är denna: en maskinöversättning där underlaget inte bara utgörs av MT-motorn utan också av mina egna översättningsminnen (TM) och mina egna termdatabaser, på så sätt att termerna alltid blir korrekta, att minnesträffar – om de finns – utgör grunden för måltextförslaget, som dock kompletteras av NMT och modifieras så att texten flyter bra. Dessutom vill jag att mina översättningar löpande ska föras in i underlaget (men det gör de ju genom att mina TM uppdateras).

En utopi? Faktiskt tror jag inte alls det – jag tror att det mesta av detta är på god väg, för de som jobbar med sådana här saker är inga dumhuvuden. Och för lite mer funderingar i samma riktning rekommenderar jag artikeln Using Neural Machine Translation Beyond Post-Editing av Jost Zetzsche (där han intervjuar översättaren och MT-forskaren Félix do Carmo) i ATA Chronicles maj/juni-nummer 2019 – bläddra fram till sidan 24.

SAMMA FÖRFATTARE +