Efteranalys

Maskinöversättning och efteranalys

11 feb, 2019

Nyttan tvivelaktig anser många översättare.

/ Foto: iStock.

Idag är det vanligt att översättare använder maskinöversättning – över hälften av SFÖ-medlemmarna enligt det enkätresultat som presenteras i denna artikel. Men skillnaden är stor mellan att använda den frivilligt, som extra hjälpmedel, och att bli anvisad en så kallad MT-motor av kunden. Här ska vi titta närmare på detta senare fall.

Det blir allt vanligare med maskinöversättning (MT) som facköversättarens hjälpmedel, men åsikterna om detta går kraftigt isär, och det i sin tur beror i hög grad på omständigheterna: ämnesområde, språkkombination, MT-leverantör – och inte minst på om man gör det frivilligt eller om kunden kräver det (vilket i så fall nästan alltid betyder att kunden är en översättningsbyrå).

Synen på MT beror också på hur betalningen påverkas, särskilt om beräkningen sker på ett annorlunda sätt än normalt. Om detta har diskussionens vågor på sistone gått höga inom SFÖ – på e-postlistan och i den nyligen startade slutna diskussionsgruppen på Facebook. Det har då nästan enbart rört Semantix, som nyligen förvärvade både Amestos och danska TextMindeds översättningsverksamhet och samtidigt övertog nämnda byråers sätt att beräkna översättarens betalning när MT används. Det innebär att man beräknar ersättningen i efterhand, baserat på så kallad efteranalys. (Andra kunder kan kräva en generell rabatt på grundpriset när MT används; åter andra betalar fullt pris.)

Men Semantix är knappast ensamt om metoden med efteranalys. Så här står det på CAT-verktyget memoQ:s webbplats, under rubriken ”Post-editing compensation” (Ersättning vid efterredigering):

Ett av de största problemen när det gäller användning av efterredigering är avsaknaden av en generell affärsmodell för just detta. Vi har för avsikt att etablera en modell för ersättning vid efterredigering baserad på de faktiska produktivitetsvinster som har uppnåtts, och att regelbundet se över produktivitetsvinsterna för att möjliggöra en rättvis ersättning som kan beräknas innan efterredigeringsprojektet påbörjas. Det är också en etablerad praxis att betala för den faktiskt utförda redigeringen, vilken beräknas sedan arbetet har levererats, eller på timbasis. [Min kursivering]

I Semantix fall görs efteranalysen med hjälp av det webbaserade verktyget Memsource (som också föreskrivs som översättningsverktyg i projekt med MT-stöd). På Memsource webbsida Post-editing in Memsource finns följande beskrivning under rubriken Post-editing Analysis:

Funktionen innebär en jämförelse mellan den text som maskinöversättningen föreslår och den slutliga, efterredigerade översättningen. Den beräknar det så kallade redigeringsavståndet (edit distance), dvs. antalet åtgärder/tangenttryckningar som användes för att omvandla maskinöversättningens textsträng till den slutliga översättningen. Om efterredigeraren accepterar ett maskinöversättningsförslag utan att göra några ändringar, anger analysen en 100-procentig matchning. Om användaren däremot gör ändringar i segmentet, avspeglar matchningsprocenttalet dessa ändringar.

Ungefär samma beskrivning finns på Semantix egen webbplats, under rubriken Post-analysis.

Vad som inte beskrivs på Semantix-sidan är vad man tillämpar för motsvarighet till den så kallade Trados-trappan – dvs. vad man erbjuder för ersättning (hur många procent av fullt ordpris) för en 100-procentig matchning och vid vilken gräns den ersättningen börjar gälla, samt hur nivåerna ändras (stegvis eller möjligen kontinuerligt) mellan den gränsen och en översättning som helt avviker från MT-förslaget (och som alltså ersätts med ordpriset till 100 procent). Faktum är dock att man tillämpar samma ”trappa” som vid översättning med hjälp av översättningsminne, vilket innebär att ett segment som har översatts med utnyttjande av mindre än 75 procent av MT-förslaget ersätts till fullo. (Och en 100 procents träff med 15 procent av ordpriset.) Se även nedan.

Det förekommer också att ett Semantix-uppdrag även inkluderar ett översättningsminne. Då får översättaren – som brukligt är – tillsammans med uppdraget en föranalys av hur ”Trados-trappan” ser ut för det minnet.

När det gäller Semantix upplägg bör vidare två saker påpekas: Man kallar inte översättarens arbete för ”efterredigering”, eftersom man vill ha ett resultat som är det bästa möjliga. ”Efterredigering” brukar i stället förknippas med något som – vare sig redigeringen kallas ”lätt” eller ”full” – inte behöver vara av högsta klass, åtminstone inte stilistiskt. Vidare säger Semantix uttryckligen att det står översättaren fritt att helt bortse från MT-förslaget/förslagen.

Icke desto mindre finns det några problem här.

1. Översättaren vet inte på förhand hur mycket hen kommer att få betalt för ett jobb där MT är inkopplat på detta sätt. Vidare är det underförstått att MT-resursen ska spara tid, men ingen vet på förhand hur mycket – alltså vet man inte heller på förhand hur lång tid jobbet tar.

2. Efteranalysen är inte transparent, dvs. översättaren kan inte själv kontrollera att den är ”korrekt” eller ens rimlig. (Samma invändning kan förstås göras mot gängse [för]analyser baserade på vanliga översättningsminnen i de fall översättaren inte själv kan kontrollera dem.) I diskussionen har många klagat på att de har fått betalningsavdrag även i de fall de helt har förkastat MT-förslaget. Med tanke på att samma analysprincip som vid översättning med minne används verkar det dock osannolikt – det skulle betyda att översättarens text ändå innehåller 75 procent av MT-texten. (Å andra sidan kan det vara så att översättaren har förkastat MT-förslaget utan att ens titta på det – eller helt stängt av visningen av MT-förslag – men ändå råkar skriva något som till stor del överensstämmer med förslaget. Detta ”upptäcks” då i efteranalysen, som görs under alla omständigheter.)

I illustrationen ovan visas en enkel beräkning enligt ett exempel från Semantix. Beräkningen görs av Memsource med en algoritm som bygger på det så kallade Levenshtein-avståndet (se Memsources beskrivning här och även i denna artikel).

Den här modellen har vållat åtskilligt ont blod bland dem som har prövat på den. Dels är det många som starkt ogillar maskinöversättning över huvud taget (av olika skäl), dels är erfarenheten den att man får mindre betalt än man annars skulle ha fått, trots att tidsvinsten ofta tycks vara försumbar.

Många översättare skulle antagligen föredra att helt avstå från MT-resursen i varje fall så länge man upplever att den tillför förhållandevis lite och samtidigt sänker ersättningen. Det skulle förstås vara en stor fördel om det gick att någorlunda enkelt bedöma MT-kvaliteten i förväg för hela jobbet – jämför det som memoQ skriver (se ovan) om att ”möjliggöra en rättvis ersättning som kan beräknas innan efterredigeringsprojektet påbörjas”. Ett steg på vägen dit har Memsource tagit genom att utarbeta en metod för att kvalitetsgradera varje MT-segmentförslag med en procentangivelse ungefär på samma sätt som en träff i ett minne graderas. Så här:

100 %: Utmärkt MT-träff som antagligen inte behöver efterredigeras
99 %: Nästan perfekt MT-träff, antagligen krävs bara mindre efterredigering av mestadels typografiska fel
75 %: Bra MT-träff, men behöver antagligen viss efterredigering
MT: Ingen poäng; MT-träffen är troligen av låg kvalitet.

Metoden och dess användning beskrivs närmare av Memsource här (se även refererade artikeln) men den kostar lite pengar att använda, och dess tillförlitlighet är än så länge inte vidimerad av oberoende aktörer. Ännu mer intressant vore förstås om den kunde utvidgas till att sammanställa de enskilda segmentens betygsättning till ett övergripande betyg på MT-verktyget för den aktuella tillämpningen.

Vad Semantix beträffar tycks det hur som helst i dagsläget inte vara ett alternativ att avstå från metoden med efteranalys. Däremot ser man över vilka möjligheter som finns att göra processen mer transparent och tydlig.

Än så länge återstår uppenbarligen mycket att diskutera; översättarens arbete när MT föreskrivs av uppdragsgivaren är ett besvärligt kapitel som nätt och jämnt har börjat skrivas. SFÖ kommer att både följa utvecklingen och sträva efter gynnsammast möjliga resultat för medlemmarna – men då bör vi komma ihåg att vi även har översättningsbyråer, inklusive Semantix, som medlemmar. Låt oss alltså säga: gynnsammast möjliga resultat för branschen.

SAMMA FÖRFATTARE +