Efterredigering

Efterredigeringens olika ansikten

10 maj, 2018

”Post-editing”, efterredigering, är en term vars innebörd i förstone kan verka uppenbar, men vars tolkning kan ha långt större konsekvenser för frilansöversättaren än man kan tro. Låt oss reda ut begreppen.

/ Foto: iStock.

På vilket avgörande sätt skiljer sig redigering av träffar i ett CAT-verktygs översättningsminne (TM) från redigering av förslag från en maskinöversättningsmotor (MT-motor)? Utan en skillnad funnes det ju inget skäl att mynta en särskild term för det senare.

Men nu är termen ”efterredigering” etablerad sedan 1980-talet. Jag ser skillnaden så här: Visserligen har flera CAT-verktyg, i synnerhet Déjà Vu men även memoQ, i flera år varit duktiga på att pussla ihop TM-fragment till mer eller mindre fullständigt översatta målsegment – men de kan så gott som aldrig översätta dokument fullständigt, vilket däremot MT kan göra. Sedan kan ju själva översättningen se ut som skrutt och vara i stort sett obrukbar, men poängen är ändå att en kund kan komma och säga: Här har jag ett maskinöversatt dokument; kan du gå igenom det och skapa en användbar text? Eller: Här har jag ett källdokument; kan du köra det i den här MT-motorn och redigera fram en bra översättning?

Skillnaden är alltså inte främst i själva arbetet – även om det är många som anser att efterredigering av maskinöversatt text skiljer sig rätt mycket från ”vanlig” CAT-översättning med ett (eller flera) TM. Skillnaden är att MT levererar en komplett översättning – brukbar eller ej – av (i teorin) varenda källtextbit.

Till saken hör också att efterredigering är en tjänst som kunden har beställt. Om jag i ett ”vanligt” jobb använder MT och kanske rentav gör hela översättningen genom att redigera MT-översatta segment så är det en annan sak. Förutsatt att sekretessfrågan är tillgodosedd rör min arbetsmetod ingen annan än mig själv. Ytterligare en faktor att beakta är huruvida beställningen gäller arbete med ett redan föröversatt dokument eller om översättaren i sitt CAT-verktyg förutsätts översätta segment för segment på vanligt sätt men med hjälp av en anvisad MT-motors förslag. Jag återkommer till det.

Vilken kvalitet önskas?
I en beställd efterredigering ingår också att önskad kvalitetsnivå anges – kunden vill ha en tillräckligt bra översättning men inte betala för en som är ”onödigt” bra. Därför har man – bl.a. i ISO-standarden 18587:2017, Translation services – Post-editing of machine translation output – Requirements, definierat följande:

1. Lätt efterredigering: Den slutliga texten är begriplig och korrekt, men redigeraren behöver inte – och ska inte heller – sträva efter en mycket bättre text än så, och hen bör använda så mycket som möjligt av den obearbetade MT-versionen.

2. Full efterredigering: Enligt flera definitioner att ska resultatet vara ”omöjligt att skilja från resultatet av mänsklig översättning” (enligt formuleringen i ISO 18587), eller vara ”publicerbart”. Men det finns motstridiga uppfattningar om detta: Vissa källor säger att stilistisk perfektion inte förväntas, och att kunderna i själva verket inte väntar sig att resultatet ska vara jämförbart med en översättning av en mänsklig översättare. Anvisningar kan lyda:

”Bry dig inte alltför mycket om stil och textualitet”
”Förväntad kvalitet: medel”
”Texter som är efterredigerade bör inte sträva efter lingvistisk perfektion; snarare bör målet vara lingvistisk godtagbarhet”.

Med tanke på det senaste menar jag att det i själva verket finns tre nivåer för användning av MT-resultaten: Överst finns det som är ”omöjligt att skilja från resultatet av mänsklig översättning”, dvs. det går inte att säga om MT har använts eller ej. Strax under har vi ”full” efterredigering: korrekt i alla avseenden men kanske inte av högsta klass vad gäller stilistiken. Och så har vi den ”lätta” nivån: duger för att texten ska förstås men inte mer (inte kul att läsa).

Givetvis är dessa kategorier bara punkter på en kontinuerlig skala. Det är svårt att objektivt testa om en ”efterredigerad” text uppfyller kriterierna för den ena eller den andra. (Är den lätta versionen inte på en högre nivå än vad som är avsett? Är den fulla versionen verkligen på den nivå som är målet? Och vilken typ av ”full” version är det som önskas?)

Frånsett andra aspekter på själva arbetet med efterredigering kommer de flesta översättare troligen att undvika uppdrag som förutsätter ”lätt efterredigering”. Den verksamheten strider mot allt som en översättare finner nöje i att göra, dvs. bästa möjliga jobb. Erfarenheten visar också att de många beslut som måste fattas om vilka ändringar som krävs ofta tar så mycket tid att det sammanlagda arbetet med ”lätt” redigering inte är mycket mindre än det med ”full” eller rentav ”högsta” kvalitet.

Föröversatt text eller interaktiv redigering
Så till frågan om huruvida jobbet gäller ett föröversatt dokument eller en ”interaktiv” översättning segment för segment i ett CAT-verktyg och med hjälp av en MT-motor. Jag har läst många artiklar och föredrag och till och med avhandlingar om efterredigering, men konstigt nog är det väldigt få som tydliggör denna skillnad. Desto gladare blev jag över följande definition i ISO 17100:2015, Translation services – Requirements for translation services (i min översättning):

efterredigera

redigera och korrigera resultatet av maskinöversättning

Denna definition innebär att efterredigeraren redigerar det resultat som automatiskt skapas av en maskinöversättningsmotor. Den gäller inte en situation där översättaren ser och använder ett förslag från en maskinöversättningsmotor i gränssnittet till ett CAT-verktyg (verktyg för datorstödd översättning).

Men … i tidigare nämnda ISO 18587 är vi tillbaka i det ovissa läget: kommentaren ovan har strukits, och det finns inga tecken på att standarden skulle göra någon skillnad mellan de två sätten att åstadkomma den måltext som ska redigeras.

Det kan i och för sig synas rimligt med tanke på att de krav som ställs på efterredigeraren är i stort sett desamma i båda fallen (och det var tydligen så man resonerade när man strök kommentaren). Det kanske inte heller spelar någon roll för kvaliteten på det arbete som utförs, eller på resultatet.

Men det har stor betydelse för den översättare som gör arbetet. I grunden kan man nämligen definiera tre scenarier för en beställd efterredigering:

A. Redigering av ett fullständigt dokument som har maskinöversatts. Källdokumentet är tillgängligt, och kunden anger önskad nivå på redigeringen. Översättaren kan någorlunda väl bedöma översättningens kvalitet och på grundval av den ge ett anbud. Bedömningen innefattar den tid som hen tror att arbetet kommer att ta, inklusive den eventuella anpassning av textmaterialet som krävs för hantering i ett CAT-verktyg.

B. Jobbet ser i stort sett ut som en vanlig översättning med CAT-verktyg förutom att man utöver – eller i stället för – ett vanligt TM tilldelas en MT-motor av kunden (vanligen ett språkföretag). Även här anges önskad kvalitetsnivå. Eventuellt medföljer en föranalys som visar tänkbara MT-träffar (och träffar i eventuellt TM). Språkföretaget kan ha en mall för erbjuden ersättning, eller så ger översättaren efter bästa förmåga ett anbud. Men: normalt är det svårt att bedöma den tid som kommer att åtgå (delvis på grund av att det fortfarande inte finns någon metod för att i förväg bedöma kvaliteten hos översättningsförslagen från en MT-motor).

C. Samma som i B, men betalningen baseras på en efteranalys av den ”redigerade” (dvs. översatta) filen som visar i vilken utsträckning (redigeringsavstånd) de föreslagna träffarna från MT-översättningen (och eventuellt minnet) har använts. Men det är som sagt svårt att bedöma arbetstiden och i detta fall också den slutliga betalningen. Inte heller vet översättaren hur efteranalysen görs, vilket betyder att hen måste lita på att den görs på rättvist sätt.

Och givetvis kan man lätt tänka sig att om metoden att basera betalning på en efterbedömning av jobbet blir accepterad, då kan den lika väl användas för traditionella jobb där CAT-verktyg används i kombination med översättningsminnen men utan MT.

Framtiden då?
En intressant syn på utvecklingen av vårt arbete ges av Arle Lommel – senior analytiker på CSA Research och expert på detta område:

En viktig förändring just nu är att efterredigering håller på att ersättas av ”förstärkt översättning”. Med det synsättet är det som översättarna gör inte att korrigera MT utan i stället att använda MT som en resurs tillsammans med TM och terminologi. Det betyder att kunderna allt mer bara vill ha en översättning utan att skilja mellan maskinell och mänsklig översättning. Man kommer alltså helt enkelt att köpa en ”översättning”, och man förväntar sig att MT används om det leder till förbättring. MT-komponenten i detta synsätt kan redan skönjas i verktyg från Lilt, SDL och andra, men vi befinner oss ännu bara i början av den här förändringen.

I det resonemanget figurerar alltså ”lätt” efterredigering/gisting över huvud taget inte. Jag vet inte något om dagens efterfrågan på sådan men jag kan tänka mig att den typen av arbete i framtiden främst kommer att vara aktuell för större företag, som då förmodligen sköter det internt.

Om Lommel har rätt, betyder det förmodligen att vi kan sluta använda den vilseledande termen efterredigering så som den definieras i dag – redigering är redigering, oavsett om det förslag som presenteras i CAT-verktyget kommer från ett TM eller en MT-motor. Den bör reserveras bara för det mycket specifika fallet scenario A. Samma synsätt intas exempelvis av bidragen från en lärare i efterredigering och en erfaren efterredigerare i den nyligen publicerade boken Machine Translation – What Language Professionals Need to Know (redigerad av Jörg Porsiel och utgiven på BDÜ Fachverlag) – se min recension på sidan xx.

Och eftersom Lommels profetia betyder att scenario A – och därmed också termen ”efterredigering” – lär försvinna, betyder den också att vi så småningom bara har kvar scenarierna B och C. Det innebär att översättarna behöver bestämma sig för hur man ska hantera C (oavsett nivå på det önskade resultatet). Detta är en ny situation som förmodligen kommer att kräva tid och eftertanke innan man kommer fram till en lösning (eller flera) som är godtagbar för alla parter. Under tiden bör vi översättare sträva efter att på egen hand utnyttja MT på bästa sätt.

SAMMA FÖRFATTARE +