Översättningsteknik

Redigeringsavståndet

15 feb, 2019

Nästgårds eller närmare Tipperary?

/ Foto: iStock.

Med redigeringsavstånd avses ett procentuellt mått på hur mycket ett förslag från ett översättningsminne, TM, eller en maskinöversättningsmotor har redigerats innan det når en nivå som översättaren kan leverera med högburet huvud – eller åtminstone utan att skämmas ögonen ur sig. Om ett förslag finns beräknas redigeringsavståndet baserat på antalet tecken/ord som ändrats. Eventuella koder är som bekant tidsödande att hantera och kan förses med en egen multiplikationsfaktor.

Olika större översättningsbyråer/LSP har sina egna, mer eller mindre öppna, rutiner för att beräkna redigeringsavstånd, men det kan vara bra att veta att motsvarande funktion även finns i de flesta CAT-verktyg – sök i hjälpfunktionen efter ”editing distance”.

I memoQ, till exempel, kan man efter avslutad översättning av en fil gå till Document -> Edit distance. Acceptera föreslagna inställningar och klicka på Calculate.

Jag testade efter att ha översatt en tämligen allmän text på engelska om ekonomiska spörsmål. Jag hade en del material i mina TM och valde dessutom att koppla Google Translate till projektet eftersom inget avtal med kunden och inget etiskt övervägande talade mot detta. Efter avslutad översättning och redigering såg resultatet ut som följer:


Fig. 1: Med inställningen ”Fuzzy”, som ger en efteranalys som kan jämföras med föranalysen.

 


Fig. 2: Med inställningen ”Levenshtein” som ger en procentuell analys.

Den procentuella analysen visar att jag hade behållit 76 % av givna förslag från TM och MT, och bearbetat 24 % av texten. Innebär det att arbetsbelastningen för jobbet ifråga minskade med tre fjärdedelar? Nej:

Den bearbetade fjärdedelen bestod i dokumentets viktiga och betydelsebärande delar – resten var mer att betrakta som transportsträcka.

Omflyttning av ord för att uppfylla målspråkets krav på syntax, utan redigering i övrigt, ger inget avtryck i statistiken.

Ett noggrant och tidskrävande studium av en föreslagen översättning av ett givet segment, som resulterar i att man godkänner det med ingen eller minimal redigering, ger inget avtryck i statistiken.

En viss ledning kan hämtas av att CAT-verktyg oftast kan leverera statistik över hur lång tid man har ägnat åt varje segment och åt dokumentet som helhet. Det går att ange ett filter som utesluter inverkan av kiss-/sätta på kaffe-/hänga tvätten-pauser. Här går det av uppenbara skäl inte att jämföra det faktiska tidsutfallet med ett hypotetiskt utfall med andra förutsättningar, men de levererade siffrorna är icke desto mindre intressanta att fundera över.

Kontentan: En efteranalys av text som översatts i ett CAT-verktyg med stöd av maskinöversättning kan ge intrycket att MT-motorn har bidragit med lejonparten av jobbet, men i verkligheten är detta mera sällan fallet.

SAMMA FÖRFATTARE +