Recension

Extremt läsvärt om maskinöversättning

2 sep, 2020

Hur är det med de tyska språkkunskaperna? De kan komma väl till pass när vi nu har fått en gedigen ny översikt över hur det står till i dag med maskinöversättning – utgiven i Tyskland men med innehåll på både engelska och tyska.

Även om en bra efterredigerare förmodligen också är en bra översättare, är det långt ifrån alla översättare som alls kan tänka sig att arbeta med efterredigering. Även om en bra efterredigerare förmodligen också är en bra översättare, är det långt ifrån alla översättare som alls kan tänka sig att arbeta med efterredigering. / Foto: iStock.

Detta är uppföljaren till ”Machine Translation – What Language Professionals Need to Know” (recenserad i FÖ nr 2/2018). Originaltexten där var skriven på tyska; denna uppföljning är skriven på både engelska och tyska. Och trots att titeln är på tyska är faktiskt ca 57 procent av texten på engelska! Ändå är några av artiklarna på tyska så viktiga att jag hoppas att de kommer att göras tillgängliga för en större publik.

Hur som helst är detta boken för alla som vill (a) få en heltäckande bild av det nuvarande läget på området maskinöversättning, och (b) tränga djupare in på några av de viktigaste områdena. Jag rekommenderar att man läser det allra första av inläggen, ”Gute Qualität zum kleinen Preis? Wandel von Erwartungen und Prozessen im Kontext von Maschineller Übersetzung”, eftersom det ger en så komplett och kunnig bild av hela processen, från kund till översättare/redaktör. De betonar behovet av kunskap hos kunden och går i detalj in på de nya slags problem som drabbar både byråer och översättare, problem som – särskilt i och med neural MT – ofta är nya och måste hanteras därefter. Exempel är de nya uppgifter som byråerna måste klara av både när det gäller kunder och översättare, såsom att på förhand bedöma MT-kvaliteten och att hantera de nya typerna av fel. Mycket av detta – och mer därtill – berörs även i redaktörens förord, men den djupgående behandlingen här, på bara 12 sidor, är beundransvärd.

Framtiden diskuteras även av andra bidragsgivare. I ”Augmented Translation Intelligence”, där mer eller mindre ”intelligenta” funktioner kommer att möjliggöra en mer omfattande användning av resurser på nätet (några intressanta exempel: ”hantera flertydighet hos ord och fraser”, ”tillhandahålla kontextuell information”, ”föreslå innehåll som är kulturspecifikt”) samt förenkla samarbetet mellan kolleger. Och i ”At human parity?” finns några skarpa kommentarer om påståendena att NMT (nästan) skulle vara på samma nivå som ”mänsklig” översättning. Avslutningsvis finns några vettiga förslag om vad MT-utvecklarna bör koncentrera sig på i stället för att sträva efter det gäckande målet ”mänsklig kvalitet”, nämligen förbättrad kvalitetsbedömning (se nedan), integrering med talteknik, samarbete med mänskliga översättare och enklare användning.

När det gäller framtiden för efterredigeringsarbete (PEMT) är den erfarna efterredaktören Sara Grizzo skeptisk (i ”Hat Post-Editing ausgedient”):  den typen av arbete är impopulärt bland många översättare. Hon har kommit fram till att PEMT främst har sin plats för lätt efterredigering (gisting). För mer krävande översättningar bör man försöka använda MT på sätt som passar översättaren bättre.

“57 sidor – med informationsteori, matematiska uttryck och text om neurala nätverk som kanske bitvis utmanar läsarens koncentrationsförmåga.”

Efterredigering är naturligtvis ett viktigt ämne för denna bok, och det behandlas i åtta bidrag. Den tidigare nämnda Sara Grizzo bidrar med ytterligare två artiklar. Den ena är en gedigen men kort handledning för efterredigering; den andra är en diskussion om de tre huvudsakliga betalningsmetoder som är vanliga i dag: per ord, per tid, och efter ”redigeringsavstånd”. Båda artiklarna är mycket skarpsynta, och Grizzo betonar särskilt att ingen av betalningsmetoderna är helt tillfredsställande. Men i en annan artikel, ”Edit-Distance Based Compensation for Machine Translation”; beskrivs en variant av en av betalningsmodellerna – EDC (för Edit-Distance Calculation) – som verkar ta hänsyn till det arbete som faktiskt utförs av efterredaktören, dvs. även sådant som efterforskning och bedömning av MT-förslagen, av vilka inget syns i de resulterande ändringarna (om några) av förslagen. Det är en intressant variant som borde kunna användas som utgångspunkt vid diskussioner.

En annan punkt som tas upp av Grizzo är vikten av att i förväg bedöma hur mycket arbete som krävs för ett PEMT-jobb, och i synnerhet kvaliteten på MT-förslagen. Hittills har endast Memsource vågat hävda att de har en tillförlitlig funktion för denna så kallade Quality Estimation, kvalitetsbedömning (i motsats till den kvalitetskontroll/kvalitetssäkring som görs av det slutliga översättningsresultatet), vilken också kort beskrivs i artikeln ”Postedition – fit für die Praxis”.

Andra artiklar om PEMT är ”DIN ISO 18587 in der Praxis”: en översikt över den standarden, vars titel är ”Translation services — Post-editing of machine translation output — Requirements”. Personligen är jag för övrigt inte säker på att den har någon större betydelse, men eftersom den är ganska dyr (ca. 82 euro) är det bra att här få den beskriven i detalj. Besläktad med den artikeln är ”The post-editor’s skill set according to industry, trainers and linguists”, som beskriver ett antal färdigheter som är viktiga för PEMT, varav de viktigaste anges vara ”beslutsfattande, felsökning och respekt för riktlinjerna för efterredigering”. En mer psykologiskt orienterad inställning till PEMT intas i ”Problemlösungsstrategien beim Post-Editing in Verbindung mit psychologischen Aspekten”. En intressant fråga: Kan en efterredaktör arbeta med PEMT varje dag utan att koncentrations­förmågan och motivationen blir lidande? Det kanske självklara svaret här är att man bör arbeta med en blandning av olika uppgifter och på så sätt utveckla metoder och strategier för efterredigering.

En artikel om PEMT ur byråns synvinkel innehåller ett avsnitt om optimering av efterredigering (s. 270 ff) som säkerligen är av mer allmänt intresse. Och en rapport om användningen av terminologi vid träning och anpassning av MT-motorer är väl värd att läsa, särskilt det detaljerade avsnittet om terminologifel i maskinöversättningar.

Bland andra frågor som tas upp hittar vi sekretess (två artiklar) och användningen av kontrollerat språk (och även om denna diskussion förvisso är värd besväret är det åtminstone min erfarenhet att byråer – för att inte nämna slutöversättaren/redaktören – ytterst sällan har möjlighet att påverka källtexten på detta sätt).

Det bör också nämnas att man i många av inläggen menar att översättning och efterredigering är två mycket olika uppgifter, och även om en bra efterredigerare förmodligen också är en bra översättare, är det långt ifrån alla översättare som alls kan tänka sig att arbeta med efterredigering. Och slutligen: om det finns ett perspektiv som jag saknar i denna mycket givande bok, är det situationen när användning av MT inte efterfrågas av kunden utan MT helt enkelt är en extra resurs i ett ”normalt” jobb. Det är inte samma sak som PEMT! Inte minst kan man då välja mellan olika MT-motorer. Ändå måste jag erkänna att hantverket rätt mycket liknar PEMT. (Men – viktigt – betalningen påverkas ju inte.)

I boken finns också en kort ordlista och presentationer av (alla 30) bidragsgivare.

Det finns en kort presentation på tyska av förläggaren här. Och det finns exempelsidor – 18 av dem, inklusive innehållsförteckningen – här.

Maschinelle Übersetzung für Übersetzungsprofis.
Jörg Porsiel (red.). 384 sidor, BDÜ Fachverlag 2020. ISBN 9783946702092.
37 euro. Beställ här.

SENASTE INSLAG +