Google Translate

Rätt verktyg – mera verkstad

17 sep, 2018

Nej, översättning är vanligtvis ingen rutinuppgift, det håller jag gärna med Douglas Hofstadter om. Icke desto mindre lockar mig hans artikel om Google Översätt (GT) i Sans nr 3/2018 att använda det engelska uttrycket ”barking up the wrong tree”, vilket jag inte hittar någon bra svensk översättning för, och det gör, förväntat nog, inte GT heller. Tvärt emot vad Hofstadter antyder hävdar inga branschkunniga att GT är i närheten av mänsklig förmåga, över huvud taget utövar ”förståelse”, vad det nu är, eller kommer att göra det inom överskådlig tid.

/ Foto: iStock.

Det existentiella magasinet Sans, som ges ut av Fri Tanke förlag, hade i nr 3/18 en artikel om Google Översätt, skriven av den väletablerade kognitionsforskaren Douglas Hofstadter. Nu finns det ingen större anledning att rida ut till GT:s försvar, men eftersom herr professorn inte förefaller ha någon kontakt med verkstadsgolvet beslutade jag att skriva en replik (om den publiceras återstår att se), men då den kan vara av allmänt intresse återges den även här i Facköversättaren. Självklart är det en bra början att läsa det ursprungliga debattinlägget. Det är inte tillgängligt digitalt, men finns på folkbiblioteken. Eller kan beställas från Fri Tanke förlag.

Maskinöversättning (MT) har i decennier varit en sittande fågel för kritiker med varierande fackkompetens att gå loss på. Vad många missar i euforin över att få leka språkpolis (eller ”småle”, som Hofstadter upprepade gånger säger sig göra) är det oerhörda kvalitetssteg som GT gjorde 2006/07 när statistisk teknik lanserades. Statistisk MT ersatte i ett slag den regelbaserade MT (baserad på grammatisk och semantisk analys, överföring och slutligen syntaktiskt korrekt syntes) som lingvister och teoretiker med Noam Chomsky i spetsen har arbetat med sedan mitten av förra seklet (sista ordet från det hållet är inte sagt). Statistisk teknik möjliggjordes mindre av nya översättningsalgoritmer än av brant ökande processorhastighet och minneskapacitet i de internationella datornätverken. Maskinöversättningar kunde plötsligt te sig riktigt bra, men det beror på att de helt enkelt är större eller mindre segment av befintlig (oftast mänsklig) översättning som hade blivit snabbt åtkomlig och som presenteras baserat på en sannolikhetsanalys och hålls samman någotsånär av bindeord som fiskats upp ur ett lexikon.

Ett nytt jättesteg togs när neural teknik infördes 2016/17. I grunden handlar det fortfarande om sannolikhetsbaserade val, men neural MT arbetar med mycket kortare språkliga segment och söker de statistiskt sannolikaste kollokationerna mellan dessa i ett neuralt nätverk som vi vanliga dödliga har begränsad insyn i. Konsekvensen är att neural MT förvånande ofta genererar grammatiskt och syntaktiskt oklanderliga översättningar, men att semantiken understundom lämnar en del i övrigt att önska.

“Man kunde förvänta lite större förståelse för var förståelse inte kan förväntas.”

All maskinöversättning kräver efterredigering, just därför att MT inte på något plan ”förstår” vad som händer i maskineriet. Förståelsen får efterredigeraren bidra med. Målet är givetvis att MT-motorn (oavsett om den heter Google Översätt eller något annat) i samverkan med efterredigeraren ska åstadkomma en översättning av rätt kvalitet på kortare tid/till lägre kostnad än om en människa hade gjort hela arbetet. Det intressanta i sammanhanget, förutom den totala tiden/kostnaden för att lösa uppgiften, är redigeringsavståndet (editing distance), dvs. den procentuella ändring av ett textsegment (vanligen en mening) som krävs för att lyfta maskinöversättningsresultatet till rätt kvalitetsnivå. Utan MT är redigeringsavståndet självklart 100 %. Det blir nästan 100 % i Hofstadters olika exempel också, dels för att översättaren kan bestämma sig för att starta om från scratch för att inte missa några detaljer, dels för att hen kan vilja göra strukturella förändringar i texten på stycke- eller till och med kapitelnivå.

De exempel som Hofstadter lägger fram i sin artikel för att bevisa att GT fattar nada är typiska texter som ingen seriös översättare skulle ge sig på med GT eller någon annan MT-motor. En översättare är en hantverkare med en välutrustad verktygslåda, som förväntas veta vilka verktyg som bör användas för vilket uppdrag. Ideala uppdrag där MT kan användas är t.ex. bruksanvisningar, datablad och andra tämligen standardmässiga texter där inga budskap döljs mellan raderna, helst mellan engelska och något annat större västerländskt språk (svenska inkluderat). Den typen av uppdrag utgör för övrigt den totalt dominerande delen av industrivärldens översättningsmarknad.

Här kan redigeringsavståndet efter maskinöversättning utan vidare landa på 30–20 %, och i kombination med det TM (översättningsminne) som översättaren har byggt upp under sin karriär (eller fått tillgång till av uppdragsgivaren) kan det krypa under 10 %.

Det återstående redigeringsavståndet är i många fall det som lyfter en text från nästan oanvändbar till väl fungerande nivå (dvs. rätt kvalitet). Rent maskinöversatt text är förvisso läsbar men sällan mer än så – det har en del svenska kommuner fått erfara, som serviceinriktat men okritiskt kopplat ett GT-gränssnitt till sina sajter för att få kommuninformation översatt till diverse språk. Härav framgår att efterredigeraren måste vara en kompetent yrkesperson (med andra ord en erfaren översättare) och att efterredigeringen har avgörande betydelse för slutresultatet. Det är inte simpel korrläsning eller språktvätt vi talar om.

En modern översättare har som sagt många verktyg i sin verktygslåda. Det handlar om så kallade CAT-verktyg, termdatabaser, termextraheringsverktyg, översättningsminnen, korpusar för konkordanssökning, kvalitetskontrollverktyg … you name it. Maskinöversättning, t.ex. i form av Google Översätt, är ett av verktygen. Om du beställer ett nytt kök av en snickare och konstaterar att snickaren har valt en slägga som enda verktyg för att lösa uppgiften – bör ansvaret för det sorgliga resultatet utkrävas av släggan eller snickaren?

Hofstadter får småle så mycket han vill åt GT och dess uppenbara brister, och jag rekommenderar sannerligen inte GT som verktyg för de texter han ägnar sig åt. Men medan Hofstadter småler tjänar översättningsbranschen mycket tid och pengar på att låta datorn sköta grovjobbet medan vi översättare får koncentrera oss på det nödvändiga finliret!

Douglas Hofstadter (född 1945) är en välrenommerad och polyglott forskare och författare samt professor i kognitionsvetenskap vid Indiana University i Bloomington. Han är otvivelaktigt en framstående och yrkesstolt översättare, men han befinner sig långt från facköversättandets skitiga verkstadsgolv där huvuddelen av jobbet görs. Han kan förväntas ha så god förståelse för begreppet förståelse som över huvud taget är möjligt. Dock skulle man kunna förvänta lite större förståelse för var förståelse inte kan förväntas.

Men jag håller med Hofstadter om att MT (och däribland GT) ännu befinner sig långt ifrån kulmen av sin utvecklingskurva, och vägen dit beskrivs troligen bäst av just Hofstadters egen lag som han presenterade 1979: ”It always takes longer than you expect, even when you take into account Hofstadter’s Law.”

SAMMA FÖRFATTARE +

SENASTE INSLAG +