ModernMT

Vad har David att ge mot Goliat?

12 aug, 2020

Svaret är mycket.

'David dödar Goliat', Peter Paul Rubens (ca 1616). 'David dödar Goliat', Peter Paul Rubens (ca 1616). / Norton Simon Museum, Pasadena, California.

Goliat får i detta sammanhang passera som metafor för Google Translate (GT), en muskelsvällande internationell jätte med resurser till allt och ganska mycket till. David är istället ModernMT (MMT), ett italienskt uppstickarföretag med kontor i universitetsområdet vid EUR i Rom och i Gabbioli – en gudsförgäten håla utanför Trento i norra Italien, som jag har haft anledning att besöka i helt andra och mindre roliga sammanhang. När jag zoomade företagets vd, Davide Caroselli, för att få klarhet i sakernas tillstånd var styrkefördelningen min första fråga. Nåja, det handlar inte om gammaltestamentliga mirakel. MMT backas upp av Translated.net, en av de större aktörerna i översättningssvängen – förvisso inte jämförbar med Google, men icke desto mindre ägare till betydande databaser som kan användas för träning av MT-motorer.

Uppenbarligen är träningspassen med MMT effektiva. Jag har intensivkört motorn parallellt med GT i en vecka, och konstaterar att för de språkkombinationer och ämnesområden jag har hunnit avverka ger den generiska MT-motorn i MMT enligt min mening något bättre eller mycket bättre resultat än GT i runt 70 procent av fallen.

Men det stannar inte med det.

MMT är den första produkten som ger vanliga dödliga översättare, utan programmeringskunskaper, tillgång till en läraktig MT-motor, som inte drar astronomiska kostnader.

Hur sker detta lärande? MMT kallar tekniken för ”Human in the loop” och går ut på att översättaren skapar ett eller flera TM inom MMT, eller laddar upp befintliga TM i TMX-format till MMT. I API:ts gränssnitt visas vilka TM som har skapats eller laddats upp, och med kryssrutor kan man välja ett eller flera som ska användas för ett visst projekt, och ett (1) som uppdateras under projektets gång. Se bilden.

ModernMT: Dialogen för val av vilka TM som ska användas och vilket som ska uppdateras.

Vitsen är att resultaten från MMT baseras på den generiska MT-funktionen, plus inlärning från uppladdade TM. Även efter bara en vecka har jag kunnat konstatera att MMT faktiskt är läraktigt, och efter några dagar slutade översätta ”seal” till säl, och istället valde termen ”tätning”, vilket är vanligare förekommande i mina uppdrag. Ännu har jag inte kunnat bekräfta att MMT håller sitt löfte att analysera kontexten för hela dokumentet och anpassa sina förslag till det, men Carosellis entusiastiska förklaring av hur detta fungerar tekniskt känns övertygande.

Jag frågade Caroselli om det även kommer att bli möjligt att ladda upp termbaser till MMT, för att göra termvalet mera träffsäkert. Svaret blev lite svävande, att funktionen är efterfrågad och ligger i röret … hmmm.

En stor förtjänst med MMT jämfört med GT är hanteringen av taggar. I GT kan man bara välja att utesluta taggarna, eller att få dem samlade i en hög på slutet av det översatta segmentet. MMT försöker istället placera taggarna där de hör hemma i målsegmenten – och lyckas förvånansvärt bra, vilket tyder på avsevärd förmåga till terminologisk analys.

En uppenbar fråga är den kring säkerhet. MMT är, i likhet med GT, certifierat enligt ISO 27001:2013 för informationssäkerhet. GT försäkrar att uppladdade källfiler inte utnyttjas eller vidarebefordras. Det gör MMT också, med tillägget att detsamma gäller uppladdade TM och löpande uppdateringar av dessa som genereras under arbetets gång, samt att GDPR uppfylls. Som användare kan vi inte göra annat än antingen välja att lita på certifieringen och löftet, eller att inte göra det. Att MMT har sina servrar inom EU ger ett visst mått av trygghet (vem vet vilken aktör POTUS får för sig att förbjuda i nästa Twitterstorm?) Men oavsett hur vi betraktar saken kvarstår förhållandet att själva utnyttjandet av en extern MT-leverantör rent tekniskt innebär att vi gör material tillgängligt för tredje part.

Vad kostar det då?

Licensen ”Professional” kostar USD 25/månad ”Human-in-the-loop”-licensen, som främst är avsedd för större företag och som även innefattar viss garanti för tillgänglighet och responstid, kostar USD 50/miljon tecken. Detta kan jämföras med prislappen för GT, som är USD 20/miljon tecken. Mer än dubbla kostnaden – men efter första veckans test anser jag att MMT gör skäl för sitt pris.

ModernMT har funnits en tid för användare av Matecat och SDL Studio, men i augusti dök det upp en betaversion som kan integreras i memoQ, vilket fick undertecknad att vakna ur semesterdvalan! Men detta kan redan vara överspelat när denna artikel når er, eftersom Caroselli försäkrar att MMT:s API från nästa version ska vara fast integrerat i memoQ.

SAMMA FÖRFATTARE +