Björns hörna

I begynnelsen var Google Translate …

28 feb, 2021

… och så förblev det både länge och väl – det var få MT-leverantörer som tyckte det var mödan värt att utveckla system som kunde konkurrera med en leverantör som sitter på mera data än vi vanliga dödliga mår bra av att veta.

Björn Olofsson på plats i sin hörna. Björn Olofsson på plats i sin hörna./ Foto: Anna Rovelli Olofsson.

Några konkurrenter dök upp – den första och ihärdigaste var Microsoft Translator (med API för de flesta CAT-verktyg), även kallad Bing. Tjänsten har, trots sin modesta prissättning, aldrig blivit något reellt hot mot GT, och har alltid legat ett tydligt kvalitetssnäpp under.

Googles stora fördel är som sagt företagets närmast oändliga skatt av träningsdata, och GT har dragit full nytta av den neurala tekniken som introducerades 2016/-17 för att få bättre flyt i översättningarna. Vi som har följt GT sedan begynnelsen kan se en kontinuerligt stigande kvalitetskurva, med tydliga språng 2007 (statistisk teknik) och 2017 (neural teknik).

Men finns det då någon möjlighet att konkurrera med jätten? Ett företag som med den äran utmanar GT är italienska ModernMT (med API för de flesta CAT-verktyg). Tjänsten satsar hårt på att vässa kvaliteten i samtliga språkkombinationer (man täcker de flesta sådana som är representerade i SFÖ). Specifikt för ModernMT är att man erbjuder personlig träning av MT-motorn med data från den enskilde översättaren. Man kan bygga TM i ModernMT medan man arbetar och också ladda upp egna TM till tjänsten. Under arbetet väljer man vilket TM som MT-motorn ska använda i det aktuella projektet. Själv har jag använt GT och ModernMT parallellt i sex månader, och kan konstatera att ModernMT snabbt blir mycket träffsäker, och dessutom hanterar såväl taggar som konverteringar (typ decimaltecken) mycket bättre än GT. Priset är avsevärt högre än för GT, men det är det värt. Att beställa ett API tar fem minuter – för GT klarar man det i bäst fall på en halv dag.

Kvalitetsvässning är en väg att gå. En annan är att satsa på språk som sätts på undantag av jättarna i branschen. Lettiska Tilde är ett lysande exempel. Affärsidén är att satsa på nordiska och baltiska språk. Finska är notoriskt svårhanterligt för MT-motorer, med sin intrikata kasusapparat och ord som kan bli hur långa som helst och inkludera mängder av metainformation om det sagda. På senare tid har GT visserligen nått en tveksam acceptans hos finska översättare, men nyttan är inte i närheten av den som översättare mellan västeuropeiska språk har.

Det stora lyftet för Tilde kom då man fick uppdraget att utveckla en MT-motor att använda under Finlands ordförandeskap i EU andra halvåret 2019. Resultatet, EU Council Presidency Translator (med API för SDL Studio), hanterar baltiska språk och finska på en nivå som GT bara kan drömma om. Nu kan jag inte ett ord finska, men jag har testat några artiklar från finska dagstidningar och fått ut en svenska som ser synnerligen vederhäftig ut. I webbgränssnittet kan följa källtexten med textmarkören och se precis hur MT-motorn har hanterat målspråkets ordföljd (klart underhållningsvärde just för finska!).

Exemplen på konkurrenter till GT blir allt flera och det är svårt att föreställa sig att Google ska sitta still i båten. Vad månde komma från Mountain View?

SAMMA FÖRFATTARE +