AI - maskinöversättning

Fördelar och nackdelar med AI och översättning

25 okt, 2024

Det finns både fördelar och nackdelar med att ta AI till hjälp vid översättning, särskilt facköversättning. AI kan också användas till annat än själva översättningen.

Artikelförfattaren gick igenom detta på SFÖ-SAT:s konferens i Uppsala våren 2024.

Illustration: Gidon Avraham, Linguistrator AB

AI (artificiell intelligens) + MT (maskinöversättning) = sant?

Generativ AI – alltså AI som själv ”skapar”, i detta fall text, till skillnad från ”vanlig” MT som mer strikt utgår från tidigare översättningar – kan användas för översättning genom att man går till en motsvarande tjänst, typiskt ChatGPT eller Gemini, och ber tjänsten översätta den text som man lägger in. Man kan samtidigt ge anvisningar (”prompter”) såsom att måltexten ska vara anpassad till en allmän läsekrets eller till en expertpublik.

Men sådana översättningar handlar alltså om att man matar in källtexten i dess helhet och får en motsvarande måltext. Vi facköversättare jobbar i allmänhet inte så; vi använder ju oftast CAT-verktyg där vi översätter ett ”segment” i taget, eventuellt med hjälp av MT. Nu kan vi alltså utvidga begreppet MT till att även omfatta AI, även om det för närvarande erbjuds mycket få alternativ: memoQ ”samarbetar” med Alexa Translations och håller dessutom på att utveckla sin egen tjänst memoQ AGT; Trados Studio erbjuder framför allt OpenAI ChatGPT och Microsoft Azure (men även vissa andra) via s.k. insticksprogram (plugins) – se del II av denna presentation. Matecat har en AI Assistant som jag inte känner närmare till. Och förmodligen finns även andra motsvarande tjänster för andra CAT-verktyg. Men överlag är detta i sin linda, både vad gäller utbudet av tjänster och deras kvalitet. Vi har säkerligen en spännade utveckling att se fram emot (eller frukta).

Andra användningar än ren översättning

  • Man kan pröva att genom upprepade hänvändelser till AI-tjänsten – alltså med hjälp av modifiering av prompter – efterredigera måltexterna så att de blir bättre och bättre. Det tar förstås tid, men om man lyckas bearbeta en större textmängd i ett svep kan det vara värt ansträngningen. Samtidigt finns förstås en risk för att man samtidigt tillverkar fel, såvida tjänsten inte inbegriper ändringsmarkering. Örjan Skoglösa visade för övrigt i sin presentation av CoTranslatorAI hur man genom iterering av prompter kan förfina översättningsresultatet.
  • Och man kan låta AI preparera källtexten inför översättning, t.ex. genom att se till att den följer reglerna för ett lämpligt ”controlled language”. (Eller möjligen be AI peka ut oklarheter i källtexten – detta är en tillämpning som jag inte har stött på, men den känns inte omöjlig.)
  • RWS/Trados utvecklar sitt användarstöd på ett kreativt och fruktbart sätt med hjälp av AIs chattfunktion (här finns en beskrivning).

Vidare har vi två användningar där AI kan bidra precis som ”vanlig” MT redan gör, men möjligen mer/bättre/annorlunda:

  • Dels för översättningar av språk där det råder brist på översättare (pga att språkområdena är små). Dock kan bristen på dataunderlag förstås göra att resultaten inte blir så bra.
  • Dels för att åstadkomma översättning av texter som annars inte skulle bli översatta. Detsamma har ju gällt för användning av MT i flera år, men med skillnaden att MT kräver CAT-verktyg vilket inte AI-översättning gör. (Det finns dock undantag, t.ex. DeepL.)

Fördelar med AI-översättning

Jag har redan nämnt möjligheten till upprepad förbättring av måltexten m.h.a. väl formulerade prompter. (Exempelvis tänker jag mig att det ibland kan vara enklare att i klartext formulera en viss, genomgående förändring i en prompt än med motsvarande s.k. regular expressions.)

En odiskutabel fördel är vidare att AI är bättre på grammatik än MT. Det gäller särskilt böjningsformer (adjektiv, verb, ändelser). Sålunda kan ett byte av exempelvis ett maskulint substantiv mot ett feminint med hjälp av AI innebära att en tillhörande bestämning automatiskt får rätt böjning.

Vidare kan möjligheten till översättning av hela dokument medföra större enhetlighet genom hela måltexten. Men det är förstås svårt att genomföra när man använder AI via CAT-verktyg.

Nackdelar med AI-översättning

Nackdelarna är som bekant många (och delvis förstås desamma som vid traditionell MT-översättning).

  • AI är helt olämplig för vissa ämnesområden, t.ex. ekonomiska och juridiska texter (bl.a. årsredovisningar). Då handlar det inte bara om eventuellt bristande sekretess utan kanske framför allt risken för att felaktigheter slinker igenom.
  • Förekomsten av s.k. hallucinationer, dvs att AI helt enkelt fabulerar, men på ett så trovärdigt sätt att man som granskare missar det. Vid översättning segmentvis är förstås denna risk betydligt mindre, men ändå inte försumbar.
  • Risk för bortfall av text – kan vara lätt att missa när måltexten ändå flyter bra och verkar rimlig.
  • Fel pga fel kontext: AI-tjänsten lägger in ord som är rätt i en annan kontext men fel i den det gäller.
  • Missar i fråga om specialuttryck: AI-tjänsten saknar helt enkelt underlag som innehåller de specialuttryck som måltexten kräver.
  • Missar pga andra ovanligheter i målspråket vilka AI-tjänsten inte känner till.
  • Bristande anpassning till målgrupp/målspråkskultur. Många gånger har en kund sin särskilda terminologi, vilken AI-tjänsten kanske helt enkelt saknar.
  • Problem med tal/nummerformat, något som en van översättare dock ofta kan korrigera med t.ex. regular expressions eller rentav lämpliga prompter.

Jag tror dock att flera av de här nackdelarna kommer att hanteras bättre i och med att tekniken utvecklas och dataunderlagen blir större.

Men apropå större dataunderlag: det har talats en del om att AI-tjänsterna, som utvecklas med hjälp av kolossala datamängder, snart kommer att få slut på underlagsdata och därför inte kommer att utvecklas lika snabbt i framtiden. OpenAI:s vd Sam Altman menar dock att detta är överdrivet; det handlar mer om att förbättra tekniken än att dammsuga nätet på mer data. Ett mer verkligt problem, som även Altman pekar på, är att användningen av AI kommer att kräva allt mer energi, både för träning av tjänsterna och för deras användning (inte minst för kylning). Sålunda uppskattar IEA att datacentralerna redan om två år kan komma att sluka dubbelt så mycket energi som i dag och stå för en tredjedel av all efterfrågan på ny elektricitet i USA. Där har vi en nackdel som heter duga!

Frågan om sekretess

I princip kan samma sak gälla för sekretess/konfidentialitet vid användning av AI-tjänster som vid användning av övriga MT-tjänster: En gratistjänst ger ingen sekretess. En betald tjänst där man har ett eget konto: leverantören garanterar däremot i allmänhet sekretess, dvs materialet används inte för att ”lära upp” tjänsten och sparas heller inte. Exempelvis sägs för Microsofts Azure OpenAI att “Your prompts (inputs) and completions (outputs), your embeddings, and your training data are NOT available to other customers, are NOT available to OpenAI, are NOT used to improve OpenAI models”.

Men obs! ”i allmänhet” innebär tyvärr att man kan behöva kolla. Sålunda visar det sig för ChatGPT (den mest använda/erbjudna tjänsten) att man även med inloggning på eget konto själv måste välja att inte låta OpenAI använda chatt-historiken – se bilden ovan.

Läget för skönlitteraturen

Användningen av AI hos bokförlag är intressant även för SFÖ-SAT av två skäl: Dels är det många medlemmar som då och då översätter böcker; dels sker utvecklingen inte isolerat och vi kan lära oss av det som händer på förlagssidan.

Det finns redan några förlag som använder AI-översättningar som sedan bearbetas av ”riktiga” (?) översättare. Det gäller främst, säger man, genrelitteratur av typen romans, spänningslitteratur och liknande (mer schablonmässiga?) texter. Och det finns alltså översättare som ställer upp på detta. Men de erfarenheter vi har hört talas om är inte positiva. Den tyska översättaren Miriam Neidhardts redogörelse i Översättarcentrums tidskrift Med andra ord nr 115 (juni 2023) är intressant även om AI-tjänsten i fråga inte var AI utan DeepL.

Det kan förstås hänga samman med att grundtjänsten “ChatGPT” är gratis. För ChatGPT Team, som kostar $25/månad, säger OpenAI däremot att ”We do not train on your business data” och ”You own your inputs and outputs”. Alltså olika (och rörigt), så det är värt att kolla upp. (Exempelvis Amazon AI säger uttryckligen att de kan komma att lagra användarens innehåll för att förbättra tjänsten även om denne har valt att inte låta lagra innehållet för det syftet!) Läget för skönlitteraturen Användningen av AI hos bokförlag är intressant även för SFÖ-SAT av två skäl: Dels är det många medlemmar som då och då översätter böcker; dels sker utvecklingen inte isolerat och vi kan lära oss av det som händer på förlagssidan. Det finns redan några förlag som använder AI-översättningar som sedan bearbetas av ”riktiga” (?) översättare. Det gäller främst, säger man, genrelitteratur av typen romans, spänningslitteratur och liknande (mer schablonmässiga?) texter. Och det finns alltså översättare som ställer upp på detta. Men de erfarenheter vi har hört talas om är inte positiva. Den tyska översättaren Miriam Neidhardts redogörelse i Översättarcentrums tidskrift Med andra ord nr 115 (juni 2023) är intressant även om AI-tjänsten i fråga inte var AI utan DeepL. Och här har vi en helt AI-genererad barnbok – text och bild – nämligen Trisse Traktor. Läs mer om detta fenomen.

Och här har vi en helt AI-genererad barnbok – text och bild – nämligen Trisse Traktor. Läs mer om detta fenomen i den här DN-artikeln.

Det kan förstås hänga samman med att grundtjänsten “ChatGPT” är gratis. För ChatGPT Team, som kostar $25/månad, säger OpenAI däremot att ”We do not train on your business data” och ”You own your inputs and outputs”. Alltså olika (och rörigt), så det är värt att kolla upp. (Exempelvis Amazon AI säger uttryckligen att de kan komma att lagra användarens innehåll för att förbättra tjänsten även om denne har valt att inte låta lagra innehållet för det syftet!)

Om framtiden

I en färsk undersökning gjord av brittiska Society of Authors (SoA) – som även organiserar översättare – redovisas en del oroande tendenser och farhågor. Det rör sig visserligen om förlagsvärlden, men tendenserna berör säkerligen även facköversättarna.

Sålunda visar det sig bl.a. att

  • ca 8 % av (bok)översättarna har blivit ombedda att använda AI
  • 36 % av översättarna har fått färre jobb pga AI; ännu fler har fått minskad inkomst
  • ■  man hyser en oro för lägre kvalitet och mångfald vad gäller originalverk

Undersökningen redovisas här, och en kommenterande artikel i The Guardian ger en del ytterligare intressanta synpunkter.

Se för övrigt den SFÖ-SAT-enkät som Örjan Skoglösa presenterade på konferensen och som finns eller kommer att finnas på denna webbplats.

EU och USA

EUs nyligen antagna Artificial Intelligence Act (huvuddelen av titeln på svenska lyder “Europaparlamentets och rådets förordning om harmoniserade regler för artificiell intelligens”) är på ca 450 sidor och handlar framför allt om hantering av de risker som utvecklingen och användningen av AI kan medföra. Den förefaller inte påverka vårt arbete men kanske allas vår framtida tillvaro. (Här finns en kort sammanfattning.)

Av betydligt större intresse för oss är ATA Statement on Artificial Intelligence. ATA står för American Translators Association och är således en systerorganisation till oss. Och även om man också organiserar boköversättare är detta uttalande av klart intresse för oss; jag föreslår att SFÖ-SAT tar en titt för att sedan göra ett motsvarande uttalande. Så här lyder slutklämmen:

”Moving forward, the Association will explore other aspects of AI-based tools and how the profession is adapting to them, with the goal of providing insights, ideas, and solutions.”

SAMMA FÖRFATTARE +

SENASTE INSLAG +