ELRC

ELRC på datajakt

13 sep, 2018

EU:s automatiserade översättningsplattform behöver matas med stora mängder data om den ska fungera tillfredsställande, inte minst vad terminologin beträffar. Därför har Europeiska kommissionen startat ELRC, ett omfattande initiativ för att identifiera och samla in språkresurser som är relevanta för nationella offentliga tjänster, förvaltningar och statliga institutioner.

/ Foto: iStock.

I projektet European Language Resource Coordination (ELRC) ingår att anordna seminarier i alla EU-länderna om behovet av att samla in språkdata till den automatiserade översättningsplattformen eTranslation. Det andra svenska seminariet av detta slag hölls i Stockholm den 23 maj och anordnades av Språkrådet. Det första svenska seminariet hölls 2016 – se Facköversättaren 2016/2, sid 6–7.

Rickard Domeij från Språkrådet inledde heldagsseminariet på Europahuset med en kort introduktion till ELRC-projektet och arbetet med att få myndigheter och andra organisationer intresserade och delaktiga. Därefter ägnades förmiddagen åt presentationer av främst olika svenska myndigheter som idag använder eTranslation, bland andra Livsmedelsverket och Tillväxtverket, som driver sajten www.verksamt.se. Efterfrågan på att e-tjänster ska finnas tillgängliga på olika EU-språk och även invandrarspråk är stor, och det gäller inte minst verksamt.se. Andra exempel på områden där behovet är stort är konsumentklagomål och upphandlingsunderlag.

Jämfördes med GT
Flera av talarna tog naturligt nog upp nyttan och meningen med eTranslation-tjänsten, och det var intressant att notera att man då i första hand verkade ställa den mot att använda gratistjänster som Google Translate snarare än mot att använda mänskliga översättare. Kristina Lagestrand Sjölin från Livsmedelsverket hade mycket positiva erfarenheter av eTranslation men menade trots detta att tjänsten inte ska ersätta mänskliga översättare utan exempelvis kan användas till att göra en första bedömning av en text för att se vilken kompetens man behöver anlita för att få den översatt. Hon var också noga med att understryka att tjänsten kräver kunskap och omdöme av användarna.

Förmiddagen avslutades med ett panelsamtal mellan talarna om för- och nackdelar med eTranslation-tjänsten. Terminologen Henrik Nilsson ställde frågan hur paneldeltagarna ser på konsekvenserna för översättningsmarknaden och översättarna (tack Henrik!). Svaret från panelen blev att det finns så mycket att göra att det fortfarande kommer att finnas behov av mänskliga översättare, samtidigt som det faktiskt inte finns översättare att få tag i för alla språkkombinationer. Som Livsmedelsverkets representant tidigare var inne på kan maskinöversättning också bidra till att öka beställarkompetensen när det gäller mänskliga översättningar.

Insamling av språkdata i praktiken
Eftermiddagens program fokuserade på det praktiska arbetet med att samla in språkdata, det vill säga översättningsminnen och flerspråkiga dokument. Bland talarna märktes Anne-Marie Colliander Lind, som representerade Språkföretagen med en presentation om översättningsföretagens roll i att tillgängliggöra språkdata – den programpunkt som kanske var den mest relevanta för oss översättare.

Anne-Marie inledde med att berätta att det redan idag översätts mer med MT på en dag än vad alla mänskliga översättare i världen tillsammans klarar på ett år, en beräkning som bland annat bygger på statistik från Google. Detta fick stå som illustration för hur integrerat MT redan är i vår verklighet och säger också något om vilka textmassor det rör sig om.

I likhet med flera tidigare talare framhöll Anne-Marie att maskinöversättningen driver på behovet av mänskliga översättningar. Dessutom uppstår behov av en ny typ av kompetens när maskinöversättningen blir allt bättre – det gör nämligen att det blir svårare att upptäcka felen som systemen fortfarande gör. Hon uttryckte också en viss nervositet över kvaliteten på de enorma mängder data som matas in i eTranslation-systemet, samt påpekade att det finns en integritetsaspekt: det finns dokument som aldrig bör få se offentlighetens ljus och någon måste ta ansvar för att dessa inte hamnar i systemet.

Vidare tog Anne-Marie upp den onekligen intressanta aspekten om vem som ska få betalt om eTranslation blir en självklar del i myndigheternas översättningsarbete, i synnerhet om det också ingår att data ska matas tillbaka in i systemet och förbättra det. Det är i så fall något som måste ingå som standard i upphandlingsunderlagen och hela prismodellen måste sannolikt förändras, till exempel så att en betydligt större del av kakan går till granskningssteget.

Fråga till översättarna
Dagen avslutades med att Rickard Domeij öppnade upp för dialog om insamling av språkdata och delaktighet i ELRC-projektet. Han ställde även en fråga till översättarna i publiken om vi ser någon fördel med att använda MT i vårt arbete, vilket flera av oss svarade ja på, om än med vissa förbehåll (inte för alla typer av jobb och inte för alla kunder). Det lät dock inte som om eTranslation kommer att bli allmänt tillgängligt för enskilda översättare inom överskådlig framtid, bland annat på grund av bristande serverkapacitet. Underleverantörer till vissa myndigheter kan komma att få tillgång, något som bedöms från fall till fall.

SENASTE INSLAG +