Det var en stor uppståndelse 2018 när kvaliteten på maskinöversättningsmotorer tydligen förbättrades avsevärt. Uttrycket ”neural maskinöversättning” tog inte bara översättningssektorn med storm utan också allmänheten. Buzzwords som artificiell intelligens, maskininlärning, Deep Learning och Data Mining fanns överallt. Plötsligt var alla experter - uppdelade i två läger: ”Maskinöversättning är värdelös och kommer alltid att vara” och ”Maskinöversättning är framtiden och översättare bör börja leta efter ett nytt jobb just nu”.
Vad är sant nu? Hur har ämnet utvecklats under de senaste två åren, och hur kan företag framgångsrikt implementera maskinöversättning (MT) i sina företag?
Ett klassiskt uttalande i MT-branschen är att "översättningsproblemet" kommer att höra till det förflutna de närmaste fem åren. Det har varit så här sedan 1950, men vi har nått en punkt där även de mest skeptiska av MT-skeptiker kommer att erkänna att resultaten är bättre - till och med användbara! Men vad gör vi med denna information? Hur implementerar vi bäst maskinöversättning i praktiken? Det är där experterna tunnar ut.
En sak i förväg: Bli inte blind av uttalanden som "tre av fyra översättare föredrar vår motor" eller "vår BLEU-poäng är mycket bättre än konkurrenternas". I de allra flesta fall är detta bara framgångsrik marknadsföring. Microsofts forskningsrapport om den förmodade mänskliga pariteten för kinesisk-engelska översättningar bör också behandlas med försiktighet. För dem som är intresserade av ämnet rekommenderar jag Tommi Nieminen bedömning.
Google Translate, DeepL, Microsoft Translator, Amazon Translate och andra är generiska MT-system. Dessa system utbildas med stora mängder data från olika avdelningar. Som ett resultat läser översättningarna mycket flytande, men terminologin passar inte varje specialområde eller översätts felaktigt på grund av brist på träningsdata i en viss domän. Det är därför generiska system är mer lämpliga för företag som inte använder högt specialiserad terminologi.
Individualiserade system utbildas däremot med kundspecifik data för att säkerställa att både terminologin och företagsspråket beaktas i översättningarna. Resultatet är motorer vars råa översättningar är av högre kvalitet och kräver mindre efterredigering.
Vilket av de två alternativen är bäst och om användningen av maskinöversättning överhuvudtaget är genomförbar för företaget beror på många faktorer: Vilken prioritet ges datasäkerhet i företaget? Hur stort är företagets översättningsminne? Hur mycket pengar ska investeras i den nya tekniken? Införandet av ett MT-system är en lång process som inte garanterar en kortsiktig avkastning på investeringen. Om en anpassad motor ska användas kan det enkelt ta ett år att ställa in, träna och testa den ordentligt. En bra leverantör eller konsult kommer att göra dig medveten om detta faktum och kommer inte att lova dig månen.
Under de senaste två åren har DeepL orsakat en ganska känsla. Nu tror många beslutsfattare att maskinöversättning kan kopplas till översättningshanteringssystemet inom en dag och att översättningskostnaderna kan halveras omedelbart. Eller ännu bättre: att översättningshanteringssystemet har blivit överflödigt eftersom DeepL och dess konkurrenter ändå kan översätta hela dokument. Svår terräng.
Ja, det kan göras. Ja, resultaten är delvis mycket bra vid första anblicken. Den avgörande punkten för hög MT-kvalitet är ämnesområdet för texten som ska översättas. E-post, kundrecensioner och sociala medier är inte längre utmaningar för MT.
Men om du försöker översätta en marknadsföringsbroschyr eller en årlig balansräkning med en generisk motor blir tydliga skillnader i kvalitet uppenbara. Man bör också komma ihåg att utskriftskvaliteten kan variera mycket beroende på språkparet. Engelska-tyska eller engelska-franska översättningar är ofta mycket bra, men med mer ”exotiska” språkpar blir kvaliteten snabbt sämre. För vissa användningsfall kan utgångskvaliteten för generiska motorer i kombination med efterredigering vara tillräcklig, och det är bra!
Den bästa delen av utvecklingen under de senaste två åren är att den har resulterat i ett ständigt ökande antal MT-leverantörer (nu mer än 100). Om ett företag vill integrera maskinöversättning i arbetsflödet för lokalisering finns det många val.
För att avgöra om en generisk motors utgångskvalitet är tillräcklig för företaget eller om en motor ska anpassas, är det bäst att göra omfattande tester med olika motorer och sedan fatta ett välgrundat beslut.
Inom datavetenskap är frasen ”Garbage In, Garbage Out” välkänd. Detsamma gäller för maskinöversättning. För att individualisera en MT-motor är stora ämnesspecifika korpor nödvändiga. Globalese, en plattform där individuella motorer kan skapas, anger en minsta storlek på 100 000 segment (cirka 1 miljon ord) per språkpar och domän.
Frågan uppstår om maskinöversättning endast är lämplig för företag med stora översättningsminnen. Svaret är: ja och nej. Den valda samarbetspartnern visar dig olika sätt att få ytterligare träningsdata. Dina egna översättningsminnen och terminologibaser är dock nödvändiga för individualisering.
Tidigare var tumregeln att ett maskinöversättningssystem blir bättre ju mer data matas in. Detta tillvägagångssätt är inte längre helt uppdaterat i utvecklingen av neurala system. Även om mycket data krävs, måste det också vara av hög kvalitet och domänspecifikt.
Projektet kan bara lyckas om det finns nära samarbete med översättarna eller efterredaktörerna i slutet av försörjningskedjan. Slutligen, när du använder maskinöversättning, är efterredigering nödvändig för att säkerställa kvaliteten på texterna.
Efterredigering är inte en färdighet som en översättare automatiskt behärskar. För att kunna arbeta produktivt måste han eller hon efterredigera cirka 7 000 ord per dag, jämfört med i genomsnitt 2 000 ord per dag för "klassisk" teknisk översättning. Detta kräver övning. Det är därför vettigt att erbjuda utbildning i efterredigering till vanliga översättare. När allt kommer omkring investerar företaget mycket pengar i en ny typ av teknik, men utan rätt expertis i slutet av försörjningskedjan kan de nya möjligheterna inte utnyttjas helt.
Ytterligare en förutsättning för framgång är att frilansöversättare får rätt ersättning. Det finns en viktig anledning till att översättare är skeptiska till att acceptera efterredigeringsjobb: otillräcklig betalning i förhållande till kvaliteten på den råa översättningen. Detta beror på att företag och språktjänstleverantörer under de senaste två åren i allt högre grad har producerat översättningar med generiska motorer och sedan skickat dem oredigerade för efterredigering. På grund av den höga felfrekvensen måste översättningarna i sådana fall ofta skapas från grunden - till ungefär en tredjedel av det vanliga ordpriset. Se till att du betalar en rimlig avgift och sänker priset per ord eller per rad för efterredigeringsuppgifter under flera månader. Detta ger dina översättare tid att vänja sig vid det nya sättet att arbeta. Också,
Maskinöversättning kan vara ett bra verktyg för att spara översättningskostnader på medellång till lång sikt. Från DeepL till stora kundanpassade lösningar finns det nu en lösning för nästan alla användningsfall. Det bör dock noteras i förväg att inte alla typer av text är lika lämpliga för maskinöversättning.
För att genomförandet ska lyckas måste ett stort projekt startas för vilket ytterligare resurser och arbetskraft måste göras tillgängliga. En förutsättning för framgång är ett bra samarbete med översättarna, för utan detta kan efterredigering varken äga rum, och det kan inte heller finnas någon feedback om maskinöversättningarna - vilket är viktigt för vidareutveckling och förbättring av motorn. Dessutom bör MT-motorn anslutas till det interna översättningshanteringssystemet via ett gränssnitt för att utnyttja styrkan i båda systemen.