Den automatiske oversættelse henviser til oversættelsesbrute af en tekst, der udelukkende er lavet af et eller flere computerprogrammer . I tilfælde af oversættelse af en lydsamtale, live eller optaget, taler vi om automatisk transkription . En menneskelig oversætter griber ikke ind for at rette tekstfejl under oversættelsen, men kun før og / eller efter. Det adskiller sig fra computerassisteret oversættelse, hvor oversættelsen er delvist manuel, muligvis interaktivt med maskinen.
På trods af sine svagheder kan den levere tjenester inden for områder som internationalt ur (inklusive teknologivag ), hvor det giver overfladisk, men hurtig viden om store mængder tekster.
Siden århundredskiftet har maskinoversættelse oplevet betydelig vækst på Internettet med flere online-systemer, der er i stand til automatisk at oversætte stadig længere websider eller tekster på få sekunder. Det er en meget værdsat hjælp fra offentligheden, fordi det gør det muligt - på en grov måde - at dechiffrere temaet for en webside på et helt ukendt sprog og de vigtigste fakta eller informationer, det indeholder. For at forenkle navigationen har flere søgemaskiner som Google , Altavista eller Yahoo! tillade, at den bruges systematisk.
Ende Oktober 2005, meddeler pressen bemærkelsesværdige forbedringer. Det Internationale Center for Avanceret Kommunikationsteknologi, der i fællesskab drives af Carnegie-Mellon University i Pittsburgh og University of Karlsruhe i Tyskland, afslører et øjeblikkeligt computersystem til oversættelse. En kinesisk studerende, der er pyntet med elleve elektroder på ansigt og hals, holder en tale på sit eget sprog, der samtidigt oversættes til engelsk og spansk. Forskerne konkluderer, at "Resultaterne er ikke perfekte", og at "der kan være vanskeligheder undertiden". Faktisk viser ingen artikel, at tyske og amerikanske journalister var i stand til at diskutere med den studerende. Journalisterne undlader generelt at specificere, at når doktor Waibel meddeler, at han vil stille spørgsmål fra tyske og amerikanske journalister, hører computeren noget i retning af: "Så vi glykogen, skiftevis spørgsmål mellem Tyskland og Amerika. Denne type øjeblikkelig oversættelse mangler stadig softwareforbedringer med hensyn til talegenkendelse , især krypteret af omgivende støj og dårlig udtale.
I 2018 formåede et computerværktøj baseret på kunstig intelligens på tolv timer at oversætte en bog med 800 sider tekst , grafik og matematiske formler , skrevet med LaTeX . Dette værktøj udviklet af Quantmetry, et ungt konsulentfirma for kunstig intelligens for virksomheder, der er tilknyttet fire franske forskere med speciale i dyb læring og fra ENSAI , INRIA og University of Caen , er baseret på DeepL- maskinoversættelsestjenesten .
Metoden til dyb læring og fremskridt med maskinoversættelse inspireret af den måde, den menneskelige hjerne fungerer på, er baseret på neurale maskinoversættelser, der almindeligvis kaldes NMT på engelsk " Neural Machine Translation ".
I 2019 er DeepL fra Linguee en af de førende tjenester på domænet, men denne service kan blive overhalet af yderligere fremskridt fra Google.
I 2010 blev Pangeanic det første firma i verden, der anvendte Moses statistiske oversætter i et kommercielt miljø ved at udvikle en platform til selvlæring, korpusrensning og genanvendelse i samarbejde med Instituto Técnico de Informática de Valencia (ITI) og forskningen. gruppe Anerkendelse af former og teknologi til menneskeligt sprog i Politècnica de València. Et stiftende medlem af TAUS, Pangeanic vandt den største maskineoversættelsesinfrastrukturkontrakt for Europa-Kommissionen med sit IADAATPA- projekt i 2017. Siden 2019 har Pangeanic været førende på NTEU.eu , et CEF-projekt fra Europa-Kommissionen. NTEU er den største neurale netværksbaserede maskinoversættelsesmotorfarm for europæiske offentlige administrationer.
Siden 2020 har Google gjort automatisk oversættelse af tale eller mundtlig samtale tilgængelig fra mobiltelefoner.
Maskinoversættelse adskiller sig fra maskintransskription, idet maskinoversættelse er oversættelse - fra skriftlig til skriftlig - mens transkription anvendes på tale og kan tilbydes i skriftlig form.
F.eks. Tilbyder Oversættelsescentret for EU-organer sine brugere begge typer tjenester, så de hurtigt og billigt kan få en tekst, der kan bruges uden at være nøjagtig korrekt.
Den første indiske filmdistributør - oprindeligt af VHS - med flere hundrede millioner registrerede brugere, kendt for sine kæmpestor film, har fået alle 12.000 produkter i sit katalog med undertekster - automatisk transskriberet - af Google-tjenesten for at gøre dem tilgængelige på arabisk. Denne automatiske transskription reducerer omkostningerne med 25% og forsinkes med to dage. Det fører også til fejl, der kræver korrektion, når de opdages eller identificeres.
Den oversættelse proces (i det menneskelige forstand) kan opdeles i tre på hinanden følgende faser:
I beregningsmæssige termer bliver forståelse analyse , deverbalisering bliver overførsel, og reekspression bliver generation . Disse faser af processen er modelleret i Vauquois-trekanten. Denne model er nyttig, fordi der for at gå fra kilden til målet er der flere mulige stier, der udgør de forskellige tilgange, der er betragtet til dato. Jo højere grad af konceptualisering, jo kortere vej til overførsel. Der er fire hovedmuligheder:
I øjeblikket er oversættelsesmotorer hovedsageligt efter regler eller statistikker. En såkaldt hybridsti opstår. Systran , Google Translate , Reverso og Microsoft Translation bruger hybrid tilgang.
Forudsætningerne afhænger af den planlagte tilgang: regelbaseret oversættelse (ord-for-ord, overførsel, pivot), oversættelse med eksempel, statistisk oversættelse.
Regelbaseret maskinoversættelse kræver:
Oversættelse med eksempel og statistisk oversættelse kræver:
Derudover har vi muligvis brug for sproglige analyseværktøjer som:
Flere metoder kan overvejes til maskinoversættelse.
Brugen af maskinoversættelse er blevet almindelig i visse udvekslinger og i visse professionelle kredse.
For eksempel, på trods af risiciene og i mangel af kompetente fagfolk, kunne hospitaler og klinikker i USA ty til maskinoversættelse.
90% af de tekster, der er oversat af Generaldirektoratet for Oversættelse (GD TRAD) er oversat med maskinoversættelse.
Maskinoversættelse, groft, er ikke perfekt, og nogle fejl kan findes i resultatet, såsom at bruge et ord i stedet for et andet. Det skal derfor bearbejdes for at fjerne fejl.
Eksempel på fejl, hvor ordet dom er oversat med ordet dekret:
" Med henvisning til dekretet, der blev truffet i denne sag den 31. januar 2019, hvorved Det blev dekreteret som et højtideligt bryllup den 1. juli 2013. ( " Henviser til dekretet i dette tilfælde 31. januar 2019, hvorved det blev dekreteret, at ægteskabet fejres højtideligt den 1. juli 2013 " på engelsk )"
- Juridisk oversættelse versus maskinoversættelse
Når kvantitet og omkostninger går forud for kvalitet, er maskinoversættelse privilegeret, og den professionelle oversætter er tvunget til at retfærdiggøre sin merværdi.
Metrics for kvalitetsmåling bruges til at kunne automatisere målingen af kvaliteten af maskinoversættelse. Nogle kendte metrics er BLÅ , RØD, NIST og METEOR.
Maskinoversættelse kan også være underlagt menneskelig klassificering:
Denne type tjenester kan udgøre risici inden for privatlivets fred samt risici for at fremkalde racistiske eller sexistiske fordomme.
Misbrug kan medføre andre risici afhængigt af brugen, så ifølge Daily Telegraph blev en polsk medarbejder alvorligt såret efter at have fulgt sikkerhedsinstruktionerne, som Google havde givet en forkert eller fejlagtig oversættelse efter anmodning fra arbejdsgiveren - Parkers Planteskoler -
Viden om at bruge maskinoversættelse med det nødvendige efterfølgende kaldes "Machine Translation Literacy".
Aktuelle oversættelsesenheder er nyttige i begrænsede situationer, såsom at booke et værelse på et hotel. "Hvis jeg tager til Beijing, kan jeg bo på Hilton uden problemer," sagde Stephan Vogel, en Carnegie Mellon-forsker.
Onlinetjenester er lette at bruge i udseende: de består i at åbne tjenesten, automatisk kopiere den tekst, der skal oversættes, vælge det originale sprog og destinationssproget og derefter anmode om oversættelse.
Gratis online oversættere :
De giver dig mulighed for at oversætte ord eller tekster af begrænset størrelse. Dette er for eksempel:
Gratis software :
Udviklingsmiljøer :
Forskellige projekter søger at forbedre ydeevnen og hastigheden for oversættelsesmotorer (inklusive Googles ) i håb om en dag at være i stand til at overvinde "sprogbarrieren" og oversætte i realtid (som mange naturvidenskabelige forfattere har forestillet sig ) fremmedsprog eller endda være i stand til at "kommunikere" med visse dyr via stemmebehandlingssoftware.