Automatisk oversættelse

Den automatiske oversættelse henviser til oversættelsesbrute af en tekst, der udelukkende er lavet af et eller flere computerprogrammer . I tilfælde af oversættelse af en lydsamtale, live eller optaget, taler vi om automatisk transkription . En menneskelig oversætter griber ikke ind for at rette tekstfejl under oversættelsen, men kun før og / eller efter. Det adskiller sig fra computerassisteret oversættelse, hvor oversættelsen er delvist manuel, muligvis interaktivt med maskinen.

På trods af sine svagheder kan den levere tjenester inden for områder som internationalt ur (inklusive teknologivag ), hvor det giver overfladisk, men hurtig viden om store mængder tekster.

Siden århundredskiftet har maskinoversættelse oplevet betydelig vækst på Internettet med flere online-systemer, der er i stand til automatisk at oversætte stadig længere websider eller tekster på få sekunder. Det er en meget værdsat hjælp fra offentligheden, fordi det gør det muligt - på en grov måde - at dechiffrere temaet for en webside på et helt ukendt sprog og de vigtigste fakta eller informationer, det indeholder. For at forenkle navigationen har flere søgemaskiner som Google , Altavista eller Yahoo! tillade, at den bruges systematisk.

Historie og udvikling

Ende Oktober 2005, meddeler pressen bemærkelsesværdige forbedringer. Det Internationale Center for Avanceret Kommunikationsteknologi, der i fællesskab drives af Carnegie-Mellon University i Pittsburgh og University of Karlsruhe i Tyskland, afslører et øjeblikkeligt computersystem til oversættelse. En kinesisk studerende, der er pyntet med elleve elektroder på ansigt og hals, holder en tale på sit eget sprog, der samtidigt oversættes til engelsk og spansk. Forskerne konkluderer, at "Resultaterne er ikke perfekte", og at "der kan være vanskeligheder undertiden". Faktisk viser ingen artikel, at tyske og amerikanske journalister var i stand til at diskutere med den studerende. Journalisterne undlader generelt at specificere, at når doktor Waibel meddeler, at han vil stille spørgsmål fra tyske og amerikanske journalister, hører computeren noget i retning af: "Så vi glykogen, skiftevis spørgsmål mellem Tyskland og Amerika. Denne type øjeblikkelig oversættelse mangler stadig softwareforbedringer med hensyn til talegenkendelse , især krypteret af omgivende støj og dårlig udtale.

I 2018 formåede et computerværktøj baseret på kunstig intelligens på tolv timer at oversætte en bog med 800 sider tekst , grafik og matematiske formler , skrevet med LaTeX . Dette værktøj udviklet af Quantmetry, et ungt konsulentfirma for kunstig intelligens for virksomheder, der er tilknyttet fire franske forskere med speciale i dyb læring og fra ENSAI , INRIA og University of Caen , er baseret på DeepL- maskinoversættelsestjenesten .

Metoden til dyb læring og fremskridt med maskinoversættelse inspireret af den måde, den menneskelige hjerne fungerer på, er baseret på neurale maskinoversættelser, der almindeligvis kaldes NMT på engelsk " Neural Machine Translation ".

I 2019 er DeepL fra Linguee en af ​​de førende tjenester på domænet, men denne service kan blive overhalet af yderligere fremskridt fra Google.

I 2010 blev Pangeanic det første firma i verden, der anvendte Moses statistiske oversætter i et kommercielt miljø ved at udvikle en platform til selvlæring, korpusrensning og genanvendelse i samarbejde med Instituto Técnico de Informática de Valencia (ITI) og forskningen. gruppe Anerkendelse af former og teknologi til menneskeligt sprog i Politècnica de València. Et stiftende medlem af TAUS, Pangeanic vandt den største maskineoversættelsesinfrastrukturkontrakt for Europa-Kommissionen med sit IADAATPA- projekt i 2017. Siden 2019 har Pangeanic været førende på NTEU.eu , et CEF-projekt fra Europa-Kommissionen. NTEU er den største neurale netværksbaserede maskinoversættelsesmotorfarm for europæiske offentlige administrationer.

Siden 2020 har Google gjort automatisk oversættelse af tale eller mundtlig samtale tilgængelig fra mobiltelefoner.


Maskinoversættelse og maskintransskription

Maskinoversættelse adskiller sig fra maskintransskription, idet maskinoversættelse er oversættelse - fra skriftlig til skriftlig - mens transkription anvendes på tale og kan tilbydes i skriftlig form.

F.eks. Tilbyder Oversættelsescentret for EU-organer sine brugere begge typer tjenester, så de hurtigt og billigt kan få en tekst, der kan bruges uden at være nøjagtig korrekt.

Den første indiske filmdistributør - oprindeligt af VHS - med flere hundrede millioner registrerede brugere, kendt for sine kæmpestor film, har fået alle 12.000 produkter i sit katalog med undertekster - automatisk transskriberet - af Google-tjenesten for at gøre dem tilgængelige på arabisk. Denne automatiske transskription reducerer omkostningerne med 25% og forsinkes med to dage. Det fører også til fejl, der kræver korrektion, når de opdages eller identificeres.

Oversættelsesprocessen

Den oversættelse proces (i det menneskelige forstand) kan opdeles i tre på hinanden følgende faser:

  1. forståelse: assimilering af betydningen formidlet af en tekst, af betydningen af ​​en forfatter ...
  2. deverbalisering: glemmer ord og bevarer betydning "Operation, hvorved et emne bliver opmærksombetydningen af en besked ved at miste bevidstheden om de ord og sætninger, der gav det krop";
  3. genudtryk: omformulering af mening på målsproget.

I beregningsmæssige termer bliver forståelse analyse , deverbalisering bliver overførsel, og reekspression bliver generation . Disse faser af processen er modelleret i Vauquois-trekanten. Denne model er nyttig, fordi der for at gå fra kilden til målet er der flere mulige stier, der udgør de forskellige tilgange, der er betragtet til dato. Jo højere grad af konceptualisering, jo kortere vej til overførsel. Der er fire hovedmuligheder:

I øjeblikket er oversættelsesmotorer hovedsageligt efter regler eller statistikker. En såkaldt hybridsti opstår. Systran , Google Translate , Reverso og Microsoft Translation bruger hybrid tilgang.

Forudsætninger

Forudsætningerne afhænger af den planlagte tilgang: regelbaseret oversættelse (ord-for-ord, overførsel, pivot), oversættelse med eksempel, statistisk oversættelse.

Regelbaseret maskinoversættelse kræver:

Oversættelse med eksempel og statistisk oversættelse kræver:

Derudover har vi muligvis brug for sproglige analyseværktøjer som:

Tilgange

Flere metoder kan overvejes til maskinoversættelse.

  1. ord-for-ord-oversættelse af kildetekst til måltekst
  2. omformulering af den oversatte ordrækkefølge i målteksten
  3. bogstavelig oversættelse af en tekst fra et foto
  1. opbygning af sprogets gengivelse af kildeteksten
  2. konstruktion af målteksten af ​​repræsentationen
  1. leksikalsk og syntaktisk analyse af kildeteksten
  2. overførsel af oversatte lemmaer og strukturer til målsproget
  1. Automatisk korrektion af kildetekst
  2. Behandling af idiomer
    1. Registrering af kildesprog-idiomer i kildetekst
    2. Målsprogfortolkning
    3. Ord-til-ord-oversættelse på kildesproget
    4. Erstatning i kildetekst
  3. Registrering til fortolkning (kildesprog → målsprog og ord-til-ord-oversættelse → kildesprog) og udskiftning af kun egennavne i kildeteksten
  4. Syntaktisk reorganisering i kildeteksten
  5. Ord-til-ord-oversættelse af kildetekst

Berygtet

Brugen af ​​maskinoversættelse er blevet almindelig i visse udvekslinger og i visse professionelle kredse.

For eksempel, på trods af risiciene og i mangel af kompetente fagfolk, kunne hospitaler og klinikker i USA ty til maskinoversættelse.

90% af de tekster, der er oversat af Generaldirektoratet for Oversættelse (GD TRAD) er oversat med maskinoversættelse.

Oversættelseskvalitet

Maskinoversættelse, groft, er ikke perfekt, og nogle fejl kan findes i resultatet, såsom at bruge et ord i stedet for et andet. Det skal derfor bearbejdes for at fjerne fejl.

Eksempel på fejl, hvor ordet dom er oversat med ordet dekret:

Med henvisning til dekretet, der blev truffet i denne sag den 31. januar 2019, hvorved Det blev dekreteret som et højtideligt bryllup den 1. juli 2013. ( " Henviser til dekretet i dette tilfælde 31. januar 2019, hvorved det blev dekreteret, at ægteskabet fejres højtideligt den 1. juli 2013 "  på engelsk )"

- Juridisk oversættelse versus maskinoversættelse

Når kvantitet og omkostninger går forud for kvalitet, er maskinoversættelse privilegeret, og den professionelle oversætter er tvunget til at retfærdiggøre sin merværdi.

Kvalitetsmåling

Metrics for kvalitetsmåling bruges til at kunne automatisere målingen af ​​kvaliteten af ​​maskinoversættelse. Nogle kendte metrics er BLÅ , RØD, NIST og METEOR.

Menneskelig vurdering

Maskinoversættelse kan også være underlagt menneskelig klassificering:

Risici

Denne type tjenester kan udgøre risici inden for privatlivets fred samt risici for at fremkalde racistiske eller sexistiske fordomme.

Misbrug kan medføre andre risici afhængigt af brugen, så ifølge Daily Telegraph blev en polsk medarbejder alvorligt såret efter at have fulgt sikkerhedsinstruktionerne, som Google havde givet en forkert eller fejlagtig oversættelse efter anmodning fra arbejdsgiveren - Parkers Planteskoler -

Vide hvordan

Viden om at bruge maskinoversættelse med det nødvendige efterfølgende kaldes "Machine Translation Literacy".

Ansøgninger

Aktuelle oversættelsesenheder er nyttige i begrænsede situationer, såsom at booke et værelse på et hotel. "Hvis jeg tager til Beijing, kan jeg bo på Hilton uden problemer," sagde Stephan Vogel, en Carnegie Mellon-forsker.

onlinetjenester

Onlinetjenester er lette at bruge i udseende: de består i at åbne tjenesten, automatisk kopiere den tekst, der skal oversættes, vælge det originale sprog og destinationssproget og derefter anmode om oversættelse.

Gratis online oversættere  :

De giver dig mulighed for at oversætte ord eller tekster af begrænset størrelse. Dette er for eksempel:


Gratis software  :

Udviklingsmiljøer  :

Fremtidige

Forskellige projekter søger at forbedre ydeevnen og hastigheden for oversættelsesmotorer (inklusive Googles ) i håb om en dag at være i stand til at overvinde "sprogbarrieren" og oversætte i realtid (som mange naturvidenskabelige forfattere har forestillet sig ) fremmedsprog eller endda være i stand til at "kommunikere" med visse dyr via stemmebehandlingssoftware.

Noter og referencer

  1. Laurence Danlos. Professor i computerlingvistik ved universitetet i Paris 7, skriver i Computer Linguistics, Automatic Translation  : "De producerer ofte fejlagtige oversættelser, men som i det mindste kan bruges til at bestemme, hvad teksten handler om (hvilket for eksempel er vigtigt i teknologisk ur) .). "
  2. "  Nye oversættelsessystemer for at overvinde sprogbarrieren  " , på www.rtflash.fr ,18. oktober 2018(adgang 14. oktober 2018 )
  3. Ange-Gabriel C., “  En samtidig oversættelsesmaskine  ” , på generation-nt.com ,31. oktober 2005(adgang 14. oktober 2018 )
  4. Laure Beaudonnet, "  " Deep learning ": Mennesket tager sit første store slag ved maskinen med hensyn til oversættelse  " , på www.20minutes.fr ,10. oktober 2018(adgang 14. oktober 2018 )
  5. "  Automatisk oversættelse tager kæmpe trin  " , på lesechos.fr (adgang til 4. marts 2019 )
  6. https://www.letemps.ch/economie/traduction-deepl-meilleur-google-innovera-bientot
  7. https://www.science-et-vie.com/science-et-culture/traduction-automatique-la-barriere-de-la-langue-est-en-train-de-tomber-58230
  8. https://www.cdt.europa.eu/fr/news/nouveaux-services-partir-de-janvier-2021-transcription-automatique-traduction-automatique-paste
  9. Cheeni Kum , Happy Bhag Jayegi , Manmarziyaan , Bajirao Mastani , Tanu Weds Manu Returns , Goliyon ki raasleela Ram-Leela , Rockstar , Shubh Mangal Savdhan , Vicky Donor , Mukkabaaz , Munna Michael , Ki & Ka , English Vinglish , Sellag Virat, Hain, Maine Pyaar Kiya og Padosan
  10. https://www.moneycontrol.com/news/trends/entertainment/changing-script-ai-not-humans-to-write-subtitles-for-movies-soaps-6632641.html
  11. Oversættelse: brugsanvisning, analytisk ordliste , J. DEMANUELLI & C. DEMANUELLI, side 51
  12. Efter arbejde fra Vauquois og Boitet (Bernard Vauquois, Christian Boitet: Automated Translation at Grenoble University. Computational Linguistics 11 (1): 28-36 (1985))
  13. Philipp Koehn: Statistisk maskinoversættelse. Cambridge University Press, 2010.
  14. (i) Eugene Seo Il-Sun Song, Su-Kyung Kim og Jin-Ho Choi. 2009. Syntaktisk og semantisk engelsk-koreansk maskinoversættelse ved hjælp af ontologi. I Proceedings of the 11. internationale conference on Advanced Communication Technology - Volume 3 (ICACT'09), bind. 3. IEEE Press, Piscataway, NJ, USA, 2129-2132.
  15. Roland Raoul KOUASSI, University of Cocody, Problemet med maskinoversættelse ,17. november 2009, 30  s. ( læs online )
  16. M. Constant, kursus for maskinoversættelse , University of Paris-Est Marne-la-Vallée,5. oktober 2009, 32  s.
  17. Juridisk oversættelse versus maskinoversættelse
  18. https://www.presse-citron.net/google-traduction-est-toujours-un-risque-pour-la-medecine/
  19. Årlig aktivitetsrapport, 2015, GD Oversættelse, D (2016) 3325
  20. https://www.erudit.org/fr/revues/meta/2018-v63-n3-meta04634/1060173ar/
  21. https://www.erudit.org/fr/revues/meta/2018-v63-n3-meta04634/1060173ar/
  22. https://www.erudit.org/fr/revues/meta/2018-v63-n3-meta04634/1060173ar/
  23. https://www.noslangues-ourlanguages.gc.ca/fr/blogue-blog/traduction-automatique-machine-translation-fra
  24. Daily Telegraph, februar 2013
  25. https://www.noslangues-ourlanguages.gc.ca/fr/blogue-blog/traduction-automatique-machine-translation-fra
  26. beskrivelse af et essay på C&C iEXPO 09 , artikel af akihabaranews .

Se også

Relaterede artikler

Bibliografi

eksterne links