Den talebehandling er en teknologisk disciplin, hvis mål er at fange, transmission, identifikation og syntese af tale.
På dette område kan vi definere tale som en mundtlig tekst. Vi er interesserede
Den udtryksfulde (i form af dramatisk kunst ) og musikalske karakterer af den menneskelige stemme er en del af det større felt af signalbehandling .
De vigtigste discipliner, der bidrager til teknologi til talebehandling, er
Fremkomsten i slutningen af XIX th århundrede en stærk industri Telefon , markerer begyndelsen på forskningsindsatsen i tale behandling. Efter de første eksperimenter og de første enheder, der tilbyder ringe lyttekomfort, lancerede den spirende telefonindustri undersøgelser for at bestemme de grundlæggende egenskaber ved et signal, der beskriver tale, der skal dirigeres på dens linjer. I 1920'erne gangede opfindelsen af elektronik mulighederne for signalbehandling; den båndbredde og lyd dynamik er nødvendige for taleforståelighed bestemmes.
Disse undersøgelser er nødvendige for at tillade dirigering af flere signaler på det samme par ledere (multiplexing).
Omkring tyve år senere, de teoretiske grundlag for signalbehandling ( prøveudtagning teorem , information teori var) etableret, baseret på erfaringerne fra telekommunikation og radiospredning .
I 1933 blev det første stemmesyntese-system bygget fra optagelsen af ord til det talende ur .
Anvendelsen af elektronik med mulighed for at optage og analysere signalet i et sonogram stimulerer på samme tid fonetiske, fonologiske og psykoakustiske studier.
I telekommunikation inspirerer søgen efter effektiviteten af stemmetransmission ideen om ikke længere at sende lyd, men tekst-til-tale-kommandoer udført af en enhed ved modtagelse. Den Vocoder blev opfundet i 1939, med den ekstra fordel, at den kryptering af telefonsignalet.
Computer -teknologi finder en ansøgning i tale behandling, hvor en stor industri kan koncentrere forskningsressourcer og finansiere udstyr og omkostningerne herved er spredt over millioner af brugere.
Talekodere, et direkte resultat af forskning i driften af telefonnetværk, omdanner det hørbare signal til en så lille informationshastighed som muligt.
En talespecifik encoder skal fungere bedre end en generel encoder (som mp3 ).
Taleanalysatorer transformerer signalet, der bærer talen, til en beskrivelse af dens egenskaber, uanset dens betydning. Denne beskrivelse kan bruges til at styre en synthesizer ( Vocoder ).
De kan bruges til at kvantificere forståeligheden af det signal, der transmitteres af et system.
De udgør det første skridt for højttalergenkendelse og behandling af tekstgenkendelse, som de udgør datasamlinger for.
Disse enheder identificerer den person, der taler en tekst.
Der er to separate problemer med stigende kompleksitet:
Det er et spørgsmål om at gå fra signalets egenskaber til en forståelig tekst.
Vanskeligheden stiger med kompleksiteten af det problem, der skal behandles
Synthesizere sigter mod at omdanne til et signal,
Intet sprog har en helt fonetisk skrivning, og tale inkluderer intonationer, som dem, der markerer organisering af sætninger, som kun er indirekte indskrevet i teksten. En synthesizer skal løse disse vanskeligheder og også håndtere problemet med nye eller fremmede ord.