Vad är talbehandling?
Talbehandling är den process som talsignaler tolkas, förstås och agerar på. Den hänvisar specifikt till behandling av mänskligt tal genom datoriserade system, som i röstigenkänningsprogramvara eller röst-till-text-program. Talbehandling är viktigt för många områden för både teoretisk och praktisk användning, allt från röstaktivering och styrning i telefoner till utveckling av funktionell konstgjord intelligens inom datavetenskap. Tolkning och produktion av sammanhängande tal är båda viktiga vid behandling av tal; vissa bekymmer gynnar det ena över det andra, eftersom applikationsbehovet för talbehandling är mycket olika.
Taligenkänning är en av de viktigaste aspekterna av talbehandling eftersom det övergripande syftet med att behandla tal är att förstå och agera på talat språk. En vanlig applikation av taligenkänning är enkel tal-till-text-konvertering, som används i många ordbehandlingsprogram. Många applikationer kräver dock mycket högre precision än vad som krävs för tal-till-text-konverteringsprogramvara. Det finns ett stort intresse, till exempel att använda taligenkänning i militära flygplan för att minska viss pilotansvar och ansträngning. För att precision och noggrannhet ska uppnås är det nödvändigt för högtalaren att kalibrera igenkänningsprogramvaran till sin egen röst och talstil.
Högtalarigenkänning, ett annat element i taligenkänning, är en annan mycket viktig aspekt av talbehandlingen, även om den ännu inte används så allmänt som allmänt taligenkänning. Medan taligenkänning specifikt hänvisar till att förstå vad som sägs, är högtalarigenkänning bara upptagen med vem som talar. Validera talarens identitet kan vara en viktig säkerhetsfunktion för att förhindra obehörig åtkomst till eller användning av ett datorsystem.
En annan komponent i talbehandlingen är röstigenkänning, som i huvudsak är en kombination av tal- och högtalarigenkänning. Röstigenkänning uppstår när taligenkänningsprogram behandlar talet för en känd talare; sådana program kan i allmänhet tolka talet för en känd högtalare med mycket större noggrannhet än för en slumpmässig högtalare.
Ett annat ämne för studier inom talbehandlingen är röstanalys. Röstanalys skiljer sig från andra ämnen i talbehandling eftersom det inte riktigt handlar om det språkliga innehållet i talet. Det handlar främst om talmönster och ljud. Röstanalys kan användas för att diagnostisera problem med röstsnören eller andra organ relaterade till tal genom att notera ljud som tyder på sjukdom eller skada. Ljud- och stresspatroner kan också användas för att avgöra om en person säger sanningen, även om denna användning av röstanalys är mycket kontroversiell.