Vad är kopplingen mellan talesyntes och erkännande?
Talsyntes och igenkänning är de två sidorna i datoriserad talanalys. Talsyntes är skapandet av mänskligt tal av en dator; till exempel en dator som läser skriftlig text. Taligenkänning är skapandet av datorinformation från talade ord, till exempel att diktera ett papper till en dator. Medan de två processerna inte är direkt relaterade, förlitar sig talsyntes och igenkänning båda på en dators förmåga att förstå mänskligt tal och böjning. En metod matas ut och den andra matas in.
De processer som används vid talsyntes och igenkänning är mycket lika, även om slutprodukten är annorlunda. Processen består av två delar, en del med mänsklig interaktion och en utan. Den mänskliga delen är när mänskliga ord kommer in i programmet; den icke-mänskliga delen är när programmet interopererar ingången.
Ett talssyntesprogram kommer att ta in mänskliga inmatningar i form eller typ eller skriftligt mänskligt språk. Programmet kommer att läsa språket och bestämma vad varje ord är, med hjälp av meningsplacering och skiljetecken för att bestämma böjning. När ett ord kan uttalas på flera sätt, till exempel i fallet "live", kommer programmet att leta efter närliggande ord och sammanhang ledtrådar för att avgöra vilket ord som faktiskt används. Orden går sedan till den andra delen av programmet, där de talas högt.
I ett taligenkänningsprogram är processen motsatt. Inmatningen kommer från en mänsklig talare som säger ord till en dator. Datorn lyssnar på varje ord och jämför mönstret som genereras av talarens röst med ett bibliotek med möjliga ljud och ord. Den gör sedan en bestämning av det mest troliga ordet och skickar det till den andra delen av systemet. Denna del skriver faktiskt ut orden på skärmen, liknande hur syntesprogrammet säger orden.
Eftersom varje högtalare låter något annorlunda har talsyntes- och igenkänningsprogram ofta en stor felmarginal. Ett av sätten människor bekämpar dessa fel är genom individualiserade talprofiler. En enda talare kommer att få sitt tal analyseras av programmet för att hitta hans specifika vokala mönster. När han hittar fel i datoröversättningen kan han specifikt korrigera dem. Korrigeringarna analyseras och lagras av programmet så när det besvärliga ordet kommer upp igen kommer programmet att översätta det korrekt.
Det finns en bred applikation för talsyntes- och igenkänningsprogram. Inom det medicinska området tillåter dessa program människor att kommunicera som annars inte skulle kunna. Dessa program har en bred applikation inom företag som ett snabbare sätt att översätta rapporter och dokument. Taligenkänning är också en vanlig metod för att ställa in handsfree-enheter i bilar, vilket gör att människor kan tala mer i telefonen säkrare under körning.