¿Cuál es la conexión entre la síntesis y el reconocimiento del habla?
La síntesis y el reconocimiento del habla son los dos lados del análisis de voz computarizado. La síntesis del habla es la creación del habla humana de una computadora; Por ejemplo, una computadora que lee texto escrito. El reconocimiento de voz es la creación de información informática a partir de palabras habladas, como dictar un documento a una computadora. Si bien los dos procesos no están directamente relacionados, la síntesis y el reconocimiento del habla dependen de la capacidad de una computadora para comprender el habla humana y la inflexión. Un método es la salida y el otro es entrada.
Los procesos utilizados por la síntesis y el reconocimiento del habla son muy similares, incluso si el producto final es diferente. El proceso consta de dos partes, una parte con interacción humana y otra sin. La parte humana es cuando las palabras humanas ingresan al programa; La parte no humana es cuando el programa introduce la entrada.
Un programa de síntesis del habla tendrá la entrada humana en la forma o el lenguaje humano escrito o escrito. El programa leerá el idioma y determinará wHat, cada palabra es, utilizando la colocación de oraciones y la puntuación para determinar la inflexión. Cuando una palabra podría pronunciarse múltiples formas, como en el caso de "vivir", el programa buscará palabras cercanas y pistas de contexto para determinar qué palabra se está utilizando realmente. Las palabras luego irán a la segunda parte del programa, donde se hablan en voz alta.
En un programa de reconocimiento de voz, el proceso es opuesto. La entrada proviene de un hablante humano que dice palabras en una computadora. La computadora escuchará cada palabra y comparará el patrón generado por la voz del altavoz con una biblioteca de posibles sonidos y palabras. Luego toma una determinación de la palabra más probable y la envía a la segunda parte del sistema. Esta porción realmente imprime las palabras en la pantalla, similar a cómo el programa de síntesis dice las palabras.
Dado que cada altavoz suena ligeramente diferente, síntesis del habla yLos programas de reconocimiento a menudo tienen un amplio margen de error. Una de las formas en que las personas combaten estos errores es a través de perfiles de habla individualizados. Un solo orador tendrá su discurso analizado por el programa para encontrar sus patrones vocales específicos. Cuando encuentra errores en la traducción de la computadora, puede corregirlos específicamente. Las correcciones son analizadas y almacenadas por el programa para que cuando la palabra problemática vuelva a aparecer, el programa lo traducirá correctamente.
Hay una amplia aplicación para los programas de síntesis y reconocimiento del habla. En el campo de la medicina, estos programas permiten a las personas comunicarse que de otro modo no podrían no poder. Estos programas tienen una amplia aplicación en el negocio como un medio más rápido para traducir informes y documentos. El reconocimiento de voz también es un método común para configurar dispositivos manos libres en automóviles, lo que permite a las personas hablar por teléfono con más seguridad mientras conduce.