¿Qué es la deformación de tiempo dinámico?

La deformación de tiempo dinámico (DTW) implica un método de cálculo, llamado algoritmo, para comparar sonidos, video y gráficos que pueden ser similares, pero cuyas muestras pueden tener diferencias sutiles. Los cálculos generalmente formulan una representación lineal de la muestra y miden las diferencias en función del tiempo. Se pueden asignar diferentes elementos de una muestra en una cuadrícula para identificar similitudes, mientras que los comandos para funciones a menudo usan símbolos para identificar cada variable. El reconocimiento de voz, por ejemplo, a veces usa la deformación de tiempo dinámico para que coincida con las palabras, incluso si se hablan a diferentes velocidades o ciertas partes se pronuncian de manera diferente.

Muchos programas de reconocimiento de voz usan una deformación dinámica de tiempo porque las personas a menudo hablan a diferentes tasas. Ciertos sonidos vocales pueden anunciarse de manera diferente dependiendo de emociones u otros factores. Algunos programas pueden reconocer las palabras pronunciadas sin importar quién esté hablando. Por esta razón, generalmente no es efectivo sumar las distancias en el interva de tiempols para comparar sonidos. Con DTW, se analizan varios puntos específicos del tiempo para cada señal; Estas distancias se calculan en una cuadrícula que se ejecuta desde la parte inferior izquierda hasta la parte superior derecha.

Las similitudes en las partes correspondientes de dos muestras se pueden medir utilizando la distancia de levenshtein. Las letras se utilizan para representar los cambios entre una fuente y otra. La solución al algoritmo típicamente es un número mayor cuanto más diferentes son las dos muestras. Este concepto a menudo se usa para el reconocimiento de voz, así como la verificación de hechizos y el análisis de material genético.

.

En algunas mediciones, los cambios de frecuencia pueden compensar la capacidad de la deformación de tiempo dinámico. Las señales se pueden calcular de tal manera que su forma se usa independientemente de la frecuencia. Las señales moduladas también pueden plantear un problema, pero una cuadrícula que calcula las distancias entre los segmentos de línea en lugar de los puntos puede compensar.

Alineadores de secuenciaT es generalmente matemático y se necesitan algunas habilidades de programación de computadoras para comprenderlo completamente. Los algoritmos de deformación de tiempo dinámico dependen de algunas condiciones básicas para calcular de manera realista las diferencias entre las muestras audio o visuales. Teniendo en cuenta una muestra como una ruta a lo largo de una cuadrícula, el algoritmo a menudo sigue reglas, como la ruta no puede volver y que se mide un paso a la vez. Además del formato inferior izquierdo a la parte superior derecha, las mediciones se limitan a ubicaciones cercanas a una línea diagonal. Los valores que son demasiado empinados o superficiales a menudo se ignoran porque pueden causar errores en la medición final.

OTROS IDIOMAS