Qu'est-ce que le Time Time Warping?

Dynamic Time Warping (DTW) implique une méthode de calcul, appelée algorithme, permettant de comparer des sons, des vidéos et des graphiques pouvant être similaires, mais dont les échantillons peuvent présenter des différences subtiles. Les calculs formulent généralement une représentation linéaire de l'échantillon et mesurent les différences en fonction du temps. Différents éléments d'un échantillon peuvent être mappés sur une grille pour identifier les similitudes, tandis que les commandes de fonctions utilisent souvent des symboles pour identifier chaque variable. La reconnaissance vocale, par exemple, utilise parfois une déformation temporelle dynamique pour faire correspondre les mots, même si leur prononciation est différente ou si certaines parties sont prononcées différemment.

De nombreux programmes de reconnaissance vocale utilisent le timeping dynamique, car les gens parlent souvent à des rythmes différents. Certaines voyelles peuvent être annoncées différemment selon les émotions ou d'autres facteurs. Certains programmes peuvent reconnaître les mots prononcés, peu importe qui parle. Pour cette raison, il n’est généralement pas efficace d’additionner les distances dans les intervalles de temps pour comparer les sons. Avec DTW, différents points temporels spécifiques à chaque signal sont analysés; ces distances sont calculées sur une grille qui va du bas à gauche au haut à droite.

Les similitudes dans les parties correspondantes de deux échantillons peuvent être mesurées en utilisant la distance de Levenshtein. Les lettres sont utilisées pour représenter les changements entre une source et une autre. La solution à l'algorithme est généralement un nombre plus grand, plus les deux échantillons sont différents. Ce concept est souvent utilisé pour la reconnaissance de la parole ainsi que pour la vérification orthographique et l'analyse du matériel génétique.

Dans certaines mesures, les changements de fréquence peuvent compenser la capacité de déformation temporelle dynamique. Les signaux peuvent être calculés de telle sorte que leur forme soit utilisée indépendamment de la fréquence. Les signaux modulés peuvent également poser problème, mais une grille qui calcule les distances entre les segments de ligne au lieu de points peut compenser.

L'alignement des séquences est généralement mathématique et certaines compétences en programmation informatique sont nécessaires pour bien le comprendre. Les algorithmes de distorsion temporelle dynamique dépendent de certaines conditions de base pour calculer de manière réaliste les différences entre des échantillons audio ou visuels. Considérant un échantillon comme un chemin le long d'une grille, l'algorithme respecte souvent des règles, telles que le chemin ne peut pas revenir en arrière et qu'il est mesuré étape par étape. En plus du format de gauche à droite, les mesures sont limitées aux emplacements proches d'une diagonale. Les valeurs trop raides ou peu profondes sont souvent ignorées car elles peuvent entraîner des erreurs lors de la mesure finale.

DANS D'AUTRES LANGUES

Cet article vous a‑t‑il été utile ? Merci pour les commentaires Merci pour les commentaires

Comment pouvons nous aider? Comment pouvons nous aider?