Skip to main content

Che cos'è la deformazione del tempo dinamico?

Dynamic Time Warping (DTW) comporta un metodo di calcolo, chiamato algoritmo, per confrontare suoni, video e grafica che possono essere simili ma i cui campioni possono avere sottili differenze.I calcoli formulano in genere una rappresentazione lineare del campione e misurano le differenze in funzione del tempo.Elementi diversi di un campione possono essere mappati su una griglia per identificare somiglianze, mentre i comandi per le funzioni usano spesso simboli per identificare ogni variabile.Il riconoscimento vocale, ad esempio, a volte usa la deformazione del tempo dinamico per abbinare le parole anche se sono pronunciate a velocità diverse o alcune parti sono pronunciati in modo diverso.

Molti programmi di riconoscimento vocale usano la deformazione del tempo dinamico perché le persone spesso parlano a tassi diversi.Alcuni suoni vocali possono essere annullati in modo diverso a seconda delle emozioni o di altri fattori.Alcuni programmi possono riconoscere le parole pronunciate, non importa chi sta parlando.Per questo motivo, di solito non è efficace sommare le distanze negli intervalli di tempo per confrontare i suoni.Con DTW vengono analizzati vari punti specifici per il tempo per ciascun segnale;Queste distanze sono calcolate su una griglia che va dalla bassa sinistra a in alto a destra.

Le somiglianze nelle parti corrispondenti di due campioni possono essere misurate usando la distanza di Levenshtein.Le lettere vengono utilizzate per rappresentare le modifiche tra una fonte e un'altra.La soluzione all'algoritmo in genere è un numero più grande, più sono diversi i due campioni.Questo concetto viene spesso utilizzato per il riconoscimento vocale e per il controllo e l'analisi del materiale genetico.

In alcune misurazioni, i cambiamenti di frequenza possono compensare la capacità di deformare il tempo dinamico.I segnali possono essere calcolati in modo tale che la loro forma venga utilizzata indipendentemente dalla frequenza.Anche i segnali modulati possono rappresentare un problema, ma una griglia che calcola le distanze tra i segmenti di linea anziché i punti può compensare. L'allineamento della sequenza è generalmente matematica e sono necessarie alcune capacità di programmazione informatica per comprenderlo appieno.Gli algoritmi di deformazione del tempo dinamico dipendono da alcune condizioni di base per il calcolo realistico delle differenze tra campioni audio o visivi.Considerando un campione come un percorso lungo una griglia, l'algoritmo spesso segue regole, come il percorso non può tornare indietro e che viene misurato un passo alla volta.Oltre al formato in basso a sinistra in alto a destra, le misurazioni sono limitate a posizioni vicine a una linea diagonale.I valori troppo ripidi o superficiali sono spesso ignorati perché possono causare errori nella misurazione finale.