Was ist dynamisches Time Warping?

Dynamic Time Warping (DTW) beinhaltet eine Berechnungsmethode, die als Algorithmus bezeichnet wird, um Sounds, Videos und Grafiken zu vergleichen, die möglicherweise ähnlich sind, von denen jedoch Beispiele geringfügige Unterschiede aufweisen können. Die Berechnungen formulieren typischerweise eine lineare Darstellung der Probe und messen die Differenzen als Funktion der Zeit. Verschiedene Elemente einer Stichprobe können auf einem Raster abgebildet werden, um Ähnlichkeiten zu identifizieren, während Befehle für Funktionen häufig Symbole verwenden, um jede Variable zu identifizieren. Beispielsweise verwendet die Spracherkennung manchmal dynamische Zeitverzerrungen, um Wörter abzugleichen, selbst wenn diese mit unterschiedlicher Geschwindigkeit gesprochen werden oder bestimmte Teile unterschiedlich ausgesprochen werden.

Viele Spracherkennungsprogramme verwenden dynamische Zeitverzerrungen, da die Sprechgeschwindigkeit häufig unterschiedlich ist. Bestimmte Vokaltöne können abhängig von Emotionen oder anderen Faktoren unterschiedlich angesagt werden. Einige Programme können gesprochene Wörter erkennen, egal wer spricht. Aus diesem Grund ist es normalerweise nicht effektiv, die Abstände in Zeitintervallen zu addieren, um Geräusche zu vergleichen. Mit DTW werden verschiedene zeitspezifische Punkte für jedes Signal analysiert; Diese Abstände werden in einem Raster berechnet, das von links unten nach rechts oben verläuft.

Ähnlichkeiten in den entsprechenden Teilen von zwei Proben können unter Verwendung des Levenshtein-Abstandes gemessen werden. Buchstaben werden verwendet, um die Änderungen zwischen einer Quelle und einer anderen darzustellen. Die Lösung für den Algorithmus ist normalerweise eine größere Zahl, je unterschiedlicher die beiden Stichproben sind. Dieses Konzept wird häufig zur Spracherkennung sowie zur Rechtschreibprüfung und Analyse von genetischem Material verwendet.

Bei einigen Messungen können Frequenzänderungen die Fähigkeit des dynamischen Zeitverzerrens ausgleichen. Signale können so berechnet werden, dass ihre Form unabhängig von der Frequenz verwendet wird. Modulierte Signale können ebenfalls ein Problem darstellen, aber ein Gitter, das Entfernungen zwischen Liniensegmenten anstelle von Punkten berechnet, kann dies ausgleichen.

Sequence Alignment ist im Allgemeinen mathematisch und einige Computerprogrammierkenntnisse sind erforderlich, um es vollständig zu verstehen. Dynamische Time Warping-Algorithmen hängen von einigen Grundbedingungen ab, um die Unterschiede zwischen Audio- und Video-Samples realistisch zu berechnen. Wenn ein Beispiel als Pfad entlang eines Rasters betrachtet wird, folgt der Algorithmus häufig Regeln, z. B. dass der Pfad nicht zurückkehren kann und schrittweise gemessen wird. Neben dem Format von links unten nach rechts oben sind die Messungen auf Positionen in der Nähe einer diagonalen Linie beschränkt. Zu steile oder zu flache Werte werden häufig ignoriert, da sie zu Fehlern bei der endgültigen Messung führen können.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?