Co to jest dynamiczne dopasowanie czasowe?
Dynamiczne dopasowanie czasu (DTW) polega na metodzie obliczeniowej zwanej algorytmem, służącej do porównywania dźwięków, wideo i grafiki, które mogą być podobne, ale ich próbki mogą mieć subtelne różnice. Obliczenia zazwyczaj formułują liniową reprezentację próbki i mierzą różnice w funkcji czasu. Różne elementy próbki można zmapować na siatce, aby zidentyfikować podobieństwa, a polecenia funkcji często używają symboli do identyfikacji każdej zmiennej. Na przykład rozpoznawanie mowy czasami wykorzystuje dynamiczne dopasowanie czasu w celu dopasowania słów, nawet jeśli są wypowiadane z różnymi prędkościami lub niektóre części są wymawiane inaczej.
Wiele programów do rozpoznawania mowy korzysta z dynamicznego dopasowywania czasu, ponieważ ludzie często mówią w różnym tempie. Niektóre dźwięki samogłoskowe mogą być różnie ogłaszane w zależności od emocji lub innych czynników. Niektóre programy rozpoznają wypowiedziane słowa bez względu na to, kto mówi. Z tego powodu zwykle nie jest skuteczne sumowanie odległości w odstępach czasu w celu porównania dźwięków. W DTW analizowane są różne punkty czasowe dla każdego sygnału; odległości te są obliczane na siatce biegnącej od lewej dolnej do prawej górnej.
Podobieństwa w odpowiednich częściach dwóch próbek można zmierzyć za pomocą odległości Levenshteina. Litery służą do przedstawienia zmian między jednym źródłem a drugim. Rozwiązaniem algorytmu jest zwykle większa liczba, im bardziej różne są dwie próbki. Ta koncepcja jest często używana do rozpoznawania mowy, a także do sprawdzania pisowni i analizy materiału genetycznego.
W niektórych pomiarach zmiany częstotliwości mogą zrównoważyć zdolność dynamicznego dopasowania czasowego. Sygnały można obliczyć w taki sposób, aby ich forma była używana niezależnie od częstotliwości. Modulowane sygnały mogą również stanowić problem, ale siatka, która oblicza odległości między segmentami linii zamiast punktów, może to zrekompensować.
Wyrównanie sekwencji jest zasadniczo matematyczne i potrzebne są pewne umiejętności programowania komputerowego, aby w pełni je zrozumieć. Algorytmy dynamicznego dopasowania czasu zależą od pewnych podstawowych warunków realistycznego obliczania różnic między próbkami audio lub wizualnymi. Rozważając próbkę jako ścieżkę wzdłuż siatki, algorytm często przestrzega reguł, takich jak ścieżka nie może zawrócić i że jest mierzona krok po kroku. Oprócz formatu od dolnego lewego do prawego górnego, pomiary są ograniczone do lokalizacji w pobliżu linii ukośnej. Wartości zbyt strome lub płytkie są często pomijane, ponieważ mogą powodować błędy w końcowym pomiarze.